Ttimofeyka
/

Llama-3-15B-512k-Instruct

Text Generation

princeton-nlp/Llama-3-8B-ProLong-512k-Instruct

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3-15B-512k-Instruct / mergekit_config.yml

Ttimofeyka's picture

Upload folder using huggingface_hub

954441c verified 2 months ago

history blame contribute delete

699 Bytes


	dtype: bfloat16
	merge_method: passthrough
	slices:
	- sources:
	- layer_range: [0, 24]
	model: princeton-nlp/Llama-3-8B-ProLong-512k-Instruct
	- sources:
	- layer_range: [8, 24]
	model: princeton-nlp/Llama-3-8B-ProLong-512k-Instruct
	parameters:
	scale:
	- filter: o_proj
	value: 0.0
	- filter: down_proj
	value: 0.0
	- value: 1.0
	- sources:
	- layer_range: [8, 24]
	model: princeton-nlp/Llama-3-8B-ProLong-512k-Instruct
	parameters:
	scale:
	- filter: o_proj
	value: 0.0
	- filter: down_proj
	value: 0.0
	- value: 1.0
	- sources:
	- layer_range: [24, 32]
	model: princeton-nlp/Llama-3-8B-ProLong-512k-Instruct