optimum-internal-testing
/

neuron-testing-cache

Model card Files Files and versions Community

optimum-internal-testing-user commited on 7 days ago

Commit

24f284a

verified ·

1 Parent(s): 1ae721e

Synchronizing local compiler cache.

Browse files

This view is limited to 50 files because it contains too many changes. See raw diff

Files changed (50) hide show

.gitattributes +17 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/granite/hf-internal-testing/tiny-random-GraniteForCausalLM/3744fb0ec890ed0ee45b.json +51 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/granite/hf-internal-testing/tiny-random-GraniteForCausalLM/8ce05e932094a24524a2.json +51 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/granite/hf-internal-testing/tiny-random-GraniteForCausalLM/a2054036498cf7febe73.json +51 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/llama/llamafactory/tiny-random-Llama-3/1db37f9b275c28f31a4c.json +55 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/llama/llamafactory/tiny-random-Llama-3/454a28c3ade838a69bb6.json +55 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/llama/llamafactory/tiny-random-Llama-3/534c886df9d760cd4ee5.json +55 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/mixtral/dacorvo/Mixtral-tiny/42dbcbe3264236b62e21.json +73 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/mixtral/dacorvo/Mixtral-tiny/62410cde55b49f22ca2f.json +73 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/mixtral/dacorvo/Mixtral-tiny/a61f5b20450ca3689552.json +73 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/phi3/yujiepan/phi-4-tiny-random/1f86d9b323d4de2f798c.json +52 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/phi3/yujiepan/phi-4-tiny-random/cb63b47e3227ecbd6006.json +52 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/phi3/yujiepan/phi-4-tiny-random/e96c051b6b9b4c77a743.json +52 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/qwen2/yujiepan/qwen2.5-128k-tiny-random/1f07aa27385a3bacc0ce.json +53 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/qwen2/yujiepan/qwen2.5-128k-tiny-random/a8eda1338b750cadb3a6.json +53 -0
neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/qwen2/yujiepan/qwen2.5-128k-tiny-random/e14b78afc1fa5e13b44a.json +53 -0
neuronxcc-2.17.194.0+d312836f/MODULE_0672b5f56c1c30461234+431f5505/model.neff +0 -0
neuronxcc-2.17.194.0+d312836f/MODULE_088cee8e523341202b27+431f5505/model.neff +0 -0
neuronxcc-2.17.194.0+d312836f/MODULE_1649fc77b87fff02e370+613edded/model.neff +1 -1
neuronxcc-2.17.194.0+d312836f/MODULE_18642e0fd797db5b7fcb+431f5505/compile_flags.json +1 -0
neuronxcc-2.17.194.0+d312836f/MODULE_18642e0fd797db5b7fcb+431f5505/model.done +0 -0
neuronxcc-2.17.194.0+d312836f/MODULE_18642e0fd797db5b7fcb+431f5505/model.hlo_module.pb +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_18642e0fd797db5b7fcb+431f5505/model.neff +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_1b80b788e3a49498f963+613edded/compile_flags.json +1 -0
neuronxcc-2.17.194.0+d312836f/MODULE_1b80b788e3a49498f963+613edded/model.done +0 -0
neuronxcc-2.17.194.0+d312836f/MODULE_1b80b788e3a49498f963+613edded/model.hlo_module.pb +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_1b80b788e3a49498f963+613edded/model.neff +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_1df250ef1cf7a7de560f+613edded/compile_flags.json +1 -0
neuronxcc-2.17.194.0+d312836f/MODULE_1df250ef1cf7a7de560f+613edded/model.done +0 -0
neuronxcc-2.17.194.0+d312836f/MODULE_1df250ef1cf7a7de560f+613edded/model.hlo_module.pb +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_1df250ef1cf7a7de560f+613edded/model.neff +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_22cf23062ec53b3fd95d+613edded/model.neff +1 -1
neuronxcc-2.17.194.0+d312836f/MODULE_24ff9ac2787ce9a1d276+613edded/model.neff +1 -1
neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/compile_flags.json +1 -0
neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/model.done +0 -0
neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/model.hlo_module.pb +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/model.neff +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/wrapped_neff.hlo +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_2ef52130792b59d66c66+613edded/model.neff +1 -1
neuronxcc-2.17.194.0+d312836f/MODULE_320f2622d4d0c9fdd0f1+613edded/model.neff +1 -1
neuronxcc-2.17.194.0+d312836f/MODULE_3cd14d7a79a82df7bd50+613edded/compile_flags.json +1 -0
neuronxcc-2.17.194.0+d312836f/MODULE_3cd14d7a79a82df7bd50+613edded/model.done +0 -0
neuronxcc-2.17.194.0+d312836f/MODULE_3cd14d7a79a82df7bd50+613edded/model.hlo_module.pb +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_3cd14d7a79a82df7bd50+613edded/model.neff +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_3da832fdaa3d62981800+613edded/model.neff +1 -1
neuronxcc-2.17.194.0+d312836f/MODULE_40a0e75a65ac51fdd01a+613edded/compile_flags.json +1 -0
neuronxcc-2.17.194.0+d312836f/MODULE_40a0e75a65ac51fdd01a+613edded/model.done +0 -0
neuronxcc-2.17.194.0+d312836f/MODULE_40a0e75a65ac51fdd01a+613edded/model.hlo_module.pb +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_40a0e75a65ac51fdd01a+613edded/model.neff +3 -0
neuronxcc-2.17.194.0+d312836f/MODULE_48bfe9ceb9631fdca2d4+613edded/model.neff +1 -1

.gitattributes CHANGED Viewed

@@ -2450,3 +2450,20 @@ neuronxcc-2.17.194.0+d312836f/MODULE_788eb0c6a9b0ca759eca+165e9558/wrapped_neff.
 neuronxcc-2.17.194.0+d312836f/MODULE_9d48665852815568ded9+bfe5714b/model.neff filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.17.194.0+d312836f/MODULE_a21bcdc4a770063da8b6+165e9558/model.neff filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.17.194.0+d312836f/MODULE_a21bcdc4a770063da8b6+165e9558/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text

 neuronxcc-2.17.194.0+d312836f/MODULE_9d48665852815568ded9+bfe5714b/model.neff filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.17.194.0+d312836f/MODULE_a21bcdc4a770063da8b6+165e9558/model.neff filter=lfs diff=lfs merge=lfs -text
 neuronxcc-2.17.194.0+d312836f/MODULE_a21bcdc4a770063da8b6+165e9558/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_18642e0fd797db5b7fcb+431f5505/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_1b80b788e3a49498f963+613edded/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_1df250ef1cf7a7de560f+613edded/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_3cd14d7a79a82df7bd50+613edded/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_40a0e75a65ac51fdd01a+613edded/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_51d9fed86504dfbff43c+613edded/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_8c063f8f288a908bf850+613edded/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_b811ebc7b9aa6e1eb84f+431f5505/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_cd4240e56f3558bf8cf0+431f5505/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_cf41a32ef696654dc19b+613edded/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_d06255807e916c398b05+bfc62e4c/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_d06255807e916c398b05+bfc62e4c/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_e36f587c697c4d8df3f6+bfc62e4c/model.neff filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_e36f587c697c4d8df3f6+bfc62e4c/wrapped_neff.hlo filter=lfs diff=lfs merge=lfs -text
+neuronxcc-2.17.194.0+d312836f/MODULE_fda7fb53c475ba393ed7+613edded/model.neff filter=lfs diff=lfs merge=lfs -text

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/granite/hf-internal-testing/tiny-random-GraniteForCausalLM/3744fb0ec890ed0ee45b.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-GraniteForCausalLM",
+  "_task": "text-generation",
+  "architectures": [
+    "GraniteForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "attention_multiplier": 1.0,
+  "embedding_multiplier": 1.0,
+  "hidden_act": "silu",
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 64,
+  "logits_scaling": 1.0,
+  "max_position_embeddings": 2048,
+  "mlp_bias": false,
+  "model_type": "granite",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": true,
+    "attention_layout": "HSB",
+    "attn_output_transposed": false,
+    "auto_cast_type": "bf16",
+    "batch_size": 1,
+    "checkpoint_id": "hf-internal-testing/tiny-random-GraniteForCausalLM",
+    "checkpoint_revision": "c3074ebc0ac2fe545305f5e5f6cce2cc9b2aa0c5",
+    "collectives_layout": "HSB",
+    "continuous_batching": false,
+    "fuse_qkv": true,
+    "group_query_attention": null,
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 4,
+  "residual_multiplier": 1.0,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 49152
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/granite/hf-internal-testing/tiny-random-GraniteForCausalLM/8ce05e932094a24524a2.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-GraniteForCausalLM",
+  "_task": "text-generation",
+  "architectures": [
+    "GraniteForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "attention_multiplier": 1.0,
+  "embedding_multiplier": 1.0,
+  "hidden_act": "silu",
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 64,
+  "logits_scaling": 1.0,
+  "max_position_embeddings": 2048,
+  "mlp_bias": false,
+  "model_type": "granite",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": true,
+    "attention_layout": "HSB",
+    "attn_output_transposed": false,
+    "auto_cast_type": "fp16",
+    "batch_size": 2,
+    "checkpoint_id": "hf-internal-testing/tiny-random-GraniteForCausalLM",
+    "checkpoint_revision": "c3074ebc0ac2fe545305f5e5f6cce2cc9b2aa0c5",
+    "collectives_layout": "HSB",
+    "continuous_batching": true,
+    "fuse_qkv": true,
+    "group_query_attention": null,
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 4,
+  "residual_multiplier": 1.0,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 49152
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/granite/hf-internal-testing/tiny-random-GraniteForCausalLM/a2054036498cf7febe73.json ADDED Viewed

	@@ -0,0 +1,51 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "hf-internal-testing/tiny-random-GraniteForCausalLM",
+  "_task": "text-generation",
+  "architectures": [
+    "GraniteForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "attention_multiplier": 1.0,
+  "embedding_multiplier": 1.0,
+  "hidden_act": "silu",
+  "hidden_size": 32,
+  "initializer_range": 0.02,
+  "intermediate_size": 64,
+  "logits_scaling": 1.0,
+  "max_position_embeddings": 2048,
+  "mlp_bias": false,
+  "model_type": "granite",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": true,
+    "attention_layout": "HSB",
+    "attn_output_transposed": false,
+    "auto_cast_type": "fp16",
+    "batch_size": 1,
+    "checkpoint_id": "hf-internal-testing/tiny-random-GraniteForCausalLM",
+    "checkpoint_revision": "c3074ebc0ac2fe545305f5e5f6cce2cc9b2aa0c5",
+    "collectives_layout": "HSB",
+    "continuous_batching": false,
+    "fuse_qkv": true,
+    "group_query_attention": null,
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 4,
+  "residual_multiplier": 1.0,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": null,
+  "rope_theta": 10000.0,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 49152
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/llama/llamafactory/tiny-random-Llama-3/1db37f9b275c28f31a4c.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "llamafactory/tiny-random-Llama-3",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "head_dim": 4,
+  "hidden_act": "silu",
+  "hidden_size": 16,
+  "initializer_range": 0.02,
+  "intermediate_size": 64,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": true,
+    "attention_layout": "BSH",
+    "attn_output_transposed": false,
+    "auto_cast_type": "fp16",
+    "batch_size": 2,
+    "checkpoint_id": "llamafactory/tiny-random-Llama-3",
+    "checkpoint_revision": "bf2a2e3bf199ad2ee96f02a3c00246c608db22a8",
+    "collectives_layout": "HSB",
+    "continuous_batching": true,
+    "fuse_qkv": true,
+    "group_query_attention": null,
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 4,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 8.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/llama/llamafactory/tiny-random-Llama-3/454a28c3ade838a69bb6.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "llamafactory/tiny-random-Llama-3",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "head_dim": 4,
+  "hidden_act": "silu",
+  "hidden_size": 16,
+  "initializer_range": 0.02,
+  "intermediate_size": 64,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": true,
+    "attention_layout": "BSH",
+    "attn_output_transposed": false,
+    "auto_cast_type": "fp16",
+    "batch_size": 1,
+    "checkpoint_id": "llamafactory/tiny-random-Llama-3",
+    "checkpoint_revision": "bf2a2e3bf199ad2ee96f02a3c00246c608db22a8",
+    "collectives_layout": "HSB",
+    "continuous_batching": false,
+    "fuse_qkv": true,
+    "group_query_attention": null,
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 4,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 8.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/llama/llamafactory/tiny-random-Llama-3/534c886df9d760cd4ee5.json ADDED Viewed

	@@ -0,0 +1,55 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "llamafactory/tiny-random-Llama-3",
+  "_task": "text-generation",
+  "architectures": [
+    "LlamaForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "head_dim": 4,
+  "hidden_act": "silu",
+  "hidden_size": 16,
+  "initializer_range": 0.02,
+  "intermediate_size": 64,
+  "max_position_embeddings": 131072,
+  "mlp_bias": false,
+  "model_type": "llama",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": true,
+    "attention_layout": "BSH",
+    "attn_output_transposed": false,
+    "auto_cast_type": "bf16",
+    "batch_size": 1,
+    "checkpoint_id": "llamafactory/tiny-random-Llama-3",
+    "checkpoint_revision": "bf2a2e3bf199ad2ee96f02a3c00246c608db22a8",
+    "collectives_layout": "HSB",
+    "continuous_batching": false,
+    "fuse_qkv": true,
+    "group_query_attention": null,
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 4,
+  "pretraining_tp": 1,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": {
+    "factor": 8.0,
+    "high_freq_factor": 4.0,
+    "low_freq_factor": 1.0,
+    "original_max_position_embeddings": 8192,
+    "rope_type": "llama3"
+  },
+  "rope_theta": 500000.0,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 128256
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/mixtral/dacorvo/Mixtral-tiny/42dbcbe3264236b62e21.json ADDED Viewed

	@@ -0,0 +1,73 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "dacorvo/Mixtral-tiny",
+  "_task": "text-generation",
+  "architectures": [
+    "MixtralForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "head_dim": 32,
+  "hidden_act": "silu",
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 3584,
+  "max_position_embeddings": 1024,
+  "model_type": "mixtral",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "async_mode": false,
+    "attn_kernel_enabled": false,
+    "batch_size": 2,
+    "capacity_factor": null,
+    "cc_pipeline_tiling_factor": 2,
+    "checkpoint_id": "dacorvo/Mixtral-tiny",
+    "checkpoint_revision": "c557ba205ddff6ea911f4719e0d543d6c08356b6",
+    "continuous_batching": false,
+    "enable_bucketing": false,
+    "ep_degree": 1,
+    "flash_decoding_enabled": false,
+    "fused_qkv": false,
+    "glu_mlp": true,
+    "is_chunked_prefill": false,
+    "local_ranks_size": 2,
+    "logical_nc_config": 1,
+    "max_batch_size": 2,
+    "max_context_length": 100,
+    "max_topk": 256,
+    "mlp_kernel_enabled": false,
+    "mlp_kernel_fuse_residual_add": false,
+    "n_active_tokens": 100,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "num_cores_per_group": 1,
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_logits": false,
+    "padding_side": "right",
+    "pp_degree": 1,
+    "qk_layernorm": false,
+    "qkv_kernel_enabled": false,
+    "rpl_reduce_dtype": "float16",
+    "sequence_length": 100,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": null,
+    "torch_dtype": "float16",
+    "tp_degree": 2,
+    "vocab_parallel": false
+  },
+  "num_attention_heads": 32,
+  "num_experts_per_tok": 2,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 8,
+  "num_local_experts": 8,
+  "output_router_logits": false,
+  "rms_norm_eps": 1e-05,
+  "rope_theta": 10000.0,
+  "router_aux_loss_coef": 0.001,
+  "router_jitter_noise": 0.0,
+  "sliding_window": 4096,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 32000
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/mixtral/dacorvo/Mixtral-tiny/62410cde55b49f22ca2f.json ADDED Viewed

	@@ -0,0 +1,73 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "dacorvo/Mixtral-tiny",
+  "_task": "text-generation",
+  "architectures": [
+    "MixtralForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "head_dim": 32,
+  "hidden_act": "silu",
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 3584,
+  "max_position_embeddings": 1024,
+  "model_type": "mixtral",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "async_mode": false,
+    "attn_kernel_enabled": false,
+    "batch_size": 1,
+    "capacity_factor": null,
+    "cc_pipeline_tiling_factor": 2,
+    "checkpoint_id": "dacorvo/Mixtral-tiny",
+    "checkpoint_revision": "c557ba205ddff6ea911f4719e0d543d6c08356b6",
+    "continuous_batching": false,
+    "enable_bucketing": false,
+    "ep_degree": 1,
+    "flash_decoding_enabled": false,
+    "fused_qkv": false,
+    "glu_mlp": true,
+    "is_chunked_prefill": false,
+    "local_ranks_size": 2,
+    "logical_nc_config": 1,
+    "max_batch_size": 1,
+    "max_context_length": 100,
+    "max_topk": 256,
+    "mlp_kernel_enabled": false,
+    "mlp_kernel_fuse_residual_add": false,
+    "n_active_tokens": 100,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "num_cores_per_group": 1,
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_logits": false,
+    "padding_side": "right",
+    "pp_degree": 1,
+    "qk_layernorm": false,
+    "qkv_kernel_enabled": false,
+    "rpl_reduce_dtype": "float16",
+    "sequence_length": 100,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": null,
+    "torch_dtype": "float16",
+    "tp_degree": 2,
+    "vocab_parallel": false
+  },
+  "num_attention_heads": 32,
+  "num_experts_per_tok": 2,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 8,
+  "num_local_experts": 8,
+  "output_router_logits": false,
+  "rms_norm_eps": 1e-05,
+  "rope_theta": 10000.0,
+  "router_aux_loss_coef": 0.001,
+  "router_jitter_noise": 0.0,
+  "sliding_window": 4096,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 32000
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/mixtral/dacorvo/Mixtral-tiny/a61f5b20450ca3689552.json ADDED Viewed

	@@ -0,0 +1,73 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "dacorvo/Mixtral-tiny",
+  "_task": "text-generation",
+  "architectures": [
+    "MixtralForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "head_dim": 32,
+  "hidden_act": "silu",
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 3584,
+  "max_position_embeddings": 1024,
+  "model_type": "mixtral",
+  "neuron": {
+    "_serialized_key": "NxDNeuronConfig",
+    "async_mode": false,
+    "attn_kernel_enabled": false,
+    "batch_size": 1,
+    "capacity_factor": null,
+    "cc_pipeline_tiling_factor": 2,
+    "checkpoint_id": "dacorvo/Mixtral-tiny",
+    "checkpoint_revision": "c557ba205ddff6ea911f4719e0d543d6c08356b6",
+    "continuous_batching": false,
+    "enable_bucketing": false,
+    "ep_degree": 1,
+    "flash_decoding_enabled": false,
+    "fused_qkv": false,
+    "glu_mlp": true,
+    "is_chunked_prefill": false,
+    "local_ranks_size": 2,
+    "logical_nc_config": 1,
+    "max_batch_size": 1,
+    "max_context_length": 100,
+    "max_topk": 256,
+    "mlp_kernel_enabled": false,
+    "mlp_kernel_fuse_residual_add": false,
+    "n_active_tokens": 100,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "num_cores_per_group": 1,
+    "on_device_sampling": false,
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_logits": false,
+    "padding_side": "right",
+    "pp_degree": 1,
+    "qk_layernorm": false,
+    "qkv_kernel_enabled": false,
+    "rpl_reduce_dtype": "bfloat16",
+    "sequence_length": 100,
+    "sequence_parallel_enabled": false,
+    "speculation_length": 0,
+    "start_rank_id": 0,
+    "target": null,
+    "torch_dtype": "bfloat16",
+    "tp_degree": 2,
+    "vocab_parallel": false
+  },
+  "num_attention_heads": 32,
+  "num_experts_per_tok": 2,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 8,
+  "num_local_experts": 8,
+  "output_router_logits": false,
+  "rms_norm_eps": 1e-05,
+  "rope_theta": 10000.0,
+  "router_aux_loss_coef": 0.001,
+  "router_jitter_noise": 0.0,
+  "sliding_window": 4096,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 32000
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/phi3/yujiepan/phi-4-tiny-random/1f86d9b323d4de2f798c.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "yujiepan/phi-4-tiny-random",
+  "_task": "text-generation",
+  "architectures": [
+    "Phi3ForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "auto_map": {},
+  "embd_pdrop": 0.0,
+  "hidden_act": "silu",
+  "hidden_size": 16,
+  "initializer_range": 0.02,
+  "intermediate_size": 32,
+  "max_position_embeddings": 16384,
+  "model_type": "phi3",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": false,
+    "attention_layout": "HSB",
+    "attn_output_transposed": false,
+    "auto_cast_type": "fp16",
+    "batch_size": 2,
+    "checkpoint_id": "yujiepan/phi-4-tiny-random",
+    "checkpoint_revision": "18a9a1168dc97ac6d128f811925670c275610f5a",
+    "collectives_layout": "HSB",
+    "continuous_batching": true,
+    "fuse_qkv": true,
+    "group_query_attention": "replicated-heads",
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 2,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 1,
+  "original_max_position_embeddings": 16384,
+  "partial_rotary_factor": 1.0,
+  "resid_pdrop": 0.0,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 250000,
+  "sliding_window": null,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 100352
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/phi3/yujiepan/phi-4-tiny-random/cb63b47e3227ecbd6006.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "yujiepan/phi-4-tiny-random",
+  "_task": "text-generation",
+  "architectures": [
+    "Phi3ForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "auto_map": {},
+  "embd_pdrop": 0.0,
+  "hidden_act": "silu",
+  "hidden_size": 16,
+  "initializer_range": 0.02,
+  "intermediate_size": 32,
+  "max_position_embeddings": 16384,
+  "model_type": "phi3",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": false,
+    "attention_layout": "HSB",
+    "attn_output_transposed": false,
+    "auto_cast_type": "bf16",
+    "batch_size": 1,
+    "checkpoint_id": "yujiepan/phi-4-tiny-random",
+    "checkpoint_revision": "18a9a1168dc97ac6d128f811925670c275610f5a",
+    "collectives_layout": "HSB",
+    "continuous_batching": false,
+    "fuse_qkv": true,
+    "group_query_attention": "replicated-heads",
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 2,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 1,
+  "original_max_position_embeddings": 16384,
+  "partial_rotary_factor": 1.0,
+  "resid_pdrop": 0.0,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 250000,
+  "sliding_window": null,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 100352
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/phi3/yujiepan/phi-4-tiny-random/e96c051b6b9b4c77a743.json ADDED Viewed

	@@ -0,0 +1,52 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "yujiepan/phi-4-tiny-random",
+  "_task": "text-generation",
+  "architectures": [
+    "Phi3ForCausalLM"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "auto_map": {},
+  "embd_pdrop": 0.0,
+  "hidden_act": "silu",
+  "hidden_size": 16,
+  "initializer_range": 0.02,
+  "intermediate_size": 32,
+  "max_position_embeddings": 16384,
+  "model_type": "phi3",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": false,
+    "attention_layout": "HSB",
+    "attn_output_transposed": false,
+    "auto_cast_type": "fp16",
+    "batch_size": 1,
+    "checkpoint_id": "yujiepan/phi-4-tiny-random",
+    "checkpoint_revision": "18a9a1168dc97ac6d128f811925670c275610f5a",
+    "collectives_layout": "HSB",
+    "continuous_batching": false,
+    "fuse_qkv": true,
+    "group_query_attention": "replicated-heads",
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 2,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 1,
+  "original_max_position_embeddings": 16384,
+  "partial_rotary_factor": 1.0,
+  "resid_pdrop": 0.0,
+  "rms_norm_eps": 1e-05,
+  "rope_scaling": null,
+  "rope_theta": 250000,
+  "sliding_window": null,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "vocab_size": 100352
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/qwen2/yujiepan/qwen2.5-128k-tiny-random/1f07aa27385a3bacc0ce.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "yujiepan/qwen2.5-128k-tiny-random",
+  "_task": "text-generation",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "hidden_act": "silu",
+  "hidden_size": 8,
+  "initializer_range": 0.02,
+  "intermediate_size": 16,
+  "max_position_embeddings": 32768,
+  "max_window_layers": 1,
+  "model_type": "qwen2",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": true,
+    "attention_layout": "HSB",
+    "attn_output_transposed": false,
+    "auto_cast_type": "fp16",
+    "batch_size": 2,
+    "checkpoint_id": "yujiepan/qwen2.5-128k-tiny-random",
+    "checkpoint_revision": "c8296d4ca3f87782876d2382fbb6481d1beb8ef0",
+    "collectives_layout": "HSB",
+    "continuous_batching": true,
+    "fuse_qkv": false,
+    "group_query_attention": "shard-over-heads",
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 2,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "factor": 4.0,
+    "original_max_position_embeddings": 32768,
+    "rope_type": "yarn",
+    "type": "yarn"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 131072,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 152064
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/qwen2/yujiepan/qwen2.5-128k-tiny-random/a8eda1338b750cadb3a6.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "yujiepan/qwen2.5-128k-tiny-random",
+  "_task": "text-generation",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "hidden_act": "silu",
+  "hidden_size": 8,
+  "initializer_range": 0.02,
+  "intermediate_size": 16,
+  "max_position_embeddings": 32768,
+  "max_window_layers": 1,
+  "model_type": "qwen2",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": true,
+    "attention_layout": "HSB",
+    "attn_output_transposed": false,
+    "auto_cast_type": "bf16",
+    "batch_size": 1,
+    "checkpoint_id": "yujiepan/qwen2.5-128k-tiny-random",
+    "checkpoint_revision": "c8296d4ca3f87782876d2382fbb6481d1beb8ef0",
+    "collectives_layout": "HSB",
+    "continuous_batching": false,
+    "fuse_qkv": false,
+    "group_query_attention": "shard-over-heads",
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 2,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "factor": 4.0,
+    "original_max_position_embeddings": 32768,
+    "rope_type": "yarn",
+    "type": "yarn"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 131072,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 152064
+}

neuronxcc-2.17.194.0+d312836f/0_REGISTRY/0.2.0.dev5/qwen2/yujiepan/qwen2.5-128k-tiny-random/e14b78afc1fa5e13b44a.json ADDED Viewed

	@@ -0,0 +1,53 @@

+{
+  "_entry_class": "SingleModelCacheEntry",
+  "_model_id": "yujiepan/qwen2.5-128k-tiny-random",
+  "_task": "text-generation",
+  "architectures": [
+    "Qwen2ForCausalLM"
+  ],
+  "attention_dropout": 0.0,
+  "hidden_act": "silu",
+  "hidden_size": 8,
+  "initializer_range": 0.02,
+  "intermediate_size": 16,
+  "max_position_embeddings": 32768,
+  "max_window_layers": 1,
+  "model_type": "qwen2",
+  "neuron": {
+    "_serialized_key": "HloNeuronConfig",
+    "all_reduce_dtype": null,
+    "allow_flash_attention": true,
+    "attention_layout": "HSB",
+    "attn_output_transposed": false,
+    "auto_cast_type": "fp16",
+    "batch_size": 1,
+    "checkpoint_id": "yujiepan/qwen2.5-128k-tiny-random",
+    "checkpoint_revision": "c8296d4ca3f87782876d2382fbb6481d1beb8ef0",
+    "collectives_layout": "HSB",
+    "continuous_batching": false,
+    "fuse_qkv": false,
+    "group_query_attention": "shard-over-heads",
+    "log_softmax_scores": false,
+    "neuronxcc_version": "2.17.194.0+d312836f",
+    "optimum_neuron_version": "0.2.0.dev5",
+    "output_all_logits": false,
+    "sequence_length": 100,
+    "tp_degree": 2
+  },
+  "num_attention_heads": 4,
+  "num_hidden_layers": 2,
+  "num_key_value_heads": 2,
+  "rms_norm_eps": 1e-06,
+  "rope_scaling": {
+    "factor": 4.0,
+    "original_max_position_embeddings": 32768,
+    "rope_type": "yarn",
+    "type": "yarn"
+  },
+  "rope_theta": 1000000.0,
+  "sliding_window": 131072,
+  "tie_word_embeddings": false,
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 152064
+}

neuronxcc-2.17.194.0+d312836f/MODULE_0672b5f56c1c30461234+431f5505/model.neff CHANGED Viewed

Binary files a/neuronxcc-2.17.194.0+d312836f/MODULE_0672b5f56c1c30461234+431f5505/model.neff and b/neuronxcc-2.17.194.0+d312836f/MODULE_0672b5f56c1c30461234+431f5505/model.neff differ

neuronxcc-2.17.194.0+d312836f/MODULE_088cee8e523341202b27+431f5505/model.neff CHANGED Viewed

Binary files a/neuronxcc-2.17.194.0+d312836f/MODULE_088cee8e523341202b27+431f5505/model.neff and b/neuronxcc-2.17.194.0+d312836f/MODULE_088cee8e523341202b27+431f5505/model.neff differ

neuronxcc-2.17.194.0+d312836f/MODULE_1649fc77b87fff02e370+613edded/model.neff CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a42bde1cae14e2adb4b8c3626971bfda3749679e38c4d9ea4d5dbb5b993efa05
 size 134144

 version https://git-lfs.github.com/spec/v1
+oid sha256:104f51ab3675a23b89a21db5993a27e9a5eeb09867470734c4497617e146159f
 size 134144

neuronxcc-2.17.194.0+d312836f/MODULE_18642e0fd797db5b7fcb+431f5505/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ "--model-type=transformer -O1 --lnc=1 --internal-hlo2tensorizer-options=--experimental-unsafe-fp8e4m3fn-as-fp8e4m3 --logfile=/tmp/nxd_model/layout_opt/log-neuron-cc.txt"

neuronxcc-2.17.194.0+d312836f/MODULE_18642e0fd797db5b7fcb+431f5505/model.done ADDED Viewed

File without changes

neuronxcc-2.17.194.0+d312836f/MODULE_18642e0fd797db5b7fcb+431f5505/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:54bcdec06d89d654845d062183036a3a4b545c119ab7f8bfcfcf806a54b9b35d
+size 11183

neuronxcc-2.17.194.0+d312836f/MODULE_18642e0fd797db5b7fcb+431f5505/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3f539c4d46bd7143bb99ab78bed121b4565d8bbb9b15cd5fb0d86fa42eabeac7
+size 103424

neuronxcc-2.17.194.0+d312836f/MODULE_1b80b788e3a49498f963+613edded/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--model-type=transformer", "--auto-cast=none", "--execute-repetition=1"]

neuronxcc-2.17.194.0+d312836f/MODULE_1b80b788e3a49498f963+613edded/model.done ADDED Viewed

File without changes

neuronxcc-2.17.194.0+d312836f/MODULE_1b80b788e3a49498f963+613edded/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3978ae0dae4598ee8e9bbe8392fc2e7e13757206db58da945eeacc59ca5ff3de
+size 21402

neuronxcc-2.17.194.0+d312836f/MODULE_1b80b788e3a49498f963+613edded/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e4017e0a785242f34f89ad69149e5db39b1a813f6c647b8b31659cc1f0868e99
+size 144384

neuronxcc-2.17.194.0+d312836f/MODULE_1df250ef1cf7a7de560f+613edded/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--model-type=transformer", "--auto-cast=none", "--execute-repetition=1"]

neuronxcc-2.17.194.0+d312836f/MODULE_1df250ef1cf7a7de560f+613edded/model.done ADDED Viewed

File without changes

neuronxcc-2.17.194.0+d312836f/MODULE_1df250ef1cf7a7de560f+613edded/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:89450bb664c81cdf16fe49daafa237c12c1cd71f5d8ddae84827db4a2eee340a
+size 17475

neuronxcc-2.17.194.0+d312836f/MODULE_1df250ef1cf7a7de560f+613edded/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bfd560af6819825c7e6f05303464c481e10d74ad257fc87de57528001c694afe
+size 134144

neuronxcc-2.17.194.0+d312836f/MODULE_22cf23062ec53b3fd95d+613edded/model.neff CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:11b12164888b716b67ed46b93830fac4e43f9e7990378269f683e7ec2f468231
 size 144384

 version https://git-lfs.github.com/spec/v1
+oid sha256:d20351b22fb897e1f04a4638ab32aea1487833c6b89eca18339835ba2fe27093
 size 144384

neuronxcc-2.17.194.0+d312836f/MODULE_24ff9ac2787ce9a1d276+613edded/model.neff CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ead3ebbe1cf12b9c8188be09fee3b1fc68585260e8c7a4404c442657ba6a6055
 size 134144

 version https://git-lfs.github.com/spec/v1
+oid sha256:7c20e3490f8986d6c6745d61708f73050a5ed63c89abe7876449170ae3914ddc
 size 134144

neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ "--enable-saturate-infinity --enable-mixed-precision-accumulation --model-type transformer -O1 --tensorizer-options='--enable-ccop-compute-overlap --cc-pipeline-tiling-factor=2' --internal-enable-dge-levels vector_dynamic_offsets --logfile=/tmp/nxd_model/token_generation_model/_tp0_bk0/log-neuron-cc.txt --enable-internal-neff-wrapper"

neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/model.done ADDED Viewed

File without changes

neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc90fd439316fffc61e3d8c3621617633a5cb8d08dda6c0736121c32054c76bf
+size 68277

neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b88ebb6d4762cb58b080eb10990ffb1777c6b5dc0aec53275fbe9a973c9fe294
+size 257024

neuronxcc-2.17.194.0+d312836f/MODULE_284ddd1b388e504631b8+bfc62e4c/wrapped_neff.hlo ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0dce1d8a73f724c37e0b050e6aabdd2a403608d397273e8ab815bd28129ade55
+size 268322

neuronxcc-2.17.194.0+d312836f/MODULE_2ef52130792b59d66c66+613edded/model.neff CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c0c9cb5dd8f03f5a551d5e99cf274e04fe28815ccd3e879779a7516ce857332f
 size 134144

 version https://git-lfs.github.com/spec/v1
+oid sha256:f8a1c8c7baf1dd72136b79095ec0210f7f7ea3d2a0aec460b4b0d187d2c2d03d
 size 134144

neuronxcc-2.17.194.0+d312836f/MODULE_320f2622d4d0c9fdd0f1+613edded/model.neff CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d6e35c0d2fdb8ebdf90b9435bc04029b89281e32ed2f251d8fc0c888721056ff
 size 144384

 version https://git-lfs.github.com/spec/v1
+oid sha256:55d6ee114007d520d9c57754d8e1ea3a59eec00c4e6fa2f8168ded13fe644d38
 size 144384

neuronxcc-2.17.194.0+d312836f/MODULE_3cd14d7a79a82df7bd50+613edded/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--model-type=transformer", "--auto-cast=none", "--execute-repetition=1"]

neuronxcc-2.17.194.0+d312836f/MODULE_3cd14d7a79a82df7bd50+613edded/model.done ADDED Viewed

File without changes

neuronxcc-2.17.194.0+d312836f/MODULE_3cd14d7a79a82df7bd50+613edded/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:38184c632616d2476fe6e7794270c8a51ed09eccce54dfc80c4ee171068da566
+size 20501

neuronxcc-2.17.194.0+d312836f/MODULE_3cd14d7a79a82df7bd50+613edded/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba2fd19607592f515c10a8c9aa2bc7fe0a7cfdb61286057096848075d43a85f1
+size 144384

neuronxcc-2.17.194.0+d312836f/MODULE_3da832fdaa3d62981800+613edded/model.neff CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7e8aa683c7d048770a00a8bc0e022488b1ab80ef008cc962d7d4d851eaad0943
 size 154624

 version https://git-lfs.github.com/spec/v1
+oid sha256:b956eaad5b3ff2e9453f6a41327cb43195efebec1d36ee916427be098eee31f6
 size 154624

neuronxcc-2.17.194.0+d312836f/MODULE_40a0e75a65ac51fdd01a+613edded/compile_flags.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ ["--target=trn1", "--model-type=transformer", "--auto-cast=none", "--execute-repetition=1"]

neuronxcc-2.17.194.0+d312836f/MODULE_40a0e75a65ac51fdd01a+613edded/model.done ADDED Viewed

File without changes

neuronxcc-2.17.194.0+d312836f/MODULE_40a0e75a65ac51fdd01a+613edded/model.hlo_module.pb ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f0df5d765518a8a37e232a30badf00c24949b6001eda6acdb60c55bbf974e1df
+size 20644

neuronxcc-2.17.194.0+d312836f/MODULE_40a0e75a65ac51fdd01a+613edded/model.neff ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:287a3588ce8935f52349c24164e47aa539bd56ee6df2ab77d46e95b3ee22d9c2
+size 144384

neuronxcc-2.17.194.0+d312836f/MODULE_48bfe9ceb9631fdca2d4+613edded/model.neff CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a123eb66616175b59767a873603b31410f8a6e1f11edbc2be8d877baa3164ebc
 size 144384

 version https://git-lfs.github.com/spec/v1
+oid sha256:7f0b07361864dbb9075ea5b55536a3b994ae2afd864ff5545d540a4abcf2cafc
 size 144384