BoruiXu
/

phi3_mini_amd_NPU

Model card Files Files and versions Community

phi3_mini_amd_NPU

1 contributor

History: 10 commits

BoruiXu's picture

Update run_awq.py

fc3d3de verified 8 months ago

.gitattributes

1.52 kB

initial commit 8 months ago
README.md

534 Bytes

Update README.md 8 months ago
model_utils.py

6.06 kB

upload 8 months ago
modeling_phi3.py

75.9 kB

upload 8 months ago
phi-3-chat-w4-g128_awq.pt

57.6 MB
LFS

upload 8 months ago
phi3_mini_awq_4bit_no_flash_attention.pt
Detected Pickle imports (24)
- "phi3_mini.modeling_phi3.Phi3DecoderLayer",
- "torch._utils._rebuild_tensor_v2",
- "phi3_mini.modeling_phi3.Phi3RotaryEmbedding",
- "torch.Size",
- "collections.OrderedDict",
- "phi3_mini.modeling_phi3.Phi3Model",
- "torch.nn.modules.activation.SiLU",
- "qlinear.QLinearPerGrp",
- "torch.bfloat16",
- "torch._utils._rebuild_parameter",
- "phi3_mini.configuration_phi3.Phi3Config",
- "torch.FloatStorage",
- "phi3_mini.modeling_phi3.Phi3MLP",
- "torch.CharStorage",
- "phi3_mini.modeling_phi3.Phi3ForCausalLM",
- "torch.nn.modules.sparse.Embedding",
- "phi3_mini.modeling_phi3.Phi3RMSNorm",
- "torch.nn.modules.container.ModuleList",
- "__builtin__.set",
- "phi3_mini.modeling_phi3.Phi3Attention",
- "torch.nn.modules.dropout.Dropout",
- "torch.nn.modules.linear.Linear",
- "torch.BFloat16Storage",
- "transformers.generation.configuration_utils.GenerationConfig"
How to fix it?
4.16 GB
LFS

Upload phi3_mini_awq_4bit_no_flash_attention.pt 8 months ago
run_awq.py

8.01 kB

Update run_awq.py 8 months ago
save_weights.py

3.83 kB

upload 8 months ago