nejumi
/

phi-4-GPTQ-Int8-calib-ja-1k

8-bit precision

Model card Files Files and versions Community

nejumi commited on Jan 22

Commit

632f2cf

·

verified ·

1 Parent(s): 98ecc64

Update README_en.md

Files changed (1) hide show

README_en.md +2 -0

README_en.md CHANGED Viewed

@@ -1,6 +1,7 @@
 # microsoft/phi-4 Quantized Models
 ## Overview
 This model applies GPTQ quantization to [microsoft/phi-4](https://huggingface.co/microsoft/phi-4) as the base model. It optimizes performance in Japanese environments by using Japanese text as calibration data.
 - **Model Variants**:
   - [nejumi/phi-4-GPTQ-Int4-calib-ja-1k](https://huggingface.co/nejumi/phi-4-GPTQ-Int4-calib-ja-1k)
   - [nejumi/phi-4-GPTQ-Int8-calib-ja-1k](https://huggingface.co/nejumi/phi-4-GPTQ-Int8-calib-ja-1k)
@@ -15,6 +16,7 @@ This model applies GPTQ quantization to [microsoft/phi-4](https://huggingface.co
 - desc_act: True
 - use_exllama: False
 - model_seqlen: 2048
 ---
 ## Performance Evaluation
 Evaluation results from [Nejumi LLM Leaderboard 3 (W&B)](https://wandb.ai/wandb-japan/llm-leaderboard3/reports/Nejumi-LLM-3---Vmlldzo4NTI1NTUx)

 # microsoft/phi-4 Quantized Models
 ## Overview
 This model applies GPTQ quantization to [microsoft/phi-4](https://huggingface.co/microsoft/phi-4) as the base model. It optimizes performance in Japanese environments by using Japanese text as calibration data.
 - **Model Variants**:
   - [nejumi/phi-4-GPTQ-Int4-calib-ja-1k](https://huggingface.co/nejumi/phi-4-GPTQ-Int4-calib-ja-1k)
   - [nejumi/phi-4-GPTQ-Int8-calib-ja-1k](https://huggingface.co/nejumi/phi-4-GPTQ-Int8-calib-ja-1k)
 - desc_act: True
 - use_exllama: False
 - model_seqlen: 2048
 ---
 ## Performance Evaluation
 Evaluation results from [Nejumi LLM Leaderboard 3 (W&B)](https://wandb.ai/wandb-japan/llm-leaderboard3/reports/Nejumi-LLM-3---Vmlldzo4NTI1NTUx)