mgoin
/

Nemotron-4-340B-Base-hf-FP8

Text Generation

Model card Files Files and versions Community

mgoin commited on Jul 24, 2024

Commit

1c04e39

·

verified ·

1 Parent(s): f0ca39a

Update README.md

Files changed (1) hide show

README.md +6 -0

README.md CHANGED Viewed

@@ -10,6 +10,12 @@ vllm (pretrained=/home/mgoin/code/Nemotron-4-340B-Base-hf-FP8,tensor_parallel_si
 |    Tasks     |Version|Filter|n-shot|Metric|   |Value |   |Stderr|
 |--------------|------:|------|-----:|------|---|-----:|---|-----:|
 |truthfulqa_mc2|      2|none  |     0|acc   |↑  |0.4869|±  |0.0142|
 ```
 The [original paper](https://arxiv.org/pdf/2407.14679) evals:

 |    Tasks     |Version|Filter|n-shot|Metric|   |Value |   |Stderr|
 |--------------|------:|------|-----:|------|---|-----:|---|-----:|
 |truthfulqa_mc2|      2|none  |     0|acc   |↑  |0.4869|±  |0.0142|
+lm_eval --model vllm --model_args pretrained=/home/mgoin/code/Nemotron-4-340B-Base-hf-FP8,tensor_parallel_size=8,distributed_executor_backend="ray",max_model_len=4096,gpu_memory_utilization=0.6 --tasks winogrande --num_fewshot 5 --batch_size 16
+vllm (pretrained=/home/mgoin/code/Nemotron-4-340B-Base-hf-FP8,tensor_parallel_size=8,distributed_executor_backend=ray,max_model_len=4096,gpu_memory_utilization=0.6), gen_kwargs: (None), limit: None, num_fewshot: 5, batch_size: 16
+|  Tasks   |Version|Filter|n-shot|Metric|   |Value |   |Stderr|
+|----------|------:|------|-----:|------|---|-----:|---|-----:|
+|winogrande|      1|none  |     5|acc   |↑  |0.8887|±  |0.0088|
 ```
 The [original paper](https://arxiv.org/pdf/2407.14679) evals: