RDson
/

CoderO1-14B-Preview

Text Generation

text-generation-inference

Model card Files Files and versions Community

RDson commited on Feb 3

Commit

a9d961d

·

verified ·

1 Parent(s): 41ffdb1

Update README.md

Files changed (1) hide show

README.md +2 -7

README.md CHANGED Viewed

@@ -11,7 +11,7 @@ tags:
 - merge
 ---
-# Untitled Model (1)
 This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
@@ -35,20 +35,15 @@ The following YAML configuration was used to produce this model:
 ```yaml
 models:
   # Pivot model
-  #- model: Qwen/Qwen2.5-14B
   # Target models
   - model: Qwen/Qwen2.5-14B-Instruct
   - model: deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
   - model: arcee-ai/Virtuoso-Small-v2
-  - model: arcee-ai/SuperNova-Medius
   - model: Krystalan/DRT-o1-14B
 merge_method: sce
 base_model: arcee-ai/SuperNova-Medius
-# Qwen/Qwen2.5-14B
 tokenizer_source: base
-# arcee-ai/Virtuoso-Small-v2
-# Qwen/Qwen2.5-14B
-# deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
 parameters:
   select_topk: 1.0
 dtype: bfloat16

 - merge
 ---
+# CoderO1-14B-Preview
 This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
 ```yaml
 models:
   # Pivot model
+  - model: arcee-ai/SuperNova-Medius
   # Target models
   - model: Qwen/Qwen2.5-14B-Instruct
   - model: deepseek-ai/DeepSeek-R1-Distill-Qwen-14B
   - model: arcee-ai/Virtuoso-Small-v2
   - model: Krystalan/DRT-o1-14B
 merge_method: sce
 base_model: arcee-ai/SuperNova-Medius
 tokenizer_source: base
 parameters:
   select_topk: 1.0
 dtype: bfloat16