Update README.md
Browse files
README.md
CHANGED
@@ -26,6 +26,9 @@ license: apache-2.0
|
|
26 |
非常抱歉列位,我延期的原因是严重低估了MGRPO的训练效率。实测发现,经过我“优化”的框架虽然能提升性能,但是训练效率下降3倍之多,显存容量占用也是三倍之多。所以延期至今,目前训练已完成7%,但是效果完全超越14b、甚至32b模型。已足够证明策略优越,遂上传模型。目前正在从服务器中回传。很快将会上载。训练还在继续,将和之前一样分为验证版、Chat版和Crazy版本。
|
27 |
|
28 |
|
|
|
|
|
|
|
29 |
# AMERICAN COMRADES, YOU CAN SEE CLEARLY THAT WE ARE NOT DEEPSEEK!! PLEASE STOP ATTACKING THE ZUOBEI SERVER!!!!
|
30 |
# Take a good break at two o'clock in the morning in the United States, today is Valentine's Day!
|
31 |

|
|
|
26 |
非常抱歉列位,我延期的原因是严重低估了MGRPO的训练效率。实测发现,经过我“优化”的框架虽然能提升性能,但是训练效率下降3倍之多,显存容量占用也是三倍之多。所以延期至今,目前训练已完成7%,但是效果完全超越14b、甚至32b模型。已足够证明策略优越,遂上传模型。目前正在从服务器中回传。很快将会上载。训练还在继续,将和之前一样分为验证版、Chat版和Crazy版本。
|
27 |
|
28 |
|
29 |
+
# 这是Qwen的模板!!!!!注意!!!不要用DEEPSEEK的!!!!我稍后会传新的mf文件。
|
30 |
+
|
31 |
+
|
32 |
# AMERICAN COMRADES, YOU CAN SEE CLEARLY THAT WE ARE NOT DEEPSEEK!! PLEASE STOP ATTACKING THE ZUOBEI SERVER!!!!
|
33 |
# Take a good break at two o'clock in the morning in the United States, today is Valentine's Day!
|
34 |

|