Update README.md
Browse files
README.md
CHANGED
@@ -12,7 +12,7 @@ tags:
|
|
12 |
- PPO
|
13 |
- RLHF
|
14 |
- RM
|
15 |
-
-
|
16 |
license: "apache-2.0"
|
17 |
---
|
18 |
- 模型体验地址:https://huggingface.co/spaces/fb700/chatglm-fitness-RLHF 测试用户过多,服务压力太大,为确保体验现设置密码,未来视情况定期更新密码,现账号密码为:test/qwer
|
@@ -20,7 +20,7 @@ license: "apache-2.0"
|
|
20 |
# 重磅消息
|
21 |
- 本项目经过多位网友实测,中文总结能力超越了GPT3.5各版本,健康咨询水平在同参数规模模型也出类拔萃,可能是任何个人和中下企业首选模型。
|
22 |
# 重大突破
|
23 |
-
- 虽然新版本的chatglm2-6b支持32k
|
24 |
# ChatGLM-6B RLHF & LoRA Model
|
25 |
|
26 |
ChatGLM-6B 是开源中英双语对话模型,本次训练基于ChatGLM-6B 的第一代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上开展训练。通过训练我们对模型有了更深刻的认知,LLM在一直在进化,好的方法和数据可以挖掘出模型的更大潜能。
|
|
|
12 |
- PPO
|
13 |
- RLHF
|
14 |
- RM
|
15 |
+
- Transformer
|
16 |
license: "apache-2.0"
|
17 |
---
|
18 |
- 模型体验地址:https://huggingface.co/spaces/fb700/chatglm-fitness-RLHF 测试用户过多,服务压力太大,为确保体验现设置密码,未来视情况定期更新密码,现账号密码为:test/qwer
|
|
|
20 |
# 重磅消息
|
21 |
- 本项目经过多位网友实测,中文总结能力超越了GPT3.5各版本,健康咨询水平在同参数规模模型也出类拔萃,可能是任何个人和中下企业首选模型。
|
22 |
# 重大突破
|
23 |
+
- 虽然新版本的chatglm2-6b支持32k,但是我训练的模型在之前经优化,早就可以支持无限context,远大于4k、8K、16K......
|
24 |
# ChatGLM-6B RLHF & LoRA Model
|
25 |
|
26 |
ChatGLM-6B 是开源中英双语对话模型,本次训练基于ChatGLM-6B 的第一代版本,在保留了初代模型对话流畅、部署门槛较低等众多优秀特性的基础之上开展训练。通过训练我们对模型有了更深刻的认知,LLM在一直在进化,好的方法和数据可以挖掘出模型的更大潜能。
|