Update README.md
Browse files
README.md
CHANGED
@@ -8,5 +8,4 @@ tags: []
|
|
8 |
|
9 |
# Qwen2.5-7B-Instruct-dpo
|
10 |
|
11 |
-
|
12 |
-
学習には、LMSYS-Chat-1MやOASST2などの既存のデータセットを日本語に翻訳したものを使用しました。まず、各データセットのプロンプトをGPT-4o miniで日本語に翻訳とその改善を行いました。その後、それらのプロンプトに対するQwen2.5-7B-InstructとGPT-4o miniによる応答をGPT-4o miniで評価し、選好データセットを作成しました。
|
|
|
8 |
|
9 |
# Qwen2.5-7B-Instruct-dpo
|
10 |
|
11 |
+
|
|