Aratako commited on
Commit
f2884f2
1 Parent(s): e885a42

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +82 -42
README.md CHANGED
@@ -1,42 +1,82 @@
1
- ---
2
- base_model: []
3
- library_name: transformers
4
- tags:
5
- - mergekit
6
- - merge
7
-
8
- ---
9
- # calm_merged
10
-
11
- This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
12
-
13
- ## Merge Details
14
- ### Merge Method
15
-
16
- This model was merged using the breadcrumbs merge method using I:/llama.cpp/calm3-22b-chat as a base.
17
-
18
- ### Models Merged
19
-
20
- The following models were included in the merge:
21
- * I:/llama.cpp/calm3-22b-RP
22
-
23
- ### Configuration
24
-
25
- The following YAML configuration was used to produce this model:
26
-
27
- ```yaml
28
- models:
29
- - model: I:/llama.cpp/calm3-22b-chat
30
- # no parameters necessary for base model
31
- - model: I:/llama.cpp/calm3-22b-RP
32
- parameters:
33
- weight: 0.5
34
- merge_method: breadcrumbs
35
- base_model: I:/llama.cpp/calm3-22b-chat
36
- dtype: bfloat16
37
- tokenizer_source: base
38
- parameters:
39
- density: 0.9
40
- gamma: 0.01
41
-
42
- ```
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ base_model: [cyberagent/calm3-22b-chat, Aratako/calm3-22b-RP-v0.1]
3
+ library_name: transformers
4
+ tags:
5
+ - mergekit
6
+ - merge
7
+ datasets:
8
+ - Aratako/Synthetic-Japanese-Roleplay-NSFW-Claude-3.5s-10.5k-formatted
9
+ - Aratako/Synthetic-Japanese-Roleplay-gpt-4o-mini-19.8k-formatted
10
+ - Aratako/Rosebleu-1on1-Dialogues-RP
11
+ - SicariusSicariiStuff/Bluemoon_Top50MB_Sorted_Fixed
12
+ - grimulkan/LimaRP-augmented
13
+ - MinervaAI/Aesir-Preview
14
+ - openerotica/freedom-rp
15
+ - openerotica/lima-nsfw
16
+ - Chaser-cz/roleplay_scripts
17
+ - roleplay4fun/aesir-v1.1
18
+ ---
19
+ # calm3-22b-RP
20
+ [GGUF版はこちら/Click here for the GGUF version](https://huggingface.co/Aratako/calm3-22b-RP-GGUF)
21
+
22
+ ## 概要
23
+ This is a merge of pre-trained language models created using [mergekit](https://github.com/cg123/mergekit).
24
+
25
+ [cyberagent/calm3-22b-chat](https://huggingface.co/cyberagent/calm3-22b-chat)と、これをベースとしてロールプレイ用にファインチューニングしたモデルである[Aratako/calm3-22b-RP-v0.1](https://huggingface.co/Aratako/calm3-22b-RP-v0.1)をマージして作成したモデルです。
26
+
27
+ 利用した学習データセットやパラメータ等の詳細は元モデルのモデルカードを参照してください。
28
+
29
+ ## プロンプトフォーマット
30
+ 元モデルから変更なく、ChatMLのフォーマットでご利用ください。以下は2ターン目の会話を行う際の形式です。
31
+ ```
32
+ <|im_start|>system
33
+ {ロールプレイの指示、世界観・あらすじの説明、キャラの設定など}<|im_end|>
34
+ <|im_start|>user
35
+ {userの1ターン目の入力}<|im_end|>
36
+ <|im_start|>assistant
37
+ {assistantの1ターン目の応答}<|im_end|>
38
+ <|im_start|>user
39
+ {userの2ターン目の入力}<|im_end|>
40
+ <|im_start|>assistant
41
+ ```
42
+
43
+ また、`tokenizer.apply_chat_template()`を使って自動で成形することも可能です。
44
+
45
+ ```
46
+ tokenizer = AutoTokenizer.from_pretrained("Aratako/calm3-22b-RP")
47
+ messages = [
48
+ {"role": "system", "content": "{ロールプレイの指示、世界観・あらすじの説明、キャラの設定など}"},
49
+ {"role": "user", "content": "{userの1ターン目の入力}"},
50
+ {"role": "assistant", "content": "{assistantの1ターン目の入力}"},
51
+ {"role": "user", "content": "{userの2ターン目の入力}"}
52
+ ]
53
+ prompt = tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)
54
+ ```
55
+
56
+ ## マージの詳細
57
+ マージに利用しているモデルは以下の通りです。
58
+ - [cyberagent/calm3-22b-chat](https://huggingface.co/cyberagent/calm3-22b-chat)
59
+ - [Aratako/calm3-22b-RP-v0.1](https://huggingface.co/Aratako/calm3-22b-RP-v0.1)
60
+
61
+ また、mergekitのconfigは以下の通りです。
62
+
63
+ ```yaml
64
+ models:
65
+ - model: cyberagent/calm3-22b-chat
66
+ # no parameters necessary for base model
67
+ - model: Aratako/calm3-22b-RP-v0.1
68
+ parameters:
69
+ weight: 0.5
70
+ merge_method: breadcrumbs
71
+ base_model: cyberagent/calm3-22b-chat
72
+ dtype: bfloat16
73
+ tokenizer_source: base
74
+ parameters:
75
+ density: 0.9
76
+ gamma: 0.01
77
+
78
+ ```
79
+
80
+ # ライセンス
81
+ 本モデルの学習データにはOpenAI社のGPT-4o-miniの出力やAnthropic社のClaude 3.5 Sonnetの出力が含まれるため、これらの競合となるサービスには本モデルは利用できません。
82
+ そのため、本モデルは[CC-BY-NC-SA 4.0](https://creativecommons.org/licenses/by-nc-sa/4.0/deed.ja)の元配布します。