---
base_model:
- llm-jp-3-13b
library_name: peft
license: apache-2.0
datasets:
- elyza/ELYZA-tasks-100
- ichikara-instruction
---
```
# 作者はGoogle Colab環境で実行
# 【これだけは環境に合わせて設定してください】elyza-tasks-100-TV_0.jsonl と結果の保存場所を指定する。
inputfile = "/data/data/elyza-tasks-100-TV_0.jsonl"
savefile = "/data/data/result.jsonl"
# # Google Colab の場合は上記の環境構築手順を行なわず、単にこのセルから実行していってください。
!pip uninstall unsloth -y
!pip install --upgrade --no-cache-dir "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.git"
!pip install --upgrade torch
!pip install --upgrade xformers
import pandas as pd
import numpy as np
from difflib import SequenceMatcher
from unsloth import FastLanguageModel
import torch
model_id = "fathom-llm/checkpoint-2000"
dtype = None # Noneにしておけば自動で設定
load_in_4bit = True # 今回は8Bクラスのモデルを扱うためTrue
# # FastLanguageModel インスタンスを作成
model, tokenizer = FastLanguageModel.from_pretrained(
model_id,
dtype=dtype,
max_seq_length = 1024,
load_in_4bit=load_in_4bit,
trust_remote_code=True,
)
# 元のタスクに対応したプロンプト(元のタスクとの類似度によってプロンプトを設定)
instruction_data = [
{'input': '仕事の熱意を取り戻すためのアイデアを5つ挙げてください。', 'instruction': '以下のタスクでは、特定の状況や課題に対して役立つアイデアを挙げてください。提案するアイデアは実用的で、具体的かつ多様性のあるものにしてください。また、それぞれのアイデアがどのように役立つのか簡潔に説明してください。'} ,
{'input': 'クマが海辺に行ってアザラシと友達になり、最終的には家に帰るというプロットの短編小説を書いてください。', 'instruction': '以下のタスクでは、指定されたテーマやプロットに基づいて短編小説を作成してください。物語の流れが自然で、登場人物や舞台が魅力的に描かれるように心掛けてください。また、プロットの重要な要素を漏れなく盛り込み、読者を引き込む物語を完成させてください。'} ,
{'input': '古代ギリシャを学ぶ上で知っておくべきポイントは?', 'instruction': '以下のタスクでは、与えられたテーマについて重要なポイントをいくつか挙げ、それぞれを簡潔かつ具体的でわかりやすく説明してください。'} ,
{'input': '以下の説明を読んだユーザーが感じるであろう疑問とは?\r\n\r\n大量のゴミの処理にお困りではありませんか?\r\n\r\n「生産で出るゴミ処理費用が大幅にかかっている」\r\n「指定ゴミ袋が導入され、一気にコストが上がってしまった」\r\n「工場が狭いので、ゴミ保管スペースを減らしたい」\r\n「ISO14001でゴミ削減が大きな課題となっている」\r\n\r\n場所をとる嵩張るゴミをつぶしてまとめて運びやすい形にすることで、処理・保管・運搬にかかる様々なコストを削減したり、環境負荷の低減にも貢献できるのが、廃棄物圧縮減容機→『ゴミ圧縮機』です。\r\n\r\nゴミ圧縮機の主な用途は廃プラスチック・紙・段ボール・袋類・ペットボトル・プラスチック容器などつぶれるが元に戻ってしまうゴミを圧縮梱包します。', 'instruction': '以下のタスクでは、提示された説明文を読んだユーザーが感じる疑問を想定してください。説明文の内容や不足している情報をもとに考えをまとめてください。'} ,
{'input': '次に読むべきSFを10冊挙げて', 'instruction': '以下のタスクに実在する具体例をもとに回答してください。回答は必要に応じてリスト形式で整理し、それぞれの項目に短い説明や理由を添えてください。タスクが特定のジャンルに関するものであれば、そのジャンルの特徴を考慮した回答を心がけてください。'} ,
{'input': '次の文章を読んで、その人がどの程度怒っているか、1?10の尺度で評価してください。(1=怒っていない、10=非常に怒っている)。\r\n\r\n1. またテストで赤点か。君は全く...\r\n2. テストで赤点?今回は難しかったね。', 'instruction': '以下のタスクでは、与えられた内容を評価するための具体的な基準を明示してください。回答は、指定された尺度や形式に基づいて行い、可能であれば評価の理由や背景も簡潔に補足してください。評価の際は、文章や文脈に込められた感情や意図を的確に解釈してください。'} ,
{'input': 'こうして社会の秩序は政治家や教師や警官による物理的な強制のほか、メンバー個々人の自発的な意志にも支えられています。実際、学校の授業が自習になったときや、誰もいない場所で信号待ちをしているとき、誰も見ていない道端でタバコを捨てたくなったときなど、教室で大騒ぎをし、堂々とタバコを投げ捨てることが可能であるにもかかわらず、そうすることになんらかの躊躇を感じる人が大半だと思います。(傍若無人にふるまう人もいますが。)\r\n\r\n上記の文章を読んで、 に入れるのに最も適したものを以下の選択肢から選び、その理由を答えなさい。\r\n\r\n- だから\r\n- また\r\n- むしろ\r\n- もちろん', 'instruction': '以下のタスクでは、提示された文章や文脈を分析し、指定された形式に基づいて回答してください。選択肢から最適な答えを選び、その選択が適切である理由を簡潔かつ明確に説明してください。回答の際には、文章全体の流れや意味を踏まえ、選択肢ごとのニュアンスや適合性を考慮してください。'} ,
{'input': '以下の表から、すべての科目名を抽出してください。\r\n| 科目名|講師名|教室名\r\n| 微積分学101|田中教授|202号室\r\n| 美術史|山田(代理)|ホールA', 'instruction': '以下のタスクでは、与えられたリストや文章から特定の情報を抽出してください。該当するものだけを正確に取り出して箇条書きで記述してください。'} ,
{'input': '以下の記事から日付をすべて抽出せよ。\r\nあすから今冬一番の寒波 “10年に一度の低温に” 大雪に備えを\r\n\r\nこの冬一番の非常に強い寒気が流れ込むため、24日から北日本から西日本の日本海側で大雪や猛吹雪となるほか、ふだん雪の少ない太平洋側の平地でも大雪となるおそれがあります。\r\n全国的に10年に一度程度の低い気温になる見込みで、路面や水道管の凍結による被害が出るおそれもあります。予定の変更を検討するなど、大雪や低温への備えを進めてください。\r\n\r\n気象庁によりますと、日本付近は24日から26日 木曜日ごろにかけて冬型の気圧配置が強まり、北日本から西日本の上空には、この冬一番の非常に強い寒気が流れ込む見込みです。\r\n\r\nこのため、北日本から西日本の日本海側を中心に大雪や猛吹雪となり、短時間で積雪が急激に増えるおそれがあります。', 'instruction': '以下のタスクでは、提示された文章やデータから特定の情報を抜き出してください。抽出対象の情報を正確にすべてリストアップし、余計な情報は含めないでください。他の類題にも対応できるように、指定された形式や条件に基づいて答えることを心がけてください。'} ,
{'input': '以下の映画タイトルのリストが与えられたとき、タイトルに含まれる都市名をすべて書き出しなさい。\r\n・バンクーバーからの挑戦\r\n・ロンドンの夢\r\n・織田信長の生涯', 'instruction': '以下のタスクでは、与えられたリストや文章から特定の情報を抽出してください。該当するものだけを正確に取り出して箇条書きで記述してください。'} ,
{'input': '以下の製品について、Facebookで流す広告を書いてください。子供のいる親をターゲットにして、キャッチーにしてください。\r\n【製品概要】\r\n子供のためのGPSトラッカー。音声通話ができる。', 'instruction': '以下のタスクでは、概要に基づいた内容を盛り込んて、指定された製品やサービスを宣伝するための5行程度のメッセージを作成してください。ターゲット層に応じた表現を使用し、キャッチーで興味を引く内容に仕上げてください。'} ,
{'input': 'このボットは、質問に皮肉たっぷりに答えてくれるチャットボットです。\r\nユーザー: 1キログラムは何ポンドですか?\r\nボット: またこれですか? 1キログラムは2.2ポンドです。よくメモしておいてくださいね。\r\nユーザー: HTMLって何の略ですか?\r\nボット:', 'instruction': '以下のタスクでは、それまでのチャットボットのトーンを反映した短い返答をしてください。'} ,
{'input': 'IMEとして機能してください。\r\n\r\nあなたのタスクはローマ字入力されたアルファベット列を単語ごとにひらがなに変換し、それぞれの単語を漢字に変換する候補を最大3つ提示することです。\r\n\r\n以下に例を示します。\r\n\r\n```\r\ninputs:\r\nk, y, o, u, h, a, a, m, e, p, p, o, i\r\n\r\noutputs:\r\n- きょうは: 今日は, 教派, 京は\r\n- あめ: 雨, 飴, アメ\r\n- っぽい: っぽい, ッポイ\r\n```\r\n\r\nそれでは、入力を開始するので、IMEとして出力を表示してください。\r\n\r\ninputs:\r\nj, u, u, b, u, n, o, s, h, o, s, e, k, i', 'instruction': '以下のタスクでは、ローマ字をひらがなへ変換した後、単語へ分割して、提示されたフォーマットに従って漢字変換候補の提示するタスクです。出力には、必要に応じて複数の候補を提供し、指定された形式やルールに従うように注意してください。'} ,
{'input': 'これは悟りを開いたブッダとの会話です。知恵と愛に満ちていた会話をしてください。\r\n私: どうしたら、より大きな平和と平穏を得ることができますか?\r\nブッダ:', 'instruction': '次のタスクでは、キャラクターの設定と会話相手の質問が提示されます。与えられた会話の問いにキャラクターの神秘的な返答を提供してください。'} ,
{'input': '次のストーリーについての質問に答えてください。\r\nある日、6人の盲人が象を触ってその正体を突きとめようとしました。\r\n\r\n1人目は象の鼻に触り、「象とは蛇のようなものだ」と言いました。\r\n\r\n2人目は象の耳に触り、「象とはうちわのようなものだ」と言いました。\r\n\r\n3人目は象の足に触り、「象とは木の幹のようなものだ」と言いました。\r\n\r\n4人目は象の胴体に触り、「象とは壁のようなものだ」と言いました。\r\n\r\n5人目は象のしっぽに触り「象とはロープのようなものだ」と言いました。\r\n\r\n6人目は象の牙に触り、「象とは槍のようなものだ」と言いました。\r\n\r\nそれから6人の盲人たちは長いこと言い争い、それぞれが自分の意見を譲りませんでした。\r\n\r\nQ: この物語の教訓は何ですか?', 'instruction': '以下のタスクでは、提示された物語や文章の内容を分析し、質問に対して明確で論理的な回答を提供してください。回答は、物語の文脈や教訓、背景に基づき、深い洞察を含めるようにしてください。'} ,
{'input': '以下のメールに返信してください。\r\nお疲れ様です。\r\n本日体調不良により、予定より到着が少し遅れてしまいそうです。\r\n遅くとも13時過ぎには着くと思います。\r\nご迷惑をおかけして恐縮ではございますが、 何卒ご容赦いただけますようお願い申し上げます。', 'instruction': '以下のタスクでは、相手の内容に具体的に応えるようにしてください。'} ,
{'input': 'これは演劇のシナリオです。\r\n要約: ある日、主人公の父親が突然亡くなり、主人公は父親の遺産を相続することになります。しかし、父親の遺産は、父が生前に作った演劇の脚本でした。\r\n主人公は、父親が作った演劇の脚本を読み始めると、父親の過去の出来事が明らかになります。そして父の過去が、主人公の人生に大きな影響を与えていきます。\r\n\r\n以上の文章をCM風に言い換えてください。', 'instruction': '以下のタスクでは、提示された文章や要約を、指定された形式やスタイルに言い換えてください。言い換えには、指定された目的や感情を引き出す要素を含め、内容が簡潔でわかりやすいものになるよう注意してください。広告、CM、プレゼンテーションなどの特定の目的に応じたトーンを取り入れることを心がけてください。'} ,
{'input': '「スタート地点から西に向かって歩き、交差点で南に曲がりしばらく歩くとゴール地点に着いた」という場面を想像して、以下の問いに答えてください。\r\n\r\n1. 交差点で左右どちらに曲がりましたか?\r\n2. スタート地点はゴール地点から見てどの方角にありますか? 東西南北八方位で答えてください。', 'instruction': '以下のタスクでは、スタート地点からゴール地点への道順を追跡し、指示に基づいて移動方向と位置関係を特定してください。方角に注意して、正確に答えてください。'} ,
{'input': 'こんな感じでパラフレーズして。\r\n\r\n源頼朝が征夷大将軍に就任。これによって鎌倉幕府の開設が完了したともされる(1192年 - 建久3年7月12日)\r\n言い換え:\r\n1192年の7月12日に源頼朝が征夷大将軍に就任して、鎌倉幕府ができたんだって!\r\n\r\n1928年 - 三井財閥の大番頭・中上川彦次郎の娘・あきがテノール歌手・藤原義江を追ってミラノへ出発。「世紀の恋」と話題になる。\r\n言い換え:', 'instruction': '以下のタスクでは、指定された目的に合った形に調整してください。フォーマットを維持してください。'} ,
{'input': '次の質問に答えてください。\r\n缶コーヒーの多くはどのような形をしていますか?一番近いものを選んでください。\r\nA) 円\r\nB) 円錐\r\nC) 円柱\r\nD) 円環', 'instruction': '以下のタスクでは、提示された質問に対して、最も適切な回答を選択肢から選び、その理由も簡潔に説明してください。'} ,
{'input': '水素とヘリウムはどのように違うか、次の事実を用いて説明してください。\r\n\r\n宇宙は情報でできている\r\n\r\n水素は可燃性だが、ヘリウムは難燃性だから爆発しない。\r\nともに常温では空気よりも軽い気体であり、難燃性のヘリウムはよく風船などに使われる。\r\n\r\nしかし決定的な違いは、原子番号だ。水素は1で、ヘリウムは2である。\r\n\r\n水素とヘリウムは、なんとなく似ていると思うかもしれない。\r\nでは鉄はどうか。性質はなにもかも違う。しかし決定的な違いは、鉄の原子番号は26だということだ。\r\nでは金は?原子番号は79。プラチナこと白金は78、水銀は80である。\r\n\r\nこの原子番号の違いとは何か。\r\nそれは原子核を構成する陽子の数と、その周囲を取り囲む電子の数を意味する。電荷をもたない通常の原子の場合、陽子の数と電子の数は一致している。\r\n\r\n逆に言えば、その違いしかない。', 'instruction': '以下のタスクでは、提示された事実や情報を用いて、指定されたテーマについて簡潔かつ分かりやすい説明を作成してください。'} ,
{'input': '私は非常に賢い質問応答ボットです。真実に根ざした質問をすれば、答えを返します。もしナンセンスな、あるいは明確な答えのない質問をした場合、「分かりません」と答えます。\r\n\r\nQ: 日本の人間の平均寿命は?\r\nA: 男性では約80歳、女性では約87歳です。\r\nQ: 水平線までの距離は?', 'instruction': '以下のタスクでは、質問がどういったものか復唱し、理由とともに回答を生成してください。'} ,
{'input': '伊勢神宮は何県?', 'instruction': '以下のタスクでは、質問に対して正確で簡潔な回答を提供してください。質問が特定の事実を求めている場合には、最も関連性の高い情報を提示してください。曖昧な質問や不明瞭な内容の場合は、その旨を説明するか、答えを控える形で応答してください'} ,
{'input': '以下の内容を小学生に向けて説明してください。\r\n\r\n衆議院は、1890年に明治憲法の施行に伴い設立された、日本の下院に相当する議院です。この「下院」は「上院」と対になる言葉ですが、必ずしも権限の強弱を表す言葉ではありません。むしろ我が国においては、下院である衆議院の方が上院の参議院よりも権限が強いとされています。これは、衆議院には解散があり、且つ任期も短いことから、より国民の意見を反映した議院となると考えられているからです。\r\n\u3000一般的に、下院は人民の代表によって構成される国が多く、上院は貴族(我が国では皇族や華族)のような地域の代表によって構成されていた事が多かった議院なのです。つまり、上院・下院の違いは構成する人間の選出方法の差だったわけですね。ただ、現在は貴族院を持たない国が増えたので、上院と下院の人材的な差は昔と比べ少なくなったと言えるでしょう。', 'instruction': '以下のタスクでは、提示された内容を指定された対象に向けて説明してください。具体性のある理解しやすいものにしてください。'} ,
{'input': '以下のカスタマーとオペレータの会話を要約してください。カスタマーの不満について述べるようにしなさい。\r\nカスタマー: すいません、ちょっとあのクレジットカードの契約を確認したいんですけど、\r\nオペレータ: かしこまりましたクレジットカード契約の確認のお問い合わせですね。\r\nカスタマー: はい。\r\nオペレータ: そういたしましたら、冬、クレジットカード番号はわかりますか。\r\nカスタマー: はいわかります。\r\nオペレータ: お聞きしてもよろしいでしょうか?\r\nカスタマー: はい。1111223334444です。\r\nオペレータ: かしこまりました。そういたしましたらご契約者様の電話番号お願いいたします。\r\nカスタマー: 電話番号は0802223333です。\r\nオペレータ: かしこまりました。\r\nオペレータ: ただいま契約受いただいた情報に基づいて契約状況お調べいたしますので、お待ちください。\r\nオペレータ: お待たせしました。確かに契約内容確認できました。ご契約いただいてるカードは、\r\nオペレータ: スタンダードタイプのカードになります。\r\nカスタマー: なるほど、わかりました。', 'instruction': '以下のタスクでは、提示された会話や文章を指定された視点や目的に基づいて要約してください。要約には、指示された要素を含め、簡潔かつ的確にまとめてください。'} ,
{'input': '質問: 太郎くんはりんごを5つ持っています。彼はさらに2つのりんごの箱を買いました。1つの箱には3つのりんごが入っています。太郎くんは何個のりんごを持っていますか?', 'instruction': '以下のタスクでは、提示された問題に正確かつ論理的に答えてください。最終的な答えをわかりやすく提示してください。'} ,
{'input': '1から500までの数字を入力するのに何回キーボードを叩く必要があるでしょうか?\r\n\r\n1桁の数字を入力するには1回、2桁の場合は2回、3桁の場合は3回キーボードを叩く必要があるものとします。\r\n\r\n選択肢: (a) 1156 (b) 1392 (c) 1480 (d) 1562 (e) 1788\r\n', 'instruction': '以下のタスクでは、与えられた条件やルールに基づいて問題を解き、最も適切な回答を選択肢から選んでください。計算や推論が必要な場合は、ステップごとに論理的に進め、正しい答えを導き出してください。解答は簡潔にまとめるとともに、選択肢形式の問題に対応するように構成してください。'} ,
{'input': '鉛筆は水に沈みますか?', 'instruction': '以下のタスクでは、提示された質問に対して、できるだけ正確で簡潔な回答を提供してください。質問が科学的、論理的、または事実に基づくものであれば、信頼できる知識をもとに答えてください。不明確な場合は、その理由を説明するか、補足情報を提供してください。'} ,
{'input': '次の文章は正しいですか?\r\n本田圭佑は高校生の時に甲子園で優勝した。', 'instruction': '以下のタスクでは、提示された文章が事実に基づいて正しいかどうかを判断してください。'} ,
{'input': '下の会話は音声認識を行った結果で誤りを含んでいる可能性があります。自然な会話に直してください。\r\n\r\nカスタマー: すいません。ちょっと投資信託を始めたいと思ってるんですけど、\r\nオペレータ: かしこまりました新宅空\r\nオペレータ: ですね\r\nオペレータ: お口座、\r\nオペレータ: ご予定お伺いしてもよろしいでしょうか?', 'instruction': '以下のタスクは、変換の誤りを音の近い自然な表現に修正するタスクです。最後に訂正した文章を示してください。'} ,
{'input': 'ガラスを使い捨てライターで炙ったら燃えますか?', 'instruction': '以下のタスクでは、提示された質問に対して論理的に回答してください。'} ,
{'input': 'あなたは先輩と後輩の3人のチームで働いています。先輩は社内の知識に長けていて、後輩は愛嬌がありコミュニケーションが得意です。\r\n\r\nあなたは取引先から契約書Xへの押印を求められました。どうしますか?', 'instruction': '以下のタスクでは、提示された状況や設定に基づいて、適切な行動計画や意思決定を提案してください。提案は、設定された条件や役割を考慮し、現実的で実行可能なものにしてください。'} ,
{'input': 'あなたはゲーム会社のプランナーです。新しいアクションゲームを企画することになりました。ゲームのコンセプトを考えてください。', 'instruction': '以下のタスクでは、指定された役割や状況に基づいて、魅力的なアイデアを提案してください。指示の条件を必ず守ってください。'} ,
{'input': '「今日は少し雨が降っている。外出するのは億劫だけど、近くのコンビニまで買い物をしなければならない。傘を持っていくかどうか迷う。」\r\n\r\nこのシチュエーションで、以下の2つの選択肢のメリットとデメリットについて説明してください。\r\n\r\nA. 傘を持っていかない\r\nB. 傘を持っていく', 'instruction': '以下のタスクでは、提示されたシチュエーションや選択肢について、それぞれのメリットとデメリットを分析し、具体的かつ論理的に説明してください。選択肢の評価には、状況や条件を考慮し、バランスの取れた視点で回答してください。'} ,
{'input': '与えられた文について、なぜそのような行動をしたかの理由を推測してください。\r\n\r\n---\r\n\r\n「もう、いい加減にして!」というと彼女は突然立ち上がって、部屋を出ていった。', 'instruction': '以下のタスクでは、登場人物の行動の理由として具体的な状況を推測してください。'} ,
{'input': 'あなたは、友人から「最近物忘れがひどくて困っている」と相談を受けました。どのような返事をしますか?', 'instruction': '以下のタスクでは、提示された状況や相談に対して、フレンドリーな返事を考えてください。'} ,
{'input': '新しいレストランに行きました。メニューを見て、以下の2種類のパスタのどちらを注文するか迷っています。どちらを選ぶべきか、理由を説明してください。\r\n\r\n・トマトソースのスパゲッティ\r\n・クリームソースのペンネ', 'instruction': '以下のタスクでは、選んだ選択肢を選択した理由とともに提案してください。'} ,
{'input': 'ある男性が、高校時代に好きだった女性に再会した。彼女は結婚して子供もいて幸せそうだった。男性は彼女に告白しようと思っていたが、その機会を逃してしまった。彼は後悔しながら、OOとつぶやいた。\r\n\r\nOOにはあることわざが入ります。何でしょう?', 'instruction': '以下のタスクでは、提示された文脈に適した言葉やフレーズを推測し、適切に埋めてください。回答は、状況や感情を考慮し、文脈に最も自然に合うものを選んでください。'} ,
{'input': '山田太郎は、宇宙軍の曹長だった。\r\nこの文に現代として考えられない要素は含まれていますか?', 'instruction': '以下のタスクでは、矛盾点や現実的ではない要素を特定し、理由を説明してください。'} ,
{'input': 'ナイジェリア、ロシア、エジプトの共通点は?', 'instruction': '次のタスクに緩い関連を含めて回答してください。'} ,
{'input': '82歳の男性が24歳の友人と、ここ数十年で政治がどれだけ変わったかについて話していました。\r\nQ: 誰が政治の変化を批判しているのでしょうか?\r\n選択肢\r\n- 82歳の男性\r\n- 24歳の友人\r\n- 情報不足', 'instruction': '次のタスクを状況を俯瞰しながら論理的に考えてください。'} ,
{'input': 'AさんとBさんは同じ会社で働いています。二人はそれぞれ、仕事でコンピューターを使う必要があることがあります。しかし、そのコンピュータはあまり高性能ではありません。二人が同時にログインすると、たいていクラッシュしてしまいます。そこで、会社は午前中はAさんだけ、午後はBさんだけがパソコンを使うことを許可すると宣言しました。翌日、AさんとBさんはどちらも寝坊して13時からコンピュータで仕事を始めました。そしてその日コンピュータはクラッシュしてしまいました。誰がコンピュータをクラッシュさせてしまったのでしょうか?', 'instruction': '次のタスクに対して論理的に回答してください。'} ,
{'input': '次の文のうち、どちらがより意味が通じるでしょうか。\r\n選択肢1: 男が刑務所に行ったのは、ガソリンスタンドを襲ったからだ。\r\n選択肢2: 男がガソリンスタンドに強盗に入ったのは、刑務所に入ったからだ。', 'instruction': '次のタスクでは、理由を含めて一般論として論理的に回答してください。'} ,
{'input': '日本語では2つの漢字が組み合わさることで熟語となり、新しい意味を持ちます。\r\n新しく熟語を与えるので、その意味を想像してみてください。\r\n杯伝', 'instruction': '以下のタスクでは、それぞれの単語の意味を組み合わせた意味を考えて回答してください。'} ,
{'input': '2つの文字列で連続した最長共通部分文字列の長さを求めよ。\r\n\r\n文字列1: あえおかささででした\r\n文字列2: ばつえおかさでくした', 'instruction': '次のタスクでは、共通部分についての文字列の長さを答えてください。'} ,
{'input': '以下の例文はジョーク(皮肉)を言っていますか?\r\nそんなに落とし物をするなんて、今日は重力が強いのかな?', 'instruction': '次のタスクでは、どうしてそうなるのかを理解した上で回答してください。'} ,
{'input': '木曜日の5日後は何曜日でしょう?', 'instruction': '次のタスクでは、正確な回答をしてください。'} ,
{'input': 'この文において「彼」が指すものは何でしょう?曖昧である場合は曖昧であると答えてください。\r\n男は重い病気に罹り、医者は余命を宣告した。彼の心情を考えると胸が苦しくなる。', 'instruction': '次のタスクでは、与えられた文章をもとに正確に回答してください。'} ,
{'input': '括弧が正しく閉じられるように、次の配列を完成させてください。\r\n[ < < { } > [ { [ ] ', 'instruction': '与えられた記号の後ろに閉じ括弧に追加して、全体を示してください。'} ,
{'input': '以下の文はある数式を自然言語で表したものです。元の数式を四則演算の数式として表してください。\r\n1を3で割った結果に33を足して、210を掛ける。最後に100で割る。', 'instruction': '以下の自然言語で記述された文を、四則演算の数式に変換してください。演算の順に括弧を使用してください。'} ,
{'input': 'ネットスラングでは、似た音を持つ別の短い表現に表されることがあります。例えばサーバーは鯖(さば)と表現されます。\r\n「消防 」というネットスラングはどのような意味を持つでしょうか?', 'instruction': ''} ,
{'input': '架空の言語「エクル語」と日本語の関係をいくつか示します。\r\n1.\r\nエクル語: ダスインガ ウタ\r\n日本語: 彼が水を飲む\r\n2.\r\nエクル語: ダストン ウタ\r\n日本語: 彼は水を運んだ\r\n3.\r\nエクル語: ダスデル\r\n日本語: 彼は走った\r\n4.\r\nエクル語: クルデル クルインガ ウタ\r\n日本語: 子供が走って水を飲んだ\r\n\r\nここから推測して以下のエクル語を日本語に直してください。\r\n5.\r\nエクル語: クルデル クルトン', 'instruction': ''} ,
{'input': 'RGB(255, 0, 0)は赤色, RGB(255, 255, 255) は白色を表します。ではRGB(200, 200, 0)は何色でしょう?', 'instruction': ''} ,
{'input': 'あの、娘がやっているあのキ、チックトック?チックトッカー?っていうのは何なんですか?', 'instruction': '以下の質問では質問者が詳しくないことを加味して、質問者が意味するものを説明した後、シンプルな言葉で回答してください。'} ,
{'input': '今日の夕方、東京タワーに行くことはできる?\r\nという問いに答えるのに十分な情報はどれですか?\r\n\r\n情報1: 今日は3/1(金)で、明日は祝日だ。\r\n情報2: 東京タワーの営業状況について: 新型コロナウイルス感染拡大防止の為、営業時間を変更致します。 平日は21時まで、祝日は19時までの短縮営業となります。\r\n\r\n選択肢:\r\n- 情報1のみで十分で、情報2のみでは不十分\r\n- 情報2のみで十分で、情報1のみでは不十分\r\n- 情報1と2の両方で十分\r\n- 情報1, 2のどちらかのみで十分\r\n- 情報1, 2のどちらでも不十分', 'instruction': '次のタスクでは、与えられた情報から特定ができなければ「情報1または2のどちらでも不十分」としてください。'} ,
{'input': '以下の文章から、話者の推測や感想を除いた客観的な事実のみを抽出してください。\r\n\r\n今日は雨だから遠足は中止になるだろうな? お菓子を買ったから皆と食べようと思ってたのに残念', 'instruction': '次のタスクでは、指示に従って理由とともに回答してください。'} ,
{'input': 'あなたは救急隊員として働いていますが、実は不死身の救急隊員です。1000年前の戦場で初めて負傷兵を治療して以来、あなたは年を取らず、世界の発展を遠くから見守ってきました。\r\nQ: あなたは年々、シワが増えていますか?', 'instruction': '次の質問に対して、設定を反映させた答えを考えてください。'} ,
{'input': '「必ず時間は守ります」葵と悠が手を繋いで歩き出すと、善吉は口調を荒げ「ふざけるな!娘をどうするつもりだ!」と捲し立てた。悠は「私は彼女を愛しています。私たちは結婚したんです。」と堂々と答えた。\r\n\r\nこの文章において、善吉は悠にとっての何ですか?', 'instruction': '以下の文章を読み、登場人物の関係性を推測してください。発言が誰に向けたものかを加味して答えてください。'} ,
{'input': '自動運転に懐疑的な太郎は、友人と「2030年以降、ほとんどの道路を自動運転車が走ることはないだろう」という賭けをした。 翌日、太郎は自動運転車のコンピュータ・ビジョン・システムに不可欠なライダー(LIDAR)技術に関する最新研究を紹介する会議に出席した。その後太郎は友人に賭けをなかったことにしないかと持ちかけた。 次のうち妥当なものを選んでください。\r\n選択肢:\r\n- 太郎はLIDARの会議で自動運転車の会社に投資した。\r\n- 太郎はまだ、自動運転車は今世紀中にうまくいかないと考えている。\r\n- 太郎は、LIDAR技術がうまくいかないことを示唆する何かを会議で学んだ。\r\n- 太郎は会議で自動運転技術の実現可能性に関する信念を変えなかった。\r\n- 太郎は会議で何かを学び、LIDAR技術に驚いた。', 'instruction': '次のタスクは与えられた状況から、最も適切な選択肢を選び理由を含めて回答してください。'} ,
{'input': '比喩を用いた文1が与えられます。文2が文1の正しい言い換えでしょうか?はいかいいえで答えてください。\r\n\r\n文1: この車はすごくガソリンを食う\r\n文2: この車は美味しそうにガソリンを食べる', 'instruction': '次のタスクを理由含めて回答してください。'} ,
{'input': '以下は2人での会話ですが、誰が何を言ったかは記されていません。\r\n\r\nまあ、そうですね。では今週はこれくらいにして、また来週の会議で話しましょう。え?来週は祝日だって?はい、勤労の日です。あーなるほど。来週の他の曜日はどうですか? ちょっと来週はどこも埋まっちゃってますね。そうですか、では再来週にしましょう。\r\n\r\nここで、「え?来週は祝日だって?」と「ちょっと来週はどこも埋まっちゃってますね。」は同じ人の発言ですか?', 'instruction': '以下のタスクでは、発言者の意図を考え、文脈を広く捉えて理由とともに答えてください。'} ,
{'input': 'Bさんの発言は「はい」か「いいえ」で言い換えるとどちらですか?\r\nAさん: 準備はできましたか?\r\nBさん: 大丈夫です。\r\n\r\nまた、Dさんの発言は「はい」か「いいえ」で言い換えるとどちらですか?\r\nCさん: 手伝いましょうか?\r\nDさん: 大丈夫です。', 'instruction': '以下のタスクでは、ある発言をがどちらに相当するかを判断してください。発言の意図とともに答えてください。'} ,
{'input': '次の指示に従った場合、あなたはスタート地点に戻っていますか?\r\n\r\n常に前を向いていてください。1歩下がって。2歩左へ行って。2歩下がって。6歩前進して。3歩、いや2歩右に進んで。', 'instruction': '以下のタスクでは、最後に原点にいるかを確認し、最後に指示に回答してください。'} ,
{'input': 'サマると8つということですね。\r\n上の文における「サマる」とはどのような意味でしょうか?', 'instruction': '以下のタスクでは、この言葉が何を意味しているかを考え、理由とともに説明してください。'} ,
{'input': '下の表はペンギンについてまとめたものです。\r\n\r\n名前, 年齢(歳), 身長(cm), 体重(kg)\r\nルイ, 7, 50, 11\r\nベルナール, 5, 80, 13\r\nヴィンセント, 9, 60, 11\r\nグエン, 8, 70, 15\r\n\r\n例えば、ルイの年齢は7歳、グエンの体重は15kg、ベルナールの身長は80cmです。\r\n\r\nQ: 一番老いているペンギンは誰ですか?', 'instruction': '以下のタスクでは、与えられた表をもとに、質問に正確に回答してください。'} ,
{'input': '次の文章では、どこかの時点である記事から別の記事へと変わります。あなたのタスクはこの境界を推測し、別の記事に変わった最初の文を記述することです。\r\n\r\nキャットフードの種類が多くて迷いますが、毎日の食事選びの基本は、栄養過不足にならないよう、「総合栄養食」で「ライフステージに合ったもの」を選ぶことです。\r\n基本は「総合栄養食」のドライフードとお水だけでOK\r\nキャットフードには、ドライフードとウェットフードがあります。ドライフード(通称カリカリ)のほとんどは「総合栄養食」なので、フードとお水だけで、猫ちゃんに必要な栄養素を摂取できます。\r\n猫は狩猟動物ですから、狩猟本能が満たされない欲求不満や運動不足も大きなストレス源となります。\r\nキャットタワーやキャットウォークなど、猫が運動しやすい環境を整えてあげたいですね。\r\n猫がストレスを感じると、便秘や下痢、食欲不振、過度なグルーミングといったストレスサインが現れます。時には皮膚炎や膀胱炎といった病気を引き起こす場合もあります。\r\n長期的なストレスは免疫の低下にも繋がるので、「たかがストレス」と思わずに早めに原因を取り除くようにしましょう。\r\n\r\n', 'instruction': '以下のタスクは、文章の前半部と後半部のそれぞれ話題が何であるか読み解き、後半部の話題が最初に記述された文を特定するタスクです。'} ,
{'input': '昔はよく海に行っていたが、最近ではほとんど泳がない。\r\n上の文章を「滅多に」という言葉を使って言い換えてください。', 'instruction': '以下のタスクでは、最後に指定された言葉を必ず使用してください。'} ,
{'input': 'Q:私の目は黒く、髪は明るい黄色で、足元はしっかりと地面に根ざしています。私は太陽の光を顔に浴びるのが好きです。私の正体は何でしょう?\r\n', 'instruction': '以下のタスクでは、与えられたヒントをもとに、正体を推測してください。'} ,
{'input': '大喜利に挑戦してみましょう。大喜利とはお題に対して面白い回答を考える遊びです。大喜利のコツは色々とありますが、1つは「共感を呼ぶ答えをひとひねりする」ことです。誰もが経験したことや思ったことに対して、少し変わった視点や表現で回答することで、共感と笑いを誘うことができます。\r\n\r\n例えば、以下の例を見てみましょう\r\n\r\nお題: ナルシスト漁師の特徴を教えてください\r\n回答: キャッチ&キス&リリース\r\n\r\nこのお題では、「普通の漁師の特徴」の「キャッチ&リリース」に対して、ナルシストという観点からの捻りを加え、語感がいいようにまとめていて面白いです。\r\n\r\nそれでは、以下のお題について大喜利で答えてください。\r\nお題:初めてドラゴンを退治しに行くのですが、アドバイスをお願いします', 'instruction': '以下のタスクでは、短く回答してください。'} ,
{'input': 'リンゴとバナナはどのように似ていますか?', 'instruction': '次の質問に対して広い視野で正確に回答してください。'} ,
{'input': '仮説: 2人の男女が、赤い薔薇を眺めています。\r\nある前提からこの仮説が導けるかを1~5で評価すると、3になります。どのような前提でしょうか?', 'instruction': '提示された評価の数値に応じて、生成した前提から仮説が導ける回答をしてください。'} ,
{'input': 'クイズを作ったのですが、選択肢が思いつきません。QとAを教えるので、それに相応しい選択肢を5つ作ってください。\r\nQ: 主に子ども向けのもので、イラストのついた物語が書かれているものはどれ?\r\nA: 絵本', 'instruction': 'クイズには正解は一つしか存在しません。以下のタスクでは、正解Aとは無関係な単語の選択肢を並べてください。'} ,
{'input': '和訳後の不自然な文が与えられます。自然な文に直してください。\r\n\r\n和文: 攻撃は驚きを持ってプレイヤーを取った、彼はゲームが終わって、彼の対戦相手が勝つだろうと言うので、彼はちょうど何を決めたのですか?', 'instruction': '以下のタスクでは、指示された文章を示してください。'} ,
{'input': 'ある生徒が記事の要約をしました。この要約をより良く直してください。\r\n\r\n記事:\r\n小売店や飲食店では、税抜き価格が強調されている一方で、税込み価格が小さく書かれているケースが比較的多く見受けられます。税抜き価格を強調する店が多いのはなぜでしょうか。考えられる理由について、教えてください。\r\n\r\n黒田さん「税抜き価格を強調することで、安く感じる顧客がいるため、結果として売り上げが伸びる可能性があることが考えられます。総額表示が義務付けられる前は、小売店や飲食店では、一般的に税抜き価格のみの表示が多かったです」\r\n\r\nでは、税込み価格を強調した場合、売り上げに影響が出る可能性があるということでしょうか。\r\n\r\n黒田さん「影響はあると思います。次のような表示が『総額表示』として認められます。\r\n\r\n(1)1万1000円(税込)\r\n(2)1万1000円(うち消費税額等1000円)\r\n(3)1万円(税込価格1万1000円)\r\n\r\nこれらの表記が並んでいた場合、(3)が目を引き、安く感じるのではないでしょうか。\r\n\r\n生徒の要約:\r\n小売店や飲食店では税込み価格が小さく書かれているケースが多いです。税込み価格を強調した場合、売り上げに影響が出る可能性があります。', 'instruction': '以下のタスクでは、与えられた記事の表現の問題点を述べ、要約をより良い形に修正してください。元の記事の重要なポイントを見逃さず、簡潔でわかりやすい要約にすることを目指してください。'} ,
{'input': 'レンタルビデオ屋で「ブルーレイはありません」と言われました。この発言が暗に意味することは何でしょうか?', 'instruction': '以下のタスクでは、文章の意図を注意深く分析してください。'} ,
{'input': '次の言葉を順に全て使って、1つの文を書いてください\r\n\r\n全力、安全、活用、軽減', 'instruction': '以下のタスクでは、指定された言葉を全て正確に使うことを心がけてください。'} ,
{'input': '次の検索クエリに最も相応しいページのタイトルを選んでください。\r\n\r\n検索クエリ: 竜のあごの下にある鱗のことで、目上の人を怒らせた時にここに触れると表現されるのは何でしょう?\r\n\r\n1. 竜の生態について\r\n2. 人を怒らせた時の対処方法\r\n3. 慣用表現一覧: 怒り・悲しみ', 'instruction': '以下のタスクでは、提示された文章の目的に着目して適切な選択をしてください。'} ,
{'input': 'あるQAのAをもとに、どんなQだったかを考えてください。\r\nA: ズボンとパンツは基本的に同じものを指し、現在明確な違いが定義されているわけではありません。 下着との区別をするためわざとズボンと表記している場合もあります。 間違いではないので、ズボンと呼んでもパンツと呼んでも問題ありません。 自由に呼びましょう。\r\n\r\n', 'instruction': '以下のタスクでは、回答の内容や文脈を分析し、質問者の意図を推測してください。'} ,
{'input': '「愛飲」を簡単な表現に言い換えて。', 'instruction': '次のタスクでは、正確で簡潔な回答をしてくだい'} ,
{'input': '「会場に女性がいた。」という文は「どこに女性がいた?」という疑問文に直すことができます。\r\nこのとき、 "会場" という単語は "どこ" という疑問詞タグを持ちます。疑問詞タグには いつ, どこ, だれ, なに, どれくらい があります。\r\n\r\nそれでは、「ドライバー」という単語はどのような疑問詞タグを持つでしょうか? 全て選んでください。対応するものがない場合は"なし"と答えてください。', 'instruction': '疑問詞タグは、その単語が疑問文でどのような質問に対応するかを示します。'} ,
{'input': 'マウスには (A) ネズミ, (B) 口, (C) コンピュータの入力機器 の3つの意味があります。下のそれぞれの選択肢ではどのような意味で使われているでしょうか?\r\n\r\n1. マウスウォッシュ\r\n2. マウスカーソル\r\n3. ミッキーマウス\r\n4. マウスパッド\r\n5. マウスピース\r\n6. マウスツーマウス法\r\n', 'instruction': '以下のタスクでは、用途を考えて対応する記号を答えてください。'} ,
{'input': '1. 彼は比類のない陸上選手だ。\r\n2. 彼は比較的に良い陸上選手だ。\r\n\r\n1の文が難しいので2の文に直そうと思っているのですが、これってあってますか?\r\n', 'instruction': 'このタスクではユーザーの意図や困り事を汲んで役に立つAIアシスタントとして振る舞ってください。ただし、物事を断定することには慎重な判断をしてください。'} ,
{'input': 'ティム: やあ、調子はどう?\r\nキム: いろいろやろうとしてたんだけど、また先延ばしにしちゃったよ。\r\nティム: 何をしようとしていたの?\r\nキム: 大学の課題だよ。どうにもやる気が出なくてね。\r\nティム: 集中できないなら、ポモドーロ・テクニックをするといいよ。\r\nキム: 何それ?\r\nティム: 25分作業して、5分休憩するのを繰り返すんだよ。一回あたりの作業時間が短くて集中できるよ。\r\nキム: うーん、集中っていうわけじゃないんだよね\r\nティム: じゃあ1日に5分だけでいいから机で課題をするっていうのはどう?\r\nキム: 5分じゃ何もできなくない?\r\nティム: 短い時間でもいいから机で作業するっていうのがポイントなんだよ。むしろもっとやりたい、くらいで止めておくと毎日続くもっと長い時間できるようになるよ。\r\nキム: 確かにそれならできるかも。ありがとう!\r\n\r\nQ: キムは何をやってみようとしていますか?また何故それをやろうとしていますか?', 'instruction': '以下では、二人の会話の後に問いが出題されます。'} ,
{'input': '「スキーストック 選び方」と検索しているユーザーが他に興味を持ちそうな検索クエリをいくつかあげてください。', 'instruction': '以下のタスクでは、与えられた検索クエリをもとに関連性の高い他の検索クエリを考えてください。このクエリを検索しているユーザーが興味を持ちそうな内容を想像し、関連するテーマやキーワードを含むクエリを複数挙げてください。'} ,
{'input': 'youtubeの台本を書くのを手伝ってください。\r\n\r\nタローとコタローという2人のキャラクターの対話ベースで進行します。\r\n\r\nタローは物知りで、コタローの疑問に答えてくれます。\r\n\r\n今回の動画は、映画スラムダンクを視聴者に薦める動画です。以下のポイントを押さえた脚本にしてください。\r\n\r\n- まるでスポーツの試合を見ているかのように迫力のあるバスケのシーン\r\n- 漫画の原作を読んだことのない人でも楽しめる、映画として完結しているストーリー\r\n- 来月に公開が終了する\r\n- 10行~15行程度の対話', 'instruction': '以下のタスクでは、2人の対話形式で進行し、指定された内容を会話に含めて10行程度で回答してください。'} ,
{'input': 'あなたは以下の道具を持っています。これらの道具を必要なだけ使って、今日の昼ごはんを準備してください。\r\n\r\nチラシ: 宅配ピザならピザジャンボ! S: 900円, M: 1200円, L: 1600円 電話番号も書いてある。\r\n鍵: 家の戸締りに使う\r\n携帯: 古いのでネット検索はできないが電話をするには十分\r\nポイントカード: ラーメン屋のポイントカード\r\n財布: 1000円しか入っていない。', 'instruction': '以下のタスクでは、指定された道具を使って条件を達成する方法を考えてください。道具の使い方やそれぞれの制約を考慮しながら、現実的な解決策を提案してください。'} ,
{'input': '以下のシチュエーションでの適切な発言をいくつか考えてください。\r\nシチュエーション: 誰かが無事に到着したとき', 'instruction': '以下のタスクでは、シチュエーションに合った自然な言葉遣いや雰囲気を重視し、複数の例を挙げてください。'} ,
{'input': '新入社員のオンボーディングをしています。\r\n\r\n会社のメールアカウントなどのITセットアップは概ね完了して、社内のドキュメントも閲覧できる状態です。また新人研修なども実施し、業務の説明などをそこで行う予定です。\r\n\r\n他に何かすべきことはありますか?特に新入社員が早く馴染めるようにするにはどうしたら良いでしょうか', 'instruction': '次のタスクに対して状況を俯瞰して、すでに行われている準備を考慮し、追加で行うべき施策について具体的なアイデアを挙げてください。'} ,
{'input': '次のリストを昇順で並び替えて。出力は入力と同じフォーマットのリストのみを返し、余計なことを喋らないで。\r\n\r\n[10, 92, 2, 5, -4, 92, 5, 101]', 'instruction': ''} ,
{'input': 'あなたは古代エジプトの貴族です。冠位によって割り振られた土地について税を納めようとしています。しかし、ある土地についてどの貴族が所有しているかを知りません。以下はその土地の形状と特徴です。\r\n- 南北に細長い\r\n- ナイル川から東に離れている\r\n- 西側は岩山になっている\r\nこの土地は誰が所有しているのでしょうか?', 'instruction': '以下のタスクでは、与えられた情報から分かる範囲で回答してください。'} ,
{'input': '「じまん」と「ほこり」、どちらの方がポジティブな意味を持っていますか?その理由も述べてください', 'instruction': '以下のタスクでは、与えられた言葉やフレーズの意味を比較し、質問に回答してください。'} ,
{'input': 'あなたは、小説の執筆者です。以下は小説の一文です。\r\n「風が強く吹いていた。」\r\nこの文章に対して、どのような表現を追加することで、風の強さがより強く表現できるか、答えを書いてください。', 'instruction': '以下のタスクでは、内容を強調することで読み手の想像力を引き立てる表現を回答します。'} ,
{'input': '小説のセリフを書くことを手伝ってください。物語の中で、主人公は学校生活での人間関係に問題があります。彼には母親がいますが、母親は彼に良い大学に行ってほしいという気持ちからハードな勉強を押し付けてしまっています。\r\n\r\nここで、最終的に主人公の気持ちを理解することができた母親のセリフを考えてください。\r\n', 'instruction': ''} ,
{'input': '「生き物デザイナー」という職業があります。これは、自分が考えたオリジナルの生き物をデザインし、実際にDNAを編集して作り出す仕事です。あなたが生き物デザイナーである場合、どんな生き物を作りたいですか?また、その生き物が持つ特徴や能力について説明してください。', 'instruction': '以下のタスクでは、与えられた設定になったつもりで、オリジナリティのある神秘的な提案をしてください。'} ,
{'input': '犬が「ワンワン」ほえるなど、音や声を直接表す言葉を「擬音語」、星が「きらきら」光るなど、ものや人の様子を直接表す言葉を「擬態語」といいます。\r\n\r\n下の文を読み、擬音語・擬態語をそれぞれリストアップしてください。\r\n\r\n窓辺に座り、ぼんやりと外を見ていると、パラパラと雨が降り始めました。ビシャビシャと音を立てる雨に、私は何でもない場面にワクワクした気持ちを抱きました。', 'instruction': '以下では、タスクの説明の後に分析する文章が提示されます。文章の中に含まれる特定の種類の言葉を分類し、リストアップしてください。'} ,
{'input': '以下の文章について、筆者がどのような意図でこの文章を書いたか、あなたならどのように解釈しますか。\r\n\r\n彼はバブル期に大金持ちになり豊かな生活に日夜明け暮れたが、バブル崩壊後にほとんどの資産と職を失った。彼女に出会ったのは、そんな人生が真っ暗になってしまっていたときだった。彼は現在アルバイトで貧しいながらも生計を立てているが、それでも彼は今が一番豊かだと言っている。', 'instruction': '以下のタスクでは、与えられた文章の展開から筆者の意図を俯瞰して分析し、物語のテーマを意識してください。'} ,
{'input': '花粉症の方々にとって、春は憂鬱な季節です。しかし、春には素敵な花や新緑もたくさんあります。そこで、花粉症でも春を楽しむコツを3つ考えてください。', 'instruction': '以下のタスクでは、与えられたテーマについて、具体的かつ実用的なアイデアを挙げるよう心掛けてください。'} ,
{'input': '漢字に対応する意味を選び、対応する数字とアルファベットのペアを解答してください。\r\n\r\n1. 立派\u3000A. すばらしい\r\n2. 開拓\u3000B. ある事柄について知っている内容。\r\n3. 知識\u3000C. 物事に味わいや価値を加える\r\n4. 賞賛\u3000D. 新しい領域を切り開く\r\n5. 味付け\u3000E. 高い評価を与える', 'instruction': '与えられた表記で回答してください。次のように漢字と対応する意味がテーブルで示されます。\\n1. 漢字 A. 対応する意味\\n2. 漢字 B. 対応する意味\\n3. 漢字 C. 対応する意味\\n4. 漢字 D. 対応する意味\\n5. 漢字 E. 対応する意味'} ,
{'input': '次の物語の展開を予想してみましょう。\r\n\r\nある日、主人公のもとに不思議な手紙が届きました。手紙には「今夜の満月に、森の奥深くにある洞窟に来てください。あなたを待っています。」と書かれていました。主人公はその手紙に従い、夜中に洞窟の入り口にたどり着きました。中に入ると、謎めいた人物と出会い……。', 'instruction': '以下のタスクでは、指定された登場人物になりきって回答してください。'} ,
{'input': '次の文は1つの物語の文の順番をシャッフルしたものです。適切な順に並び替えてください。\r\n\r\n1. 「果物だけではなく、人生も同じです。協力しなくては、全てをこなすことはできません。」\r\n2. 老人は、広い畑で色々な果物を育てていました。\r\n3. ある日、孫が老人に『こんなに広い畑で、全ての果物を一人で育てるのは大変そうですね』と尋ねました。\r\n4. 昔、あるところに老人と孫がいました。\r\n5. 老人は微笑みながら次のように答えました。\r\n', 'instruction': '以下のタスクでは、文脈や物語の展開を考慮し、ストーリーが自然になるように順序を整えてください。'} ,
]
df_elyza_inst = pd.DataFrame(instruction_data)
df_elyza_inst.loc[pd.isna(df_elyza_inst['instruction']), 'instruction'] = ''
tasks_original = df_elyza_inst['input'].values
# 一文ずつ分解
original_reform = []
for text in tasks_original:
temp = []
for t in text.split('。'):
if len(t) > 5:
temp.append(t)
original_reform.append(temp)
# 与えられるタスクの読み込み
import json
datasets = []
with open(inputfile, "r") as f:
item = ""
for line in f:
line = line.strip()
item += line
if item.endswith("}"):
datasets.append(json.loads(item))
item = ""
# 類似度の計算
import itertools
def calculate_similarity(query):
"""
優先順位1. scores1とscores2の両方が首位のもの
優先順位2. scores3が首位のもの
"""
query_reform = []
for t in query.split('。'):
if len(t) > 0:
query_reform.append(t)
scores1 = []
scores2 = []
for _, originals in enumerate(original_reform):
scores1.append(max([SequenceMatcher(None, t1, t2).ratio() for t1, t2 in itertools.product(query_reform, originals)]))
scores2.append(max([SequenceMatcher(None, t1, t2).find_longest_match().size for t1, t2 in itertools.product(query_reform, originals)]))
if np.argmax(scores1) == np.argmax(scores2):
return np.argmax(scores1)
else:
scores3 = [SequenceMatcher(None, query, text).find_longest_match().size / max(len(query), len(text)) for i, text in enumerate(tasks_original)]
return np.argmax(scores3)
# 学習したモデルを用いてタスクを実行
from tqdm import tqdm
# 推論するためにモデルのモードを変更
FastLanguageModel.for_inference(model)
# model.eval()
results = []
for dt in tqdm(datasets):
query = dt["input"]
max_idx = calculate_similarity(query)
instruction = df_elyza_inst.loc[max_idx, 'instruction']
if len(instruction) > 0:
prompt = f"""### 指示\n{instruction}\n\n{query}\n### 回答\n"""
else:
prompt = f"""### 指示\n{query}\n### 回答\n"""
inputs = tokenizer([prompt], return_tensors = "pt").to(model.device)
outputs = model.generate(**inputs, max_new_tokens = 1024, use_cache = True, do_sample=False, repetition_penalty=1.2)
prediction = tokenizer.decode(outputs[0], skip_special_tokens=True).split('\n### 回答\n')[-1]
results.append({"task_id": dt["task_id"], "input": '', "output": prediction})
# jsonlで保存
with open(savefile, 'w', encoding='utf-8') as f:
for result in results:
json.dump(result, f, ensure_ascii=False)
f.write('\n')
```