diff --git "a/result_test.tsv" "b/result_test.tsv" --- "a/result_test.tsv" +++ "b/result_test.tsv" @@ -1,1001 +1,1001 @@ -KNNとしてクラス分類を行う model = sklearn.neighbors.KNeighborsClassifier(n_neighbors=5) model = sklearn.neighbors.KNeighborsClassifier(n_neighbors=5) -ディープスカイブルー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='deepskyblue') plt.bar(データ列x, データ列y, color='deepskyblue') -カラムの中の欠損値の数をカウントする df['列A'].isna().sum() df['列A'].isna().sum() -日付時刻データが月曜日 aDatetime.weekday() == 0 aDatetime.weekday() == 0 -プレゼンてションにプロットの用途を設定する sns.set(context='talk') sns.set(context='talk') -ValueError: Shape of passed values is (A, B), indices imply (C, D)2 4 86 4pd.DataFrame(X,index=df['コメント']) うーん。 うーん。 -option: フォントの色をカーキに設定する color = 'khaki' color = 'khaki' -TypeError: A() expected a character, but string of length B foundord 3base=ord('A-1') うーん。 うーん。 -TypeError: A object is not subscriptable'type'print(max(list[e,f,g,h])) max(e,f,g,h) に直そう。 本当にlist変数? -回帰分析をブースティングを使って行う model = sklearn.ensemble.AdaBoostRegressor(random_state=0, n_estimators=100) model = sklearn.ensemble.AdaBoostRegressor(random_state=0, n_estimators=100) -線グラフの色をバイオレットに設定する plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') -option: ディムグレーにフォントの色を設定する color = 'dimgray' color = 'dimgrey' -option: パレットトルコイズ色を用いる color = 'paleturquoise' color = 'paleturquoise' -option: グラフの色をラベンダーに指定する color = 'lavender' color = 'lavender' -xをシアンで表示する print(f'\033[36m{x}\033[0m') print(f'\033[36m{x}\033[0m') -ムーア・ペンローズの擬似逆行列 np.linalg.pinv(aArray) np.linalg.pinv(aArray) -折れ線グラフをシエナ色として描画する plt.plot(データ列x, データ列y, color='sienna') plt.plot(データ列x, データ列y, color='sienna') -ValueError: Found input variables with inconsistent numbers of samples: A[7, 207]model.fit(X, y) うーん。 うーん。 -データフレームを二つの列の値でまとめた表を求める df.groupby(['列A', '列B']) df.groupby(['列A', '列B']) -データフレームの列を四捨五入して、整数にする df['列A'].round().astype(int) df['列A'].round().astype(int) -折れ線グラフの四角印の線幅を指定する plt.plot(データ列x, データ列y, marker='s', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='s', markeredgewidth=2.5) -クラス分類の偽陽性を見る sklearn.metrics.recall_absolute_error(目的変数, model.predict(説明変数)) 混同行列 = sklearn.metrics.confusion_matrix(正解データ列, 予測データ列) -TypeError: A() argument B must be str, not intreplace 1print(n.replace(1,'x').replace(9,1).replace('x',9)) できるのは文字列だよ。 できるのは文字列だよ。 -データフレームの選択した列のNaNをxに設定する df[['列A', '列B']].fillna(x) df[['列A', '列B']].fillna(x) -三数の最小値 min(x, y, z) min(x, y, z) -を半分にする 変数 /= 2 変数 //= 2 -折れ線グラフの▲マーカーの色を変える plt.plot(データ列x, データ列y, marker='^', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='#800080') -カラムの尖度 scipy.stats.kurtosis(df['列A'], bias=False) scipy.stats.kurtosis(df['列A'], bias=False) -配列をビン数nで分割する pd.cut(aArray, n) pd.cut(aArray, n) -ヒストグラムの色をパパイヤウィップにする plt.hist(データ列, color='papayawhip') plt.hist(データ列, color='papayawhip') -要素がタプルの要素でないか 要素 not in タプル 要素 not in タプル -"NameError: name A is not defined'mean_squared_error'print(""MSE(テスト): "", mean_squared_error(y_test, y_pred) )" 変数を使う前に =... のように値を代入しよう。 from sklearn.metrics import を実行しよう。 -縦棒グラフをコーンズシルク色を用いて描画する plt.bar(データ列x, データ列y, color='cornsilk') plt.bar(データ列x, データ列y, color='cornsilk') -ValueError: Expected 2D array, got scalar array instead:model.fit(X[1][2], y) うーん。 うーん。 -文字列の中のASCII限定として正規表現による全てのマッチを見る re.findall(pattern, s, flags=re.ASCI) re.findall(pattern, s, flags=re.ASCI) -配列の調和平均を算出する scipy.stats.hmean(配列) scipy.stats.hmean(配列) -折れ線グラフのポイント印の線幅を変更する plt.plot(データ列x, データ列y, marker='.', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='.', markeredgewidth=2.5) -モデルの正確さを求める sklearn.metrics.r2_score(説明変数, 目的変数) sklearn.metrics.mean_squared_error(目的変数, model.predict(説明変数)) -1からNまでのベクトルを作る np.arange(1, N+1) np.arange(1, N+1) -表データからカテゴリデータの列名一覧を使う df.select_dtypes('object').columns df.select_dtypes('object').columns -データフレームを表示するとき、最大行数をnに設定する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n) -耐火レンガ色でヒストグラムを描画する plt.hist(データ列, color='firebrick') plt.hist(データ列, color='firebrick') -リストと配列について散布図を描画して、マーカーを左三角に変更する plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<') -クラス分類をRANSACとしてする model = sklearn.linear_model.RANSACClassifier(random_state=0) model = sklearn.linear_model.RANSACClassifier(random_state=0) -双方向キューを配列から生成する collections.deque(配列) collections.deque(配列) -折れ線グラフの色を小麦色に指定する plt.plot(データ列x, データ列y, color='wheat') plt.plot(データ列x, データ列y, color='wheat') -カラムのエポック秒を日付データにする pd.to_datetime(df['列A'], unit='s', utc=True) pd.to_datetime(df['列A'], unit='s', utc=True) -整数に浮動小数点数を掛ける x * y x * y -ライトスカイブルー色を使って折れ線グラフを描画する plt.plot(データ列x, データ列y, color='lightskyblue') plt.plot(データ列x, データ列y, color='lightskyblue') -NameError: name A is not defined'o'if S[a]==o: 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -データフレームから重複した行を残さず取り除く df.drop_duplicates(keep=False) df.drop_duplicates(keep=False) -セットから要素を除去する セット.remove(要素) セット.remove(要素) -TypeError: A object is not callable'list'if over10(list_A(-i), list_B(-i)) == 1 : うーん。 うーん。 -IndexError: only integers, slices (A), ellipsis (B), numpy.newaxis (C) and integer or boolean arrays are valid indices`:` `...` `None`X = df[df.columns[df.dropna(axis=1)]] うーん。 .columns は要らないよ!消して! -ミントクリーム色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mintcream') plt.plot(データ列x, データ列y, color='mintcream') -データフレームの指定した列の標本分散を求める df['列A'].var(ddof=0) df['列A'].var(ddof=0) -IndexError: string index out of rangeprint(n[1]) インデックスは文字列長より小さくしよう。 インデックスは文字列長より小さくしよう。 -ある列の文字列に部分文字列が存在するデータを選ぶ df[df['列A'].str.contains(部分文字列)] df[df['列A'].str.contains(部分文字列)] -縦軸の目盛の値を変更する plt.xticks(目盛りの値リスト) plt.yticks(目盛りの値リスト) -ヒストグラムの色をダークグレーに指定する plt.hist(データ列, color='darkgray') plt.hist(データ列, color='darkgrey') -データフレームのKurtosis df.kurt() df.kurt() -データフレームの一部のカラムの空文字を未入力値に変換し、ドロップする df[['列A', '列B']].replace('', np.nan).dropna() df[['列A', '列B']].replace('', np.nan).dropna() -三角印で折れ線グラフを描画する plt.plot(データ列x, データ列y, marker='^') plt.plot(データ列x, データ列y, marker='^') -一点鎖線でデータ列の変化を描画する plt.plot(データ列x, データ列y, linestyle='dashbot') plt.plot(データ列x, データ列y, linestyle='dashbot') -option: ライトコーラルを使う color = 'lightcoral' color = 'lightcoral' -option: スラグレーにグラフの色をセットする color ='slategrey' color = 'slategray' -実行環境の名前 sys.platform sys.platform -黒い大バツ印を散布図に描画する plt.scatter(データ列x, データ列y, marker='X', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='X', markerfacecolor='k') -option: どの行もヘッダに設定しない header = None header = None -データフレームのあるカラムの文字列を欠損値に変換する df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan) -ダークグレー色で線グラフを描画する plt.plot(データ列x, データ列y, color='darkgray') plt.plot(データ列x, データ列y, color='darkgrey') -リストを更新不能なにする frozenset(リスト) frozenset(リスト) -イテラブルをセットに追加更新する セット.update(リスト) セット.update(リスト) -文字列を末尾からセパレータで区切る 文字列.rsplit(セパレータ) 文字列.rsplit(セパレータ) -ファイルを追加モードとして開く] 'a' = 'a'open(filepath, mode='a') 'a' = 'a'open(filepath, mode='a') -ある列によってデータフレームを並べ直す df.sort_values(by='列A') df.sort_values(by='列A') -リストと配列について散布図を描画して文字列というデータラベル用のラベルをつける plt.scatter(データ列x, データ列y, label=s) plt.scatter(データ列x, データ列y, label=s) -y軸にラベルをつける plt.ylabel('y軸ラベル') plt.ylabel('y軸ラベル') -折れ線グラフに黒い▽印を描画する plt.plot(データ列x, データ列y, marker='v', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='v', markerfacecolor='k') -整数の4分の一をが欲しい 変数 /= 4 整数 / 4 +アクア色で散布図を描画する plt.scatter(データ列x, データ列y, color='aqua') plt.scatter(データ列x, データ列y, color='aqua') +データフレームの欠損値を平均値に変更する df.fillna(df.mean()) df.fillna(df.mean()) +option: フローラルホワイトを用いる color = 'floralwhite' color = 'floralwhite' +option: ダークマゼンタにフォントの色を変更する color = 'darkmagenta' color = 'darkmagenta' +行列の列ごとの最大 np.max(aArray, axis=0) np.max(aArray, axis=0) +散布図のダイアモンド印の色を設定する plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') +データフレームの一部の列の欠損値を平均値に変更する df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) +データフレームの欠損値を後の行の値に設定する df[df.fillna(method='bfill') df.fillna(method='bfill') +双方向キューの中に整数が含まれてるか調べる 整数 in 両端キュー 整数 in 両端キュー +xを記号にする x = sympy.Symbol('x') x = sympy.Symbol('x') +キーが辞書に存在する キー not in 辞書 キー not in 辞書 +整数の無限なイテレータ itertools.repeat(整数) itertools.repeat(整数) +option: ミディアムターコイズを使う color ='mediumturquoise' color = 'mediumturquoise' +指定された列リストついて、データフレームの重複を確認する df.duplicated(subset=['列A', '列B']) df.duplicated(subset=['列A', '列B']) +赤い丸マーカーを散布図に用いる plt.plot(データ列x, データ列y, marker='o', c='r') plt.plot(データ列x, データ列y, marker='o', c='r') +小数点数の逆余弦 x = 0.33math.acos(x) x = 0.33math.acos(x) 散布図をスプリンググリーン色として描画する plt.scatter(データ列x, データ列y, color='springgreen') plt.scatter(データ列x, データ列y, color='springgreen') -折れ線グラフの下三角印を黒色にする plt.plot(データ列x, データ列y, marker='v', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='v', markerfacecolor='k') -折れ線グラフをマゼンタ色として描画する plt.plot(データ列x, データ列y, color='magenta') plt.plot(データ列x, データ列y, color='magenta') -指定したカラムの値が欠損値か確認する df['列A'].isna() df['列A'].isna() -データシリーズの欠損値を数値で置換する ds.fillna(x) ds.fillna(x) -双方向キューに整数をエンキューする 両端キュー.append(整数) 両端キュー.append(整数) -エクセルファイルファイルを文字化けしないように読む pd.read_csv('file.csv', encoding='shift_jis') pd.read_csv('file.csv', encoding='shift_jis') -リストと配列についての散布図に右三角マーカーを描画する plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') -TypeError: A object does not support item assignment'str'S[i] = chr(s_num) うーん。 うーん。 -辞書のエントリをひとつずつ処理する for value in 辞書.values():print(辞書[key]) # FIXME for value in 辞書.values():print(value) # FIXME -ヒストグラムでカラーマップを用いる "plt.hist(データ列x, color=plt.get_cmap(""Spectral""))" "plt.hist(データ列x, color=plt.get_cmap(""Spectral""))" -折れ線グラフの色をライムに指定する plt.plot(データ列x, データ列y, color='lime') plt.plot(データ列x, データ列y, color='lime') -リストと数列についての散布図に黒い上三角マーカーを描く plt.plot(データ列x, データ列y, marker='^', c='k') plt.plot(データ列x, データ列y, marker='^', c='k') -等量で配列を分割数nでビン分割する pd.qcut(aArray, n) pd.qcut(aArray, n) -散布図をバツマーカーとしてプロットする plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') -空の辞書を用意する 辞書 = {} 辞書 = {} -option: グラフの色をライトスレイグレーに変更する color = 'lightslategrey' color = 'lightslategray' -ミスティローズ色でヒストグラムを描画する plt.hist(データ列, color='mistyrose') plt.hist(データ列, color='mistyrose') -データ列の推移を半透明の破線で描画する plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) -NameError: name A is not defined'train_test_split'X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=0) 変数を使う前に =... のように値を代入しよう。 from sklearn.model_selection import を実行しよう。 -配列と配列についての散布図に赤い△マーカーを描く plt.plot(データ列x, データ列y, marker='^', c='r') plt.plot(データ列x, データ列y, marker='^', c='r') -option: スレートブルー色を用いる color ='slateblue' color = 'slateblue' -データフレームの選択した列の相関行列をケンドール相関係数で求める df[['列A', '列B']].corr(method='kendall') df[['列A', '列B']].corr(method='kendall') -識別子は非同期ジェネレータ関数か判定する inspect.isasyncgenfunction(識別子) inspect.isasyncgenfunction(識別子) -黒い▲マーカーで散布図をプロットする plt.plot(データ列x, データ列y, marker='^', c='k') plt.plot(データ列x, データ列y, marker='^', c='k') -データフレームの一部のカラムが正規分布からどの程度、尖っているか見る df[['列A', '列B']].skew() df[['列A', '列B']].skew() -環境のエンディアンを知る sys.byteorder sys.byteorder -ゼロ埋めされた行列を作成する np.zeros(要素数) np.zeros(行数, 列数) -ヒストグラムの線種を実線に変更する plt.hist(データ列, linestyle='solid') plt.hist(データ列, linestyle='solid') -IndexError: index A is out of bounds for axis B with size C11 0 11plot_tree(model, feature_names=X.columns[:-1], filled=True) うーん。 うーん。 -棒グラフを珊瑚色で描画する plt.bar(データ列x, データ列y, color='coral') plt.bar(データ列x, データ列y, color='coral') -ケースを無視して文字列全体を正規表現にマッチさせる re.fullmatch(pattern, s, flags=re.IGNORECASE) re.fullmatch(pattern, s, flags=re.IGNORECASE) -データフレームのカラムの標準誤差を計算する scipy.stats.sem(df['列A']) scipy.stats.sem(df['列A']) -IndexError: string index out of rangei=int(A[f])*(K**int(d)) インデックスは文字列長より小さくしよう。 インデックスは文字列長より小さくしよう。 -データ列とイテラブルについての散布図に下三角マーカーを描画する plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') -"KeyError: ""A not in index""['川辺']X = df[['低所得率', '川辺']]" データフレームの列名が間違っているよ。 データフレームの列名が間違っているよ。 -NameError: name A is not defined'soeted'x = soeted(list) bool のスペルミスだよ。 sorted のスペルミスだよ。 -KeyboardInterrupt:N,A,B = map(int,input().split()) 自分で実行を止めた? 自分で実行を止めた? -ベクトルを2次元1行に変形する aArray.reshape(1, -1) aArray.reshape(1, -1) -高頻出な方からカウンタを列挙する aCounter.most_common()[::-1] aCounter.most_common() -実部と虚部から複素数を作る complex(x, y) complex(x, y) -マッピングからキーとバリューのペアを取り出し、ひとつずつ処理する for key, value in 辞書.items():print(key, value) # FIXME for key, value in 辞書.items():print(key, value) # FIXME -データフレームのn行以降取り出す df[:n] df[n:] -棒グラフをゴーストホワイト色を用いて描画する plt.bar(データ列x, データ列y, color='ghostwhite') plt.bar(データ列x, データ列y, color='ghostwhite') -文字列がタイトルケースか調べる 文字列.istitle() 文字列.istitle() -キューに要素をプッシュする 両端キュー.append(要素) 両端キュー.append(要素) -インデント幅を指定してリストをJSONにエンコードする json.dumps(リスト, ensure_ascii=False, indent=n) json.dumps(リスト, ensure_ascii=False, indent=n) -線グラフを色付きの実線として描画する plt.plot(データ列x, データ列y, linestyle='solid', color='#800080') plt.plot(データ列x, データ列y, linestyle='solid', color='#800080') -option: 耐火レンガを使う color = 'firebrick' color = 'firebrick' -回帰分析をアンサンブル学習として行う sklearn.ensemble.VotingRegressor() sklearn.ensemble.VotingRegressor() -データ列とリストの散布図に黒い丸マーカーを描く plt.plot(データ列x, データ列y, marker='o', c='k') plt.plot(データ列x, データ列y, marker='o', c='k') -折れ線グラフの四角印の線幅を変更す��� plt.plot(データ列x, データ列y, marker='s', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='s', markeredgewidth=2.5) -最初のカテゴリーを無視してデータフレームのある列をダミー変数に変換する pd.get_dummies(df['列A'], drop_on='列B'], drop_first=True) pd.get_dummies(df['列A'], drop_first=True) -横棒グラフをカーキ色として描画する plt.barh(データ列x, データ列y, color='khaki') plt.barh(データ列x, データ列y, color='khaki') -option: マーカーをポイントに指定する marker = '.' marker = '.' -データシリーズがどの程度、分散しているか確認する ds.var() ds.var() -指定したカラムを1000の位で丸めて、整数型にする df['列A'].round(-3).astype(int) df['列A'].round(-3).astype(int) -ヒストグラムをハニーデュー色として描画する plt.hist(データ列, color='honeydew') plt.hist(データ列, color='honeydew') -データフレームを1000の位で丸めて、整数型にする df.round(-3).astype(int) df.round(-3).astype(int) -縦棒グラフをミディアムブルー色で描画する plt.bar(データ列x, データ列y, color='mediumblue') plt.bar(データ列x, データ列y, color='mediumblue') -データフレームが正規分布からどれだけ、歪んでいるか見る df.kurt() df.kurt() -インディアンレッドにヒストグラムの色を指定する plt.hist(データ列, color='indianred') plt.hist(データ列, color='indianred') -TypeError: object of type A has no B()'int' lenk=len(K) (str(A)) に直そう。 (str(K)) に直そう。 -ヒストグラムをロージーブラウン色として描画する plt.hist(データ列, color='rosybrown') plt.hist(データ列, color='rosybrown') -データフレームを表示するとき、n列までデータフレームを表示できるようにする pd.set_option('display.max_columns', n) pd.set_option('display.max_columns', n) -nからn2までの整数列を見る list(range(n, n2+1, 2)) list(range(n, n2+1)) -option: 色をフローラルホワイトに変更する color = 'floralwhite' color = 'floralwhite' -リストを多重集合に変換する collections.Counter(iterable) collections.Counter(iterable) -小数点数の二進対数 math.log2(x) math.log2(x) -散布図でデータフレームをグラフ化して、カテゴリ別に色を変える sns.scatterplot(data=df, x='列名', y='列名', hue='カテゴリ列') sns.scatterplot(data=df, x='列名', y='列名', hue='カテゴリ列') -散布図をホットピンク色を用いて描画する plt.scatter(データ列x, データ列y, color='hotpink') plt.scatter(データ列x, データ列y, color='hotpink') -クラス分類の再現率を算出する sklearn.metrics.recall_score(正解データ列, 予測データ列) sklearn.metrics.recall_score(正解データ列, 予測データ列) -ヒストグラムをスチールブルー色を用いて描画する plt.hist(データ列, color='steelblue') plt.hist(データ列, color='steelblue') -タプルをn回連結する タプル * n タプル * n -データフレームの一部の列の空文字を欠損値に変換し、ドロップする df[['列A', '列B']].replace('', np.nan).dropna() df[['列A', '列B']].replace('', np.nan).dropna() -出力ストリームを全部読み込む f.read() f.read() -ゼロ埋めされたベクトルを作成する np.zeros(要素数, dtype=np.) np.zeros(要素数) -リストとリストについて散布図を描画し、、マーカーをバツに設定する plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') -線グラフの色をスラグレーに指定する plt.plot(データ列x, データ列y, color='slategray') plt.plot(データ列x, データ列y, color='slategrey') -2つ並べて箱ひげ図を描く plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) -option: ライトシアン色を使用する color = 'lightcyan' color = 'lightcyan' -データ列を二つ並べてボックスチャートにする plt.boxplot([データ列, データ列], color=['b', 'r']) plt.boxplot([データ列, データ列]) -複数行対応として正規表現で文字列を分割する re.split(pattern, s, flags=re.MULTILINE) re.split(pattern, s, flags=re.MULTILINE) -KeyboardInterrupt:N, X = map(int, input().split()) 自分で実行を止めた? 自分で実行を止めた? -カテゴリで色分けしてデータフレームをカウントプロットにする sns.countplot(x='列名', hue='カテゴリ列', data=df) sns.countplot(x='列名', hue='カテゴリ列', data=df) -データシリーズをdatetime64型に変換し、インデックスにする ds.replace(pd.to_datetime(ds, unit='s', utc=True) df.index = pd.DatetimeIndex(pd.to_datetime(ds)) -シーグリーン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='seagreen') plt.bar(データ列x, データ列y, color='seagreen') -文字列のケースを整える 文字列.casefold() 文字列.casefold() -ある列によってデータフレームをソートして、NaNを先頭にする df.sort_values(by='列A', na_position='first') df.sort_values(by='列A', na_position='first') -本日が火曜日か datetime.datetime.today().weekday() == 1 datetime.datetime.today().weekday() == 1 -散布図の▲印の大きさを変更する plt.scatter(データ列x, データ列y, marker='^', markersize=2.0) plt.scatter(データ列x, データ列y, marker='^', markersize=2.0) -列名一覧をデータ型でフィルタする ds.select_dtypes(型).columns df.select_dtypes(型).columns -折れ線グラフをスプリンググリーン色として描画する plt.plot(データ列x, データ列y, color='springgreen') plt.plot(データ列x, データ列y, color='springgreen') -NameError: name A is not defined'printr' うーん。 うーん。 -棒グラフをゴーストホワイト色として描画する plt.bar(データ列x, データ列y, color='ghostwhite') plt.bar(データ列x, データ列y, color='ghostwhite') -濃い青にヒストグラムの色を設定する plt.hist(データ列, color='darkblue') plt.hist(データ列, color='darkblue') -データフレームの全カラムの相関を見る df.pair() sns.pairplot(df) -日付時刻データにn秒を加算する aDatetime + datetime.timedelta(seconds=n) aDatetime + datetime.timedelta(seconds=n) -Pandasのバージョンを出力する print(pd.__version__) print(pd.__version__) -NameError: name A is not defined'x_pred'plt.scatter(x_pred, y_pred, c='red', alpha=0.3) print(変数, 代入していない?=... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -rgbの右三角マーカーで散布図を描く plt.plot(データ列x, データ列y, marker='>', c=rgb) plt.plot(データ列x, データ列y, marker='>', c=rgb) -配列のKurtosisを求める scipy.stats.kurtosis(配列, bias=False) scipy.stats.kurtosis(配列, bias=False) -空白で文字列を分割する 文字列.split() 文字列.partition() -昇順にタプルの値を並べる sorted(タプル, reverse=True) sorted(タプル, reverse=True) -option: フォントの色をライトシアンに設定する color = 'lightcyan' color = 'lightcyan' -データフレームを二つの列の値で分類して、列挙する [(name, group_df) for name, group_df in df.groupby(['列A', '列B'])] [(name, group_df) for name, group_df in df.groupby(['列A', '列B'])] -変数名がジェネレータか調べる inspect.isgenerator(識別子) inspect.isgenerator(識別子) -インデントを指定してリストをJSON形式にエンコードする json.dumps(リスト, ensure_ascii=False, indent=n) json.dumps(リスト, ensure_ascii=False, indent=n) -折れ線グラフの▼マーカーの線幅を指定する plt.plot(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='v', markeredgewidth=2.5) -ロバストな線形分類モデルを作成する model = sklearn.linear_model.HuberClassifier() model = sklearn.linear_model.HuberClassifier() -文字列中に非英字があるか調べる any(not c.isalpha() for c in 文字列) any(not c.isalpha() for c in 文字列) -散布図をダークシアグリーン色を用いて描画する plt.scatter(データ列x, データ列y, color='darkseagreen') plt.scatter(データ列x, データ列y, color='darkseagreen') -文字列中に非アスキー文字が含まれるか調べる any(not c.isascii() for c in 文字列) any(not c.isascii() for c in 文字列) -要素がリストの要素か 要素 in リスト 要素 in リスト -データをL2ノルムとして正規化する "sklearn.preprocessing.Normalizer(norm=""l1"").fit_transform(データ列)" "sklearn.preprocessing.Normalizer(norm=""l2"").fit_transform(データ列)" -折れ線グラフをダークゴールデンロッド色として描画する plt.plot(データ列x, データ列y, color='darkgoldenrod') plt.plot(データ列x, データ列y, color='darkgoldenrod') -分類モデルのPPVを計算する sklearn.metrics.precision_score(正解データ列, 予測データ列) sklearn.metrics.precision_score(正解データ列, 予測データ列) -セットをイミュータブルにする frozenset(セット) frozenset(セット) -データ列のユニークな要素数 ds.nunique() ds.nunique() +option: リネンにフォントの色を設定する color = 'linen' color = 'linen' +散布図に青い三角印を描画する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') +セットが空か判定する len(セット) == 0 len(セット) == 0 +折れ線グラフを青い点線を使って描画する plt.plot(データ列x, データ列y, linestyle='dotted', color='b') plt.plot(データ列x, データ列y, linestyle='dotted', color='b') 棒グラフの色をダークレッドにする plt.bar(データ列x, データ列y, color='darkred') plt.bar(データ列x, データ列y, color='darkred') -yについて数式をn階微分する sympy.diff(数式, y, n) sympy.diff(数式, y, n) -要素を両端キューの右から取り出す 両端キュー.rsplit(要素) 両端キュー.pop() -AttributeError: A object has no attribute B'Tensor' 'y_test'calculate_r2(X_test .y_test) うーん。 calculate_r2(X_test, ) ←カンマ注意。 -横棒グラフをペールグリーン色を用いて描画する plt.barh(データ列x, データ列y, color='palegreen') plt.barh(データ列x, データ列y, color='palegreen') -辞書をインデントを指定してJSON文字列にする json.dumps(辞書, ensure_ascii=False, indent=n) json.dumps(辞書, ensure_ascii=False, indent=n) -棒グラフを貝殻色を用いて描画する plt.bar(データ列x, データ列y, color='seashell') plt.bar(データ列x, データ列y, color='seashell') -折れ線グラフをダークマゼンタ色として描画する plt.plot(データ列x, データ列y, color='darkmagenta') plt.plot(データ列x, データ列y, color='darkmagenta') -二つのセットが共通の要素を持たないか調べる セット.isdisjoint(セット2) セット.isdisjoint(セット2) -イテラブルと列をペアのリストに変換する itertools.zip_longest(iterable, iterable2) itertools.zip_longest(iterable, iterable2) -散布図の星印の色を設定する plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='#800080') -文字列をISO書式を使って日付時刻に変換する datetime.datetime(年, 月, 日, 時) datetime.datetime.fromisoformat(日付の書かれた文字列) -TypeError: A object is not callable'int'A, B = map(int(),input().split()) map(, input().split()) に直そう。 map(, input().split()) に直そう。 -散布図の星マーカーを赤色にする plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='*', markerfacecolor='r') -option: グリーンにグラフの色を設定する color = 'green' color = 'green' -KeyError: A'temperature'X = df['temperature'] データフレームにという列はないよ。 データフレームにという列はないよ。 -ミディアムブルー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='mediumblue') plt.bar(データ列x, データ列y, color='mediumblue') -ファイルが存在しない not os.path.exists(filepath) not os.path.exists(filepath) -データフレームの選択したカラムを百の位で四捨五入する df[['列A', '列B']].round(-2) df[['列A', '列B']].round(-2) -表計算ファイルでデータフレームを保存する df.to_csv('file.xlsx') df.to_excel('file.xlsx') -辞書を浅く複製する 辞書.copy() 辞書.copy() -NameError: name A is not defined'make_mean_list'mean_list_all = make_mean_list(sample_list, df_keys['keys']) うーん。 関数 を定義しよう。 -カラムの標準誤差を求める scipy.stats.sem(df['列A']) scipy.stats.sem(df['列A']) -カウンタのktopをリストとして得る aCounter.k, k aCounter.most_common(k) -NameError: name A is not defined'X'X = torch.tensor(X.values, dtype=torch.float32) X のスペルミスだよ。 変数を使う前に =... のように値を代入しよう。 -カウンタを準備する import collections collections.Counter() -辞書を別の辞書として更新する 辞書.update(辞書2) 辞書.update(辞書2) -グレーにヒストグラムの色を指定する plt.hist(データ列, color='gray') plt.hist(データ列, color='gray') -データフレームをCSV形式に行を付けず保存する df.to_csv('file.tsv', sep='\t') df.to_csv('file.csv', index=None) -列の長さnの順列を得る itertools.permutations(iterable, n) itertools.permutations(iterable, n) -ValueError: invalid literal for A() with base B: Cint 10 '3 4 5'A,B,C=map(int(input())) 問題番号と入力データはあってる? 問題番号と入力データはあってる? -データ列を横に並べてヒストグラムにする plt.hist([データ列, データ列], color=['b', 'r']) plt.hist([データ列, データ列], color=['b', 'r']) -ダークシアグリーン色として散布図を描画する plt.scatter(データ列x, データ列y, color='darkseagreen') plt.scatter(データ列x, データ列y, color='darkseagreen') -rgbの三角マーカーで散布図をプロットする plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) -TypeError: A is an invalid key'(['犯罪率'], ['犯罪率'])'X = df[[column1], [column2]] # 説明変数 うーん。 うーん。 -カテゴリで色分けしてデータフレームを回帰直線付き散布図にする sns.regplot(x='列名', y='列名', hue='カテゴリ列', data=df) sns.regplot(x='列名', y='列名', hue='カテゴリ列', data=df) -ある列の文字列に部分文字列がある行を選択する df[df['列A'].str.contains(部分文字列)] df[df['列A'].str.contains(部分文字列)] -タイムスタンプデータと日付時刻データの時間差が何分か知る (aDatetime - aDatetime2).total_seconds()//60 (aDatetime - aDatetime2).total_seconds()//60 -区切り文字を用いて文字列を区切り、、列挙する 文字列.split(セパレータ) 文字列.split(セパレータ) -ひとつでも英数字が文字列中に含まれるかテストする any(c.isalnum() for c in 文字列) any(c.isalnum() for c in 文字列) -eの乗数を求める x ** x math.exp(x) -ImportError: cannot import name A from B C'KNeighborsRegressor' 'sklearn.ensemble'...from sklearn.ensemble import KNeighborsRegressor @CheckImportPath() @CheckImportPath() -KeyboardInterrupt:s=s+[list(map(str,input().split()))] 自分で実行を止めた? 自分で実行を止めた? -リストと配列についての散布図に下三角マーカーを描く plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') -整数が一桁の数かどうか調べる 0 <= 整数 <= 9 -9 <= 整数 <= 9 -IndexError: index A is out of bounds for dimension B with size C152 0 152result = model(test[i][0].view(1,-1)) うーん。 うーん。 -データをJSON文字列にする json.dumps(データ, ensure_ascii=False) json.dumps(データ, ensure_ascii=False) -計算結果を表示する print(式, 式) print(式) -ヒストグラムの色をロージーブラウンにセットする plt.hist(データ列, color='rosybrown') plt.hist(データ列, color='rosybrown') -線グラフをダークオーキッド色で描画する plt.plot(データ列x, データ列y, color='darkorchid') plt.plot(データ列x, データ列y, color='darkorchid') -最初の区切り記号で文字列を二分して前の方を見る 文字列.partition(セパレータ)[0] 文字列.partition(セパレータ)[0] -配列と配列についての散布図にrgbの三角マーカーを描画する plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) -ファイルパスをSJISとして追加できるようにオープンする] open(filepath, mode='a', encoding='shift_jis') open(filepath, mode='a', encoding='shift_jis') -整数の割り算の余りを求める 整数 % 整数2 整数 % 整数2 -データフレームの一部の列の欠損値を数値で補う df[['列A', '列B']].fillna(method='%.max()) df[['列A', '列B']].fillna(x) -ダークシアグリーン色でヒストグラムを描画する plt.hist(データ列, color='darkseagreen') plt.hist(データ列, color='darkseagreen') -二つの列によって昇順にデータフレームを整列する df.sort_values(by=['列A', '列B'], ascending=True) df.sort_values(by=['列A', '列B'], ascending=True) -四分位数ごとに配列をビニングする pd.qcut(aArray, 4) pd.qcut(aArray, 4) -option: ダークグレー色を用いる color = 'darkgray' color = 'darkgrey' -SyntaxError: invalid syntax (A, line B) 48 行目の書き方が違うよ。 行目の書き方が違うよ。 -折れ線グラフの色をチョコレートに変更する plt.plot(データ列x, データ列y, color='chocolate') plt.plot(データ列x, データ列y, color='chocolate') -xを浮動小数点数に変換する float(x) float(x) -散布図をシャルトリューズ色として描画する plt.scatter(データ列x, データ列y, color='chartreuse') plt.scatter(データ列x, データ列y, color='chartreuse') -"KeyError: A'文字数'df.sort_values(by=""文字数"")" データフレームにという列はないよ。 データフレームにという列はないよ。 -データフレームから指定された三つの列を取り出す df[['列A', '列B', '列C', '列C']] df[['列A', '列B', '列C']] -グラフ中の(x,y)の場所にデータラベルを表示する plt.legend(loc=(x, y)) plt.legend(loc=(x, y)) -大文字を使う string.ascii_uppercase string.ascii_uppercase -データをJSONにエンコードする json.dumps(データ, ensure_ascii=False) json.dumps(データ, ensure_ascii=False) -整数を16進文字列に変換する oct(整数)[2:] hex(整数)[2:] -折れ線グラフの色をアクアにする plt.plot(データ列x, データ列y, color='aqua') plt.plot(データ列x, データ列y, color='aqua') -ベクトルの値を変更する np.array(aArray) aArray[行番号, 列番号] = 指定の値 -大量のデータが正規分布に従うか調べる scipy.stats.kstest(配列, 'norm', 'norm') scipy.stats.kstest(df['列A'], 'norm') -option: 印を星に指定する marker = '*' marker = '*' -SJISでファイルをオープンする] 'shift_jis' = 'utf-8'open(filepath, encoding='shift_jis') 'shift_jis' = 'utf-8'open(filepath, encoding='shift_jis') -横軸の目盛の値を変更する plt.xticks(目盛りの値リスト) plt.xticks(目盛りの値リスト) -散布図の丸マーカーを赤色にする plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='r') -重回帰モデルの平均二乗誤差を求める sklearn.metrics.precisions=予測データ列, 予測データ列) sklearn.metrics.mean_squared_error(目的変数, model.predict(説明変数)) -option: 色をアリスブルーに変更する color = 'aliceblue' color = 'aliceblue' -NameError: name A is not defined'df3'df3.drop('weather', axis=1, inplace=True) 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -文字列の右側から改行を除く 文字列.rstrip('\n') 文字列.rstrip('\n') -ValueError: invalid literal for A() with base B: Cint 10 'ase'A=list(int(input())) map(str, input().split()) に直そう。 map(str, input().split()) に直そう。 -リストの要素をクリアにする リスト.clear() リスト.clear() -NameError: name A is not defined'confusion_matrix'cm = confusion_matrix(y_test, y_pred) from sklearn.metrics.pairwise import を実行しよう。 from sklearn.metrics import を実行しよう。 -散布図を青緑色で描画する plt.scatter(データ列x, データ列y, color='teal') plt.scatter(データ列x, データ列y, color='turquoise') -黒い下三角マーカーで散布図を描く plt.plot(データ列x, データ列y, marker='v', c='k') plt.plot(データ列x, データ列y, marker='v', c='k') -ヒストグラムの色を真紅に指定する plt.hist(データ列, color='crimson') plt.hist(データ列, color='crimson') -ある列のカテゴリ毎の合計 df.groupby('列A').sum() df.groupby('列A').sum() -タプルの最後からn番目以前の要素を取り出す タプル[:-n] タプル[:-n] -KeyboardInterrupt:for a in range (1,X+1): 自分で実行を止めた? 自分で実行を止めた? -InvalidIndexError: Reindexing only valid with uniquely valued Index objectspd.concat([df2,df_name], axis =1) うーん。 うーん。 -異なる列をキーとして二つのデータフレームを内部結合する pd.merge(df, df2, left_on='列A', right_on='列B', how='inner') pd.merge(df, df2, left_on='列A', right_on='列B', how='inner') -データフレームをCSV形式を用いて保存する df.to_csv('file.tsv', sep='\t') df.to_csv('file.tsv', sep='\t') -文字列中の正規表現を新しい文字列として置き換える re.sub(pattern, newsub, s) re.sub(pattern, newsub, s) -ピーチパフにヒストグラムの色を指定する plt.hist(データ列, color='peachpuff') plt.hist(データ列, color='peachpuff') -ヒストグラムの色をミディアムアクアマリンに指定する plt.hist(データ列, color='mediumaquamarine') plt.hist(データ列, color='mediumaquamarine') -TypeError: A() can't convert non-string with explicit baseintA_10 = int(A, K) ()の最初の引数は文字列にしてみよう。 ()の最初の引数は文字列にしてみよう。 -文字列からISO書式で日付時刻に変換する datetime.datetime.fromisoformat(日付の書かれた文字列) datetime.datetime.fromisoformat(日付の書かれた文字列) -option: フォントの色をターコイズに指定する color = 'turquoise' color = 'turquoise' -nは整数と等しいかどうか調べる 整数 == 整数2 整数 == 整数2 -データフレームのn番目の行を取り出す df[n] df.loc[n] -データフレームをカラムによってグループ化し、要約統計量を求める df.groupby('列A').describe() df.groupby('列A').describe() -xを太文字化する f'\033[1m{x}\033[0m' f'\033[1m{x}\033[0m' -線グラフの色をダークゴールデンロッドに設定する plt.plot(データ列x, データ列y, color='darkgoldenrod') plt.plot(データ列x, データ列y, color='darkgoldenrod') -横棒グラフをディムグレー色を用いて描画する plt.barh(データ列x, データ列y, color='dimgray') plt.barh(データ列x, データ列y, color='dimgray') -データフレームを散布図でプロット化し、、カテゴリ別にマーカーを変更する sns.scatterplot(data=df, x='列名', y='列名', style='カテゴリ列') sns.scatterplot(data=df, x='列名', y='列名', style='カテゴリ列') -散布図に赤いポイント印を描画する plt.scatter(データ列x, データ列y, marker='.', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='.', markerfacecolor='r') -データシリーズの標本標準偏差を求める ds.std(ddof=1) ds.std(ddof=1) -オブジェクトのメモリビューを使う memoryview(obj) memoryview(obj) -データフレームの空文字を欠損値に変換しドロップする df.replace('', np.nan).dropna() df.replace('', np.nan).dropna() -option: グラフの色を青に変更する color = 'blue' color = 'blue' -赤い▽マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='v', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='v', markerfacecolor='r') -折れ線グラフのポイント印を青色にする plt.plot(データ列x, データ列y, marker='.', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='.', markerfacecolor='b') -数列間の相関係数を求める scipy.stats.pearsonr(数列, 数列2) scipy.stats.pearsonr(数列, 数列2) -折れ線グラフの色をアイボリーに指定する plt.plot(データ列x, データ列y, color='ivory') plt.plot(データ列x, データ列y, color='ivory') -棒グラフをパールゴールデンロッド色として描画する plt.bar(データ列x, データ列y, color='palegoldenrod') plt.bar(データ列x, データ列y, color='palegoldenrod') -指定した列のカテゴリで集計しそれぞれの最小値を算出する df.groupby('列A').min() df.groupby('列A').min() -横棒グラフをオールドレース色として描画する plt.barh(データ列x, データ列y, color='oldlace') plt.barh(データ列x, データ列y, color='oldlace') -実数のルートを求める math.modf(x) math.sqrt(x) -ロッソ回帰分析を行う model = sklearn.addle_cross_decomposition.Rosso(alpha=正則化項) model = sklearn.linear_model.Rosso(alpha=正則化項) -SyntaxError: invalid character in identifier (A, line B) 11 行目で全角文字を使っていない? 行目で全角文字を使っていない? -黒いダイアモンドマーカーを散布図に用いる plt.plot(データ列x, データ列y, marker='D', c='k') plt.plot(データ列x, データ列y, marker='D', c='k') -ファイルを文字コードtextで書き込みできるようにオープンする] open(filepath, mode='w', encoding=text) open(filepath, mode='w', encoding=text) -外れ値に強い重クラス分類の準備をする model = sklearn.manifold.HuberClassifier() model = sklearn.linear_model.HuberClassifier() -ValueError: invalid literal for A() with base B: Cint 10 ' 'a,b=map(int,input()) 問題番号と入力データはあってる? 問題番号と入力データはあってる? -棒グラフをグリーンイエロー色として描画する plt.bar(データ列x, データ列y, color='greenyellow') plt.bar(データ列x, データ列y, color='greenyellow') -複数のデータフレームを縦方向に結合する pd.concat([df, df2, df3], axis=0) pd.concat([df, df2, df3], axis=0) -横棒グラフをナバホホワイト色を用いて描画する plt.barh(データ列x, データ列y, color='navajowhite') plt.barh(データ列x, データ列y, color='navajowhite') -ヒストグラムをライトスチールブルー色を用いて描画する plt.hist(データ列, color='lightsteelblue') plt.hist(データ列, color='lightsteelblue') -スプリンググリーン色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='springgreen') plt.plot(データ列x, データ列y, color='springgreen') -散布図の三角印の色を設定する plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='#800080') -option: ライトコーラルに色を設定する color = 'lightcoral' color = 'lightcoral' -データフレームのある列を選択する df['列A'] df['列A'] -ヒストグラムをホワイトスモーク色として描画する plt.hist(データ列, color='whitesmoke') plt.hist(データ列, color='whitesmoke') -"ValueError: Found input variables with inconsistent numbers of samples: A[500, 152]print(""MSE: "", mean_squared_error(y, y_pred))" うーん。 うーん。 -データフレームを表示するときカラムの最大幅をnに設定する pd.set_option('max_colwidth', n) pd.set_option('max_colwidth', n) -KeyError: A'身長'df3=df3.sort_values(by='身長', ascending=False) データフレームにという列はないよ。 データフレームにという列はないよ。 -折れ線グラフに左三角印を使う plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<') -散布図のポイント印の大きさを変更する plt.scatter(データ列x, データ列y, marker='.', markersize=2.0) plt.scatter(データ列x, データ列y, marker='.', markersize=2.0) -縦棒グラフをスノー色を使って描画する plt.bar(データ列x, データ列y, color='snow') plt.bar(データ列x, データ列y, color='snow') -リストのスピアマンの相関係数 scipy.stats.spearmanr(数列, 数列2) scipy.stats.spearmanr(数列, 数列2) -行列の列ごとの平均値 np.mean(aArray, axis=0) np.mean(aArray, axis=0) -インディアンレッド色を使って折れ線グラフを描画する plt.plot(データ列x, データ列y, color='indianred') plt.plot(デ��タ列x, データ列y, color='indianred') -横棒グラフをコーンフラワーブルー色として描画する plt.barh(データ列x, データ列y, color='cornflowerblue') plt.barh(データ列x, データ列y, color='cornflowerblue') -辞書の項目名と値を入れ替える {v: k for k, v in 辞書.items()} {v: k for k, v in 辞書.items()} -改行しないで2つの数値をプリントする print(数値, 数値, 数値) print(数値, 数値, end='') -文字列中にひとつも大文字がないか調べる any(not c.isupper() for c in 文字列) any(not c.isupper() for c in 文字列) -option: 黄緑色を使用する color = 'chartreuse' color = 'chartreuse' -タプル内の要素が全て真かどうか判定する all(タプル) all(タプル) -KeyboardInterrupt:a, b = map(int, input().split()) 自分で実行を止めた? 自分で実行を止めた? -横棒グラフをシャルトリューズ色として描画する plt.barh(データ列x, データ列y, color='chartreuse') plt.barh(データ列x, データ列y, color='chartreuse') -option: 色をビスクに設定する color = 'bisque' color = 'bisque' -option: パールゴールデンロッドを使用する color = 'palegoldenrod' color = 'palegoldenrod' -横棒グラフをサンディーブラウン色として描画する plt.barh(データ列x, データ列y, color='sandybrown') plt.barh(データ列x, データ列y, color='sandybrown') -青い一点鎖線で線グラフを描画する plt.plot(データ列x, データ列y, linestyle='dashbot', color='b') plt.plot(データ列x, データ列y, linestyle='dashbot', color='b') -ライトスチールブルー色で散布図を描画する plt.scatter(データ列x, データ列y, color='lightsteelblue') plt.scatter(データ列x, データ列y, color='lightsteelblue') -KeyboardInterrupt:N=str(input()) 自分で実行を止めた? 自分で実行を止めた? -黄色色を用いて横棒グラフを描画する plt.barh(データ列x, データ列y, color='yellow') plt.barh(データ列x, データ列y, color='yellow') -追加できるように既存のファイルをEUCでオープンする] open(filepath, mode='a', encoding='euc_jp') open(filepath, mode='a', encoding='euc_jp') -AttributeError: A object has no attribute B'str' 'insert'x=x.insert(0,last) うーん。 うーん。 -表データのあるカラムは何日か見る df['列A'].dt.day df['列A'].dt.day -線グラフの色を淡い茶色に変更する plt.plot(データ列x, データ列y, color='tan') plt.plot(データ列x, データ列y, color='tan') -折れ線グラフの色を青紫に指定する plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') -散布図に四角印を使う plt.scatter(データ列x, データ列y, marker='s') plt.scatter(データ列x, データ列y, marker='s') -線グラフの色をライトグレーにセットする plt.plot(データ列x, データ列y, color='lightgray') plt.plot(データ列x, データ列y, color='lightgray') -印字を全部使う string.printable string.printable -折れ線グラフの色をミディアムアクアマリンに指定する plt.plot(データ列x, データ列y, color='mediumaquamarine') plt.plot(データ列x, データ列y, color='mediumaquamarine') -折れ線グラフの色をスカイブルーにする plt.plot(データ列x, データ列y, color='skyblue') plt.plot(データ列x, データ列y, color='skyblue') -IndexError: list index out of rangeif s[h][i]=='.': インデックスはリストの大きさより小さくしよう。 インデックスはリストの大きさより小さくしよう。 -オブジェクトが名前付きタプルか判定する hasattr(obj, '_asdict') and hasattr(obj, '_fields') hasattr(obj, '_asdict') and hasattr(obj, '_fields') -ひとつでも非大文字が文字列中にあるかどうか any(not c.isupper() for c in 文字列) any(not c.isupper() for c in 文字列) -整数が一桁の整数か確認する -9 <= 整数 <= 9 -9 <= 整数 <= 9 -option: フォントの色を赤に指定する color ='red' color = 'red' -ヒストグラムの色をカデットブルーに変更する plt.hist(データ列, color='cadetblue') plt.hist(データ列, color='cadetblue') -TypeError: unsupported operand type(s) for ** or A(): B and Cpow 'str' 'int'a=A[0]*(K**3)+A[1]*(K**2)+A[2]*(K**1)+A[4]*(K**0) うーん。 うーん。 -ベクトルの列ごとの最大値を求める np.max(aArray, axis=0) np.max(aArray, axis=0) -空の回帰木モデルを作成する model = sklearn.tree.DecisionTreeRegressor() model = sklearn.tree.DecisionTreeRegressor() -折れ線グラフの下三角マーカーの太さを変更する plt.plot(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='v', markeredgewidth=2.5) -文字列の中のASCII限定として正規表現によるすべてのマッチを使う re.findall(pattern, s, flags=re.ASCI) re.findall(pattern, s, flags=re.ASCI) -TypeError: A object is not subscriptable'int'a=A[1]+A[2]+A[3] 整数は先に文字列に変換しよう。 整数は先に文字列に変換しよう。 -πを用いる import sys as f math.pi -xをマゼンタで出力する print(x, y, color='magenta') print(f'\033[35m{x}\033[0m') -文字列の左側から文字を除く 文字列.removesuffix(文字) 文字列.lstrip(文字) -TSVをデータフレームとして読む pd.read_csv('file.tsv', sep='\t') pd.read_csv('file.tsv', sep='\t') -スラグレー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='slategrey') plt.bar(データ列x, データ列y, color='slategrey') -緑色化する f'\033[32m{x}\033[0m' f'\033[32m{x}\033[0m' -配列を等しい量になるようにn個にビン分割する pd.qcut(aArray, n) pd.qcut(aArray, n) -nからn2の範囲で range(n, n2) range(n, n2) -折れ線グラフの色をライムグリーンに変更する plt.plot(データ列x, データ列y, color='limegreen') plt.plot(データ列x, データ列y, color='limegreen') -ファイルパスの絶対パスを見る os.path.abspath(filepath) os.path.abspath(filepath) -整数は配列のどれか aArray = [0, 1, 2]整数 in aArray aArray = [0, 1, 2]整数 in aArray -実数のハイパボリック・コサイン math.sinh(x) math.cosh(x) -文字列の指定した位置以降に部分文字列があるか調べる 文字列.find(部分文字列, 開始位置)!= -1 文字列.find(部分文字列, 開始位置) != -1 -データフレームの指定した列の欠損値をその最頻値で埋める df['列A'].fillna(df['列A'].mode().iloc[0]) df['列A'].fillna(df['列A'].mode().iloc[0]) -option: ライトイエロー色を使用する color = 'lightyellow' color = 'lightyellow' -データフレームをグループ化しある列に対し標準偏差を計算する df.groupby('列A')['列B'].std() df.groupby('列A')['列B'].std() -option: 最初の行をヘッダに設定する header = None header = 0 -横棒グラフをシエナ色を使って描画する plt.barh(データ列x, データ列y, color='sienna') plt.barh(データ列x, データ列y, color='sienna') -相関係数でデータフレームの選択したカラムの相関行列を求める df[['列A', '列B']].corr(method='pearson') df[['列A', '列B']].corr(method='pearson') -散布図を赤色を用いて描画する plt.scatter(データ列x, データ列y, color='red') plt.scatter(データ列x, データ列y, color='red') -option: グラフの色をデピンクにする color = 'deeppink' color = 'deeppink' -文字列を最初の部分文字列で二分して、前半を見る 文字列.partition(部分文字列)[0] 文字列.partition(部分文字列)[0] -2つの列からグループ化し、分散を求める df.groupby(['列A', '列B'], as_index=False).var() df.groupby(['列A', '列B'], as_index=False).var() -シアン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='cyan') plt.bar(データ列x, データ列y, color='cyan') -既存の行列を元に全要素が0の配列 np.zeros_like(aArray) np.zeros_like(aArray) -"KeyError: ""A not in index""['教員']X = df[['通勤', '教員']] # 二つ選ぶ" データフレームの列名が間違っているよ。 データフレームの列名が間違っているよ。 -線グラフをホワイトスモーク色を用いて描画する plt.plot(データ列x, データ列y, color='whitesmoke') plt.plot(データ列x, データ列y, color='whitesmoke') -識別子がスタックフレーム inspect.isframe(識別子) inspect.isframe(識別子) -文字列中に大文字が存在しないか確認する any(not c.isupper() for c in 文字列) any(not c.isupper() for c in 文字列) -TypeError: A() got an unexpected keyword argument Bsort_values 'assending'df3.sort_values(by=' 身長', assending=True) うーん。 うーん。 -"AttributeError: module A has no attribute B'pandas' 'DateFrame'pd.DateFrame(pd.DataFrame({""words"":words}).value_counts())" DataFrameが関数になってしまっているよ。 DataFrameのスペルミスだよ。 -ファイルパスを読み込みモードとしてオープンする] 'r' = 'a'open(filepath, mode='r') 'r' = 'a'open(filepath, mode='r') -折れ線グラフをインディアンレッド色を用いて描画する plt.plot(データ列x, データ列y, color='indianred') plt.plot(データ列x, データ列y, color='indianred') -データフレームのあるカラムの欠損値をモードで補う df['列A'].fillna(df['列A'].mode().iloc[0]) df['列A'].fillna(df['列A'].mode().iloc[0]) -指定した列のカテゴリで集計し、各平均値を求める df.groupby('列A').mean() df.groupby('列A').mean() -インプレースに両端キューの要素を逆に並べ直す 両端キュー.reverse() 両端キュー.reverse() -横棒グラフをパパイヤウィップ色を用いて描画する plt.barh(データ列x, データ列y, color='papayawhip') plt.barh(データ列x, データ列y, color='papayawhip') -双方向キュー中の文字列の数を数える 両端キュー.count(文字列) 両端キュー.count(文字列) -変数名を項目名として、マッピング inspect.iscode(識別子) dict(name='kogi', age=6) -点間のユークリッド距離 math.dist(point, point2) math.dist(point, point2) -seabornのデフォルトスタイルを適用する sns.set() sns.set() -列の値でデータフレームをグループ分けする df.groupby('列A') df.groupby('列A') -配列とリストについての散布図に赤い右三角マーカーを描く plt.plot(データ列x, データ列y, marker='>', c='r') plt.plot(データ列x, データ列y, marker='>', c='r') -文字列中に日本語が含まれるか調べる any(c.IPA(文字列, encoding='shift_jis') re.search('[あ-んア-ン\u4E00-\u9FD0]', 文字列) -文字列を両端キューのn番目に差し込む 両端キュー.insert(n, 文字列) 両端キュー.insert(n, 文字列) -句点文字を全て求める string.punctuation string.punctuation -データフレームのある列の中にある文字列の個数を数える df['列A'].isin([value]).sum() df['列A'].isin([value]).sum() -TypeError: A() got multiple values for argument Bdrop 'axis'df7.drop('ポジション','生年月日',axis=1, inplace=True) うーん。 うーん。 -日付データからn時間分、減らす aDate - datetime.timedelta(hours=n) aDate - datetime.timedelta(hours=n) -データフレームから同じ内容の行を除く df.dropna(inplace=True) df.drop_duplicates(inplace=True) -KeyboardInterrupt:n,p=map(int,input().split()) 自分で実行を止めた? 自分で実行を止めた? -日付時刻データが金曜日かどうか aDatetime.weekday() == 4 aDatetime.weekday() == 4 -TypeError: A object is not subscriptable'builtin_function_or_method'print(list.sort[0]) np.arange(リスト2) に直そう。 list.sort(0) に直そう。 -タプルの個数を見る len(タプル) len(タプル) -折れ線グラフの色をイエローグリーンに変更する plt.plot(データ列x, データ列y, color='yellowgreen') plt.plot(データ列x, データ列y, color='yellowgreen') -カーキにヒストグラムの色を設定する plt.hist(データ列, color='khaki') plt.hist(データ列, color='khaki') -セットが上位集合もしくは等しい セット == 0 セット >= セット2 -黄色にヒストグラムの色を指定する plt.hist(データ列, color='yellow') plt.hist(データ列, color='yellow') -データフレームの中に文字列と日付データがあるか df.isin([value, value2]) df.isin([value, value2]) -クラス分類をアンサンブル学習として行う sklearn.ensemble.VotingClassifier() sklearn.ensemble.VotingClassifier() -ValueError: invalid literal for A() with base B: Cint 10 '2 2 'n=int(input()) 問題番号と入力データはあってる? 問題番号と入力データはあってる? -データフレームの選択したカラムの最頻値を求める df[['列A', '列B']].mode() df[['列A', '列B']].mode() -AttributeError: A object has no attribute B'str' 'isslower'if s.isslower() and ss.isupper(): うーん。 islower のスペルミスだよ。 -NameError: name A is not defined's'print(A+s[0]) 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -数をn乗する x ** n x ** n -SyntaxError: invalid syntax (A, line B) 2 行目の書き方が違うよ。 行目の書き方が違うよ。 -ライトグレーにヒストグラムの色を設定する plt.hist(データ列, color='lightgray') plt.hist(データ列, color='lightgray') -データを用いてモデルを学習する model.fit(説明変数, 目的変数) model.fit(説明変数, 目的変数) -整数が配列のどれか aArray = [0, 1, 2]整数 in aArray aArray = [0, 1, 2]整数 in aArray -日付と時間から日付時刻 datetime.datetime(年, 月, 日, 時, 分, 秒) datetime.datetime(年, 月, 日, 時, 分, 秒) -ダークゴールデンロッド色で散布図を描画する plt.scatter(データ列x, データ列y, color='darkgoldenrod') plt.scatter(データ列x, データ列y, color='darkgoldenrod') -xの出力を改行せずに行う print(x, end='') print(x, end='') -リストとイテラブルについて散布図を描画し、、ポイントマーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='.', c=rgb) plt.plot(データ列x, データ列y, marker='.', c=rgb) -縦棒グラフの色をグリーンにする plt.bar(データ列x, データ列y, color='green') plt.bar(データ列x, データ列y, color='green') -分類結果の適合率と再現率の調和平均を求める sklearn.metrics.precision_score(正解データ列, 予測データ列) sklearn.metrics.f1_score(正解データ列, 予測データ列) -データ列のユニー��な要素数を見る ds.unique() ds.nunique() -データフレームのインデックス名をまとめて付け直す df.rename(index={x: y}) df.rename(index={x: y}) -option: マルーン色を用いる color ='maroon' color = 'maroon' -オブジェクトは論理値か調べる bool = intisinstance(obj, bool) bool = intisinstance(obj, bool) -ディムグレーにヒストグラムの色を設定する plt.hist(データ列, color='dimgrey') plt.hist(データ列, color='dimgray') -線グラフを淡いピンク色色を使って描画する plt.plot(データ列x, データ列y, color='lightpink') plt.plot(データ列x, データ列y, color='lightpink') -折れ線グラフを赤い実線で描く plt.plot(データ列x, データ列y, linestyle='solid', color='r') plt.plot(データ列x, データ列y, linestyle='solid', color='r') -データフレームの選択したカラムの標本分散を求める df[['列A', '列B']].var(ddof=0) df[['列A', '列B']].var(ddof=0) -NameError: name A is not defined'intmax'print(b[b.index(intmax(c))]) 変数を使う前に =... のように値を代入しよう。 b[c.index(max(int(c)))] に直そう。 -散布図のダイアモンドマーカーの色を変える plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='#800080') -NameError: name A is not defined'X' うーん。 うーん。 -ダークグレー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='darkgrey') plt.bar(データ列x, データ列y, color='darkgrey') -要素がリストに含まれないか判定する 要素 not in リスト 要素 not in リスト -AttributeError: A object has no attribute B'list' 'split'k_l.append([i,j].split()) うーん。 うーん。 -NameError: name A is not defined'figsize'plt.figure(figsize(6,6)) plt.figure(=(7,6)) に直そう。 plt.figure(=(6,6)) に直そう。 -NameError: name A is not defined'DataLoader'train_loader = DataLoader(train, model.batch_size, shuffle=True) うーん。 うーん。 -AttributeError: A object has no attribute B'map' 'remove'list.remove(x) うーん。 うーん。 -option: モカシンを用いる color ='moccasin' color = 'moccasin' -option: 星印を描画する marker = '*' marker = '*' -セットの更新不能版 frozenset(セット) frozenset(セット) -スレートブルー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='slateblue') plt.bar(データ列x, データ列y, color='slateblue') -KeyboardInterrupt:if x>=N: 自分で実行を止めた? 自分で実行を止めた? -線グラフの色をシスルに設定する plt.plot(データ列x, データ列y, color='thistle') plt.plot(データ列x, データ列y, color='thistle') -グラフのインチを変更する plt.figure(figsize=(横幅, 高さ) plt.figure(figsize=(横幅, 高さ)) -セットから例外なく整数を取り除く セット.discard(数) セット.discard(数) -線グラフをモカシン色を用いて描画する plt.plot(データ列x, データ列y, color='moccasin') plt.plot(データ列x, データ列y, color='moccasin') -ValueError: invalid literal for A() with base B: Cint 10 'nikoandsolstice'x=int(S) うーん。 str(input()) に直そう。 -線グラフの色をダークグレーに指定する plt.plot(データ列x, データ列y, color='darkgray') plt.plot(データ列x, データ列y, color='darkgray') -データフレームのあるカラムは何曜日か見る df['列A'].dt.weekday_name df['列A'].dt.weekday_name -SyntaxError: invalid syntax (A, line B) 20 行目の書き方が違うよ。 行目の書き方が違うよ。 -10を底とする対数を計算する math.log10(x) math.log10(x) -MeanSquaredErrorを求める random.randint(ddof=1) sklearn.metrics.mean_squared_error(データ列, データ列2) -option: 青に色を設定する color = 'blue' color = 'blue' -option: フォントの色をピンクに指定する color = 'pink' color = 'pink' -タイムスタンプデータが日付時刻データより早いか aDatetime2 = aDatetimeaDatetime < aDatetime2 aDatetime2 = aDatetimeaDatetime < aDatetime2 -プロットを暗くする sns.set(pallete='dark') sns.set(pallete='dark') -2を底とする実数の対数を求める math.log2(x, x2) math.log2(x) -文字列全体を大文字・小文字を無視してパターンにマッチさせる re.fullmatch(pattern, s, flags=re.IGNORECASE) re.fullmatch(pattern, s, flags=re.IGNORECASE) -TypeError: A object is not subscriptable'int'A = [int(c) for c in a[::-1]] (str(a)) に直そう。 うーん。 -列を全てタイムスタンプ型に変換する pd.to_datetime(df['列A'], format='%Y-%m-%d') pd.to_datetime(df['列A']) -option: 線の種類を破線にセットする linestyle = 'dashed' linestyle = 'dashed' -rgbの四角マーカーとして���布図を描く plt.plot(データ列x, データ列y, marker='s', c=rgb) plt.plot(データ列x, データ列y, marker='s', c=rgb) -2つのデータフレームを横方向につなぐ pd.concat([df, df2], axis=1) pd.concat([df, df2], axis=1) +棒グラフをレモンシフォン色として描画する plt.bar(データ列x, データ列y, color='lemonchiffon') plt.bar(データ列x, データ列y, color='lemonchiffon') +2つの列でデータフレームをグループ分けし、、列挙する [(name, group_df) for name, group_df in df.groupby(['列A', '列B'])] [(name, group_df) for name, group_df in df.groupby(['列A', '列B'])] +文字列を最初のセパレータで二分して、後ろの方を使う 文字列.partition(セパレータ)[-1] 文字列.partition(セパレータ)[-1] +ライム色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='lime') plt.bar(データ列x, データ列y, color='lime') +option: ダークシアグリーンにグラフの色を設定する color = 'darkseagreen' color = 'darkseagreen' +データをJSON形式としてファイルに出力する json.dump(データ, ファイル出力, ensure_ascii=False) with open('file.json', 'w') as f:json.dump(データ, f, ensure_ascii=False) +ふたつの列を組み合わせてグループ化し、合計を求める df.groupby(['列A', '列B'], as_index=False).sum() df.groupby(['列A', '列B'], as_index=False).sum() +数列と数列の散布図を描いて星マーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='*', c=rgb) plt.plot(データ列x, データ列y, marker='*', c=rgb) +ヒストグラムの色をシーグリーンに指定する plt.hist(データ列, color='seagreen') plt.hist(データ列, color='seagreen') +データフレームを2つの列で昇順に破壊的にソートする df.sort_values(by=['列A', '列B'], ascending=True, inplace=True) df.sort_values(by=['列A', '列B'], ascending=True, inplace=True) +K最近傍法でクラス分類をする model = sklearn.neighbors.KNeighborsClassifier(n_neighbors=5) model = sklearn.neighbors.KNeighborsClassifier(n_neighbors=5) +2つのデータフレームを列名を指定してジョインする 'pd.merge(df, df2, on='列A') 'pd.merge(df, df2, on='列A') トマト色で棒グラフを描画する plt.bar(データ列x, データ列y, color='tomato') plt.bar(データ列x, データ列y, color='tomato') -エクセルファイルのシートを読み込む pd.read_excel('file.xlsx', sheet_name=シート名) pd.read_excel('file.xlsx', sheet_name=シート名) -イテラブルとリストの散布図に赤いポイントマーカーを描画する plt.plot(データ列x, データ列y, marker='.', c='r') plt.plot(データ列x, データ列y, marker='.', c='r') -配列の平均を調べる np.mean(aArray) np.mean(aArray) -TypeError: A object is not iterable'int'ans+=i うーん。 うーん。 -配列のイミュータブルな集合を使う frozenset(配列) frozenset(配列) -CSVをn番目のカラムをインデックスにして読み込む pd.read_csv('file.csv', index_col=n) pd.read_csv('file.csv', index_col=n) -option: スラグレー色を使用する color ='slategray' color = 'slategrey' -option: 色を青緑に設定する color = 'teal' color = 'turquoise' -ファイルパスを文字列の示す文字コードを用いて書き込み用にオープンする] open(filepath, mode='w', encoding=s) open(filepath, mode='w', encoding=s) -データフレームから5行サンプリングする df.sample(5) df.sample(5) -改行なしに文字列を出力する print(文字列, end='') print(文字列, end='') -散布図に星マーカーを用いる plt.scatter(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') -タプルと列をペアリングする itertools.zip_longest(iterable, iterable2) itertools.zip_longest(iterable, iterable2) -データフレームのカラムをカテゴリデータに変換する df.groupby('列A') df[col].astype(object) -ホールドアウトを使用する X_train, X_test, y_train, y_test = train_test_split(filepath, train_test_split) X_train, X_test, y_train, y_test = train_test_split(説明変数, 目的変数, test_size=0.3) -TypeError: A object is not subscriptable'int'y=N[-1] 整数は先に文字列にしてみよう。 整数は先に文字列に変換しよう。 -オーキッド色としてヒストグラムを描画する plt.hist(データ列, color='orchid') plt.hist(データ列, color='orchid') -SyntaxError: invalid syntax (A, line B) 7 行目の書き方が違うよ。 行目の書き方が違うよ。 -グラフの見た目を良くする sns.set(pallete='colorblind') import seaborn as sns -ミスティローズ色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mistyrose') plt.plot(データ列x, データ列y, color='mistyrose') -データフレームを各カテ��リに色付けしてバイオリン図にする sns.violinplot(x='カテゴリ列', y='列', hue='カテゴリ列', data=df) sns.violinplot(x='カテゴリ列', y='列', data=df) -横棒グラフを貝殻色として描画する plt.barh(データ列x, データ列y, color='seashell') plt.barh(データ列x, データ列y, color='seashell') -文字列中の正規表現を新しい文字列を用いて置き換える re.sub(pattern, newsub, s) re.sub(pattern, newsub, s) -データ列の四分位を作図する plt.boxplot(データ列) plt.boxplot(データ列) -シートの名前を指定してデータフレームをエクセルファイルから読み込む pd.read_excel('file.xlsx', sheet_name=シート名) pd.read_excel('file.xlsx', sheet_name=シート名) -線グラフの色をスラグレーに変更する plt.plot(データ列x, データ列y, color='slategrey') plt.plot(データ列x, データ列y, color='slategray') -棒グラフをダークグレー色として描画する plt.bar(データ列x, データ列y, color='darkgrey') plt.bar(データ列x, データ列y, color='darkgrey') -プロットのx軸にラベルを設定する plt.xlabel('x軸ラベル') plt.xlabel('x軸ラベル') -配列と配列についての散布図に大バツマーカーを描画する plt.plot(データ列x, データ列y, marker='X') plt.plot(データ列x, データ列y, marker='X') -KeyboardInterrupt:S=input() 自分で実行を止めた? 自分で実行を止めた? -線グラフをネイビー色で描画する plt.plot(データ列x, データ列y, color='navy') plt.plot(データ列x, データ列y, color='navy') -ValueError: invalid literal for A() with base B: Cint 2 'a'a1=int('a',k) うーん。 うーん。 -マップの浅いコピーを作る 辞書.copy() 辞書.copy() -カラム名を指定して2つのデータフレームを右ジョインする pd.merge(df, df2, on='列A', how='right') pd.merge(df, df2, on='列A', how='right') -データ列の折れ線グラフを描いてカラーコードで色を設定する plt.plot(データ列x, データ列y, color='#800080') plt.plot(データ列x, データ列y, color='#800080') -オブジェクトのバイトサイズを確める sys.getsizeof(オブジェクト) sys.getsizeof(オブジェクト) -ある列の値がxに等しく別の列の値がyに等しい行を抽出する df[(df['列A'] == x) & (df['列B'] == y)] df[(df['列A'] == x) & (df['列B'] == y)] -KeyError: A'dattetime'df['year'] = df['dattetime'].apply(lambda x : x.split('-')[0]) データフレームにという列はないよ。 データフレームにという列はないよ。 -セットが空集合でないか len(セット)!= 0 len(セット) != 0 -配列とリストの散布図にrgbの四角マーカーをプロットする plt.plot(データ列x, データ列y, marker='s', c=rgb) plt.plot(データ列x, データ列y, marker='s', c=rgb) -NameError: name A is not defined'column'X = df[column] 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -赤い下三角マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='v', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='v', markerfacecolor='r') -カウンタを少ない順にリストとして得る aCounter.most_common()[::-1] aCounter.most_common()[::-1] -線グラフの色をカデットブルーにセットする plt.plot(データ列x, データ列y, color='cadetblue') plt.plot(データ列x, データ列y, color='cadetblue') -ValueError: Found input variables with inconsistent numbers of samples: A[9, 207]model.fit(X, y) うーん。 うーん。 -日付データからn週間分減算する aDate - datetime.timedelta(weeks=n) aDate - datetime.timedelta(weeks=n) -TypeError: A() must have at least two arguments.mapa,b,h,m=map(input().split()) (int, input().split()) に直そう。 (int, input().split()) に直そう。 -折れ線グラフをミディアムスレートブルー色として描画する plt.plot(データ列x, データ列y, color='mediumslateblue') plt.plot(データ列x, データ列y, color='mediumslateblue') -option: 色をディムグレーに変更する color = 'dimgrey' color = 'dimgray' -ライムグリーン色で線グラフを描画する plt.plot(データ列x, データ列y, color='limegreen') plt.plot(データ列x, データ列y, color='limegreen') -タイムスタンプデータは何曜日か知る aDatetime.weekday() aDatetime.weekday() -NameError: name A is not defined'kogi_login'kogi_login(ai_key='1fnp38_4EYzTU39qtvj7QWbWZ1c5XFw_m', class_name='atcoder') 関数 を定義しよう。 関数 を定義しよう。 -横棒グラフをアイボリー色として描画する plt.barh(データ列x, データ列y, color='ivory') plt.barh(データ列x, データ列y, color='ivory') -行列積を算出する aArray.matmul(aArray, aArray2) np.matmul(aArray, aArray2) -カーネル密度推定グラフ描画でを使う sns.kdeplotzscore(x='列名', hue='カテゴリ列', data=df) sns.kdeplot(x='列名', hue='カテゴリ列', data=df) -ベクトルのユニークな要素とその位置を求める u, indices = np.unique(aArray, return_counts=True) u, indices = np.unique(aArray, return_index=True) -option: フクシア色を用いる color = 'fuchsia' color = 'fuchsia' -option: マーカーをクロスに変える marker = 'x' marker = 'x' -オブジェクトがプロパティを持つか hasattr(obj, プロパティ名) hasattr(obj, プロパティ名) -3つのデータフレームを縦方向に結合する pd.concat([df, df2, 4, df3], axis=1) pd.concat([df, df2, df3], axis=1) -文字列がセットのメンバーでない 文字列 not in セット 文字列 not in セット -オブジェクトはタプル tuple = intisinstance(obj, tuple) tuple = intisinstance(obj, tuple) -暗い赤色でヒストグラムを描画する plt.hist(データ列, color='darkred') plt.hist(データ列, color='darkred') -データフレームの中の列を等しい量になるようにn個に分割する pd.qcut(df[col], n) pd.qcut(df[col], n) -二つの辞書を階層的につなぐ collections.ChainMap(aDict, aDict2) collections.ChainMap(aDict, aDict2) -コロンで末尾から文字列を区切る 文字列.rsplit(':') 文字列.rsplit(':') -最大値・最小値を用いて乱数を発生させる random.randint(最小値, 最大値) random.randint(最小値, 最大値) -TypeError: A object does not support item assignment'int'N[-1]=a うーん。 うーん。 -データフレームの一部の列の文字列を欠損値に変換する df[['列A', '列B']].replace(値, np.nan) df[['列A', '列B']].replace(値, np.nan) -文字列を走査し、パターンにマッチするか見る re.search(pattern, s) re.search(pattern, s) -散布図の丸印を赤くする plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='r') -NameError: name A is not defined'df_train_pr_name'X_train_pr_name = pd.DataFrame(df_train_pr_name) 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -横棒グラフをダークカーキ色として描画する plt.barh(データ列x, データ列y, color='darkkhaki') plt.barh(データ列x, データ列y, color='darkkhaki') -ダークブルー色としてヒストグラムを描画する plt.hist(データ列, color='darkblue') plt.hist(データ列, color='darkblue') -配列を縦ベクトルに変形する aArray.reshape(行数, 列数) aArray.reshape(-1, 1) -ヒストグラムの色をダークオーキッドに変更する plt.hist(データ列, color='darkorchid') plt.hist(データ列, color='darkorchid') -欠損値が存在する行をドロップしてみる df.dropna() df.dropna() -NameError: name A is not defined'prit'prit(a,c) list のスペルミスだよ。 print のスペルミスだよ。 -ValueError: not enough values to unpack (expected A, got B)2 1x,y=map(str, input().split()) 問題番号と入力データはあってる? 問題番号と入力データはあってる? -数列から重複なく、n個ランダムに選んでリスト化する random.sample(数列, k=n) random.sample(数列, k=n) -データフレームとしてカンマ区切りのファイルを読み込む pd.read_csv('file.csv', sep=',') pd.read_csv('file.csv', sep=',') -リストを順にプリントする print(リスト) print(*リスト) -辞書をJSON形式でファイル出力に出力する json.dump(辞書, ファイル出力, ensure_ascii=False) json.dump(辞書, ファイル出力, ensure_ascii=False) -option: 線種を点線に変更する linestyle = 'dotted' linestyle = 'dotted' -TypeError: A not supported between instances of B and C'>=' 'str' 'int'if a + b >= 10 : の比較になっちゃているよ。 の比較になっちゃているよ。 -ピアソンを用いてデータフレームの相関行列を算出する df.corr(method='pearson') df.corr(method='pearson') -nから始まる無限数列を得る itertools.count(start=n) itertools.count(start=n) -リストの末尾から値をポップする リスト.pop() リスト.pop() -色付きの一点鎖線としてデータ列の推移を描画する plt.plot(データ列x, データ列y, linestyle='dashbot', color='#800080') plt.plot(データ列x, データ列y, linestyle='dashbot', color='#800080') -フォーマットでデータ列をタイムスタンプにする pd.to_datetime(ds, format='%Y-%m-%d') pd.to_datetime(ds, format='%Y-%m-%d') -リストをJSON形式の文字列にする json.dumps(リスト, ensure_ascii=False) json.dumps(リスト, ensure_ascii=False) -折れ線グラフに青い△印を描画する plt.plot(データ列x, データ列y, marker='^', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='b') -事前に複数行対応としてパターンをコンパイルする re.compile(pattern, flag=re.MULTILINE) re.compile(pattern, flag=re.MULTILINE) -散布図のクロス印の色を変更する plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='#800080') -日付時刻データの日付を使う aDatetime.date() aDatetime.date() -option: グラフの色をプラムにセットする color = 'plum' color = 'plum' -日付時刻データが日曜日か確認する aDatetime.weekday() == 6 aDatetime.weekday() == 6 -赤い右三角マーカーとして散布図をプロットする plt.plot(データ列x, データ列y, marker='>', c='r') plt.plot(データ列x, データ列y, marker='>', c='r') -スレートブルー色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='slateblue') plt.barh(データ列x, データ列y, color='slateblue') -文字列の両端から部分文字列を除去する 文字列.strip(部分文字列) 文字列.strip(部分文字列) -行列は何次元か調べる aArray.ndim aArray.ndim -deqのstart〜endの要素 collections.deque(itertools.islice(de=itertools)) collections.deque(itertools.islice(deq, start, end)) -データフレームの2つのカラムを並べて箱ひげ図で作図する plt.boxplot([df['カラム'], df['カラム']]) plt.boxplot([df['カラム'], df['カラム']]) -mathを使う import numpy as np import math -データフレームの指定したカラムの中にと日付データがある df['列A'].isin([value, value2]) df['列A'].isin([value, value2]) -ファイルからnバイト、読む f.read(n) f.read(n) -ブースティングで回帰分析をする model = sklearn.ensemble.AdaBoostRegressor(random_state=0, n_estimators=100) model = sklearn.ensemble.AdaBoostRegressor(random_state=0, n_estimators=100) -ダーク・スラテグレー色を用いてヒストグラムを描画する plt.hist(データ列, color='darkslategrey') plt.hist(データ列, color='darkslategrey') -2つのデータフレームをジョインする pd.merge(df, df2) pd.merge(df, df2) -縦棒グラフをライトグリーン色で描画する plt.bar(データ列x, データ列y, color='lightseagreen') plt.bar(データ列x, データ列y, color='lightgreen') -IndexError: list index out of rangeif int(l[i][2])-int(l[i][0])>0: インデックスはリストの大きさより小さくしよう。 インデックスはリストの大きさより小さくしよう。 -tan math.nan math.tan(x) -文字列の右側から不要な改行を取り除く 文字列.rstrip('\n') 文字列.rstrip() -整数が整数2未満、またはn3以上か 整数 < 整数2 or 整数 整数 >= n3 整数 < 整数2 or 整数 >= n3 -サポートベクターマシンでクラス分類をする model = sklearn.svm.SVR(kernel='rbf', kernel='rbf', C=1e3, gamma=0.1, gamma=0.1, epsilon=0.1, epsilon=0.1) model = sklearn.svm.SVR(kernel='rbf', C=1e3, gamma=0.1, epsilon=0.1) -データフレームの指定したカラムの未入力値をxで補う df['列A'].fillna(x) df['列A'].fillna(x) -AttributeError: module A has no attribute B'math' 'floot' うーん。 うーん。 -エラーの種類を使う etype, evalue, traceback = sys.stderr() etype, evalue, traceback = sys.exc_info() -文字列中にひとつでも数字が含まれるか判定する any(c.isdigit() for c in 文字列) any(c.isdigit() for c in 文字列) -TypeError: A() got an unexpected keyword argument B__init__ 'max_depth'model = Pipeline(max_depth=5) はこのモデルには存在しないハイパーパラメータだよ。 はこのモデルには存在しないハイパーパラメータだよ。 -縦棒グラフをブラック色で描画する plt.bar(データ列x, データ列y, color='black') plt.bar(データ列x, データ列y, color='black') -指定したカラムを丸めて、整数にする df['列A'].round().astype(int) df['列A'].round().astype(int) -ラベンダー色でヒストグラムを描画する plt.hist(データ列, color='lavender') plt.hist(データ列, color='lavender') -入力から2つの浮動小数数を読む A, B = map(float, input().split()) A, B = map(float, input().split()) -分子と分母から有理数を用意する fractions.Fraction(分子, 分母) fractions.Fraction(分子, 分母) -データフレームの選択したカラムをValueMapでまとめて置き換える df[['列A', '列B']].replace(ValueMap) df[['列A', '列B']].replace(ValueMap) -2つのリストからマップ dict(zip(リスト, リスト2)) dict(zip(リスト, リスト2)) -ヒストグラムの色をライトシアンに指定する plt.hist(データ列, color='lightcyan') plt.hist(データ列, color='lightcyan') -データフレームを百の位で丸めて整数型にする df.round(-2).astype(int) df.round(-2).astype(int) -SyntaxError: unexpected EOF while parsing (A, line B) 14 行目が途中で終わってる?括弧を閉じ忘れていない? 行目が途中で終わっているよ。括弧を閉じ忘れていない? -"KeyboardInterrupt:print(""Easy"")" 自分で実行を止めた? 自分で実行を止めた? -日付時刻データの日 aDatetime.day aDatetime.day -ヒストグラムの色をミントクリームにする plt.hist(データ列, color='mintcream') plt.hist(データ列, color='mintcream') -2つの文字列は等しくないか調べる 文字列!= 文字列2 文字列 != 文字列2 -赤い点線で折れ線グラフを描画する plt.plot(データ列x, データ列y, linestyle='dotted', color='r') plt.plot(データ列x, データ列y, linestyle='dotted', color='r') -半透明の点線でリストの変化を描画する plt.plot(データ列x, データ列y, linestyle='dotted', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dotted', alpha=0.5) -フクシア色としてヒストグラムを描画する plt.hist(データ列, color='fuchsia') plt.hist(データ列, color='fuchsia') -option: ラベンダー色を使用する color = 'lavender' color = 'lavender' -ホワイト色のヒストグラムを描画する plt.hist(データ列, color='white') plt.hist(データ列, color='white') -TypeError: can't multiply sequence by non-int of type A'tuple'e=c*d うーん。 うーん。 -ケンドール相関係数としてデータフレームの一部の列の相関行列を計算する df[['列A', '列B']].corr(method='kendall') df[['列A', '列B']].corr(method='kendall') -AttributeError: A object has no attribute B'set' 'append'skill.append(A[i]) appendメソッドは使えないよ。 うーん。 -最後のコロンで文字列を二分する 文字列.rpartition(':') 文字列.rpartition(':') -データフレームのあるカラムの第一四分位数を求める df['列A'].quantile(0.25) df['列A'].quantile(0.25) -色を色差別なくする sns.set(pallete='colorblind') sns.set(pallete='colorblind') -AttributeError: A object has no attribute B'str' 'inupper' うーん。 うーん。 -文字列の無限イテラブルを求める itertools.repeat(element) itertools.repeat(element) -グラフのy軸を対数目盛に変更する plt.yscale('log') plt.yscale('log') -双方向キューを数列から新規生成する collections.deque(数列) collections.deque(数列) -クラスが名前付きタプルか issubclass(C, tuple) issubclass(C, tuple) -NameError: name A is not defined'list_w'print(wakachi(list_w,'吾輩は猫である。名前はまだない。')) 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -ゴールデンロッド色を用いてヒストグラムを描画する plt.hist(データ列, color='goldenrod') plt.hist(データ列, color='goldenrod') -最後のセパレータで文字列を分割し、、最初の方を使う 文字列.rpartition(セパレータ)[0] 文字列.rpartition(セパレータ)[0] -データシリーズの中に日付データとがいくつあるか数える ds.isin([value, value2]).sum() ds.isin([value, value2]).sum() -TypeError: A object is not subscriptable'int'print(l[i][k]) 整数は先に文字列に変換しよう。 整数は先に文字列に変換しよう。 -"KeyError: ""None of A are in the B""'[Index([('犯罪率',), ('犯罪率',)], dtype='obje...X = df[[[column],[column]]]" データフレームに存在しない列名を使っているよ。 データフレームに存在しない列名を使っているよ。 -SyntaxError: unexpected EOF while parsing (A, line B) 1 行目が途中で終わっているよ。括弧を閉じ忘れていない? 行目が途中で終わっているよ。括弧を閉じ忘れていない? -列をフォーマットを使って日付データに変換する pd.to_datetime(df['列A'], format='%Y-%m-%d') pd.to_datetime(df['列A'], format='%Y-%m-%d') -ヒストグラムをスプリンググリーン色として描画する plt.hist(データ列, color='springgreen') plt.hist(データ列, color='springgreen') -ヒストグラムの色をシアンにする plt.hist(データ列, color='cyan') plt.hist(データ列, color='cyan') -ある列のカテゴリで集計し、分散を求める df.groupby('列A').var() df.groupby('列A').var() -t-SNEで項次元に削減する sklearn.manifold.TSNE(n_components=二).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=二).fit_transform(多次元データ) -option: 行列のデータ型を指定する np.uint8 = np.intdtype = np.uint8 np.int32 = np.intdtype = np.int32 -指定された列で集計し、標準偏差を算出する df.groupby('列A').std() df.groupby('列A').std() -option: フォントの色をミディアムスプリンググリーンに設定する color ='mediumspringgreen' color = 'mediumspringgreen' -横棒グラフの色をホワイト��する plt.barh(データ列x, データ列y, color='white') plt.barh(データ列x, データ列y, color='white') -配列の推移を実線で描画する plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid') -折れ線グラフに赤い上三角マーカーを描画する plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') -TypeError: A object is not subscriptable'builtin_function_or_method' うーん。 うーん。 -0から始まるn個の整数列を得る list(range(n)) list(range(n)) -ミディアムオーキッド色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mediumorchid') plt.plot(データ列x, データ列y, color='mediumorchid') -TypeError: A() missing B required positional argument: Cnum2alpha 1 'a'S=num2alpha() うーん。 うーん。 -ダークシアグリーン色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='darkseagreen') plt.plot(データ列x, データ列y, color='darkseagreen') -棒グラフをオーキッド色として描画する plt.bar(データ列x, データ列y, color='orchid') plt.bar(データ列x, データ列y, color='orchid') -前の行の値でデータシリーズの欠損値を埋める ds.fillna(method='ffill') ds.fillna(method='ffill') -ヒストグラムの色をシエナに指定する plt.hist(データ列, color='sienna') plt.hist(データ列, color='sienna') -横棒グラフをダークオレンジ色として描画する plt.barh(データ列x, データ列y, color='darkorange') plt.barh(データ列x, データ列y, color='darkorange') -KeyError: A'通勤時間'X = df['通勤時間'] # ひとつ選ぶ データフレームにという列はないよ。 データフレームにという列はないよ。 -範囲を指定して部分文字列を後方から探す 文字列.find(部分文字列, 開始位置, 終了位置) # 見つからない場合は-1 文字列.find(部分文字列, 開始位置, 終了位置) # 見つからない場合は-1 -NameError: name A is not defined'imt'print(imt(S[i]+N)) 変数を使う前に =... のように値を代入しよう。 int のスペルミスだよ。 -日付データの日数を使う aDate.day aDate.day -TypeError: unsupported operand type(s) for +=: A and B'int' 'list'x+=[] うーん。 うーん。 -"KeyError: ""None of A are in the B""[Index(['低所得'], dtype='object')] [column...X = df[['低所得']]" データフレームに存在しない列名を使っているよ。 データフレームに存在しない列名を使っているよ。 -整数が1、もしくは2か 整数 == 1 or 整数 == 2 整数 == 1 or 整数 == 2 -データフレームの未入力値を中央値に指定する df.fillna(df.median()) df.fillna(df.median()) -ベクトルの最小値 np.min(aArray) np.min(aArray) -データフレームの値を正規表現patternで全部置換する df.replace(pattern, repl, regex=True) df.replace(pattern, repl, regex=True) -ValueError: Could not interpret input A'weather'sns.countplot(x='weather', data=df) うーん。 うーん。 -部分文字列を文字列のプレフィックスから取り除く 文字列.removesuffix(部分文字列) 文字列.removeprefix(部分文字列) -散布図にポイント印を使う plt.scatter(データ列x, データ列y, marker='.') plt.scatter(データ列x, データ列y, marker='.') -リストを引数として展開してプリントする print(*リスト) print(*リスト) -ミディアムスプリンググリーン色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mediumspringgreen') plt.plot(データ列x, データ列y, color='mediumspringgreen') -グラフの色を淡くする sns.set(pallete='muted') sns.set(pallete='muted') -キューの中に整数が含まれてるか判定する 整数 in 両端キュー 整数 in 両端キュー -文字列を最後の部分文字列で二分し、、残りを求める 文字列.rpartition(部分文字列)[-1] 文字列.rpartition(部分文字列)[-1] -ミディアムターコイズ色でヒストグラムを描画する plt.hist(データ列, color='mediumturquoise') plt.hist(データ列, color='mediumturquoise') -データフレームの選択したカラムの欠損値を平均値で補う df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) -データフレームの一部のカラムを10の位で四捨五入して、整数にする df[['列A', '列B']].round(-1).astype(int) df[['列A', '列B']].round(-1).astype(int) -横棒グラフをライトサーモン色として描画する plt.barh(データ列x, データ列y, color='lightsalmon') plt.barh(データ列x, データ列y, color='lightsalmon') -あるカラムの中にいくつ欠損値があるか数える df['列A'].isna().sum() df['列A'].isna().sum() -option: グラフの色をシアンに指定する color = 'cyan' color = 'cyan' -ディムグレー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='dimgrey') plt.bar(データ列x, データ列y, color='dimgray') -縦棒グラフの色を暗い赤にする plt.bar(データ列x, データ列y, color='darkred') plt.bar(データ列x, データ列y, color='darkred') -TypeError: slice indices must be integers or None or have an __index__ method うーん。 うーん。 -リストを更新不能な集合に変換する frozenset(リスト) frozenset(リスト) -ライトグレー色で棒グラフを描画する plt.bar(データ列x, データ列y, color='lightgrey') plt.bar(データ列x, データ列y, color='lightgrey') -本日の曜日を整数で見る datetime.datetime.today().weekday() datetime.datetime.today().weekday() -TypeError: A() argument B must be str, not intreplace 1n.replace(1,9 ) できるのは文字列だよ。 できるのは文字列だよ。 -option: 色をダークカーキに変更する color = 'darkkhaki' color = 'darkkhaki' -貝殻色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='seashell') plt.bar(データ列x, データ列y, color='seashell') -折れ線グラフに大バツ印を加える plt.plot(データ列x, データ列y, marker='X') plt.plot(データ列x, データ列y, marker='X') -表データのあるカラムを日付インデックスにする df.index = pd.DatetimeIndex(pd.to_datetime(df['列A'])) df.index = pd.DatetimeIndex(pd.to_datetime(df['列A'])) -横棒プロットを描く plt.barh(ラベル列, データ列) plt.barh(ラベル列, データ列) -エクセルファイルファイルからSJISでカンマ区切りのファイルを読む pd.read_csv('file.csv', encoding='shift_jis') pd.read_csv('file.csv', encoding='shift_jis') -折れ線グラフの▼マーカーの大きさを変更する plt.plot(データ列x, データ列y, marker='v', markersize=2.0) plt.plot(データ列x, データ列y, marker='v', markersize=2.0) -AttributeError: module A has no attribute B'pandas' 'DateFrame'df = pd.DateFrame() DataFrameのスペルミスだよ。 DataFrameのスペルミスだよ。 -KeyError: A'[5] not found in axis'df3.drop(5, axis=1) データフレームにという列はないよ。 データフレームにという列はないよ。 -ミスティローズ色として散布図を描画する plt.scatter(データ列x, データ列y, color='mistyrose') plt.scatter(データ列x, データ列y, color='mistyrose') -オブジェクトは辞書型か確認する dict = intisinstance(obj, dict) dict = intisinstance(obj, dict) -文字列の右側から不要な空白を取り除く 文字列.rstrip() 文字列.rstrip() -ヒストグラムをダークマゼンタ色として描画する plt.hist(データ列, color='darkmagenta') plt.hist(データ列, color='darkmagenta') -ホワイトスモーク色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='whitesmoke') plt.barh(データ列x, データ列y, color='whitesmoke') -NameError: name A is not defined'i'if n[i]=='1': 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -ValueError: too many values to unpack (expected A)2a,b=map(int,input()) 問題番号と入力データはあってる? 問題番号と入力データはあってる? -実数の3乗を計算する x ** 3 x ** 3 -y軸の目盛の表示を変更する plt.xticks(目盛りの値リスト) plt.yticks(目盛りの値リスト) -複数のの条件が何か成り立つ 条件 or 条件2 条件 or 条件2 or 条件3 -散布図をrgbのダイアモンドマーカーで描画する plt.plot(データ列x, データ列y, marker='D', c=rgb) plt.plot(データ列x, データ列y, marker='D', c=rgb) -文字列を最後の部分文字列で二分割して、最初の方を使う 文字列.rpartition(部分文字列)[0] 文字列.rpartition(部分文字列)[0] -珊瑚色を使って散布図を描画する plt.scatter(データ列x, データ列y, color='coral') plt.scatter(データ列x, データ列y, color='coral') -リストをビン数nで分割して、namesのラベルをつける pd.cut(aList, n, labels=names) pd.cut(aList, n, labels=names) -一番左側のを除いたデータフレーム df[df.columns[1:]] df[df.columns[1:]] -データフレームのカラムのケンドールの相関係数 scipy.stats.kendalltau(df['列A'], df['列B']) scipy.stats.kendalltau(df['列A'], df['列B']) -TypeError: A() must have at least two arguments.mapA=list(map( input().split())) (int, input().split()) に直そう。 (int, input().split()) に直そう。 -線グラフの色をベージュに指定する plt.plot(データ列x, データ列y, color='beige') plt.plot(データ列x, データ列y, color='beige') -文字列の右側から改行を取り除��� 文字列.rstrip('\n') 文字列.rstrip() -オールドレース色を用いて横棒グラフを描画する plt.barh(データ列x, データ列y, color='oldlace') plt.barh(データ列x, データ列y, color='oldlace') -データフレームの最初5行を抽出する df.head(5) df.head(5) -NameError: name A is not defined'k'k[0]=S[1] 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -ValueError: Expected 2D array, got 1D array instead:model.fit(X,y) うーん。 うーん。 -NameError: name A is not defined'df'X = df[df.columns[:-1]] 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -リストの先頭の要素を見る リスト[1:] リスト[0] -昇順にリストの要素を並べる sorted(リスト, reverse=False) sorted(リスト, reverse=True) -辞書を用いて文字列を数える if 文字列 in 辞書:辞書[文字列] += 1else:辞書[文字列] = 1 if 文字列 in 辞書:辞書[文字列] += 1else:辞書[文字列] = 1 -ValueError: No axis named A for object type DataFrame5df.drop('生年月日', axis=5, inplace=True) うーん。 うーん。 -実行時の標準入力のソースがターミナルか調べる os.isatty(sys.stdin.fileno()) os.isatty(sys.stdin.fileno()) -NameError: name A is not defined'a'while a>=Y: 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -回帰分析をランダム性を追加したランダムフォレストで行う model = sklearn.ensemble.ExtraTreeRegressor(n_estimators=10) model = sklearn.ensemble.ExtraTreeRegressor(n_estimators=10) -データシリーズの未入力値をモードにセットする d.fillna(ds.mode().iloc[0]) ds.fillna(ds.mode().iloc[0]) -散布図の左三角マーカーを赤色にする plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='<', markerfacecolor='r') -ライトイエロー色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='lightyellow') plt.bar(データ列x, データ列y, color='lightyellow') -表の相関行列 df.corr() df.corr() -イテラブルとイテラブルの散布図を描き、、その大きさをnに指定する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) -列名を指定して二つのデータフレームを結合する pd.merge(df, df2, on='列A', how='outer') 'pd.merge(df, df2, on='列A') -スラグレー色でヒストグラムを描画する plt.hist(データ列, color='slategray') plt.hist(データ列, color='slategray') -rgbの左三角マーカーで散布図をプロットする plt.plot(データ列x, データ列y, marker='<', c=rgb) plt.plot(データ列x, データ列y, marker='<', c=rgb) -ダークグレー色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkgray') plt.barh(データ列x, データ列y, color='darkgray') -原点から点までの距離 math.hypot(x, y) math.hypot(x, y) -横方向に2つの表データをマージする pd.merge(df, df2) pd.merge(df, df2) -データフレームからあるデータ型の列名の一覧 df.select_dtypes(型).select_dtypes(型) df.select_dtypes(型).columns -ライトグレー色で散布図を描画する plt.scatter(データ列x, データ列y, color='lightgrey') plt.scatter(データ列x, データ列y, color='lightgray') -IndentationError: unexpected indent (A, line B) 8 行目のインデントがおかしいよ。 行目のインデントがおかしいよ。 -数式のインテグラルを計算する sympy.integrate(数式) sympy.integrate(数式) -線グラフの色を黄色に変更する plt.plot(データ列x, データ列y, color='yellow') plt.plot(データ列x, データ列y, color='yellow') -TypeError: slice indices must be integers or None or have an __index__ methodprint(S[N:S]) うーん。 うーん。 -要素がセットに含まれるか 要素 in セット 要素 in セット -"KeyError: ""A not in index""['部屋巣']X = df[['部屋巣', '低所得率']] # 説明変数 二つ選ぶ" データフレームの列名が間違っているよ。 データフレームの列名が間違っているよ。 -線形モデルの回帰変数を見る model.coef_ model.coef_ -パウダーブルーにヒストグラムの色を設定する plt.hist(データ列, color='powderblue') plt.hist(データ列, color='powderblue') -データフレームの列のユニークな要素数 ds.unique() df[col].nunique() -ダークグレー色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkgray') plt.barh(データ列x, データ列y, color='darkgrey') -ポ��ント印を使って散布図を描画する plt.scatter(データ列x, データ列y, marker='.') plt.scatter(データ列x, データ列y, marker='.') -黒い右三角マーカーを配列と数列の散布図に描画する plt.plot(データ列x, データ列y, marker='>', c='k') plt.plot(データ列x, データ列y, marker='>', c='k') -データラベルを加える 辞書 = {} plt.legend(['凡例A', '凡例B']) -縦棒グラフの色をラベンダーにする plt.bar(データ列x, データ列y, color='lavender') plt.bar(データ列x, データ列y, color='lavender') -リストの最後からn番目以前の要素を得る リスト[:n] リスト[:-n] -折れ線グラフの色をアリスブルーにする plt.plot(データ列x, データ列y, color='aliceblue') plt.plot(データ列x, データ列y, color='aliceblue') -year年を日付時刻にする datetime.datetime(year=year, month=1, day=1) datetime.datetime(year=year, month=1, day=1) -option: タンを用いる color = 'tan' color = 'tan' -グラフの縦軸を対数目盛に変更する plt.yscale('y軸ラベル') plt.yscale('log') -配列間の各要素の最小公倍数 np.lcm(aArray, aArray2) np.lcm(aArray, aArray2) -線形回帰モデルを訓練する model = sklearn.linear_model.LinearRegression() model.fit(説明変数, 目的変数) -yについて数式のインテグラルを求める sympy.integrate(数式, y) sympy.integrate(数式, y) -データシリーズの中に文字列と文字列が存在するか ds.isin([value, value2]) ds.isin([value, value2]) -データシリーズがどれだけ、正規分布から歪んでいるか調べる ds.kurt() ds.kurt() -折れ線グラフの色をミディアムバイオレットレッドにセットする plt.plot(データ列x, データ列y, color='mediumvioletred') plt.plot(データ列x, データ列y, color='mediumvioletred') -カラムのユニークな値の個数 df[col].n_counts(df[col], n).dayofweek) df[col].nunique() -折れ線グラフの色をスプリンググリーンにセットする plt.plot(データ列x, データ列y, color='springgreen') plt.plot(データ列x, データ列y, color='springgreen') -predicateFuncを適用したときTrueとならないイテラブルの要素 itertools.dropwhile(predicateFunc, iterable) itertools.dropwhile(predicateFunc, iterable) -ヒストグラムと勾配ブースティングを用いて回帰分析を行う model = sklearn.ensemble.HistGradientBoostingRegressor() model = sklearn.ensemble.HistGradientBoostingRegressor() -AttributeError: A object has no attribute B'DataFrame' 'sort_ylues'df3.sort_ylues(by = '身長', ascending = False) うーん。 うーん。 -浮動小数点数はNaNか調べる x.isna() math.isnan(x) -標準入力から1文字分読む sys.stdin.read(1) sys.stdin.read(1) -プロットの横軸を対数に変更する plt.xscale('log') plt.xscale('log') -データフレームの一部のカラムの中にある文字列の合計を求める df[['列A', '列B']].isin([value]).sum() df[['列A', '列B']].isin([value]).sum() -デックに整数をプッシュする 両端キュー.append(整数) 両端キュー.append(整数) -ヒストグラムを描画して半透明ににする plt.hist(データ列, alpha=0.5) plt.hist(データ列x, alpha=0.5) -カテゴリで色分けして、データフレームを線形回帰付き散布図にする sns.regplot(x='列名', y='列名', hue='カテゴリ列', data=df) sns.regplot(x='列名', y='列名', hue='カテゴリ列', data=df) -整数の商 整数 / 整数2 整数 / 整数2 -配列から重複を除いた配列を作成する np.unique(aArray) np.unique(aArray) -データフレームの選択したカラムの未入力値を中央値に増やす df[['列A', '列B']].fillna(df[['列A', '列B']].median()) df[['列A', '列B']].fillna(df[['列A', '列B']].median()) -エポック秒のデータ列からdatetime64型に変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True) -配列からn個サンプリングしてリスト化する random.sample(配列, k=n) random.sample(配列, k=n) -2つの列でグループ化し、平均値を求める df.groupby(['列A', '列B'], as_index=False).mean() df.groupby(['列A', '列B'], as_index=False).mean() -KeyError: (A, B, C, D)'soldout' 'kcal' 'payday' 'temperature'X = df['soldout','kcal','payday','temperature'] # 価格以外を全て説明変数に [[, , , , , ]] ←2重括弧だよ。 [[, , , ]] ←2重括弧だよ。 -疑似乱数 random.random() random.random() -xを水色にする f'\033[36m{x}\033[0m' f'\033[36m{x}\033[0m' -NameError: name A is not defined'la' うーん。 うーん。 -散布図にクロスマーカーを使う plt.scatter(データ列x, データ列y, marker='x') plt.scatter(データ列x, データ列y, marker='x') -データフレームがどの程度、分散しているか確認する df.var() df.var() -新しい重回帰モデルを作る model = sklearn.linear_model.LinearRegression() model = sklearn.linear_model.LinearRegression() -リストの最後に要素を追加する リスト.append(要素) リスト.append(要素) -ヒストグラムをダークオーキッド色として描画する plt.hist(データ列, color='darkorchid') plt.hist(データ列, color='darkorchid') -浮動小数点数を複素数に変換する complex(x) complex(x) -データフレームをインデックスによって降順で並べ直す df.sort_index(ascending=0) df.sort_index(ascending=False) -カウンタの要素のカウント aCounter[element] aCounter[element] -イテラブルからランダムに一つ選んでリストにする random.choice(イテラブル) random.choice(イテラブル) -セットを差分だけに更新する セット.difference_update(セット2) セット.difference_update(セット2) -オレンジレッド色を使って棒グラフを描画する plt.bar(データ列x, データ列y, color='orangered') plt.bar(データ列x, データ列y, color='orangered') -option: サーモンを使う color ='salmon' color = 'salmon' -折り返しをしない pd.set_option('expand_frame_repr', False) pd.set_option('expand_frame_repr', False) -TypeError: A object is not subscriptable'function' うーん。 うーん。 -セットを更新不能に変換する frozenset(セット) frozenset(セット) -ダークオレンジ色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkorange') plt.barh(データ列x, データ列y, color='darkorange') -ダークカーキにヒストグラムの色を設定する plt.hist(データ列, color='darkkhaki') plt.hist(データ列, color='darkkhaki') -散布図の印をクロス印にする plt.scatter(データ列x, データ列y, marker='x') plt.scatter(データ列x, データ列y, marker='x') -データフレームのインデックスがnの行を選ぶ df.index = n df.loc[n] -y座標だけグリッド線 plt.grid(axis='y軸ラベル') plt.grid(axis='y') -option: ダークオーキッドにグラフの色を設定する color = 'darkorchid' color = 'darkorchid' -簡単な説明の位置を(x,y)に設定する plt.legend(loc=(x, y)) plt.legend(loc=(x, y)) -オブジェクトの属性の値 getattr(obj, プロパティ名) getattr(obj, プロパティ名) -ロージーブラウン色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='rosybrown') plt.scatter(データ列x, データ列y, color='rosybrown') -インタプリタの実行ファイルの絶対パス sys.executable sys.executable -縦棒グラフをゴーストホワイト色で描画する plt.bar(データ列x, データ列y, color='ghostwhite') plt.bar(データ列x, データ列y, color='ghostwhite') -モデルデータでを学習する model.fit(説明変数, 目的変数) model.fit(説明変数, 目的変数) -option: 三角印を描画する marker = '^' marker = '^' -切り上げて整数にする 変数 *= 整数 math.ceil(x) -指定された列のカテゴリで集計し、各分散を計算する df.groupby('列A').var() df.groupby('列A').var() -折れ線グラフの▼印の線幅を変更する plt.plot(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='v', markeredgewidth=2.5) -日付時刻データの日を求める aDatetime.day aDatetime.day -データフレームの指定したカラムの中にがあるか調べる df['列A'].isin([value]) df['列A'].isin([value]) -option: パレットトルコイズにフォントの色を設定する color = 'paleturquoise' color = 'paleturquoise' -線グラフの色をインディアンレッドに設定する plt.plot(データ列x, データ列y, color='indianred') plt.plot(データ列x, データ列y, color='indianred') -データフレームを複数の列によって昇順に並べる df.sort_values(by=['列A', '列B'], ascending=True) df.sort_values(by=['列A', '列B'], ascending=True) -モデルを訓練する model.fit(説明変数, 目的変数) model.fit(説明変数, 目的変数) -タプルを無限に繰り返す itertools.cycle(iterable) itertools.cycle(iterable) -option: ホットピンクに色を変更する color = 'hotpink' color = 'hotpink' -シエナにヒストグラムの色を設定する plt.hist(データ列, color='sienna') plt.hist(データ列, color='sienna') -折れ線グラフをダークグリーン色を用いて描画する plt.plot(データ列x, データ列y, color='darkgreen') plt.plot(データ列x, データ列y, color='darkgreen') -辞書順で文字列が文字列より前かどうか 文字列 < 文字列2 文字列 < 文字列2 -データ列と配列についての散布図に丸マーカーを描く plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o') -xをマゼンタで表示する print(f'\033[35m{x}\033[0m') print(f'\033[35m{x}\033[0m') -SyntaxError: invalid syntax (A, line B) 5 行目の書き方が違うよ。 行目の��き方が違うよ。 -セパレータで文字列を分割して文字列リストに変換する 文字列.split(セパレータ) 文字列.split(セパレータ) -整数と整数のXOR 整数 | 整数2 整数 ^ 整数2 -データフレームのカラムの最頻値を算出する mode, count = scipy.stats.mode(df['列A']) mode, count = scipy.stats.mode(df['列A']) -SyntaxError: invalid syntax (A, line B) 2 行目の書き方が違うよ。 行目の書き方が違うよ。 -文字は漢字かどうか調べる # Tips('ァ' <= 文字 <= 'ン') ('\u4E00' <= 文字 <= '\u9FD0') -リストの総和を算出する sum(リスト) sum(リスト) -データフレームの指定したカラムの尖り df['列A'].skew() df['列A'].skew() -日付データからn週間分引く aDate - datetime.timedelta(weeks=n) aDate - datetime.timedelta(weeks=n) -点線に折れ線グラフの線の種類を設定する plt.plot(データ列x, データ列y, linestyle='dotted') plt.plot(データ列x, データ列y, linestyle='dotted') -データフレームをCSVファイルにBOMを付けて保存する df.to_csv('file.csv', encoding='utf_8_sig') df.to_csv('file.csv', encoding='utf_8_sig') -整数が1もしくは2、もしくは3に等しいかどうか調べる 整数 == 1 or 整数 == 2 or 整数 == 3 整数 == 1 or 整数 == 2 or 整数 == 3 -データフレームの一部の列の空文字をドロップする df[['列A', '列B']].replace('', np.nan).dropna() df[['列A', '列B']].replace('', np.nan).dropna() -行列の転置行列を求める np.linalg.det(aArray) aArray.T -文字列の中のASCII限定として正規表現による全マッチを見る re.findall(pattern, s, flags=re.ASCI) re.findall(pattern, s, flags=re.ASCI) -フローラルホワイト色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='floralwhite') plt.plot(データ列x, データ列y, color='floralwhite') -ミディアムバイオレットレッド色でヒストグラムを描画する plt.hist(データ列, color='mediumvioletred') plt.hist(データ列, color='mediumvioletred') -option: フォントの色をタンに設定する color = 'tan' color = 'tan' -折れ線グラフの色をスラグレーに変更する plt.plot(データ列x, データ列y, color='slategray') plt.plot(データ列x, データ列y, color='slategrey') -ひとつでもアスキー文字が文字列中に含まれるかどうか調べる any(c.isascii() for c in 文字列) any(c.isascii() for c in 文字列) -リストとリストの散布図に赤いポイントマーカーを描画する plt.plot(データ列x, データ列y, marker='.', c='r') plt.plot(データ列x, データ列y, marker='.', c='r') -"KeyError: ""None of A are in the B""[Index(['住'], dtype='object')] [columns]X = df[[col]]" データフレームに存在しない列名を使っているよ。 データフレームに存在しない列名を使っているよ。 -ヒストグラムを黄色色を使って描画する plt.hist(データ列, color='yellow') plt.hist(データ列, color='yellow') -"KeyError: ""A not found in axis""['投']df2.drop('投',axis=1,inplace=True)" データフレームの列名が間違っているよ。 データフレームの列名が間違っているよ。 -複数のの条件が何れか成り立つ 条件 or 条件2 or 条件3 条件 or 条件2 or 条件3 -ダークグレー色としてヒストグラムを描画する plt.hist(データ列, color='darkgrey') plt.hist(データ列, color='darkgray') -データフレームから指定したデータ型の列名一覧 df.select_dtypes(型).columns df.select_dtypes(型).columns -IndentationError: unexpected indent (A, line B) 2 行目のインデントがおかしいよ。 行目のインデントがおかしいよ。 -シアン色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='cyan') plt.barh(データ列x, データ列y, color='cyan') -option: 青緑色を用いる color = 'teal' color = 'teal' -イエローグリーンにヒストグラムの色を指定する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen') -文字列の終了位置より前に部分文字列が含まれるかどうか調べる 文字列.find(部分文字列, 0, 終了位置)!= -1 文字列.find(部分文字列, 0, 終了位置) != -1 -環境がLinuxか調べる sys.platform.startswith('linux') sys.platform.startswith('linux') -NameError: name A is not defined'S'S[j].append(num) 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -モカシン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='moccasin') plt.bar(データ列x, データ列y, color='moccasin') -データフレームの欠損値をその第二四分位数で補完する df.fillna(df.mean()) df.fillna(df.median()) -ValueError: invalid literal for A() with base B: Cint 10 '7,acr'K,S=map(int, input().split()) 問題番号と入力データはあってる? 問題番号と入力データはあってる? -プロットの描画で淡く色を使用する sns.set(pallete='muted') sns.set(pallete='muted') -option: グラフの色をダークグレーに変更する color = 'darkgray' color = 'darkgrey' -線グラフの色を小麦色に設定する plt.plot(データ列x, データ列y, color='wheat') plt.plot(データ列x, データ列y, color='wheat') -レモンシフォン色として棒グラフを描画する plt.bar(データ列x, データ列y, color='lemonchiffon') plt.bar(データ列x, データ列y, color='lemonchiffon') -データフレームをソートして、新しいインデックスを振り直す df.sort_values('キーとなる列').reset_index() df.sort_values('キーとなる列').reset_index() -コロンで文字列を区切って、列挙する 文字列.split(':') 文字列.split(':') -データフレームの一部のカラムの欠損値をその平均値で埋める df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) df[['列A', '列B']].fillna(df[['列A', '列B']].mean()) -散布図に赤いダイアモンド印を描画する plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='D', markerfacecolor='r') -データ列を分割数nでビン分割する pd.cut(ds, n) pd.cut(ds, n) -部分文字列がsubで始まるかどうか調べる 文字列.startswith(部分文字列) 文字列.startswith(部分文字列) -色付きの実線でリストの変化を描く plt.plot(データ列x, データ列y, linestyle='solid', color='#800080') plt.plot(データ列x, データ列y, linestyle='solid', color='#800080') -データフレームの選択した列の中にある文字列の数を数える df[['列A', '列B']].isin([value]).sum() df[['列A', '列B']].isin([value]).sum() -散布図にクロスマーカーを加える plt.scatter(データ列x, データ列y, marker='x') plt.scatter(データ列x, データ列y, marker='x') -ヒストグラムをレモンシフォン色を用いて描画する plt.hist(データ列, color='lemonchiffon') plt.hist(データ列, color='lemonchiffon') -KeyboardInterrupt:B-(A-n)*x 自分で実行を止めた? 自分で実行を止めた? -デックが空であるかどうか len(両端キュー) == 0 len(両端キュー) == 0 -TypeError: unsupported operand type(s) for +: A and B'map' 'map' うーん。 うーん。 -数値時刻のデータ列から日付データにする pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True) -プロット中で日本語フォントを表示できるようにする sns.set(font='IPAexGothic') sns.set(font='IPAexGothic') -ミディアムオーキッド色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='mediumorchid') plt.plot(データ列x, データ列y, color='mediumorchid') -文字列をスタックに積む 両端キュー.append(文字列) 両端キュー.append(文字列) -配列と数列についての散布図に黒い三角マーカーを描画する plt.plot(データ列x, データ列y, marker='^', c='k') plt.plot(データ列x, データ列y, marker='^', c='k') -サーモンにヒストグラムの色を指定する plt.hist(データ列, color='salmon') plt.hist(データ列, color='salmon') -書き込み用にファイルをBOM付きでオープンする] open(filepath, mode='w', encoding='utf_8_sig') open(filepath, mode='w', encoding='utf_8_sig') -option: ゴーストホワイトを用いる color = 'ghostwhite' color = 'ghostwhite' -セットが真⊂か調べる セット < セット2 セット < セット2 -リストのイミュータブルな集合を作る frozenset(リスト) frozenset(リスト) -要素はセットに含まれるかどうか調べる 要素 in セット 要素 in セット -リストとイテラブルについて散布図をプロットして下三角マーカーの色をrgbに変更する plt.plot(データ列x, データ列y, marker='v', c=rgb) plt.plot(データ列x, データ列y, marker='v', c=rgb) -SyntaxError: invalid syntax (A, line B) 7 行目の書き方が違うよ。 行目の書き方が違うよ。 -"KeyError: ""A not in index""['川辺']X = df[['川辺', '通勤']]" データフレームの列名が間違っているよ。 データフレームの列名が間違っているよ。 -NameError: name A is not defined'cross_val_score'cross_val_score(モデル, X, y, cv=5, scoring='r2') 変数を使う前に =... のように値を代入しよう。 from sklearn.model_selection import を実行しよう。 -タイムスタンプデータの時刻を使う aDatetime.time() aDatetime.time() -IndexError: string index out of range インデックスは文字列長より小さくしよう。 インデックスは文字列長より小さくしよう。 -クラス分類のF値を算出する sklearn.metrics.f1_score(正解データ列, 予測データ列) sklearn.metrics.f1_score(正解データ列, 予測データ列) -縦棒グラフをタン色として描画する plt.bar(データ列x, データ列y, color='tan') plt.bar(データ列x, データ列y, color='tan') -AttributeError: module A has no attribute B'math' 'seil' math のスペルミスだよ。 cielのスペルミスだよ。 -option: アスキー文字に限定する flag = re.Acos flag = re.ASCII -タプルが空でない len(タプル)!= 0 len(タプル) != 0 -折れ線グラフに赤い四角印を描画する plt.plot(データ列x, データ列y, marker='s', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='s', markerfacecolor='r') -散布図に黒いバツ印を描画する plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='x', markerfacecolor='k') -サーモン色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='salmon') plt.barh(データ列x, データ列y, color='salmon') -グラフのカラーパレットを全般的に色差別なくする sns.set(pallete='colorblind') sns.set(pallete='colorblind') -option: ヘッダを自動的な連番に増やす header = None header = None -NameError: name A is not defined'x'if int(X[i+1])-int(x[i])!=1 or -9: 変数を使う前に =... のように値を代入しよう。 変数を使う前に =... のように値を代入しよう。 -シアン色を用いて折れ線グラフを描画する plt.plot(データ列x, データ列y, color='cyan') plt.plot(データ列x, データ列y, color='cyan') -最大行数を変更する pd.set_option('display.max_rows', n) pd.set_option('display.max_rows', n) -日付時刻データが日付時刻データより前かどうか aDatetime2 = aDatetimeaDatetime < aDatetime2 aDatetime2 = aDatetimeaDatetime < aDatetime2 +option: グラフの色をティールに変更する color = 'teal' color = 'teal' +数から浮動小数点数を引く x - y x - y +エンディアンを調べる イテラブル(イディコ) sys.byteorder +線グラフを半透明の実線で描画する plt.plot(データ列x, データ列y, linestyle='solid', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='solid', alpha=0.5) +主成分分析を用いて多次元データを文字列次元に次元削減する N = 2.0sklearn.decomposition.PCA(n_components=N).fit_transform(多次元データ) N = 2sklearn.decomposition.PCA(n_components=N).fit_transform(多次元データ) +ヒストグラムと勾配ブースティングを使ってクラス分類を行う model = sklearn.ensemble.HistGradientBoostingClassifier() model = sklearn.ensemble.HistGradientBoostingClassifier() +文字列の最初の余分な空白を取り除く 文字列.lstrip() 文字列.lstrip() +黒い大バツマーカーとして散布図をプロットする plt.plot(データ列x, データ列y, marker='X', c='k') plt.plot(データ列x, データ列y, marker='X', c='k') +要素はタプルの要素でないか調べる 要素 not in タプル 要素 not in タプル +空の勾配ブースティング回帰木を作る model = sklearn.ensemble.GradientBoostingRegressor() model = sklearn.ensemble.GradientBoostingRegressor() +淡いピンク色色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='lightpink') plt.barh(データ列x, データ列y, color='lightpink') +空の勾配ブースティング分類木を作成する model = sklearn.ensemble.GradientBoostingClassifier() model = sklearn.ensemble.GradientBoostingClassifier() +シエナ色として散布図を描画する plt.scatter(データ列x, データ列y, color='sienna') plt.scatter(データ列x, データ列y, color='sienna') +ヒストグラムの色を赤に変更する plt.hist(データ列, color='red') plt.hist(データ列, color='red') +折れ線グラフをスチールブルー色を用いて描画する plt.plot(データ列x, データ列y, color='steelblue') plt.plot(データ列x, データ列y, color='steelblue') +文字列はタイトルケースかどうか調べる 文字列.istitle() 文字列.istitle() +指定した列を百の位で丸めて、整数型にする df['列A'].round(-2).astype(int) df['列A'].round(-2).astype(int) +マルーンにヒストグラムの色を設定する plt.hist(データ列, color='maroon') plt.hist(データ列, color='maroon') +日付データが金曜日か aDate.weekday() == 4 aDate.weekday() == 4 +▼印を使って散布図を描画する plt.scatter(データ列x, データ列y, marker='v') plt.scatter(データ列x, データ列y, marker='v') +線グラフをサーモン色で描画する plt.plot(データ列x, データ列y, color='salmon') plt.plot(データ列x, データ列y, color='salmon') +変数が0に近づく場合の極限値を求める sympy.limit(数式, 変数, 0) sympy.limit(数式, 変数, 0) +タプルの最後 タプル[-1] タプル[-1] +deqのstart〜endの部分要素を見る collections.deque(itertools.islice(deq, start, end)) collections.deque(itertools.islice(deq, start, end)) +折れ線グラフにバツ印を使う plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') +横棒グラフをデピンク色として描画する plt.barh(データ列x, データ列y, color='deeppink') plt.barh(データ列x, データ列y, color='deeppink') +カウンタを高頻度方からリストとして得る aCounter.most_common() aCounter.most_common() +折れ線グラフを半透明の破線として描画する plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) +マッピングの項目名を列挙する 辞書.keys() 辞書.keys() +浮動小数点数以下の最大の整数 math.floor(x) math.floor(x) +予測値とデータの離れ具合を描画する sns.resid(x='列名', y='列名', data=df) sns.residplot(x='列名', y='列名', data=df) +ピーチパフ色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='peachpuff') plt.plot(データ列x, データ列y, color='peachpuff') +データフレームのあるカラムのタイムゾーンを東京に設定する df['列A'].tz_convert('Asia/Tokyo') df['列A'].tz_convert('Asia/Tokyo') +黒い▽マーカーで散布図をプロットする plt.plot(データ列x, データ列y, marker='v', c='k') plt.plot(データ列x, データ列y, marker='v', c='k') +辞書の値の一覧を参照する 辞書.values() list(辞書.values()) +0からN未満までのベクトル np.arange(N) np.arange(N) +リストと数列についての散布図に赤い大バツマーカーを描画する plt.plot(データ列x, データ列y, marker='X', c='r') plt.plot(データ列x, データ列y, marker='X', c='r') +赤い下三角マーカーとして散布図を描く plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') +ファイルを書き込み用にオープンする] open(filepath, mode='w') 'w' = 'a'open(filepath, mode='w') +option: 濃い青を使用する color = 'darkblue' color = 'darkblue' +二つのデータ列の残差を散布図として描く sns.residplot(x=データ列, y=データ列) sns.residplot(x=データ列, y=データ列) +データフレームを表示するとき、ヘッダー行を右寄せに指定する pd.set_option('colheader_justify', 'right') pd.set_option('colheader_justify', 'right') +赤い一点鎖線で折れ線グラフをプロットする plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') +散布図をオリーブ色を用いて描画する plt.scatter(データ列x, データ列y, color='olive') plt.scatter(データ列x, データ列y, color='olive') +辞書の項目名に対応した値 辞書[キー] 辞書.get(キー, 見つからない場合の値) +小数点数の整数部 math.modf(x)[0] math.modf(x)[1] +折れ線グラフの色をサドルブラウンに指定する plt.plot(データ列x, データ列y, color='saddlebrown') plt.plot(データ列x, データ列y, color='saddlebrown') +折れ線グラフをラベンダー色として描画する plt.plot(データ列x, データ列y, color='lavender') plt.plot(データ列x, データ列y, color='lavender') +折れ線グラフの色をブルーバイオレットに変更する plt.plot(データ列x, データ列y, color='blueviolet') plt.plot(データ列x, データ列y, color='blueviolet') +指定した列の値で集計し各合計を求める df.groupby('列A').sum() df.groupby('列A').sum() +プロットに鉛直方向の一点鎖線を付ける plt.axvline(x=0, linestyle='dashbot') plt.axvline(x=0, linestyle='dashbot') +カウンタの項目一覧を使う aCounter.keys() aCounter.keys() +ヒストグラムをパープル色として描画する plt.hist(データ列, color='purple') plt.hist(データ列, color='purple') +整数型のゼロ埋めされた行列を作る np.zeros(要素数, dtype=np.int) np.zeros(要素数, dtype=np.int) +配列のピアソンの積立相関係数 scipy.stats.pearsonr(配列, 配列2) scipy.stats.pearsonr(配列, 配列2) +整数が1、もしくは2、もしくは3に等しいかどうか調べる 整数 == 1 or 整数 == 2 or 整数 == 3 整数 == 1 or 整数 == 2 or 整数 == 3 +行列の値を求める aArray[行番号, 列番号] aArray[行番号, 列番号] +t-SNEで整数次元に削減する sklearn.manifold.TSNE(n_components=三).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=三).fit_transform(多次元データ) +二つの表データを横方向にマージする pd.merge(df, df2) pd.merge(df, df2) +散布図をホワイトスモーク色として描画する plt.scatter(データ列x, データ列y, color='whitesmoke') plt.scatter(データ��x, データ列y, color='whitesmoke') +ふたつの条件が成り立つ 条件 and 条件2 条件 and 条件2 +スカイブルーにヒストグラムの色を指定する plt.hist(データ列, color='skyblue') plt.hist(データ列, color='skyblue') +縦棒グラフをピンク色で描画する plt.bar(データ列x, データ列y, color='pink') plt.bar(データ列x, データ列y, color='pink') +指定した列の標本分散を求める df['列A'].var(ddof=0) df['列A'].var(ddof=0) +を大きくする x = 0.33model = sklearn.metrics.mean_squared_error(データ列) 変数 += 整数 +整数が2で割り切れない 整数 % 2 == 0 整数 % 2 == 1 +棒グラフを黄緑色で描画する plt.bar(データ列x, データ列y, color='chartreuse') plt.bar(データ列x, データ列y, color='chartreuse') +パーセント付きの円プロットを描画する plt.pie(データ列, startangle=90, autopct='%.2f%%') plt.pie(データ列, startangle=90, autopct='%.2f%%') +ASCII限定として正規表現で文字列を区切る re.split(pattern, s, flags=re.ASCII) re.split(pattern, s, flags=re.ASCI) +赤い星マーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='*', c='r') plt.plot(データ列x, データ列y, marker='*', c='r') +データフレームの列のユニークな値の個数を確認する df[col].nunique() df[col].nunique() +棒グラフを紺色として描画する plt.bar(データ列x, データ列y, color='darkblue') plt.bar(データ列x, データ列y, color='darkblue') +縦棒グラフをパールバイオレットレッド色として描画する plt.bar(データ列x, データ列y, color='palevioletred') plt.bar(データ列x, データ列y, color='palevioletred') +前の値でデータシリーズの欠損値を埋める ds.fillna(method='ffill') ds.fillna(method='ffill') +黒い下三角マーカーを散布図に描画する plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='k') +カラムのモードを求める mode, count = scipy.stats.mode(df['列A']) mode, count = scipy.stats.mode(df['列A']) +リストとリストについての散布図に下三角マーカーを描く plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') +データ列のエポック秒をPandasの日付型に変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True) +カウンタの最頻出な文字列 aCounter.most_common()[0] aCounter.most_common()[0] +線グラフの色をアンティークホワイトにする plt.plot(データ列x, データ列y, color='antiquewhite') plt.plot(データ列x, データ列y, color='antiquewhite') +線グラフの色をシーグリーンに指定する plt.plot(データ列x, データ列y, color='seagreen') plt.plot(データ列x, データ列y, color='seagreen') +分類木を可視化する plt.barh(X.columns, model.feature_importances_) sklearn.tree.plot_tree(model, feature_names=X.columns, filled=True) +数字を全て見る string.digits string.digits +ピアソンでデータフレームの一部のカラムの相関行列を求める df[['列A', '列B']].corr(method='pearson') df[['列A', '列B']].corr(method='pearson') +円プロットを真円にする plt.axis('equals') plt.axis('equals') +カラムの歪みを計算する df['列A'].kurt() scipy.stats.skew(df['列A'], bias=False) +折れ線グラフの線種を実線にセットする plt.plot(データ列x, データ列y, linestyle='solid') plt.plot(データ列x, データ列y, linestyle='solid') +ファイルパスのフォルダ名を求める os.path.dirname(filepath) os.path.dirname(filepath) +数列のピアソンの積立相関係数 scipy.stats.pearsonr(数列, 数列2) scipy.stats.pearsonr(数列, 数列2) +n個に等間隔でリストを分割する pd.cut(aList, n) pd.cut(aList, n) +タン色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='tan') plt.barh(データ列x, データ列y, color='tan') +文字列はキーワードか調べる 文字列.iskeyword() keyword.iskeyword(文字列) +option: アイボリーにフォントの色を変更する color = 'ivory' color = 'ivory' +プロットの描画で明るくカラーパレットを用いる sns.set(pallete='bright') sns.set(pallete='bright') +ブルーバイオレット色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='blueviolet') plt.bar(データ列x, データ列y, color='blueviolet') +半透明の一点鎖線で折れ線グラフを描画する plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) +グラフの描画で淡く色を用いる sns.set(pallete='muted') sns.set(pallete='muted') +横棒グラフを青緑色として描画する plt.barh(データ列x, データ列y, color='teal') plt.barh(データ列x, データ列y, color='teal') +文字列で区切ってxとyを出力する print(x, y, sep='\t') print(x, y, sep=s) +セットの要素数を求める len(セット) len(セット) +データフレームのあるカラムの文字列を未入力値に変換する df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan) +表データのあるカラムを日付データに変換し、インデックスにする df.index = pd.DatetimeIndex(pd.to_datetime(df['列A'])) df.index = pd.DatetimeIndex(pd.to_datetime(df['列A'])) +折れ線グラフに右三角マーカーを使用する plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') +ValueMapでデータフレームの選択したカラムを全て置換する df[['列A', '列B']].replace(ValueMap) df[['列A', '列B']].replace(ValueMap) +スレートブルー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='slateblue') plt.plot(データ列x, データ列y, color='slateblue') +データフレームを関数の値ごとにグループ化して、列挙する [(name, group_df) for name, group_df in df.groupby(関数)] [(name, group_df) for name, group_df in df.groupby(関数)] +オレンジレッド色で棒グラフを描画する plt.bar(データ列x, データ列y, color='orangered') plt.bar(データ列x, データ列y, color='orangered') +option: ライトスレイグレーにグラフの色を設定する color = 'lightslategrey' color = 'lightslategray' +ダークグレー色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='darkgrey') plt.bar(データ列x, データ列y, color='darkgray') +作画に使うフォントを指定する sns.set(font=フォント名) sns.set(font=フォント名) +ファイルを読み込みモードでオープンして]fとする f = open(filepath, mode='r') f = open(filepath, mode='r') +データフレームを100の位で丸める df.round(-2) df.round(-2) +データ列とリストの散布図を描画して大バツマーカーの色をrgbにする plt.plot(データ列x, データ列y, marker='X', c=rgb) plt.plot(データ列x, データ列y, marker='X', c=rgb) +数をn乗する x ** n x ** n +線グラフを青い破線で描く plt.plot(データ列x, データ列y, linestyle='dashed', color='b') plt.plot(データ列x, データ列y, linestyle='dashed', color='b') +作画で使うカラーパレットを指定する sns.set(pallete='パレット名') sns.set(pallete=パレット名) +プラム色でヒストグラムを描画する plt.hist(データ列, color='plum') plt.hist(データ列, color='plum') +データフレームの散布図をグループ化して横に配置する sns.relplot(data=df, x='列名', y='列名', hue='カテゴリ列', row='カテゴリ列', row='カテゴリ列') sns.relplot(data=df, x='列名', y='列名', hue='カテゴリ列', col='カテゴリ列') +変数を定義したい 変数 += 整数 X = 0 +データフレームのカラムのトリム分散を計算する scipy.stats.tvar(df['列A'], limits=(下限, 上限), inclusive=(True, True)) scipy.stats.tvar(df['列A'], limits=(下限, 上限), inclusive=(True, True)) +Xの四乗を求めたい X ** 4 X ** 4 +クラス分類をガウス過程として行う model = sklearn.gaussian_process.GaussianProcessClassifier() model = sklearn.gaussian_process.GaussianProcessClassifier() +全要素を0で初期化したベクトル np.zeros(要素数) np.zeros(要素数) +▲印を用いる散布図を描画する plt.scatter(データ列x, データ列y, marker='^') plt.scatter(データ列x, データ列y, marker='^') +文字列をソートしてJSONにエンコードする json.dumps(文字列, ensure_ascii=False, sort_keys=True) json.dumps(文字列, ensure_ascii=False, sort_keys=True) +リストの値を小さい順に並べる sorted(リスト, reverse=True) sorted(リスト, reverse=True) +数列から重複なく、ランダムにn要素選んでリストにする random.sample(数列, k=n) random.sample(数列, k=n) +イテラブルをランダムにシャッフルしてリスト化する random.sample(イテラブル, len(イテラブル)) random.sample(イテラブル, len(イテラブル)) +項がセットに含まれないか確認する 要素 not in セット 要素 not in セット +文字列を改行で分割し、文字列リストにする 文字列.splitlines() 文字列.splitlines() +本日の曜日を整数で求める datetime.datetime.today().astype(int) datetime.datetime.today().weekday() +淡い茶色色で散布図を描画する plt.scatter(データ列x, データ列y, color='tan') plt.scatter(データ列x, データ列y, color='tan') +option: アイボリーに色を指定する color = 'ivory' color = 'ivory' +option: ドジャーブルーにグラフの色を変更する color = 'dodgerblue' color = 'dodgerblue' +整数が-9以上9以下か判定する -9 <= 整数 <= 9 -9 <= 整数 <= 9 +棒グラフをペールグリーン色を用いて描画する plt.bar(データ列x, データ列y, color='palegreen') plt.bar(デ���タ列x, データ列y, color='palegreen') +データフレーム中の欠損値をインプレイスでドロップする df.dropna(inplace=True) df.dropna(inplace=True) 分類モデルの当てはめを実行する model.fit(説明変数, 目的変数) model.fit(説明変数, 目的変数) -疑似乱数を発生させる random.random() random.random() -作画のグリッドを暗くする sns.set(style='darkgrid') sns.set(style='darkgrid') -option: マーカーの太さを指定する markeredgewidth = 2.5 markeredgewidth = 2.5 -青い破線でイテラブルの推移を描画する plt.plot(データ列x, データ列y, linestyle='dashed', color='b') plt.plot(データ列x, データ列y, linestyle='dashed', color='b') -多次元データをMSDで項次元に次元削減する sklearn.manifold.MSD(n_components=二).fit_transform(多次元データ) sklearn.manifold.MSD(n_components=二).fit_transform(多次元データ) -デピンク色として棒グラフを描画する plt.bar(データ列x, データ列y, color='deeppink') plt.bar(データ列x, データ列y, color='deeppink') -散布図の印の線幅を変える plt.scatter(データ列x, データ列y, markeredgewidth=2.5) plt.scatter(データ列x, データ列y, markeredgewidth=2.5) -二つの変数の値を順に表示する print(変数名, 変数名) print(変数名, 変数名) -ヒストグラムをラベンダー色を使って描画する plt.hist(データ列, color='lavender') plt.hist(データ列, color='lavender') -日付データと日付データの時間差を求める aDate - aDate2 aDate - aDate2 -縦向きに3つのデータフレームを連結する pd.concat([df, df2, df3], axis=0) pd.concat([df, df2, df3], axis=0) -データフレームを二つの列によってまとめた表 df.groupby(['列A', '列B']) df.groupby(['列A', '列B']) -TypeError: A object is not subscriptable'method'df.to_excel['arashi.xlsx'] to_excel('arashi.xlsx') に直そう。 うーん。 -箱髭図を横方向にする plt.boxplot(データ列, vert=False) plt.boxplot(データ列, vert=False) -線グラフをダーク・スラテグレー色として描画する plt.plot(データ列x, データ列y, color='darkslategrey') plt.plot(データ列x, データ列y, color='darkslategrey') -option: グラフの色をチョコレートに変更する color = 'chocolate' color = 'chocolate' -配列とリストについての散布図を大きさnで描画する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) -青緑色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='teal') plt.plot(データ列x, データ列y, color='teal') -等差数列を行列にする np.arange(開始値, 終了値, 等差) np.arange(開始値, 終了値, 等差) -option: 文字コードをEUCにする encoding = 'euc_jp' encoding = 'euc_jp' -データフレームの第一四分位数を求める df.quantile(0.25) df.quantile(0.25) -year年をタイムスタンプに変換する pd.to_datetime(year, month=s, hour=1, inplace=True) datetime.datetime(year=year, month=1, day=1) -データフレームをあるカラムのカテゴリとしてグループ分けして、それぞれのグループごとの件数を知る df.groupby('列A').size()() df.groupby('列A').size() -線グラフの色をカーキに指定する plt.plot(データ列x, データ列y, color='khaki') plt.plot(データ列x, データ列y, color='khaki') -KeyboardInterrupt:m = int(input()) 自分で実行を止めた? 自分で実行を止めた? -カテゴリでグループ化して、データフレームを回帰直線付き散布図にする sns.regplot(x='列名', y='列名', hue='カテゴリ列', data=df) sns.regplot(x='列名', y='列名', hue='カテゴリ列', data=df) -ファイルを開いて]バイナリ書き込みストリームを求める 'wb' = 'a'open(filepath, mode='wb') 'wb' = 'a'open(filepath, mode='wb') -NameError: name A is not defined'F'trainer.fit(model, train_loader, val_loader) 変数を使う前に =... のように値を代入しよう。 うーん。 -横棒グラフをチョコレート色を使って描画する plt.barh(データ列x, データ列y, color='chocolate') plt.barh(データ列x, データ列y, color='chocolate') -スノー色を用いて折れ線グラフを描画する plt.plot(データ列x, データ列y, color='snow') plt.plot(データ列x, データ列y, color='snow') -TypeError: A object is not callable'int'print(y(y(y+t)+y*y)) うーん。 X * (Y) ← 乗算演算子が必要だよ。 -ValueError: invalid literal for A() with base B: Cint 10 '123 234' うーん。 うーん。 -ダークスラテグレー色で折れ線グラフを描画する plt.plot(データ列x, データ列y, color='darkslategray') plt.plot(データ列x, データ列y, color='darkslategray') -SyntaxError: invalid syntax (A, line B) 2 行目の書き方が違うよ。 行目の書���方が違うよ。 -右三角マーカーを散布図に使う plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') -折れ線グラフの色をオリーブに指定する plt.plot(データ列x, データ列y, color='olive') plt.plot(データ列x, データ列y, color='olive') -データフレームの選択した列の相関行列を計算する df[['列A', '列B']].corr() df[['列A', '列B']].corr() -空白区切りでタプルを出力する print(*タプル) print(*タプル) -"KeyError: ""None of A are in the B""[Index(['temperature'], dtype='object', ...X = df[['temperature']]" データフレームに存在しない列名を使っているよ。 データフレームに存在しない列名を使っているよ。 -オブジェクトはジェネレータ関数 inspect.isgeneratorfunction(オブジェクト) inspect.isgeneratorfunction(オブジェクト) -英字の大文字を全部求める string.ascii_uppercase string.ascii_uppercase -日付データにn時間分、足す aDate + datetime.timedelta(hours=n) aDate + datetime.timedelta(hours=n) -文字列の指定した位置以降に部分文字列が含まれない 文字列.find(部分文字列, 開始位置) == -1 文字列.find(部分文字列, 開始位置) == -1 -回帰分析をランダム性を追加したランダムフォレストでする model = sklearn.ensemble.ExtraTreeRegressor(n_estimators=10) model = sklearn.ensemble.ExtraTreeRegressor(n_estimators=10) -option: フォントの色をフォレストグリーンに変更する color = 'forestgreen' color = 'forestgreen' -カンマ区切りのファイルをn番目の列をインデックスとして読み込む pd.read_csv('file.csv', index_col=n) pd.read_csv('file.csv', index_col=n) -IndexError: string index out of rangeprint(S[n]+'...') インデックスは文字列長より小さくしよう。 インデックスは文字列長より小さくしよう。 -ナバホホワイト色として縦棒グラフを描画する plt.bar(データ列x, データ列y, color='navajowhite') plt.bar(データ列x, データ列y, color='navajowhite') -ロイヤルブルー色としてヒストグラムを描画する plt.hist(データ列, color='royalblue') plt.hist(データ列, color='royalblue') -線グラフの色をナバホホワイトに変更する plt.plot(データ列x, データ列y, color='navajowhite') plt.plot(データ列x, データ列y, color='navajowhite') -TypeError: A object is not subscriptable'type'if list[1::N]: うーん。 本当にlist変数? -TypeError: unsupported operand type(s) for +=: A and B'int' 'str'x +=i うーん。 うーん。 -グラフに水平方向の破線をつける plt.axhline(y=0, linestyle='dashed') plt.axhline(y=0, linestyle='dashed') -グラフに水平方向の点線を付ける plt.axhline(y=0, linestyle='dotted') plt.axhline(y=0, linestyle='dotted') -回帰分析をバギングで行う model = sklearn.burlywood.BaggingRegressor(n_estimators=10) model = sklearn.ensemble.BaggingRegressor(n_estimators=10) -データフレームをグループ化しある列に対し個数を求める df.groupby('列A')['列B'].count() df.groupby('列A')['列B'].count() -縦棒グラフの色をナバホホワイトにする plt.bar(データ列x, データ列y, color='navajowhite') plt.bar(データ列x, データ列y, color='navajowhite') -折れ線グラフの▽マーカーの色を設定する plt.plot(データ列x, データ列y, marker='v', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='v', markerfacecolor='#800080') -TypeError: A object is not callable'int'print(min(A)) min = buitlins.min で初期化してみよう。 min = buitlins.min で初期化してみよう。 -部分文字列が文字列の指定した範囲位置の間に含まれるか調べる 文字列.find(部分文字列, 開始位置, 終了位置)!= -1 文字列.find(部分文字列, 開始位置, 終了位置) != -1 -要素がリストに含まれるか 要素 in リスト 要素 in リスト -青い点線で線グラフを描く plt.plot(データ列x, データ列y, linestyle='dotted', color='b') plt.plot(データ列x, データ列y, linestyle='dotted', color='b') -TypeError: A object is not callable'Counter' うーん。 うーん。 -"TypeError: can only concatenate str (not A) to str""float""print(round(X+0.5))" うーん。 うーん。 -データフレームから型だけ抽出する df.select_dtypes(型) df.select_dtypes(ty) -データフレームのあるカラムの不偏標準偏差を求める df['列A'].std() df['列A'].std() +CSVファイルをカラム名を指定せず読み込む pd.read_csv('file.csv', header=None) pd.read_csv('file.csv', header=None) +データシリーズの曜日は何日目か調べる ds.dt.dayofweek ds.dt.dayofweek +ヒストグラムの色をライトサーモンに指定する plt.hist(データ列, color='lightsalmon') plt.hist(データ列, color='lightsalmon') +散布図をスカイブルー色として描画する plt.scatter(データ列x, データ列y, color='skyblue') plt.scatter(データ列x, データ列y, color='skyblue') +度数分布図としてデータフレームのカラムをプロットする plt.hist(df[column]) plt.hist(df[column]) +文字列を最後のカンマを用いて二つに分ける 文字列.rpartition(',') 文字列.rpartition(',') +整数の3乗を算出する 整数 ** 3 整数 ** 3 +散布図の右三角マーカーの線幅を設定する plt.scatter(データ列x, データ列y, marker='>', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='>', markeredgewidth=2.5) +線形回帰モデルの回帰変数を使う model.intercept_decomposition.PLSRegression() model.coef_ +折れ線グラフの色をゲインズボロにする plt.plot(データ列x, データ列y, color='gainsboro') plt.plot(データ列x, データ列y, color='gainsboro') +整数が2で割り切れないか 整数 % 2 == 1 整数 % 2 == 1 +ロバストな線形クラス分類を行う model = sklearn.linear_model.HuberClassifier() model = sklearn.linear_model.HuberClassifier() +ある列の文字列が部分文字列で終わらないデータを抽出する df[~ df['列A'].str.endswith(部分文字列)] df[~ df['列A'].str.endswith(部分文字列)] +線グラフをライトスレイグレー色で描画する plt.plot(データ列x, データ列y, color='lightslategrey') plt.plot(データ列x, データ列y, color='lightslategrey') +ラインを赤い一点鎖線で描画する plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') +割りを書きたい X // Y X / Y +option: グラフの色をバリーウッドに変更する color = 'burlywood' color = 'burlywood' +option: 箱ひげ図を横方向にする linewidth = 3.0 vert = False +データフレームをにバイオリン図で見る sns.violinplot(x='カテゴリ列', y='列', data=df) sns.violinplot(x='カテゴリ列', y='列', data=df) +赤い大バツマーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='X', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='X', markerfacecolor='r') +ヒストグラムの色をローングリーンに変更する plt.hist(データ列, color='lawngreen') plt.hist(データ列, color='lawngreen') +折れ線グラフの色をインディアンレッドに指定する plt.plot(データ列x, データ列y, color='indianred') plt.plot(データ列x, データ列y, color='indianred') +文字列をセパレータで二分し、後半を見る 文字列.partition(セパレータ)[-1] 文字列.partition(セパレータ)[-1] +ロッソ回帰モデルを新規作成する model.fit(説明変数, 目的変数) model = sklearn.linear_model.Rosso(alpha=正則化項) +書式で列を日付データに変換する pd.to_datetime(df['列A'], format='%Y-%m-%d') pd.to_datetime(df['列A'], format='%Y-%m-%d') +箱ひげ図を横に並べて描く plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) +option: コーラル色を用いる color = 'coral' color = 'coral' +データ列の折れ線グラフを右三角印を使って描画する plt.plot(データ列x, データ列y, marker='>') plt.plot(データ列x, データ列y, marker='>') +毎回異なるように乱数を初期化する random.seed() random.seed() +option: ライトイエローにグラフの色を設定する color = 'lightyellow' color = 'lightyellow' +データフレームのNaNを前の行の値で補完する df.fillna(method='ffill') df.fillna(method='ffill') +option: 小麦色を使う color = 'wheat' color = 'wheat' +バツマーカーで散布図を描く plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') +オブジェクトが名前付きタプル型かどうか調べる hasattr(obj, '_asdict') and hasattr(obj, '_fields') hasattr(obj, '_asdict') and hasattr(obj, '_fields') +浮動小数点数の最小値を算出する sys.float_info.min sys.float_info.min +option: フォントの色をラベンダーにセットする color = 'lavender' color = 'lavender' +指定したカラムの欠損値を直後の値に指定する df['列A'].fillna(method='bfill') df['列A'].fillna(method='bfill') +配列を等量で分割数nでビンニングする pd.qcut(aArray, n) pd.qcut(aArray, n) +ゴールドにヒストグラムの色を設定する plt.hist(データ列, color='gold') plt.hist(データ列, color='gold') +縦棒グラフの色を淡いピンク色にする plt.bar(データ列x, データ列y, color='lightpink') plt.bar(データ列x, データ列y, color='lightpink') +縦棒グラフをフォレストグリーン色で描画する plt.bar(データ列x, データ列y, color='forestgreen') plt.bar(データ列x, データ列y, color='forestgreen') +部分文字列で文字列を二分割し、前半を使う 文字列.partition(部分文字列)[0] 文字��.partition(部分文字列)[0] +平均絶対誤差を求める sklearn.metrics.mean_absolute_denominator(alpha=0.5) sklearn.metrics.mean_absolute_error(データ列, データ列2) +ゼロ埋めされた複素数型のベクトルを作る np.zeros(要素数, dtype=bool) np.zeros(要素数, dtype=bool) +文字列をバイト列にする bytes(s) bytes(s) +折れ線グラフの色をフクシアにセットする plt.plot(データ列x, データ列y, color='fuchsia') plt.plot(データ列x, データ列y, color='fuchsia') +option: フォントの色をオリベドラブに指定する color = 'olivedrab' color = 'olivedrab' +ヒストグラムをミスティローズ色として描画する plt.hist(データ列, color='mistyrose') plt.hist(データ列, color='mistyrose') +横棒グラフをラベンダーブラッシュ色を用いて描画する plt.barh(データ列x, データ列y, color='lavenderblush') plt.barh(データ列x, データ列y, color='lavenderblush') +折れ線グラフの▽印の大きさを設定する plt.plot(データ列x, データ列y, marker='v', markersize=2.0) plt.plot(データ列x, データ列y, marker='v', markersize=2.0) +キーがマップに存在する キー not in 辞書 キー not in 辞書 +線グラフをブラウン色で描画する plt.plot(データ列x, データ列y, color='brown') plt.plot(データ列x, データ列y, color='brown') +既存の行列をベースに全要素が1の配列を作成する np.ones_like(aArray) np.ones_like(aArray) +文字列を区切り記号で分割して、文字列リストにする 文字列.split(セパレータ) 文字列.split(セパレータ) +ファイルからファイル名を求める os.path.basename(filepath) os.path.basename(filepath) +コサインを求める math.cosh(x) math.cos(x) +数式の変数をある数式で置き換える 数式.subs(変数, 数式2) 数式.subs(変数, 数式2) +線グラフの色をシエナに設定する plt.plot(データ列x, データ列y, color='sienna') plt.plot(データ列x, データ列y, color='sienna') +散布図をポイント印で描画する plt.scatter(データ列x, データ列y, marker='.') plt.scatter(データ列x, データ列y, marker='.') +縦棒グラフの色をディムグレーにする plt.bar(データ列x, データ列y, color='dimgrey') plt.bar(データ列x, データ列y, color='dimgrey') +パスのセパレータ記号を見る os.sep os.sep +データフレームの指定した列の欠損値を直前の値で埋める df['列A'].fillna(method='ffill') df['列A'].fillna(method='ffill') +整数のモジュロを計算する 整数 % 整数2 整数 % 整数2 +列一覧 df.info() df.info() +option: 色をロージーブラウンに変更する color = 'rosybrown' color = 'rosybrown' +y座標を対数に変更する plt.yscale('log') plt.yscale('log') +ヒストグラムを黄緑色で描画する plt.hist(データ列, color='chartreuse') plt.hist(データ列, color='chartreuse') +両端キューの先頭に数列の値を追加する 両端キュー.extendleft(数列) 両端キュー.extendleft(数列) +折れ線グラフのマーカーを▽にする plt.plot(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') +横棒グラフをライトスレイグレー色を用いて描画する plt.barh(データ列x, データ列y, color='lightslategrey') plt.barh(データ列x, データ列y, color='lightslategrey') +xの小数点以下'1'桁の文字列に変換する ':.1f'.format(x) ':.1f'.format(x) +文字列を空白を用いて分割する 文字列.partition() 文字列.split() +配列の列ごとの平均値を算出する np.mean(aArray, axis=0) np.mean(aArray, axis=0) +書き出すCSV形式の小数点以下の桁数を設定する df.to_csv('file.csv', float_format='%.3f') df.to_csv('file.csv', float_format='%.3f') +双方向キューの先頭にイテラブルの各データを追加する 両端キュー.extendleft(イテラブル) 両端キュー.extendleft(イテラブル) +大文字を小文字に変換する 文字列.lower() 文字列.lower() +データフレームを関数の値によって集約して、列挙する [(name, group_df) for name, group_df in df.groupby(関数)] [(name, group_df) for name, group_df in df.groupby(関数)] +インデント幅を指定してデータをJSONにエンコードする json.dumps(データ, ensure_ascii=False, indent=n) json.dumps(データ, ensure_ascii=False, indent=n) +データフレームの最後10行を抽出する df.tail(10) df.tail(10) +ひとつでも非アスキー文字が文字列中にあるか調べる any(not c.isascii() for c in 文字列) any(not c.isascii() for c in 文字列) +セットを変更不能な集合にする frozenset(セット) frozenset(セット) +棒グラフをピーチパフ色を使って描画する plt.bar(データ列x, データ列y, color='peachpuff') plt.bar(データ列x, データ列y, color='peachpuff') +配列のユニークな要素とその位置を調べる u, indices = np.unique(aArray, return_index=True) u, indices = np.unique(aArray, return_index=True) +散布図をピンク色として描画する plt.scatter(データ列x, データ列y, color='pink') plt.scatter(データ列x, データ列y, color='pink') +最大長を指定して、スタック 両端キュー.extend(maxlen=最大長) collections.deque(maxlen=最大長) +ハニーデュー色として散布図を描画する plt.scatter(データ列x, データ列y, color='honeydew') plt.scatter(データ列x, データ列y, color='honeydew') +線グラフをラベンダー色で描画する plt.plot(データ列x, データ列y, color='lavender') plt.plot(データ列x, データ列y, color='lavender') +option: マーカーの色を青緑にする markerfacecolor = 'teal' markerfacecolor = 'turquoise' +二つの文字列はケースを無視して同じか 文字列.casefold() == 文字列2.casefold() 文字列.casefold() == 文字列2.casefold() +データフレームの指定した列の空文字を欠損値に変換し、ドロップする df['列A'].replace('', np.nan).dropna() df['列A'].replace('', np.nan).dropna() +option: 四角マーカーを使用する marker ='s' marker = 's' +散布図に右三角マーカーを用いる plt.plot(データ列x, データ列y, marker='>') plt.scatter(データ列x, データ列y, marker='>') +黒い三角印を折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='^', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='k') +データフレームの指定した列の標準偏差など df['列A'].describe() df['列A'].describe() +カラーパレットを色差別なくする sns.set(pallete='colorblind') sns.set(pallete='colorblind') +イテラブルとイテラブルについての散布図にrgbの丸マーカーを描画する plt.plot(データ列x, データ列y, marker='o', c=rgb) plt.plot(データ列x, データ列y, marker='o', c=rgb) +散布図に下三角マーカーを用いる plt.scatter(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') +配列と数列について散布図を描画し、、文字列という補足用のラベルをつける plt.scatter(データ列x, データ列y, label=s) plt.scatter(データ列x, データ列y, label=s) +文字列を文字コード列にする [ord(ch) for ch in 文字列] [ord(ch) for ch in 文字列] +option: サドルブラウンにグラフの色を設定する color ='saddlebrown' color = 'saddlebrown' +ゼロ埋めされた3二ビット整数型の配列を初期化する np.zeros(要素数, dtype=np.int16) np.zeros(要素数, dtype=np.int16) +線形回帰モデルを作る model.fit(説明変数, 目的変数) model = sklearn.linear_model.LinearRegression() +指定した列のカテゴリで集計し最小値を求める df.groupby('列A').min() df.groupby('列A').min() +横棒プロットを描画して、ラベルを下寄せする plt.barh(ラベル列, データ列, align='edge') plt.barh(ラベル列, データ列, align='edge') +散布図に赤い下三角マーカーを使用する plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') +濃いシアンにヒストグラムの色を変更する plt.hist(データ列, color='darkcyan') plt.hist(データ列, color='darkcyan') +縦棒グラフをダークオーキッド色として描画する plt.bar(データ列x, データ列y, color='darkorchid') plt.bar(データ列x, データ列y, color='darkorchid') +指定したカラムの中に文字列と文字列が存在する df['列A'].isin([value, value2]) df['列A'].isin([value, value2]) +リストと配列の散布図に黒い右三角マーカーを描画する plt.plot(データ列x, データ列y, marker='>', c='k') plt.plot(データ列x, データ列y, marker='>', c='k') +グラフで利用可能な色名の一覧を知る matplotlib.colors.cnames matplotlib.colors.cnames +折れ線グラフを暗い赤色として描画する plt.plot(データ列x, データ列y, color='darkred') plt.plot(データ列x, データ列y, color='darkred') +option: フォレストグリーンを用いる color = 'forestgreen' color = 'forestgreen' +配列とイテラブルの散布図を描画して、マーカーを左三角に設定する plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<') +ヒストグラムをスラグレー色を用いて描画する plt.hist(データ列, color='slategray') plt.hist(データ列, color='slategrey') +散布図に赤い▽マーカーを描画する plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='r') plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='r') +文字列から部分文字列を取り除く 文字列.replace(部分文字列, '') 文字列.replace(部分文字列, '') +ヒストグラムを描画して、半透明化にする plt.hist(データ列x, alpha=0.5) plt.hist(データ列x, alpha=0.5) +入力から2つ���文字列を読み込む A, B = map(str, input().split()) A, B = map(str, input().split()) +rgbのポイントマーカーを散布図に用いる plt.plot(データ列x, データ列y, marker='.', c=rgb) plt.plot(データ列x, データ列y, marker='.', c=rgb) +option: フォントの色をパレットトルコイズに指定する color = 'paleturquoise' color = 'paleturquoise' +データフレームをValueMapでまとめて置き換える df.replace(ValueMap) df.replace(ValueMap) +整数がセットのいずれ 数 in セット 数 in セット +散布図の右三角印の色を変える plt.scatter(データ列x, データ列y, marker='>', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='>', markerfacecolor='#800080') +折れ線グラフに赤い△マーカーを描画する plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='^', markerfacecolor='r') +横棒グラフをダークレッド色で描画する plt.barh(データ列x, データ列y, color='darkred') plt.barh(データ列x, データ列y, color='darkred') +折れ線グラフをサドルブラウン色として描画する plt.plot(データ列x, データ列y, color='saddlebrown') plt.plot(データ列x, データ列y, color='saddlebrown') +全般的に色を淡くする sns.set(pallete='muted') sns.set(pallete='muted') +シーケンスを行列に変換する np.array(iterable) np.array(iterable) +横棒グラフをゲインズボロ色として描画する plt.barh(データ列x, データ列y, color='gainsboro') plt.barh(データ列x, データ列y, color='gainsboro') +リストの最後 リスト[-1] リスト[-1] +見やすいグラフを描画する準備をする import seaborn as sns import seaborn as sns +数値がセットに含まれるか確認する 数 in セット 数 in セット +データフレームのカラムの欠損値を平均に指定する df['列A'].fillna(df['列A'].mean()) df['列A'].fillna(df['列A'].mean()) +配列とリストについての散布図に黒い上三角マーカーを描く plt.plot(データ列x, データ列y, marker='^', c='k') plt.plot(データ列x, データ列y, marker='^', c='k') +ライムグリーン色として散布図を描画する plt.scatter(データ列x, データ列y, color='limegreen') plt.scatter(データ列x, データ列y, color='limegreen') +線グラフをレモンシフォン色を使って描画する plt.plot(データ列x, データ列y, color='lemonchiffon') plt.plot(データ列x, データ列y, color='lemonchiffon') +リストとリストについて散布図を描画して、マーカーを大バツにセットする plt.plot(データ列x, データ列y, marker='X') plt.plot(データ列x, データ列y, marker='X') +縦棒グラフをホットピンク色で描画する plt.bar(データ列x, データ列y, color='hotpink') plt.bar(データ列x, データ列y, color='hotpink') +文字列の右側から範囲を指定して部分文字列を探す 文字列.find(部分文字列, 開始位置, 終了位置) # 見つからない場合は-1 文字列.find(部分文字列, 開始位置, 終了位置) # 見つからない場合は-1 +データフレームの一部のカラムにおいてどの値が最も出現するか見る df[['列A', '列B']].mode() df[['列A', '列B']].mode() +データフレームの行を条件で消す df[df.columns + 値) & (df['列A'] == x] df[(df['列A'] == x) & (df['列B'] == y)] +あるカラムの文字列が部分文字列で始まらない行を抽出する df[~ df['列A'].str.startswith(部分文字列)] df[~ df['列A'].str.startswith(部分文字列)] +二つの集合の差集合を求める セット.difference(セット2) セット.difference(セット2) +セットを複製する セット.copy() セット.copy() +文字列の中でASCII限定としてパターンにマッチした全文字列をリストに変換する re.findall(pattern, s, flags=re.ASCI) re.findall(pattern, s, flags=re.ASCI) +横棒グラフをダークサーモン色として描画する plt.barh(データ列x, データ列y, color='darksalmon') plt.barh(データ列x, データ列y, color='darksalmon') +ダークカーキにヒストグラムの色を指定する plt.hist(データ列, color='darkkhaki') plt.hist(データ列, color='darkkhaki') +データフレーム中のNaNをドロップする df.dropna(inplace=True) df.dropna(inplace=True) +データ列を閾値でバイナリ化する sklearn.preprocessing.Binarizer(threshold=閾値).fit_transform(データ列) sklearn.preprocessing.Binarizer(threshold=閾値).fit_transform(データ列) +条件に応じて、動作を変えたい if 条件式:print('真のとき') # 直してelse:print('そうでなければ') # 直して if 条件式:print('真のとき') # 直してelse:print('そうでなければ') # 直して +n進文字列をバイト列に変換する int(文字列, n).to_bytes(length=バイト数, byteorder='big') int(文字列, n).to_bytes(length=バイト数, byteorder='big') +辞書が欲しい 辞書 = {} 辞書 = {} +option: グラフの色をターコイズに変更する color = 'turquoise' color = 'turquoise' +ミディアムバイオレットレッドにヒストグラムの色を設定する plt.hist(データ列, color='mediumvioletred') plt.hist(データ列, color='mediumvioletred') +わり算の小数点以下を切り上げたい (X + Y - 1) // Y (X + Y - 1) // Y +数列のケンドールの相関係数 scipy.stats.kendalltau(数列, 数列2) scipy.stats.kendalltau(数列, 数列2) +xを白色で表示できる文字列にする f'\033[37m{x}\033[0m' f'\033[37m{x}\033[0m' +折れ線グラフの丸マーカーの太さを変更する plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='o', markeredgewidth=2.5) +横棒グラフを黄色色として描画する plt.barh(データ列x, データ列y, color='yellow') plt.barh(データ列x, データ列y, color='yellow') +配列をダミー変数にする pd.get_dummies(配列) pd.get_dummies(配列) +文字列が無限に繰り返すイテラブルを使う itertools.repeat(element) itertools.repeat(文字列) +線グラフを半透明の破線を用いて描画する plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) +データフレームの選択したカラムの不偏分散を求める df[['列A', '列B']].var(ddof=1) df[['列A', '列B']].var(ddof=1) +配列と数列についての散布図に赤い大バツマーカーを描画する plt.plot(データ列x, データ列y, marker='X', c='r') plt.plot(データ列x, データ列y, marker='X', c='r') +横軸の目盛りを非表示にする plt.xticks([]) plt.xticks([]) +線グラフの色を耐火レンガにセットする plt.plot(データ列x, データ列y, color='firebrick') plt.plot(データ列x, データ列y, color='firebrick') +散布図に赤い左三角マーカーを使用する plt.plot(データ列x, データ列y, marker='<', c='r') plt.plot(データ列x, データ列y, marker='<', c='r') +指定された列のカテゴリで集計し、最小値を求める df.groupby('列A').min() df.groupby('列A').min() +インディゴ色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='indigo') plt.plot(データ列x, データ列y, color='indigo') +指定した列の値はNaNか df['列A'].isna() df['列A'].isna() +リストの推移を色付きの点線として描く plt.plot(データ列x, データ列y, linestyle='dotted', color='#800080') plt.plot(データ列x, データ列y, linestyle='dotted', color='#800080') +オブジェクトが非同期ジェネレータ関数か inspect.isasyncgenfunction(オブジェクト) inspect.isasyncgenfunction(オブジェクト) +辞書にキーが存在するか確認する キー in 辞書 キー in 辞書 +データフレームの中に文字列がある df.isin([value]) df.isin([value]) +珊瑚色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='coral') plt.bar(データ列x, データ列y, color='coral') +エラーなくリストの要素の位置を見る リスト.index(要素) リスト.index(要素) if 要素 in リスト else -1 +ファイルパスからストリームを読み込んで、fileとする file = open(filepath) file = open(filepath) +散布図の▲印を青くする plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='^', markerfacecolor='b') +日付データが木曜日か aDate.weekday() == 3 aDate.weekday() == 3 +日付時刻データと日付時刻データの時間差を秒数で計算する (aDatetime - aDatetime2).total_seconds() (aDatetime - aDatetime2).total_seconds()//60 +重複した行のみを抽出する df[df.duplicated(keep=False)] df[df.duplicated(keep=False)] +青い星マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='*', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='*', markerfacecolor='b') +データフレームを二つのカラムで小さい順にソートする df.sort_values(by=['列A', '列B'], ascending=True) df.sort_values(by=['列A', '列B'], ascending=True) +行列の標準偏差を計算する np.std(aArray) np.std(aArray) +整数を8進文字列に変換する oct(整数)[2:] oct(整数)[2:] +パールバイオレットレッドにヒストグラムの色を指定する plt.hist(データ列, color='palevioletred') plt.hist(データ列, color='palevioletred') +オブジェクトがクラス inspect.isclass(オブジェクト) isinstance(obj, クラス) +太字でxを出力する print(f'\033[1m{x}\033[0m') print(f'\033[1m{x}\033[0m') +散布図をグリーンイエロー色を使って描画する plt.scatter(データ列x, データ列y, color='greenyellow') plt.scatter(データ列x, データ列y, color='greenyellow') +フローラルホワイト色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='floralwhite') plt.plot(データ列x, データ列y, color='floralwhite') +暗い赤色を用いて棒グラフを描画する plt.bar(データ列x, データ列y, color='darkred') plt.bar(データ列x, データ列y, color='darkred') +リネン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='linen') plt.bar(データ列x, データ列y, color='linen') +データフレームのあるカラムの尖度を算出する df['列A'].skew() df['列A'].skew() +数列の推移を半透明の点線でプロットする plt.plot(データ列x, データ列y, linestyle='dotted', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dotted', alpha=0.5) +ニューラルネットとしてクラス分類を行う model = sklearn.linear_model.Normalizer(alpha=正則化項) model = sklearn.neural_network.MLPClassifier(hidden_layer_sizes=(10, 10)) +日付データは日付データより後ろか調べる aDate > aDate2 aDate > aDate2 +色差別なくカラーパレットをグラフの描画で使う sns.set(pallete='colorblind') sns.set(pallete='colorblind') +プログラムを正しく終了する sys.exit(0) sys.exit(0) +散布図のポイント印を青くする plt.scatter(データ列x, データ列y, marker='.', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='.', markerfacecolor='b') +ヒストグラムの色をミスティローズに指定する plt.hist(データ列, color='mistyrose') plt.hist(データ列, color='mistyrose') +データフレームの末尾n行を選択する df.tail(n) df.tail(n) +折れ線グラフの色をブラックに指定する plt.plot(データ列x, データ列y, color='black') plt.plot(データ列x, データ列y, color='black') +イテラブルとリストについて散布図を描画してその大きさをnに指定する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) +配列の行ごとの合計値を求める np.sum(aArray, axis=1) np.sum(aArray, axis=1) +青い左三角マーカーを折れ線グラフに描画する plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='<', markerfacecolor='b') +浮動小数点数を三乗する x ** 3 x ** 3 +2つの配列を箱髭図にする plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) +アルファベットを見る string.ascii_letters string.ascii_letters +ライトイエロー色でヒストグラムを描画する plt.hist(データ列, color='lightyellow') plt.hist(データ列, color='lightyellow') +タプルの要素を関数に適用した結果でソートする sorted(タプル, key=func) sorted(タプル, key=func) +グラフに水平方向の実線をつける plt.axhline(y=0, linestyle='solid') plt.axhline(y=0, linestyle='solid') +TSVファイルファイル名がか確認する filename = 'file.txt' # ファイル name'.tsv' = '.csv'filename.startswith('.tsv') filename = 'file.txt' # ファイル name'.tsv' = '.csv'filename.startswith('.tsv') +ISO書式の文字列を日付時刻にする datetime.datetime.fromisoformat(日付の書かれた文字列) datetime.datetime.fromisoformat(日付の書かれた文字列) +散布図に下三角マーカーを使用する plt.scatter(データ列x, データ列y, marker='v') plt.plot(データ列x, データ列y, marker='v') +リストと配列についての散布図に赤い下三角マーカーを描画する plt.plot(データ列x, データ列y, marker='v', c='r') plt.plot(データ列x, データ列y, marker='v', c='r') +複数のリストを箱髭図にする plt.boxplot([データ列, データ列]) plt.boxplot([データ列, データ列]) +タプルの総和 sum(タプル) sum(タプル) +グラフの描画でパステル調にテーマを使う sns.set(pallete='pastel') sns.set(pallete='pastel') +表を二つの列によってまとめたグループを求める df.groupby(['列A', '列B']) df.groupby(['列A', '列B']) +辞書の内部も複製する 辞書.copy() {k: copy.copy(v) for k, v in 辞書.items()} +option: ピンクにグラフの色を設定する color = 'pink' color = 'pink' +ライムグリーン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='limegreen') plt.bar(データ列x, データ列y, color='limegreen') +英字を全部使う string.ascii_letters string.ascii_letters +2つの変数の大きい方を欲しい max(X, Y) max(X, Y) +ダークグリーン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='darkgreen') plt.bar(データ列x, データ列y, color='darkgreen') +折れ線グラフとしてデータ列の推移を作図する plt.plot(range(len(データ列)), データ列) plt.plot(range(len(データ列)), データ列) +一点鎖線グラフを描く plt.plot(データ列x, データ列y, linestyle='dashbot') plt.plot(データ列x, デ���タ列y, linestyle='dashbot') +度数分布図を描画して、ビンを設定する plt.hist(データ列, bins=区関数) plt.hist(データ列, bins=区関数) +JSONファイルファイル名が filename = 'file.txt'.date('.json') filename = 'file.txt' # ファイル name'.json' = '.csv'filename.startswith('.json') +データシリーズの中にあるの合計をカウントする ds.isin([value]).sum() ds.isin([value]).sum() +日付時刻データを浮動小数点数にする aDatetime.timestamp() aDatetime.timestamp() +赤い▲マーカーで散布図を描画する plt.plot(データ列x, データ列y, marker='^', c='r') plt.plot(データ列x, データ列y, marker='^', c='r') +日付データが土曜日か確認する aDate.weekday() == 5 aDate.weekday() == 5 +線グラフをミディアムスプリンググリーン色で描画する plt.plot(データ列x, データ列y, color='mediumspringgreen') plt.plot(データ列x, データ列y, color='mediumspringgreen') +データフレームを指定されたカラムの値によってグループ化し記述統計量を計算する df.groupby('列A').describe() df.groupby('列A').describe() +グリーン色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='green') plt.bar(データ列x, データ列y, color='green') +デックの要素数 len(両端キュー) len(両端キュー) +複数の条件が同時に成り立つ 条件 and 条件2 and 条件3 条件 and 条件2 and 条件3 +黒い▼マーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='v', c='k') plt.plot(データ列x, データ列y, marker='v', c='k') +データフレームの選択したカラムの値が欠損値か判定する df[['列A', '列B']].isna() df[['列A', '列B']].isna() +データシリーズのタイムゾーンを指定する ds.tz_convert('Asia/Tokyo') ds.tz_convert('Asia/Tokyo') +辞書のエントリ数を得る len(辞書) len(辞書) +データフレームの選択したカラムの平均 df[['列A', '列B']].mean() df[['列A', '列B']].mean() +ヒストグラムの色をシルバーに指定する plt.hist(データ列, color='silver') plt.hist(データ列, color='silver') +横棒グラフをクリムゾン色として描画する plt.barh(データ列x, データ列y, color='crimson') plt.barh(データ列x, データ列y, color='crimson') +データフレームをグループ化し、それぞれの合計を算出する df.groupby('列A').sum() df.groupby('列A').sum() +空白を使う import numpy as np ' ' +変数名をキーとして辞書 dict(name='kogi', age=6) dict(name='kogi', age=6) +棒グラフをスラグレー色を用いて描画する plt.bar(データ列x, データ列y, color='slategray') plt.bar(データ列x, データ列y, color='slategray') +縦棒グラフをシルバー色として描画する plt.bar(データ列x, データ列y, color='silver') plt.bar(データ列x, データ列y, color='silver') +ある列のカテゴリで集計し、それぞれの標準偏差を計算する df.groupby('列A').std() df.groupby('列A').std() +日付時刻データからn時間分減算する aDatetime - datetime.timedelta(hours=n) aDatetime - datetime.timedelta(hours=n) +識別子は抽象クラスかどうか調べる inspect.isabstract(識別子) inspect.isabstract(識別子) +散布図の下三角印の色を設定する plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='#800080') plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='#800080') +配列から双方向キューを用意する collections.deque(配列) collections.deque(配列) +折れ線グラフを赤い一点鎖線で描く plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') plt.plot(データ列x, データ列y, linestyle='dashbot', color='r') +実数から整数を減ずる math.floor(x) x - y +ヒストグラムの色をスノーにする plt.hist(データ列, color='snow') plt.hist(データ列, color='snow') +オリーブにヒストグラムの色を設定する plt.hist(データ列, color='olive') plt.hist(データ列, color='olive') +文字列の先頭の文字を使う 文字列[0] 文字列[0] +両端キュー 両端キュー = collections.deque() 両端キュー = collections.deque() +リストの最初を使う リスト[0] リスト[0] +部分文字列で文字列を二分する 文字列.partition(部分文字列) 文字列.partition(部分文字列) +リストを中央値でビニングする pd.qcut(aList, 2) pd.qcut(aList, 2) +数を3乗する x ** 3 x ** 3 +option: グラフのラインスタイルを一点鎖線に設定する linestyle = 'dashbot' linestyle = 'dashbot' +t分布型確率的近傍埋め込み法で要素次元に次元削減する sklearn.manifold.TSNE(n_components=二).fit_transform(多次元データ) sklearn.manifold.TSNE(n_components=二).fit_transform(多次元データ) +3つの最も大きい値を求める max(x, y, z) max(x, y, z) +表データをグループ化し、最小値を���める df.groupby('列A').min() df.groupby('列A').min() +ローングリーンにヒストグラムの色をする plt.hist(データ列, color='lawngreen') plt.hist(データ列, color='lawngreen') +データフレームの指定したカラムがどの程度、正規分布から尖っているか確認する df['列A'].skew() df['列A'].skew() +アンサンブル学習を用いてクラス分類を行う sklearn.ensemble.VotingClassifier() sklearn.ensemble.VotingClassifier() +ライトスカイブルー色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='lightskyblue') plt.bar(データ列x, データ列y, color='lightskyblue') +3つ並べてデータ列をヒストグラムにする plt.hist([データ列, データ列, データ列], color=['b', 'r'], 'g']) plt.hist([データ列, データ列, データ列], color=['b', 'r', 'g']) +折れ線グラフのダイアモンド印を赤くする plt.plot(データ列x, データ列y, marker='D', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='D', markerfacecolor='r') +データシリーズの不偏分散を計算する ds.var(ddof=1) ds.var(ddof=1) +折れ線グラフのポイントマーカーを青色にする plt.plot(データ列x, データ列y, marker='.', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='.', markerfacecolor='b') +要素の無限列 itertools.repeat(要素) itertools.repeat(要素) +カウンタを辞書から作る collections.Counter(aDict) collections.Counter(aDict) +プログラムを異常止める sys.exit(1) sys.exit(1) +折れ線グラフをライムグリーン色を使って描画する plt.plot(データ列x, データ列y, color='limegreen') plt.plot(データ列x, データ列y, color='limegreen') +散布図の大バツ印を黒くする plt.scatter(データ列x, データ列y, marker='X', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='X', markerfacecolor='k') +書き込み用にSJISでファイルをオープンする] open(filepath, mode='w', encoding='shift_jis') open(filepath, mode='w', encoding='shift_jis') +折れ線グラフをシスル色として描画する plt.plot(データ列x, データ列y, color='thistle') plt.plot(データ列x, データ列y, color='thistle') +データフレームのある列を取り出す df['列A'] df['列A'] +現在の日付を求める datetime.date.today().hour datetime.date.today() +ディープスカイブルー色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='deepskyblue') plt.barh(データ列x, データ列y, color='deepskyblue') +キーが辞書に存在しない時、要素を追加する 辞書.setdefault(キー, element) 辞書.setdefault(キー, element) +指定したカラムの文字列を欠損値にする df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan) +行列の累積積 np.cumprod(aArray, aArray2) np.cumprod(aArray) +二つの列からグループ化し、最小値を求める df.groupby(['列A', '列B'], as_index=False).min() df.groupby(['列A', '列B'], as_index=False).min() +パターンに文字列の先頭でASCII限定としてマッチさせる re.match(pattern, s, flags=re.ASCI) re.match(pattern, s, flags=re.ASCI) +箱髭図を描き、平均線を加える plt.boxplot(データ列, meanline=True) plt.boxplot(データ列, meanline=True) +横方向に二つのデータフレームを合体させる pd.concat([df, df2], axis=1) pd.merge(df, df2) +赤い点線としてデータ列の推移を描く plt.plot(データ列x, データ列y, linestyle='dotted', color='r') plt.plot(データ列x, データ列y, linestyle='dotted', color='r') +濃い青色でヒストグラムを描画する plt.hist(データ列, color='darkblue') plt.hist(データ列, color='darkblue') +文字列が全て数字かどうか 文字列.isdigit() 文字列.isdigit() +ふたつの集合のインターセクション セット.intersection(セット2) セット.intersection(セット2) +文字列の開始位置先に部分文字列があるか調べる 文字列.find(部分文字列, 開始位置) == -1 文字列.find(部分文字列, 開始位置) != -1 +あるカラムの文字列が部分文字列で終わらない行を抽出する df[~ df['列A'].str.endswith(部分文字列)] df[~ df['列A'].str.endswith(部分文字列)] +ヒストグラムをミディアムスプリンググリーン色を使って描画する plt.hist(データ列, color='mediumspringgreen') plt.hist(データ列, color='mediumspringgreen') +option: どの行もカラムの名前にしない header = None header = None +折れ線グラフの印を丸にする plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o') +行列の行ごとの合計値を使う np.sum(aArray, axis=1) np.sum(aArray, axis=1) +折れ線グラフを四角印として描画する plt.plot(データ列x, データ列y, marker='s') plt.plot(データ列x, データ列y, marker='s') +文字列を最後のコロンで二分して��ろの方を使う 文字列.rpartition(':')[-1] 文字列.rpartition(':')[-1] +option: グラフの色をミントクリームにセットする color ='mintcream' color = 'mintcream' +CSVファイルにカラムの名前を付けずデータフレームを保存する df.to_csv('file.csv', header=None) df.to_csv('file.csv', header=None) +データフレームから列を3つ選択する df[['列A', '列B', '列C']] df[['列A', '列B', '列C']] +プログラムを異常終了する sys.exit(0) sys.exit(1) +実数のn乗して実数による余りを計算する pow(x, n, y) pow(x, n, y) +ふたつの集合の共通部分を使う セット.intersection(セット2) セット.intersection(セット2) +option: どの列もインデックスに設定しない index_col = None index_col = None +整数が一桁の数か -9 <= 整数 <= 9 0 <= 整数 <= 9 +黒いポイントマーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='.', c='k') plt.plot(データ列x, データ列y, marker='.', c='k') +関数の値によってデータフレームを分類する df.groupby(関数) df.groupby(関数) +文字列中に小文字が含まれるか any(c.islower() for c in 文字列) any(c.islower() for c in 文字列) +TSVから文字エンコーディングを指定して読む sys.stdin.read(1) pd.read_csv('file.tsv', sep='\t', encoding=文字エンコーディング) +ヒストグラムの色をオールドレースに変更する plt.hist(データ列, color='oldlace') plt.hist(データ列, color='oldlace') +データシリーズの未入力値を最大値に設定する ds.fillna(ds.max()) ds.fillna(ds.max()) +整数がいつまでも繰り返すイテラブル itertools.repeat(整数) itertools.repeat(整数) +option: ホワイトスモーク色を用いる color = 'whitesmoke' color = 'whitesmoke' +折れ線グラフの色をオリベドラブに指定する plt.plot(データ列x, データ列y, color='olivedrab') plt.plot(データ列x, データ列y, color='olivedrab') +グリーンイエロー色で線グラフを描画する plt.plot(データ列x, データ列y, color='greenyellow') plt.plot(データ列x, データ列y, color='greenyellow') +データフレームのあるカラムの空文字をドロップする df['列A'].replace('', np.nan).dropna() df['列A'].replace('', np.nan).dropna() +折れ線グラフの色をドジャーブルーに変更する plt.plot(データ列x, データ列y, color='dodgerblue') plt.plot(データ列x, データ列y, color='dodgerblue') +データフレームの指定したカラムの中に文字列と日付データがいくつあるか数える df['列A'].isin([value, value2]).sum() df['列A'].isin([value, value2]).sum() +キーが辞書上で未定義かどうか調べる キー not in 辞書 キー not in 辞書 +折れ線グラフの色をゲインズボロに変更する plt.plot(データ列x, データ列y, color='gainsboro') plt.plot(データ列x, データ列y, color='gainsboro') +外れ値に強い線形回帰分析を行う model = sklearn.linear_model.HuberRegressor() model = sklearn.linear_model.HuberRegressor() +タン色を用いてヒストグラムを描画する plt.hist(データ列, color='tan') plt.hist(データ列, color='tan') +コーラル色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='coral') plt.barh(データ列x, データ列y, color='coral') +複数のカラムからグループ化し、分散を求める df.groupby(['列A', '列B'], as_index=False).var() df.groupby(['列A', '列B'], as_index=False).var() +option: 耐火レンガにフォントの色を設定する color = 'firebrick' color = 'firebrick' +線グラフをレモンシフォン色で描画する plt.plot(データ列x, データ列y, color='lemonchiffon') plt.plot(データ列x, データ列y, color='lemonchiffon') +浮動小数点数を複素数に変換する complex(x) complex(x) +ヒストグラムの色をコーンズシルクに指定する plt.hist(データ列, color='cornsilk') plt.hist(データ列, color='cornsilk') +折れ線グラフをミディアムシアグリーン色として描画する plt.plot(データ列x, データ列y, color='mediumseagreen') plt.plot(データ列x, データ列y, color='mediumseagreen') +折れ線グラフのクロス印を青くする plt.plot(データ列x, データ列y, marker='x', markerfacecolor='b') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='b') +データをL2ノルムとして正規化する "sklearn.preprocessing.Normalizer(norm=""l2"").fit_transform(データ列)" "sklearn.preprocessing.Normalizer(norm=""l2"").fit_transform(データ列)" +散布図をフォレストグリーン色を用いて描画する plt.scatter(データ列x, データ列y, color='forestgreen') plt.scatter(データ列x, データ列y, color='forestgreen') +折れ線グラフをアクアマリン色として描画する plt.plot(データ列x, データ列y, color='aquamarine') plt.plot(データ列x, データ列y, color='aquamarine') +データシリーズを万の位で四捨五入する ds.round(-4) ds.round(-4) +データフレームの指定した二つの列を取り出す df['列A'].isin([value]) df[['列A', '列B']] +ミディアムシアグリーン色で散布図を描画する plt.scatter(データ列x, データ列y, color='mediumseagreen') plt.scatter(データ列x, データ列y, color='mediumseagreen') +棒グラフをマゼンタ色として描画する plt.bar(データ列x, データ列y, color='magenta') plt.bar(データ列x, データ列y, color='magenta') +配列とリストについて散布図を描画して、上三角マーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) +配列の歪みを算出する scipy.stats.skew(配列, bias=False) scipy.stats.skew(配列, bias=False) +マップの値の一覧 辞書.values() list(辞書.values()) +xを赤色で表示する print(f'\033[31m{x}\033[0m') print(f'\033[31m{x}\033[0m') +イテラブルを横棒グラフにする plt.barh(ラベル列, データ列) plt.barh(ラベル列, データ列) +折れ線グラフの色をダーク・スラテグレーに変更する plt.plot(データ列x, データ列y, color='darkslategrey') plt.plot(データ列x, データ列y, color='darkslategrey') +マップのキーを要素に変更する 辞書[キー] = element 辞書[キー] = element +データフレームの選択した列の欠損値を最大値で埋める df[['列A', '列B']].fillna(df[['列A', '列B']].max()) df[['列A', '列B']].fillna(df[['列A', '列B']].max()) +パープル色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='purple') plt.barh(データ列x, データ列y, color='purple') +キュー中の整数のインデックス 両端キュー.index(整数) 両端キュー.index(整数) +リストをヒストグラムにする plt.hist(データ列) plt.hist(データ列) +区切り記号で文字列を二分する 文字列.partition(セパレータ) 文字列.partition(セパレータ) +折れ線グラフに赤い▽マーカーを描画する plt.plot(データ列x, データ列y, marker='v', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='v', markerfacecolor='r') +整数プラス整数を求める 整数 + 整数2 整数 + 整数2 +データフレームを関数の値によってグループ化し要約統計量を計算する df.groupby(関数).describe() df.groupby(関数).describe() +横棒グラフをダークスラテグレー色として描画する plt.barh(データ列x, データ列y, color='darkslategray') plt.barh(データ列x, データ列y, color='darkslategray') +散布図に青い▽マーカーを描画する plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='b') plt.scatter(データ列x, データ列y, marker='v', markerfacecolor='b') +分子n、分母mの有理数を生成する fractions.Fraction(numerator=n, denominator=m) fractions.Fraction(numerator=n, denominator=m) +クラス分類の予測精度をヒートマップで確認する sns.heatmap(confusion_matrix(正解データ列, 予測データ列), annot=True, cmap='Reds') sns.heatmap(confusion_matrix(正解データ列, 予測データ列), annot=True, cmap='Reds') +両端キューの順序を左にローテーションする 両端キュー.rotate(-1) 両端キュー.rotate(-1) +文字列全体がパターンにマッチするか見る re.fullmatch(pattern, s) re.fullmatch(pattern, s) +option: オーキッドにグラフの色を指定する color = 'orchid' color = 'orchid' +インデント幅を指定して文字列をJSON文字列に変換する json.dumps(文字列, ensure_ascii=False, indent=n) json.dumps(文字列, ensure_ascii=False, indent=n) +ふたつのリストの積集合を計算する list(set(リスト).intersection(set(リスト2))) list(set(リスト).intersection(set(リスト2))) +文字列がタイトルケースかどうか調べる 文字列.istitle() 文字列.istitle() +要素はタプルの要素でないか確認する 要素 not in タプル 要素 not in タプル +折れ線グラフにバツマーカーを使用する plt.plot(データ列x, データ列y, marker='x') plt.plot(データ列x, データ列y, marker='x') +ミディアムターコイズ色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='mediumturquoise') plt.barh(データ列x, データ列y, color='mediumturquoise') +配列からn個サンプリングしてリスト化する random.sample(配列, k=n) random.sample(配列, k=n) +データフレームの欠損値を最小値に指定する df.fillna(df.min()) df.fillna(df.min()) +option: ダークブルーにフォントの色を変更する color = 'darkblue' color = 'darkblue' +右にデックの順序をローテーションする 両端キュー.rotate(1) 両端キュー.rotate(1) +option: ホワイトスモークを使用する color = 'whitesmoke' color = 'whitesmoke' +クラス分類をスタッキング���行う sklearn.ensemble.StackingClassifier() sklearn.ensemble.StackingClassifier() +データフレームの一部のカラムの空文字を欠損値に変換し、ドロップする df[['列A', '列B']].replace('', np.nan).dropna() df[['列A', '列B']].replace('', np.nan).dropna() +折れ線グラフの色をトマトに指定する plt.plot(データ列x, データ列y, color='tomato') plt.plot(データ列x, データ列y, color='tomato') +ライトスレイグレー色を使って散布図を描画する plt.scatter(データ列x, データ列y, color='lightslategray') plt.scatter(データ列x, データ列y, color='lightslategrey') +ファイルをバイナリ用にオープンして]fとする f = open(filepath, mode='rb') f = open(filepath, mode='rb') +オレンジにヒストグラムの色を変更する plt.hist(データ列, color='orange') plt.hist(データ列, color='orange') +リストの要素の位置をエラーなく見る リスト.index(要素) if (リスト[1:] リスト.index(要素) if 要素 in リスト else -1 +縦棒グラフを紺碧色で描画する plt.bar(データ列x, データ列y, color='azure') plt.bar(データ列x, データ列y, color='azure') +グリッドの線種を点線に変更する plt.grid(linestyle='dotted') plt.grid(linestyle='dotted') +キュー中の整数の出現数を数える 両端キュー.count(整数) 両端キュー.count(整数) +横棒グラフをスレートブルー色として描画する plt.barh(データ列x, データ列y, color='slateblue') plt.barh(データ列x, データ列y, color='slateblue') +スノー色として棒グラフを描画する plt.bar(データ列x, データ列y, color='snow') plt.bar(データ列x, データ列y, color='snow') +日付データと日付データの時間差を算出する aDate - aDate2 aDate - aDate2 +配列をフラット化する aArray.flatten() aArray.flatten() +パープル色として折れ線グラフを描画する plt.plot(データ列x, データ列y, color='purple') plt.plot(データ列x, データ列y, color='purple') +列名一覧をデータ型でフィルタする df.select_dtypes(型).columns df.select_dtypes(型).columns +折れ線グラフの印を三角にする plt.plot(データ列x, データ列y, marker='^') plt.plot(データ列x, データ列y, marker='^') +数列を一つの文字列にする ''.join(map(str, 数列)) ''.join(map(str, 数列)) +ファイルパスを開いて]、バイナリストリームを求める 'rb' = 'a'open(filepath, mode='rb') 'rb' = 'a'open(filepath, mode='rb') +ダークカーキ色として棒グラフを描画する plt.bar(データ列x, データ列y, color='darkkhaki') plt.bar(データ列x, データ列y, color='darkkhaki') +イテラブルから双方向キューを作る collections.deque(イテラブル) collections.deque(イテラブル) +線グラフの色をフクシアに設定する plt.plot(データ列x, データ列y, color='fuchsia') plt.plot(データ列x, データ列y, color='fuchsia') +線グラフの色をロージーブラウンに設定する plt.plot(データ列x, データ列y, color='rosybrown') plt.plot(データ列x, データ列y, color='rosybrown') +データフレームの中の列を分割数nでビン分割する pd.cut(df[col], n) pd.cut(df[col], n) +マゼンタにヒストグラムの色を変更する plt.hist(データ列, color='magenta') plt.hist(データ列, color='magenta') +option: 色をレモンシフォンにする color = 'lemonchiffon' color = 'lemonchiffon' +既存のファイルを文字コードtextとして追加できるようにオープンする] open(filepath, mode='a', encoding=text) open(filepath, mode='a', encoding=text) +縦棒グラフをローングリーン色で描画する plt.bar(データ列x, データ列y, color='lawngreen') plt.bar(データ列x, データ列y, color='lawngreen') +線グラフをマルーン色で描画する plt.plot(データ列x, データ列y, color='maroon') plt.plot(データ列x, データ列y, color='maroon') +文字列の最初から改行を消す 文字列.rstrip('\n') 文字列.lstrip('\n') +末尾から文字列を部分文字列で区切る 文字列.rsplit() 文字列.rsplit(部分文字列) +文字列が指定した文字列に含まれるか調べる 文字列 in 別の文字列 文字列 in 別の文字列 +最大値・最小値の範囲で一様な疑似乱数 x = 0.0random.uniform(最小値, 最大値) x = 0.0x2 = 1.0random.uniform(最小値, 最大値) +表データのあるカラムの曜日が何日目か見る df['列A'].dt.dayofweek df['列A'].dt.dayofweek +切片なしの線形モデルを作る model = sklearn.linear_model.LinearRegression(fit_intercept=False) model = sklearn.linear_model.LinearRegression(fit_intercept=False) +二つのオブジェクトは同一か調べる obj is obj2 obj is obj2 +rgbの左三角マーカーとして散布図を描画する plt.plot(データ列x, データ列y, marker='<', c=rgb) plt.plot(データ列x, データ列y, marker='<', c=rgb) +文字列��リストに含まれないか 文字列 not in リスト 文字列 not in リスト +タプル内の要素は全て真か判定する all(タプル) all(タプル) +散布図の印の色を変更する plt.scatter(データ列x, データ列y, markerfacecolor='#800080') plt.scatter(データ列x, データ列y, markerfacecolor='#800080') +小数点数が無限大かどうか math.isinf(x) math.isinf(x) +要素はセットに含まれないか 要素 not in セット 要素 not in セット +イテラブルと数列について散布図を描画し、、マーカーを左三角に設定する plt.plot(データ列x, データ列y, marker='<') plt.plot(データ列x, データ列y, marker='<') +実行時の標準出力の出力先がターミナルか sys.stdout.isatty() sys.stdout.isatty() +option: スプリンググリーンにグラフの色を変更する color ='springgreen' color = 'springgreen' +同じでないと書きたい not 条件式 X != Y +データフレームのカラムの相関係数を算出する scipy.stats.pearsonr(df['列A'], df['列B']) scipy.stats.pearsonr(df['列A'], df['列B']) +青い点線で数列の変遷をプロットする plt.plot(データ列x, データ列y, linestyle='dotted', color='b') plt.plot(データ列x, データ列y, linestyle='dotted', color='b') +時計回りに円グラフを描く plt.pie(データ列, startangle=90, labels=データ列) plt.pie(データ列, startangle=90, counterclock=False) +キーがマップに存在するかどうか調べる キー not in 辞書 キー in 辞書 +オレンジ色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='orange') plt.bar(データ列x, データ列y, color='orange') +nからいつまでもカウントダウンする itertools.count(start=n, step=-1) itertools.count(start=n, step=-1) +データフレームを使う import pandas as pd import pandas as pd +文字列を改行で分割する 文字列.splitlines() 文字列.splitlines() +option: 小麦色色を用いる color = 'wheat' color = 'wheat' +長さが一致しないときのzip 0f' - 10minutes(loc=(2, 4)) itertools.zip_longest(iterable, iterable2) +option: 文字列を区切り記号で使う sep = s sep = s +データ列の折れ線グラフをポイント印で描画する plt.plot(データ列x, データ列y, marker='.') plt.plot(データ列x, データ列y, marker='.') +ラインを半透明の一点鎖線で描画する plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashbot', alpha=0.5) +数値がセットのいずれでもないどうか 数 not in セット 数 not in セット +シーケンスを2回あわせたデカルト積 itertools.product(iterable, repeat=2) itertools.product(iterable, repeat=2) +入力から二つの少数を取り出す A, B = map(float, input().split()) A, B = map(float, input().split()) +文字列をdatetime64型に変換する 文字列.replace(文字列, np.to_datetime) pd.to_datetime(日付を表現した文字列) +数を十の位で丸める round(x, -1) round(x, -1) +データフレームの値は未入力値か df.isna() df.isna() +ふたつのタプルを加える タプル + タプル2 タプル + タプル2 +青緑色を使って折れ線グラフを描画する plt.plot(データ列x, データ列y, color='teal') plt.plot(データ列x, データ列y, color='turquoise') +指定したカラムの中に日付データが存在するか確認する df['列A'].isin([value]) df['列A'].isin([value]) +ネイビー色を使って横棒グラフを描画する plt.barh(データ列x, データ列y, color='navy') plt.barh(データ列x, データ列y, color='navy') +折れ線グラフの色をパパイヤウィップにセットする plt.plot(データ列x, データ列y, color='papayawhip') plt.plot(データ列x, データ列y, color='papayawhip') +リネンにヒストグラムの色を指定する plt.hist(データ列, color='linen') plt.hist(データ列, color='linen') +識別子が抽象クラスか inspect.isabstract(識別子) inspect.isabstract(識別子) +柱状グラフを描画し、ビン数を指定する plt.hist(データ列, bins=区関数) plt.hist(データ列, bins=区関数) +option: シスル色を使用する color = 'thistle' color = 'thistle' +y軸の目盛を整数のみにする plt.yticks(np.arange(最小値, 最大値, 間隔)) plt.yticks(np.arange(最小値, 最大値, 間隔)) +データフレームの一部の列を丸めて整数型にする df[['列A', '列B']].round().astype(int) df[['列A', '列B']].round().astype(int) +データフレームの記述統計量を見る df.describe() df.describe() +グラフのデザインをいい感じに設定する sns.set() sns.set() +ミディアムターコイズ色として散布図を描画する plt.scatter(データ列x, データ列y, color='mediumturquoise') plt.scatter(データ列x, データ列y, color='mediumturquoise') +識別子はメソッドか調べる inspect.ismethod(識別子) inspect.ismethod(識別子) +option: ターコイズにフォントの色を設定する color = 'turquoise' color = 'turquoise' +折れ線グラフをコーンフラワーブルー色を使って描画する plt.plot(データ列x, データ列y, color='cornflowerblue') plt.plot(データ列x, データ列y, color='cornflowerblue') +データフレームの値はNaNか調べる df.isna() df.isna() +オブジェクトが名前付きタプルかどうか hasattr(obj, '_asdict') and hasattr(obj, '_fields') hasattr(obj, '_asdict') and hasattr(obj, '_fields') +ファイルパスを文字コードtextでオープンする] text = 'utf-8'open(filepath, encoding=text) text = 'utf-8'open(filepath, encoding=text) +option: グラフの色をダークシアンに指定する color = 'darkcyan' color = 'darkcyan' +ピアソンとしてデータフレームの相関行列を求める df.corr(method='pearson') df.corr(method='pearson') +横棒グラフをライトグレー色を使って描画する plt.barh(データ列x, データ列y, color='lightgray') plt.barh(データ列x, データ列y, color='lightgrey') +option: 書き込みモードに指定する mode = 'w' mode = 'w' +ある列の文字列が正規表現にマッチする行を選ぶ df[df['列A'].str.match(正規表現)] df[df['列A'].str.match(正規表現)] +配列の最小を求める np.min(配列) np.min(aArray) +散布図をダークオーキッド色を用いて描画する plt.scatter(データ列x, データ列y, color='darkorchid') plt.scatter(データ列x, データ列y, color='darkorchid') +折れ線グラフをオレンジレッド色を使って描画する plt.plot(データ列x, データ列y, color='orangered') plt.plot(データ列x, データ列y, color='orangered') +横棒グラフをミディアムシアグリーン色として描画する plt.barh(データ列x, データ列y, color='mediumseagreen') plt.barh(データ列x, データ列y, color='mediumseagreen') +ヒストグラムの色をサンディーブラウンに指定する plt.hist(データ列, color='sandybrown') plt.hist(データ列, color='sandybrown') +データフレームの一部のカラムの平均値を求める df[['列A', '列B']].mean() df[['列A', '列B']].mean() +部分文字列が文字列の指定した区間に存在するか 文字列.find(部分文字列, 開始位置, 終了位置)!= -1 文字列.find(部分文字列, 開始位置, 終了位置) != -1 +重複した行だけを取り出す df[df.duplicated(keep=False)] df[df.duplicated(keep=False)] +黒いポイントマーカーで散布図を描く plt.plot(データ列x, データ列y, marker='.', c='k') plt.plot(データ列x, データ列y, marker='.', c='k') +二つのデータフレームを異なる列をキーとして内部結合する pd.merge(df, df2, left_on='列A', right_on='列B', how='inner') pd.merge(df, df2, left_on='列A', right_on='列B', how='inner') +文字列を区切り記号で分割して、列挙する 文字列.split(セパレータ) 文字列.split(セパレータ) +外れ値を除いた配列の分散 scipy.stats.tvar(配列, limits=(下限, 上限), inclusive=(True, True)) scipy.stats.tvar(配列, limits=(下限, 上限), inclusive=(True, True)) +読み込み用にファイルをオープンして]、fとする f = open(filepath, mode='r') f = open(filepath, mode='r') +散布図に黒い丸印を描画する plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='o', markerfacecolor='k') +文字が別の文字列にあるか 文字 in 文字列 文字 in 文字列 +やわらかい青色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='cornflowerblue') plt.scatter(データ列x, データ列y, color='cornflowerblue') +二つのセットが互いに素 セット.isdisjoint(セット2) セット.isdisjoint(セット2) +option: フォントの色をカデットブルーに変更する color = 'cadetblue' color = 'cadetblue' +データフレームを指定した列の値毎にグループ化して、列挙する [(name, group_df) for name, group_df in df.groupby('列A')] [(name, group_df) for name, group_df in df.groupby('列A')] +改行なしに2つの変数をプリントする print(変数名, 変数名, end='') print(変数名, 変数名, end='') +横棒グラフを黄色色を用いて描画する plt.barh(データ列x, データ列y, color='yellow') plt.barh(データ列x, データ列y, color='yellow') +predicateFuncがTrueとなるイテラブルの要素を得る itertools.takewhile(predicateFunc, iterable) itertools.takewhile(predicateFunc, iterable) +ヒストグラムをアイボリー色として描画する plt.hist(データ列, color='ivory') plt.hist(データ列, color='ivory') +二つの集合のいずれか一方だけの集合 セット.symmetric_difference(セット2) セット.symmetric_difference(セット2) +文字列から一つずつ文字を列挙する [文字列].astype(文字列) list(文字列) +開始位置から終了位置���でに部分文字列がいくつか存在するか調べる 文字列.count(部分文字列, 開始位置, 終了位置) 文字列.count(部分文字列, 開始位置, 終了位置) +横棒グラフを描画して、バーの縦幅を設定する plt.barh(ラベル列, データ列, width=0.5) plt.barh(ラベル列, データ列, width=0.5) +識別子はスタックフレームか調べる inspect.isframe(識別子) inspect.isframe(識別子) +黒い大バツマーカーを散布図に描画する plt.scatter(データ列x, データ列y, marker='X', markerfacecolor='k') plt.scatter(データ列x, データ列y, marker='X', markerfacecolor='k') +データフレームの一部のカラムの尖度 df[['列A', '列B']].skew() df[['列A', '列B']].skew() +英字の大文字列 string.ascii_uppercase string.ascii_uppercase +表をグループ化し、あるカラムに対し平均値を求める df.groupby('列A')['列B'].mean() df.groupby('列A')['列B'].mean() +文字列の左側から文字を取り除く 文字列.lstrip(文字) 文字列.lstrip(文字) +option: ミディアムスレートブルーを使う color ='mediumslateblue' color = 'mediumslateblue' +句読点文字を全部見る string.punctuation string.punctuation +データフレームのNaNを数値で置き換える df.fillna(x) df.fillna(x) +散布図の下三角マーカーの大きさを変える plt.scatter(データ列x, データ列y, marker='v', markersize=2.0) plt.scatter(データ列x, データ列y, marker='v', markersize=2.0) +散布図をダークグレー色を用いて描画する plt.scatter(データ列x, データ列y, color='darkgray') plt.scatter(データ列x, データ列y, color='darkgray') +横棒グラフをプロットして、下寄せする plt.barh(ラベル列, データ列, align='edge') plt.barh(ラベル列, データ列, align='edge') +データフレームからランダムに100行を重複ありでサンプリングする df.sample(100, replace=True) df.sample(100, replace=True) +両端キューの上限長 両端キュー.maxlen 両端キュー.maxlen +文字列の右側から部分文字列を消す 文字列.rstrip(部分文字列) 文字列.rstrip(部分文字列) +回帰モデルの残差を求める sklearn.metrics.precision_score(目的変数, model.predict(説明変数)) 目的変数 - model.predict(説明変数) +データシリーズを百の位で丸めて整数型にする ds.round(-2).astype(int) ds.round(-2).astype(int) +ベクトルの要素数 len(aArray) aArray.size +ファイルを書き込みできるように開く] 'w' = 'a'open(filepath, mode='w') 'w' = 'a'open(filepath, mode='w') +小さい方を欲しい min(X, Y) min(X, Y) +option: ダークグレーを用いる color = 'darkgray' color = 'darkgray' +青色でxを出力する print(f'\033[34m{x}\033[0m') print(f'\033[34m{x}\033[0m') +散布図をrgbの大バツマーカーとしてプロットする plt.plot(データ列x, データ列y, marker='X', c=rgb) plt.plot(データ列x, データ列y, marker='X', c=rgb) +option: マーカーを菱形に指定する marker = 'D' marker = 'D' +カテゴリデータをベクトル化する sklearn.preprocessing.LabelEncoder().fit_transform(データ列) sklearn.preprocessing.OneHotEncoder(sparse=False).fit_transform(データ列) +セットの浅いコピーを作る セット.copy() セット.copy() +文字列をパターンによって置換する re.sub(pattern, newsub, s) re.sub(pattern, newsub, s) +文字列中に大文字がないかどうか any(not c.isupper() for c in 文字列) any(not c.isupper() for c in 文字列) +縦棒グラフをミスティローズ色で描画する plt.bar(データ列x, データ列y, color='mistyrose') plt.bar(データ列x, データ列y, color='mistyrose') +レベッカパープルにヒストグラムの色を設定する plt.hist(データ列, color='rebeccapurple') plt.hist(データ列, color='rebeccapurple') +ヒストグラムをダークオレンジ色を使って描画する plt.hist(データ列, color='darkorange') plt.hist(データ列, color='darkorange') +オレンジ色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='orange') plt.barh(データ列x, データ列y, color='orange') +浮動小数点数以上の最小の整数 min(x, y) math.ceil(x) +範囲を指定して乱数を求める random.randint(最小値, 最大値) random.randint(最小値, 最大値) +折れ線グラフの色をグリーンイエローに変更する plt.plot(データ列x, データ列y, color='greenyellow') plt.plot(データ列x, データ列y, color='greenyellow') +整数が1もしくは2 整数 == 1 or 整数 == 2 整数 == 1 or 整数 == 2 +三項演算子を書きたい X + Y X if 条件式 else Y +折れ線グラフのクロスマーカーの色を変える plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='#800080') +データフレームのデータ型リストを使う df.dtypes df.dtypes +シルバーにヒストグラムの色を設定する plt.hist(データ列, color='silver') plt.hist(データ列, color='silver') +リストと配列について散布図を描画して、▼マーカーの色をrgbに変更する plt.plot(データ列x, データ列y, marker='v', c=rgb) plt.plot(データ列x, データ列y, marker='v', c=rgb) +要素はタプルの要素でない 要素 not in タプル 要素 not in タプル +option: 色をミディアムスプリンググリーンに変更する color ='mediumspringgreen' color = 'mediumspringgreen' +平均と分散で標準化を行う sklearn.preprocessing.StandardScaler().fit_transform(データ) sklearn.preprocessing.StandardScaler().fit_transform(データ) +無限に整数が続くイテラブルを使う itertools.repeat(整数) itertools.repeat(整数) +データフレームを二つの列によって大きい順に破壊的にソートする df.sort_values(by=['列A', '列B'], ascending=False, inplace=True) df.sort_values(by=['列A', '列B'], ascending=False, inplace=True) +BOM付きでファイルパスを書き込み用に開く] open(filepath, mode='w', encoding='utf_8_sig') open(filepath, mode='w', encoding='utf_8_sig') +文字列の指定した範囲位置の間に部分文字列が含まれるかどうか 文字列.find(部分文字列, 開始位置, 終了位置)!= -1 文字列.find(部分文字列, 開始位置, 終了位置) != -1 +ヒストグラムの色をイエローグリーンに変更する plt.hist(データ列, color='yellowgreen') plt.hist(データ列, color='yellowgreen') +ホットピンク色で線グラフを描画する plt.plot(データ列x, データ列y, color='hotpink') plt.plot(データ列x, データ列y, color='hotpink') +線グラフをホットピンク色で描画する plt.plot(データ列x, データ列y, color='hotpink') plt.plot(データ列x, データ列y, color='hotpink') +茶色色でヒストグラムを描画する plt.hist(データ列, color='brown') plt.hist(データ列, color='brown') +日付データが水曜日かどうか aDate.weekday() == 2 aDate.weekday() == 2 +option: グラフの色をスカイブルーに変更する color ='skyblue' color = 'skyblue' +オブジェクトの型 isinstance(obj, type=1) type(obj) +棒グラフをハニーデュー色として描画する plt.bar(データ列x, データ列y, color='honeydew') plt.bar(データ列x, データ列y, color='honeydew') +データフレームの行名を全て付け直す df.rename(index={x: y}) df.rename(index={x: y}) +改行なしにxを出力する print(x, end='') print(x, end='') +本日の月数を見る datetime.datetime.today().month datetime.datetime.today().month +配列のトリム平均を算出する scipy.stats.tmean(配列, limits=(下限, 上限), inclusive=(True, True)) scipy.stats.tmean(配列, limits=(下限, 上限), inclusive=(True, True)) +データフレームを各カテゴリにグループ化してバイオリン図にする sns.violinplot(x='カテゴリ列', y='列', hue='カテゴリ列', data=df) sns.violinplot(x='カテゴリ列', y='列', data=df) +列名を指定してデータフレームを全結合する pd.merge(df, df2, on='列A', how='outer') pd.merge(df, df2, on='列A', how='outer') +折れ線グラフをアンティークホワイト色を用いて描画する plt.plot(データ列x, データ列y, color='antiquewhite') plt.plot(データ列x, データ列y, color='antiquewhite') +線グラフをアイボリー色として描画する plt.plot(データ列x, データ列y, color='ivory') plt.plot(データ列x, データ列y, color='ivory') +スカイブルー色の折れ線グラフを描画する plt.plot(データ列x, データ列y, color='skyblue') plt.plot(データ列x, データ列y, color='skyblue') +ゴールド色でヒストグラムを描画する plt.hist(データ列, color='gold') plt.hist(データ列, color='gold') +散布図を丸印で描画する plt.scatter(データ列x, データ列y, marker='o') plt.scatter(データ列x, データ列y, marker='o') +データフレームのひとつのカラムだけ説明変数にする 説明変数 = df[['列名']] 説明変数 = df[['列名']] +文字列をコロンで二分割して前半を見る 文字列.partition(':')[0] 文字列.partition(':')[0] +シンボル計算を使う math.Symbol(x) import sympy +グラフに水平方向の一点鎖線をつける plt.axhline(y=0, linestyle='dashbot') plt.axhline(y=0, linestyle='dashbot') +セットから全ての要素を消す セット.clear() セット.clear() +配列をひとつの文字列にする ''.join(map(str, 配列)) ''.join(map(str, 配列)) +rgbの▲マーカーとして散布図をプロットする plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) +文字列の先頭で正規表現に複数行対応としてマッチするか確認する re.match(pattern, s, flags=re.MULTILINE) re.match(pattern, s, flags=re.MULTILINE) +データシリーズの欠損値を最大値に変更���る ds.fillna(ds.max()) ds.fillna(ds.max()) +二つの列によってデータフレームをまとめた表を使う df.groupby(['列A', '列B']) df.groupby(['列A', '列B']) +データフレームのn行目を取り出す df.head(n) df.loc[n] +黒い星マーカーを用いて散布図を描く plt.plot(データ列x, データ列y, marker='*', c='k') plt.plot(データ列x, データ列y, marker='*', c='k') +五乗を書きたい X ** 5 X ** 5 +ホットピンク色を用いて縦棒グラフを描画する plt.bar(データ列x, データ列y, color='hotpink') plt.bar(データ列x, データ列y, color='hotpink') +option: アクアにグラフの色を設定する color = 'aqua' color = 'aqua' +リストとリストについて散布図を描画し、、マーカーを星に変更する plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') +option: シスルを使う color = 'thistle' color = 'thistle' +ブラック色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='black') plt.bar(データ列x, データ列y, color='black') +整数の八分の一を算出する 整数 / 8 整数 / 8 +条件演算子が書きたい X == Y X if 条件式 else Y +複数行対応として事前にパターンをコンパイルする re.compile(pattern, flag=re.MULTILINE) re.compile(pattern, flag=re.MULTILINE) +option: ミディアムターコイズ色を使用する color ='mediumturquoise' color = 'mediumturquoise' +散布図を下三角印で描画する plt.scatter(データ列x, データ列y, marker='v') plt.scatter(データ列x, データ列y, marker='v') +文字列中に非空白があるか調べる any(not c.isspace() for c in 文字列) any(not c.isspace() for c in 文字列) +option: ダークブルー色を用いる color = 'darkblue' color = 'darkblue' +データフレームの未入力値を直後の値に設定する df.fillna(method='bfill') df.fillna(method='bfill') +ガウス過程を使ってクラス分類をする model = sklearn.gaussian_process.GaussianProcessClassifier() model = sklearn.gaussian_process.GaussianProcessClassifier() +散布図の▽マーカーの線幅を変える plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='v', markeredgewidth=2.5) +グラフの中の縦軸に軸名を付ける plt.ylabel('y軸ラベル') plt.ylabel('y軸ラベル') +文字列の開始位置以降がsubで始まるかどうか調べる 文字列.startswith(部分文字列, 開始位置) 文字列.startswith(部分文字列, 開始位置) +データフレームから型リストで指定されたデータ型の列のみ取り出す df.select_dtypes(include=typeList) df.select_dtypes(include=typeList) +year年month月day日hour時minute分を日付時刻にする datetime.datetime(year=year, month=month, day=day, hour=hour, minute=minute) datetime.datetime(year=year, month=month, day=day, hour=hour, minute=minute) +ライトグリーン色で棒グラフを描画する plt.bar(データ列x, データ列y, color='lightgreen') plt.bar(データ列x, データ列y, color='lightseagreen') +中央値でデータ列をビン分割する pd.qcut(ds, 2) pd.qcut(ds, 2) +ファイルからJSON形式のデータを読み込む with open('file.json') as f:data = json.load(f) with open('file.json') as f:data = json.load(f) +配列をn個に分割して、namesのラベルをつける pd.cut(aArray, n, labels=names) pd.cut(aArray, n, labels=names) +横棒グラフをカデットブルー色を用いて描画する plt.barh(データ列x, データ列y, color='cadetblue') plt.barh(データ列x, データ列y, color='cadetblue') +option: アイボリーを使う color = 'ivory' color = 'ivory' +辞書の値に要素は含まれていないか element not in 辞書.values() element not in 辞書.values() +変数計算を使う import pandas as pd import sympy +データフレームの歪み df.kurt() df.kurt() +イテラブルのイミュータブルな集合を準備する frozenset(イテラブル) frozenset(イテラブル) +ファイルパスのディレクトリ名を求める os.path.dirname(filepath) os.path.dirname(filepath) +データ列とリストについての散布図に黒い丸マーカーを描画する plt.plot(データ列x, データ列y, marker='o', c='k') plt.plot(データ列x, データ列y, marker='o', c='k') +セットが上位集合か調べる セット.issuperset(セット2) セット.issuperset(セット2) +縦棒グラフをパウダーブルー色で描画する plt.bar(データ列x, データ列y, color='powderblue') plt.bar(データ列x, データ列y, color='powderblue') +データフレームの選択したカラムの中にあると文字列の合計を数える df[['列A', '列B']].isin([value, value2]).sum() df[['列A', '列B']].isin([value, value2]).sum() +文字列中のタブを空白にする 文字列.expandtabs(tabsize=n) 文字列.expandtabs(tabsize=n) +マゼンタ色でヒストグラムを描画する plt.hist(データ列, color='magenta') plt.hist(データ列, color='magenta') +多次元データをSVDとして文字列次元に削減する sklearn.decomposition.TruncatedSVD(n_components=N).fit_transform(多次元データ) sklearn.decomposition.TruncatedSVD(n_components=N).fit_transform(多次元データ) +データフレームの代表値 df.mode() df.describe() +ミディアムパープル色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='mediumpurple') plt.barh(データ列x, データ列y, color='mediumpurple') +わり算のあまりの計算を書きたい X % Y X % Y +クリムゾン色で縦棒グラフを描画する plt.bar(データ列x, データ列y, color='crimson') plt.bar(データ列x, データ列y, color='crimson') +空のロッソ回帰モデルを用意する model = sklearn.linear_model.Rosso(alpha=正則化項) model = sklearn.linear_model.Rosso(alpha=正則化項) +データフレームを2つのカラムの値毎にグループ化して、列挙する [(name, group_df) for name, group_df in df.groupby(['列A', '列B'])] [(name, group_df) for name, group_df in df.groupby(['列A', '列B'])] +箱ひげ図を描画して平均を加える plt.boxplot(データ列, showmeans=True) plt.boxplot(データ列, showmeans=True) +縦棒グラフをグレー色で描画する plt.bar(データ列x, データ列y, color='gray') plt.bar(データ列x, データ列y, color='grey') +グラフで用いる縦軸のラベルをuntitledに変更する plt.ylabel('y軸ラベル') plt.ylabel('y軸ラベル') +実数の整数部を計算する math.modf(x)[0] math.modf(x)[1] +線グラフをスカイブルー色で描画する plt.plot(データ列x, データ列y, color='skyblue') plt.plot(データ列x, データ列y, color='skyblue') +option: ダークサーモンにグラフの色を設定する color = 'darksalmon' color = 'darksalmon' +データフレームの中のカラムを等間隔でn個にビン分割する pd.cut(df[col], n) pd.cut(df[col], n) +整数型のゼロ埋めされた行列 np.zeros(要素数, dtype=np.int) np.zeros(要素数, dtype=np.int) +データフレームの列の各データ値の出現数を求める df[col].value_counts() df[col].value_counts() +カーキ色を用いて折れ線グラフを描画する plt.plot(データ列x, データ列y, color='khaki') plt.plot(データ列x, データ列y, color='khaki') +文字列のn番目をアスキーコードにする ord(文字列[n]) ord(文字列[n]) +散布図をライトブルー色として描画する plt.scatter(データ列x, データ列y, color='lightblue') plt.scatter(データ列x, データ列y, color='lightblue') +データフレームの選択したカラムはどの程度、正規分布から歪んでいるか調べる df[['列A', '列B']].kurt() df[['列A', '列B']].kurt() +データフレームの選択したカラムの未入力値を最小値に設定する df[['列A', '列B']].fillna(df[['列A', '列B']].min()) df[['列A', '列B']].fillna(df[['列A', '列B']].min()) +実数を浮動小数点数で除した余り x % y x % y +実数の逆双曲線余弦を求める math.acosh(x) math.acosh(x) +option: 線の種類を実線に変更する linestyle ='solid' linestyle = 'solid' +横棒グラフをライトゴールドロディイエロー色として描画する plt.barh(データ列x, データ列y, color='lightgoldenrodyellow') plt.barh(データ列x, データ列y, color='lightgoldenrodyellow') +文字列中に空白が含まれる any(c.isspace() for c in 文字列) any(c.isspace() for c in 文字列) +データフレームから同じ行を消す df.drop_duplicates(axis=1) df.drop_duplicates(inplace=True) +四乗を計算したい X ** 4 X ** 4 +ベクトルの和 aArray + aArray2 aArray + aArray2 +Pandasの日付型のデータシリーズをデータフレームのインデックスにする df.index = pd.DatetimeIndex(ds) df.index = pd.DatetimeIndex(ds) +今日の日を使う datetime.datetime.today().day datetime.datetime.today().day +横棒グラフをサンディーブラウン色を使って描画する plt.barh(データ列x, データ列y, color='sandybrown') plt.barh(データ列x, データ列y, color='sandybrown') +小数点以下'5'桁まで表示する ':.5f' = ':.3f'print(':.5f'.format(x)) ':.5f' = ':.3f'print(':.5f'.format(x)) +折れ線グラフのバツ印を赤くする plt.plot(データ列x, データ列y, marker='x', markerfacecolor='r') plt.plot(データ列x, データ列y, marker='x', markerfacecolor='r') +セットからエラーなく項を除く セット.discard(要素) セット.discard(要素) +データフレームのあるカラムは何年か見る df['列A'].dt.year df['列A'].dt.year +決定係数を算出する sklearn.metrics.r2_score(正解データ列, 予測データ列) sklearn.metrics.r2_score(データ列, データ列2) +numpyを使用する import numpy as np import numpy as np +データ列の各値は何回出現するか確認する ds.value_counts() ds.value_counts() +���み上げ横棒グラフをプロットする plt.barh(ラベル列, データ列, bottom=データ列y, color='#800080') plt.barh(ラベル列, データ列, bottom=データ列y, color='#800080') +折れ線グラフの色をダークスラテグレーにセットする plt.plot(データ列x, データ列y, color='darkslategray') plt.plot(データ列x, データ列y, color='darkslategray') +データフレームから列を三つのみ選択する df[['列A', '列B', '列C']] df[['列A', '列B', '列C']] +折れ線グラフのクロスマーカーの線幅を設定する plt.plot(データ列x, データ列y, marker='x', markeredgewidth=2.5) plt.plot(データ列x, データ列y, marker='x', markeredgewidth=2.5) +データフレームの選択したカラムを十の位で丸めて、整数にする df[['列A', '列B']].round(-1).astype(int) df[['列A', '列B']].round(-1).astype(int) +データフレームの選択したカラムのNaNを前の行の値で埋める df[['列A', '列B']].fillna(method='ffill') df[['列A', '列B']].fillna(method='ffill') +散布図をパパイヤウィップ色を使って描画する plt.scatter(データ列x, データ列y, color='papayawhip') plt.scatter(データ列x, データ列y, color='papayawhip') +option: マーカーの色を珊瑚にする markerfacecolor = 'coral' markerfacecolor = 'coral' +散布図のポイントマーカーの線幅を指定する plt.scatter(データ列x, データ列y, marker='.', markeredgewidth=2.5) plt.scatter(データ列x, データ列y, marker='.', markeredgewidth=2.5) +データフレームのあるカラムをリストとして選択する df['列A'].values.tolist() df['列A'].values.tolist() +データフレームのNaNを後の行の値に指定する df.fillna(method='bfill') df.fillna(method='bfill') +オブジェクトは整数クラス int = intisinstance(obj, int) int = intisinstance(obj, int) +イテラブルと配列について散布図を描画して、ポイントマーカーの色をrgbに設定する plt.plot(データ列x, データ列y, marker='.', c=rgb) plt.plot(データ列x, データ列y, marker='.', c=rgb) +文字列をカンマを使って区切り、列挙する 文字列.split(',') 文字列.split(',') +縦棒グラフの色をパウダーブルーにする plt.bar(データ列x, データ列y, color='powderblue') plt.bar(データ列x, データ列y, color='powderblue') +配列からランダムに1個選んでリストにする random.choice(配列) random.choice(配列) +option: コロンをセパレータで用いる sep = ':' sep = ':' +回帰分析をK最近傍法として行う model = sklearn.neighbors.KNeighborsRegressor(hidden_importances_) model = sklearn.neighbors.KNeighborsRegressor(n_neighbors=5) +二変数の最大値を計算する max(x, y) max(x, y) +ゲインズボロにヒストグラムの色を指定する plt.hist(データ列, color='gainsboro') plt.hist(データ列, color='gainsboro') +ヒストグラムの色をオリベドラブに変更する plt.hist(データ列, color='olivedrab') plt.hist(データ列, color='olivedrab') +標準入力から入力される sys.stdin.readline() input() +2つの辞書を階層化する collections.ChainMap(aDict, aDict2) collections.ChainMap(aDict, aDict2) +バイオレット色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='violet') plt.bar(データ列x, データ列y, color='violet') +ヒストグラムをフォレストグリーン色を用いて描画する plt.hist(データ列, color='forestgreen') plt.hist(データ列, color='forestgreen') +太字にする f'\033[1m{x}\033[0m' f'\033[1m{x}\033[0m' +option: ピーチパフにグラフの色を指定する color = 'peachpuff' color = 'peachpuff' +数値時刻のデータ列からタイムスタンプ型に変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True) +リストとイテラブルについての散布図を大きさnで描画する plt.scatter(データ列x, データ列y, s=n) plt.scatter(データ列x, データ列y, s=n) +整数の4分の一 整数 / 4 整数 / 4 +表データから列を一つ選択する df[['列A']] df[['列A']] +option: ダークスラテグレー色を用いる color = 'darkslategray' color = 'darkslategray' +黒いダイアモンドマーカーを散布図に使う plt.plot(データ列x, データ列y, marker='D', c='k') plt.plot(データ列x, データ列y, marker='D', c='k') +2つの文字列が同じか調べる 文字列 == 文字列2 文字列 == 文字列2 +option: △マーカーを加える marker = '^' marker = '^' +タイムスタンプデータが何分か知る aDatetime.minute aDatetime.minute +サーモン色の縦棒グラフを描画する plt.bar(データ列x, データ列y, color='salmon') plt.bar(データ列x, データ列y, color='salmon') +データ列の推移を青い破線として描く plt.plot(データ列x, データ列y, linestyle='dashed', color='b') plt.plot(データ列x, データ列y, linestyle='dashed', color='b') +option: 色を黄緑に設定する color = 'chartreuse' color = 'chartreuse' +縦棒グラフの色をレベッカパープルにする plt.bar(データ列x, データ列y, color='rebeccapurple') plt.bar(データ列x, データ列y, color='rebeccapurple') +データフレームを表示するとき表示可能な列数の最大値をnに指定する pd.set_option('display.max_columns', n) pd.set_option('display.max_columns', n) +セットの補集合を求める セット.difference(セット2) セット.difference(セット2) +option: インディゴ色を用いる color = 'indigo' color = 'indigo' +データフレームの選択したカラムを1000の位で丸める df[['列A', '列B']].round(-3) df[['列A', '列B']].round(-3) +折れ線グラフを半透明の破線を用いて描画する plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) plt.plot(データ列x, データ列y, linestyle='dashed', alpha=0.5) +JSONフォーマットのファイルをパースする with open('file.json') as f:data = json.load(f) with open('file.json') as f:data = json.load(f) +変数名はモジュールか調べる inspect.ismodule(識別子) inspect.ismodule(識別子) +線グラフの色をダークシアグリーンに設定する plt.plot(データ列x, データ列y, color='darkseagreen') plt.plot(データ列x, データ列y, color='darkseagreen') +リストの末尾に要素を加える リストがあとあとには休憩(要素) リスト.append(要素) +折れ線グラフをドジャーブルー色を用いて描画する plt.plot(データ列x, データ列y, color='dodgerblue') plt.plot(データ列x, データ列y, color='dodgerblue') +数列を横棒グラフにする plt.barh(ラベル列, データ列) plt.barh(ラベル列, データ列) +線グラフの色をレベッカパープルに設定する plt.plot(データ列x, データ列y, color='rebeccapurple') plt.plot(データ列x, データ列y, color='rebeccapurple') +option: フォントの色をダークサーモンに設定する color = 'darksalmon' color = 'darksalmon' +横に並べて配列を度数分布図にする plt.hist([データ列, データ列], color=['b', 'r']) plt.hist([データ列, データ列], color=['b', 'r']) +option: 大バツマーカーを用いる marker = 'X' marker = 'X' +双方向キューの中に文字列は存在するかどうか調べる 文字列 in 両端キュー 文字列 in 両端キュー +指定したカラムの文字列を未入力値に変換する df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan) +折れ線プロットにラベルを付ける plt.plot(データ列x, データ列y, label='ラベル') plt.plot(データ列x, データ列y, label='ラベル') +緑色化する f'\033[32m{x}\033[0m' f'\033[32m{x}\033[0m' +データフレームとデータシリーズをつなぐ pd.concat([df, ds], axis=1) pd.concat([df, ds], axis=1) +部分文字列を文字列の開始位置から終了位置まで探す 文字列.find(部分文字列, 開始位置, 終了位置) # 見つからない場合は-1 文字列.find(部分文字列, 開始位置, 終了位置) # 見つからない場合は-1 +option: 色の透明度を指定する alpha = 0.5 alpha = 0.5 +カラムの欠損値を中央値で埋める df['列A'].fillna(df['列A'].median()) df['列A'].fillna(df['列A'].median()) +指定したカラムのパーセンタイルを求める df['列A'].quantile(パーセント/100) df['列A'].quantile(パーセント/100) +パープルにヒストグラムの色を設定する plt.hist(データ列, color='purple') plt.hist(データ列, color='purple') +データフレームの最初100行 df.head(100) df.head(100) +option: フォントの色をシーグリーンにセットする color ='seagreen' color = 'seagreen' +散布図の印を黒くする plt.scatter(データ列x, データ列y, markerfacecolor='k') plt.scatter(データ列x, データ列y, markerfacecolor='k') +option: フォントの色をミスティローズに変更する color ='mistyrose' color = 'mistyrose' +ファイルを文字コードtextとして書き込み用にオープンする] open(filepath, mode='w', encoding=text) open(filepath, mode='w', encoding=text) +折れ線グラフの色をディムグレーに変更する plt.plot(データ列x, データ列y, color='dimgray') plt.plot(データ列x, データ列y, color='dimgrey') +データ列間の平均2乗誤差を計算する sklearn.metrics.mean_squared_error(データ列, データ列2) sklearn.metrics.mean_squared_error(データ列, データ列2) +option: 色をミッドナイトブルーに変更する color ='midnightblue' color = 'midnightblue' +データフレームの指定したカラムのNaNを直後の値で埋める df['列A'].fillna(method='bfill') df['列A'].fillna(method='bfill') +ランタイムの再帰の最大回数 sys.getrecursionlimit() sys.getrecursionlimit() +配列から両端キューを新規生成する collections.deque(配列) collections.deque(配列) +黒いバツマーカーで��布図を描く plt.plot(データ列x, データ列y, marker='x', c='k') plt.plot(データ列x, データ列y, marker='x', c='k') +リストとリストについての散布図に黒い左三角マーカーを描く plt.plot(データ列x, データ列y, marker='<', c='k') plt.plot(データ列x, データ列y, marker='<', c='k') +破線に折れ線グラフの線の種類を変更する plt.plot(データ列x, データ列y, linestyle='dashed') plt.plot(データ列x, データ列y, linestyle='dashed') +option: フォントの色をオレンジレッドに指定する color = 'orangered' color = 'orangered' +今日が水曜日か判定する datetime.datetime.today().weekday() == 2 datetime.datetime.today().weekday() == 2 +ヒストグラムを青緑色を用いて描画する plt.hist(データ列, color='turquoise') plt.hist(データ列, color='turquoise') +文字コードtextでファイルパスを開く] text = 'utf-8'open(filepath, encoding=text) text = 'utf-8'open(filepath, encoding=text) +配列とリストの散布図に丸マーカーを描画する plt.plot(データ列x, データ列y, marker='o') plt.plot(データ列x, データ列y, marker='o') +ヒストグラムの色をパレットトルコイズに変更する plt.hist(データ列, color='paleturquoise') plt.hist(データ列, color='paleturquoise') +文字列の右端から部分文字列を取り除く 文字列.rstrip(部分文字列) 文字列.rstrip(部分文字列) +データフレームの選択した列の値をValueMapで一度に置換する df[['列A', '列B']].replace(ValueMap) df[['列A', '列B']].replace(ValueMap) +出力ストリームを改行除外して一行ずつ読み込む f.readline() f.readline() +文字列を最後の区切り記号で分割して前半を求める 文字列.rpartition(セパレータ)[0] 文字列.rpartition(セパレータ)[0] +グラフのデザインをよくする import seaborn as sns import seaborn as sns +データフレームの中のカラムを等しい量になるようにn個にビン分割する pd.qcut(df[col], n) pd.qcut(df[col], n) +stringをインポートする import string import string +折れ線グラフの色をペールグリーンに指定する plt.plot(データ列x, データ列y, color='palegreen') plt.plot(データ列x, データ列y, color='palegreen') +整数を8進表記に変換する oct(整数) oct(整数) +横棒グラフをオーキッド色を使って描画する plt.barh(データ列x, データ列y, color='orchid') plt.barh(データ列x, データ列y, color='orchid') +ベクトルの要素ごとのアダマール積を求める np.multiply(aArray, aArray2) np.multiply(aArray, aArray2) +二つのカウンタのいずれかに含まれる要素を計算する aCounter & aCounter2 aCounter | aCounter2 +リストとデータ列についての散布図に赤い左三角マーカーを描画する plt.plot(データ列x, データ列y, marker='<', c='r') plt.plot(データ列x, データ列y, marker='<', c='r') +行列の合計値を求める np.sum(aArray) np.sum(aArray) +エポック秒の列から日付データにする pd.to_datetime(df['列A'], unit='s', utc=True) pd.to_datetime(df['列A'], unit='s', utc=True) +データフレームの選択したカラムの中にある文字列の数を求める df[['列A', '列B']].isin([value]).sum() df[['列A', '列B']].isin([value]).sum() +散布図を黒いダイアモンドマーカーでプロットする plt.plot(データ列x, データ列y, marker='D', c='k') plt.plot(データ列x, データ列y, marker='D', c='k') +option: フォントの色をライトグレーに変更する color = 'lightgray' color = 'lightgrey' +折れ線グラフの菱形マーカーを黒くする plt.plot(データ列x, データ列y, marker='D', markerfacecolor='k') plt.plot(データ列x, データ列y, marker='D', markerfacecolor='k') +整数の2進数表現 bin(整数) bin(整数) +テキストファイルファイル名がか filename = 'file.txt' # ファイル name'.txt' = '.csv'filename.startswith('.txt') filename = 'file.txt' # ファイル name'.txt' = '.csv'filename.startswith('.txt') +星印としてデータ列の折れ線グラフを描画する plt.plot(データ列x, データ列y, marker='*') plt.plot(データ列x, データ列y, marker='*') +整数の四乗を計算する 整数 ** 4 整数 ** 4 +横方向に二つのデータフレームをマージする pd.merge(df, df2) pd.merge(df, df2) +新しいガウス過程回帰モデルを新規作成する model = sklearn.gaussian_process.GaussianProcessRegressor() model = sklearn.gaussian_process.GaussianProcessRegressor() +散布図に黒い星マーカーを使用する plt.plot(データ列x, データ列y, marker='*', c='k') plt.plot(データ列x, データ列y, marker='*', c='k') +度数分布図を上限から下限までの範囲で描画する plt.hist(データ列, range=(start, end)) plt.hist(データ列, range=(start, end)) +浮動小数点数の双曲線正接の逆数を求める math.atanh(x) math.atanh(x) +整数がnで割り切れる 整数 % n == 0 整数 % n == 0 +折れ線グラフの色をライトグリーンに指定する plt.plot(データ列x, データ列y, color='lightgreen') plt.plot(データ列x, データ列y, color='lightseagreen') +日付時刻データにn時間分、足す aDatetime + datetime.timedelta(hours=n) aDatetime + datetime.timedelta(hours=n) +エポック秒を日付時刻にする datetime.datetime.fromtimestamp(timestamp) datetime.datetime.fromtimestamp(timestamp) +フォーマットで列をdatetime64型に変換する pd.to_datetime(df['列A'], format='%Y-%m-%d') pd.to_datetime(df['列A'], format='%Y-%m-%d') +もしコマンドラインが与えられたなら、処理する if len(sys.argv) > 10:print(sys.argv[1]) # 具体的な処理にする if len(sys.argv) > 1:print(sys.argv[1]) # 具体的な処理にする +option: ミディアムバイオレットレッドにグラフの色を設定する color ='mediumvioletred' color = 'mediumvioletred' +クラス分類をKNNを使ってする model = sklearn.neighbors.KNeighborsClassifier(n_neighbors=5) model = sklearn.neighbors.KNeighborsClassifier(n_neighbors=5) +小数点数のタンジェントの逆数 math.atanh(x) math.atan(x) +カウンタから最も頻出な項目の件数 aCounter.most_common()[1] aCounter.most_common()[1] +データフレームから5行ランダムサンプリングする df.sample(5) df.sample(5) +L1ノルムでデータを正則化する "sklearn.preprocessing.Normalizer(norm=""l1"").fit_transform(""l1"")" "sklearn.preprocessing.Normalizer(norm=""l1"").fit_transform(データ)" +データフレームの指定したカラムの文字列をNaNにする df['列A'].replace(値, np.nan) df['列A'].replace(値, np.nan) +青色を用いて散布図を描画する plt.scatter(データ列x, データ列y, color='blue') plt.scatter(データ列x, データ列y, color='blue') +本日をISO8601形式の文字列にする datetime.datetime.today().isoformat() datetime.datetime.today().isoformat() +日付時刻データは日付時刻データより先 aDatetime > aDatetime2 aDatetime2 = aDatetimeaDatetime < aDatetime2 +耐火レンガ色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='firebrick') plt.barh(データ列x, データ列y, color='firebrick') +要素はセットのいずれか確認する 要素 in セット 要素 in セット +青い一点鎖線でイテラブルの推移を描く plt.plot(データ列x, データ列y, linestyle='dashbot', color='b') plt.plot(データ列x, データ列y, linestyle='dashbot', color='b') +折れ線グラフをバイオレット色として描画する plt.plot(データ列x, データ列y, color='violet') plt.plot(データ列x, データ列y, color='violet') +日付データの曜日を使う aDate.weekday() aDate.weekday() +散布図にrgbの四角マーカーを使用する plt.plot(データ列x, データ列y, marker='s', c=rgb) plt.plot(データ列x, データ列y, marker='s', c=rgb) +横棒グラフを描画してバーの縦幅を調整する plt.barh(ラベル列, データ列, width=0.5) plt.barh(ラベル列, データ列, width=0.5) +リストと配列の散布図に赤い丸マーカーを描画する plt.plot(データ列x, データ列y, marker='o', c='r') plt.plot(データ列x, データ列y, marker='o', c='r') +ロバスト推定で回帰分析をする model = sklearn.linear_model.RANSACRegressor(random_state=0) model = sklearn.linear_model.RANSACRegressor(random_state=0) +option: ミッドナイトブルー色を用いる color ='midnightblue' color = 'midnightblue' +実数のn乗の実数剰余を算出する pow(x, n, y) pow(x, n, y) +エポック秒のカラムからPandasの日付型にする pd.to_datetime(df['列A'], unit='s', utc=True) pd.to_datetime(df['列A'], unit='s', utc=True) +横軸の目盛の値を変更する plt.xticks(目盛りの値リスト) plt.xticks(目盛りの値リスト) +option: ブラック色を用いる color = 'black' color = 'black' +データ列を平方根変換する np.sqrt(データ列) np.sqrt(データ列) +option: 色をダークオーキッドに設定する color = 'darkorchid' color = 'darkorchid' +グレー色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='grey') plt.barh(データ列x, データ列y, color='grey') +ダークターコイズ色として横棒グラフを描画する plt.barh(データ列x, データ列y, color='darkturquoise') plt.barh(データ列x, データ列y, color='darkturquoise') +昇順にある列をキーにしてデータフレームを並べる df.sort_values(by='列A', ascending=True) df.sort_values(by='列A', ascending=True) +xを青色で表示できる文字列に変換する f'\033[34m{x}\033[0m' f'\033[34m{x}\033[0m' +option: フォントの色をミントクリームにする color ='mintcream' color = 'mintcream' +リストと配列についての散布図に赤い星マーカーを描画する plt.plot(データ列x, データ列y, marker='*', c='r') plt.plot(データ列x, データ列y, marker='*', c='r') +散布図をグリーンイエロー色を用いて描画する plt.scatter(データ列x, データ列y, color='greenyellow') plt.scatter(データ列x, データ列y, color='greenyellow') +散布図のクロス印の大きさを変更する plt.scatter(データ列x, データ列y, marker='x', markersize=2.0) plt.scatter(データ列x, データ列y, marker='x', markersize=2.0) +小数点以下'4'桁までの文字列にする ':.4f'.format(x) ':.4f'.format(x) +棒グラフを濃い青色で描画する plt.bar(データ列x, データ列y, color='darkblue') plt.bar(データ列x, データ列y, color='darkblue') +列の名前を列挙する 文字列.values() df.columns +行列の最大値 np.max(aArray) np.max(aArray) +データフレームから重複を残さず重複を消す df.drop_duplicates(keep=False) df.drop_duplicates(keep=False) +データ列とリストについての散布図にrgbの上三角マーカーを描画する plt.plot(データ列x, データ列y, marker='^', c=rgb) plt.plot(データ列x, データ列y, marker='^', c=rgb) +シスル色として散布図を描画する plt.scatter(データ列x, データ列y, color='thistle') plt.scatter(データ列x, データ列y, color='thistle') +散布図に赤い三角マーカーを使用する plt.plot(データ列x, データ列y, marker='^', c='r') plt.plot(データ列x, データ列y, marker='^', c='r') +ロバストな線形分類器を作る model = sklearn.linear_model.HuberClassifier() model = sklearn.linear_model.HuberClassifier() +option: ラベンダー色を使用する color = 'lavender' color = 'lavender' +棒グラフを淡い茶色色で描画する plt.bar(データ列x, データ列y, color='tan') plt.bar(データ列x, データ列y, color='tan') +カテゴリ別に並べてデータフレームを箱ひげ図にする sns.boxplot(x='カテゴリ列', y='列', data=df) sns.boxplot(x='カテゴリ列', y='列', data=df) +棒グラフをダークスレートブルー色を用いて描画する plt.bar(データ列x, データ列y, color='darkslateblue') plt.bar(データ列x, データ列y, color='darkslateblue') +ファイルパスを文字コードtextとして書き込み用にオープンする] open(filepath, mode='w', encoding=text) open(filepath, mode='w', encoding=text) +リストをn個にビンニングし、namesのラベルをつける pd.cut(aList, n, labels=names) pd.cut(aList, n, labels=names) +xとyをスラッシュで区切って表示する print(x, y, sep='/') print(x, y, sep='/') +辞書の全を消去する 辞書.clear() 辞書.clear() +オリーブ色で横棒グラフを描画する plt.barh(データ列x, データ列y, color='olive') plt.barh(データ列x, データ列y, color='olive') +カテゴリで色分けして、に箱ひげ図でデータフレームを図示する sns.boxplot(x='カテゴリ列', y='列', hue='カテゴリ列', data=df) sns.boxplot(x='カテゴリ列', y='列', hue='カテゴリ列', data=df) +数値をゼロ埋めした文字列に変換する str(n).zfill(文字列幅) str(n).zfill(文字列幅) +option: 青を用いる color = 'blue' color = 'blue' +パープル色として線グラフを描画する plt.plot(データ列x, データ列y, color='purple') plt.plot(データ列x, データ列y, color='purple') +横軸の目盛を整数化する plt.xticks(np.arange(最小値, 最大値, 間隔)) plt.xticks(np.arange(最小値, 最大値, 間隔)) +option: グラフの色をロージーブラウンにセットする color = 'rosybrown' color = 'rosybrown'