本記事では、表題の雛形コードを載せました。下図は、機械学習で有名なタイタニックのデータセットです。これを例に説明します。
例えば、インデックスにPclass(チケットクラス)、列名にSex(性別)にして、平均値や標準偏差を算出して表にしたい場合に下図のようにできます。
一旦、csvファイルに保存して、読み込めば下図のようにして、グラフ化なども容易にできます。
■本プログラム
import pandas as pd
import numpy as np
df = pd.read_csv('train.csv')
df
df2 = df.pivot_table(index = 'Pclass',
values = 'Age',
columns = 'Sex',
margins = False,
aggfunc = [np.mean])
df2.to_csv('statistics.csv')
df2
file_path = 'statistics.csv'
DF = pd.read_csv(
file_path,
sep = ',',
skiprows = [0, 2]
)
DF
以上
<広告>
リンク