本記事では、二次元ヒストグラムを作成する雛形コードを2種類記載しました。例題に使用したのは、機械学習で有名なBostonデータセットです。横軸に部屋数「RM」、縦軸に住宅価格「PRICE」を用いました。分布は数を表します。
下図例は、matplotlibのhist2dを使用した場合です。
下図例は、seabornのjointplotを使用した場合です。
■本プログラム
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib.cm as cm
plt.rcParams['font.size'] = 20
df = pd.read_csv('boston_XYdata.csv')
df
x_name = 'RM'
x_data = df[x_name]
x_data
y_name = 'PRICE'
y_data = df[y_name]
y_data
fig = plt.figure()
ax = fig.add_subplot(111)
g = ax.hist2d(x_data, y_data, bins = 60, cmap = cm.jet)
ax.set_xlabel(x_name)
ax.set_ylabel(y_name)
fig.colorbar(g[3], ax = ax)
plt.show()
sns.jointplot(x = x_data, y = y_data, kind = 'hex', color = 'magenta')
plt.xlabel(x_name)
plt.ylabel(y_name)
plt.grid()
plt.show()
以上
<広告>
リンク