Python 2次元ヒストグラムの作成

  本記事では、二次元ヒストグラムを作成する雛形コードを2種類記載しました。例題に使用したのは、機械学習で有名なBostonデータセットです。横軸に部屋数「RM」、縦軸に住宅価格「PRICE」を用いました。分布は数を表します。

下図例は、matplotlibのhist2dを使用した場合です。

f:id:HK29:20210821225208p:plain

下図例は、seabornのjointplotを使用した場合です。

f:id:HK29:20210821223131p:plain

■本プログラム

#!/usr/bin/env python
# coding: utf-8

# In[1]:


import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
import matplotlib.cm as cm
plt.rcParams['font.size'] = 20 # グラフの基本フォントサイズの設定

# csvファイルを読み込む
df = pd.read_csv('boston_XYdata.csv')
df


# In[2]:


# x軸データ
x_name = 'RM'
x_data = df[x_name]
x_data


# In[3]:


# y軸データ
y_name = 'PRICE'
y_data = df[y_name]
y_data


# In[4]:


# ヒストグラム その1
fig = plt.figure()
ax = fig.add_subplot(111)

g = ax.hist2d(x_data, y_data, bins = 60, cmap = cm.jet)
ax.set_xlabel(x_name)
ax.set_ylabel(y_name)
fig.colorbar(g[3], ax = ax)
plt.show()


# In[5]:


# ヒストグラム その2
sns.jointplot(x = x_data, y = y_data, kind = 'hex', color = 'magenta')
plt.xlabel(x_name)
plt.ylabel(y_name)
plt.grid()
plt.show()


# In[ ]:

以上

<広告>