Python scikit-learn付属の多目的用のデータ「Linnerud dataset」をcsvファイル化する

本記事のコードを実行すると下図のようなcsvファイルを作成する。

f:id:HK29:20191219213504p:plain

生理学的特徴と運動能力の関係

説明変数X 目的変数Y
Chins Situps Jumps Weight Waist Pulse
懸垂の回数 腹筋の回数 跳躍 体重 腹囲

心拍数

■本プログラム

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
from sklearn.datasets import load_linnerud
import pandas as pd
import seaborn as sns
from matplotlib import pyplot as plt

def main():
    linnerud = load_linnerud()
    
    x_df = pd.DataFrame(linnerud.data, columns=linnerud.feature_names) # 説明変数Xをpandas形式に変換
    x_df.to_csv('linnerud_Xdata.csv', sep=',', index=False, encoding='utf-8', header=True)

    y_df = pd.DataFrame(linnerud.target, columns=linnerud.target_names) # 目的変数Yをpandas形式に変換
    xy_df = pd.concat([x_df, y_df], axis=1)
    xy_df.to_csv('linnerud_XYdata.csv', sep=',', index=False, encoding='utf-8', header=True)
    print(xy_df)
    
    xy_df.describe().to_csv('linnerud_describe.csv', sep=',', index=False, encoding='utf-8', header=True)

    plt.figure(num=1, dpi=100)
    sns.pairplot(xy_df)
    plt.savefig("Summary.png")
    plt.close()

if __name__ == "__main__":
    main()

●参考資料(下記リンク先の内容は'19/12/07に更新しました) 

hk29.hatenablog.jp

以上

<広告>