'20/01/01更新: csvファイル化せずに直接読み出す場合についても文末に追記しました。
本プログラム実行後のフォルダ内を下図に示す。3つのcsvファイルを出力しています。

「boston_Xdata.csv」…入力変数Xデータ(設計因子)

「boston_XYdata.csv」…出力変数Yデータ(目的関数)も加えた

「boston_describe.csv」…要約統計量

■本プログラム
from sklearn import datasets
import pandas as pd
def create_boston_data():
boston = datasets.load_boston()
boston_df=pd.DataFrame(boston.data)
boston_df.columns = boston.feature_names
boston_df.to_csv('boston_Xdata.csv', sep=',', index=False, encoding='utf-8', header=True)
boston_df['PRICE'] = pd.DataFrame(boston.target)
boston_df.to_csv('boston_XYdata.csv', sep=',', index=False, encoding='utf-8', header=True)
boston_df.describe().to_csv('boston_describe.csv', sep=',',
index=True, encoding='utf-8')
x_df = boston_df.drop("PRICE", axis=1)
y_df = boston_df.loc[:,['PRICE']]
x_column_name_np = boston.feature_names
return x_df, y_df, x_column_name_np
if __name__ == "__main__":
x_df, y_df, x_column_name_np = create_boston_data()
print(x_df)
print(type(x_df))
print(y_df)
print(type(y_df))
print(x_column_name_np)
print(type(x_column_name_np))
参考までに、csvファイル出力せずに直接読み込む場合を下記に示す。
from sklearn.datasets import load_boston
from sklearn.model_selection import train_test_split
boston = load_boston()
X_df = pd.DataFrame(boston.data, columns=boston.feature_names)
Y_s = boston.target
X_train, X_test, y_train, y_test = train_test_split(X_df, Y_s, test_size=0.3)
以上
<広告>
リンク