'21/06/19更新:利便性を考えて、JupyterLabのようにインタラクティブに使用できる雛形コードにしました。勿論、テキストファイルに保存してコマンドプロンプトで実行することも可能です。
機械学習モデルを作成してバイナリファイル(.joblib)へ保存する例は次のリンクを参照下さい。Python ランダムフォレスト分類でタイタニックの生存予測 - PythonとVBAで世の中を便利にする
本記事では、上記リンク先で作成した分類学習器を読み込んで未知データを読み込んで予測してcsvファイルに保存するまでの一連の雛形コードを載せました。
分類ではなく、回帰分析の場合でも方法と手順は同じです。
■本プログラム
import pandas as pd
from sklearn.preprocessing import OneHotEncoder
from sklearn.ensemble import RandomForestClassifier
import joblib
import datetime
now = datetime.datetime.now()
now = now.strftime("%y%m%d")
df_test = pd.read_csv('test.csv')
df_test
drop_list = ['PassengerId', 'Name', 'Ticket', 'Cabin']
df_test2 = df_test.drop(drop_list, axis=1)
df_test2
df_test2.isnull().sum()
df_test2.dtypes
df_test3 = df_test2.fillna(df_test2.median())
df_test3
df_test3.isnull().sum()
test_data = pd.get_dummies(df_test3)
test_data
model = now + '_07_titanic_RandomForestClassifier.joblib'
clf = joblib.load(model)
clf
predict = clf.predict(test_data)
predict
results = pd.Series(predict, name = "Survived_pred")
DF = pd.concat([df_test, results], axis = 1)
DF
DF.to_csv(now + '_08_titanic_classyfiy_predict.csv')
(参考)シリアライズ方法のその他の例
TensorFlowに統合されたKerasを使用した例は下記で拡張子は「.h5」です。
Python テンソルフローによるニューラルネットワーク回帰分析 - HK29’s blog
Python テンソルフローによる回帰モデルのロードと予測 - HK29’s blog
以上
<広告>
リンク