2018-05-01から1ヶ月間の記事一覧

Python scikit-learnによる主成分分析

本記事では、sklearnのPrincipal component analysis (PCA)を利用した。主成分分析の目的は次元削減であり、説明変数Xそのものではなく分散に着目した分析方法である。はじめに、全データの分散が最大となる方向に軸をとって第一主成分と呼ぶ。これは複数の…

Python scikit-learnのランダムフォレストによる回帰分析

本記事では、sklearnのRandomForestRegressorを用いた回帰分析について記載してます。ランダムフォレストとは、多数の決定木を作成して平均化する手法です。これは、1本の決定木の場合では階層が深くなると過学習してしまうことから考えられたアルゴリズムで…

Python scikit-learnによる重回帰分析(データの標準化/正規化含む)

重回帰分析と言ってもソルバーは複数ある。本記事では、sklearn(サイキットラーン)のLinearRegressionとSGDRegressorを用いた2つについて記載した。得られる回帰式は文字通り、Y=f(Xi)=a1x1+a2x2+…+aixi+eで表し、共にlinear_modelをインポートして利用する…

Bash if文とfor文の活用例5つ。ほぼコピペで利用可能

'20/09/21更新: 本記事では、Linuxのshell(シェル)のひとつであるBash(バッシュ)について、普段よく使用するif文3つ、for文2つの計5つの雛形コードを記載しました。 if文 1. 数値で判定して条件分岐する 次の例では、xが偶数の場合にx+1をset_numに代入し、…

Python 実験データを自作関数にフィッティングする「scipy.optimize」

本プログラム実行後のグラフを下図に示す。青点は実験データ(便宜上、手で作成)、赤線はガウス関数でのフィッティング後をプロットしている。 ▼本プログラム フィッテイングはScipyのoptimizeを利用しており、最適値は初期値の設定に依存する。他には、matpl…

VBA サブフォルダ内の全ての画像ファイルをExcelに貼り付ける

'18/05/19更新:フォルダ名/ファイル名の並びを各々ソートして取得する仕様にコードを更新した。本プログラムは、main関数を指定して実行するとダイアログが表示されるので、下図のように画像ファイルがあるサブフォルダの親フォルダの箇所でOKを押す。ちな…

Python ファイル内の最終行に指定文字列があるかを確認し、無ければ追記する。

表題の件を成すには最終行を取得する必要があり、その方法は下記2点です。lastrow = sum(1 for i in open([ファイル名])) # ファイル内の最終行の番号を取得lastrow_sen = linecache.getline([ファイル名], [指定行]) # ファイル内の指定行を取得 本プログ…

Python 指定ファイルの存在をチェックし、無ければファイルを作成する。有れば追記する。

'20/02/29/更新:コードの可読性を若干良くしました。os.path.isfile()を使用すれば楽である。指定ファイルが存在すれば真「True」、存在しなければ偽「False」を返す。その結果を、if文で、if True: や if not True: で分岐すれば良い。ちなみに、ファイル…