2018-05-01から1ヶ月間の記事一覧
本記事では、sklearnのPrincipal component analysis (PCA)を利用した。主成分分析の目的は次元削減であり、説明変数Xそのものではなく分散に着目した分析方法である。はじめに、全データの分散が最大となる方向に軸をとって第一主成分と呼ぶ。これは複数の…
本記事では、sklearnのRandomForestRegressorを用いた回帰分析について記載してます。ランダムフォレストとは、多数の決定木を作成して平均化する手法です。これは、1本の決定木の場合では階層が深くなると過学習してしまうことから考えられたアルゴリズムで…
重回帰分析と言ってもソルバーは複数ある。本記事では、sklearn(サイキットラーン)のLinearRegressionとSGDRegressorを用いた2つについて記載した。得られる回帰式は文字通り、Y=f(Xi)=a1x1+a2x2+…+aixi+eで表し、共にlinear_modelをインポートして利用する…
'20/09/21更新: 本記事では、Linuxのshell(シェル)のひとつであるBash(バッシュ)について、普段よく使用するif文3つ、for文2つの計5つの雛形コードを記載しました。 if文 1. 数値で判定して条件分岐する 次の例では、xが偶数の場合にx+1をset_numに代入し、…
'24/05/06更新:コードの可読性向上のため、コード中のパラメータに説明を追記しました。 本記事では、自作のガウス関数にフィッティングする例の雛形コードを載せました。下図は、本プログラム実行結果です。青点は実験データ(便宜上のサンプルデータ)で…
'18/05/19更新:フォルダ名/ファイル名の並びを各々ソートして取得する仕様にコードを更新した。本プログラムは、main関数を指定して実行するとダイアログが表示されるので、下図のように画像ファイルがあるサブフォルダの親フォルダの箇所でOKを押す。ちな…
表題の件を成すには最終行を取得する必要があり、その方法は下記2点です。lastrow = sum(1 for i in open([ファイル名])) # ファイル内の最終行の番号を取得lastrow_sen = linecache.getline([ファイル名], [指定行]) # ファイル内の指定行を取得 本プログ…
'20/02/29/更新:コードの可読性を若干良くしました。os.path.isfile()を使用すれば楽である。指定ファイルが存在すれば真「True」、存在しなければ偽「False」を返す。その結果を、if文で、if True: や if not True: で分岐すれば良い。ちなみに、ファイル…