2018-06-01から1ヶ月間の記事一覧

Python 横棒グラフを作成する「matplotlib」

'21/02/26:刷新 本記事では、横棒グラフ化する雛形コードを載せました。下図左のような都道府県別の人口データのcsvファイルがあります。これを下図右のようにソート(並び替え)して横棒グラフ化します。 日本語が含まれてるデータをmatplotlibで扱う場合…

Python 行名を指定して行データをリスト化し、別ファイル内の文字を置換「pandas」

本記事の特記事項はpandasのインデックスのデータ処理について下記2点です。1. インデックス名(行名)を列名で指定して与える下記例では、一行目に列名IDの列がインデックス(行名)になります。df_s = df.set_index('ID')2. インデックス(行名)のその行のデー…

Python 指定列の要素に対して、部分一致によりデータをリストで抽出。それを用いて置換する方法「pandas」

'20/08/15更新:インデックス番号を1から振り直すコードを追記。また、備忘録の観点から、本記事の構成を再編集しました。 1. ある列を対象に部分一致したその行データを抽出したい場合 df[df['列名'].str.contains('部分一致にしたい内容')] 完全一致の場合…

Python replaceを利用して「指定した」空白を埋める

'20/03/20更新: コードが見づらかったので更新しました。 本記事では、replaceメソッドを使用していて、「指定した」空白箇所を埋める方法です。下図左のような文字列間に空白があるテキストファイルを下図右のように埋めます。 ▼本プログラムmain関数下で…

Python scikit-learnによる因子分析

本記事ではsklearnのFactorAnalysisを利用した。因子分析は主成分分析と同様に説明変数Xとは別の変数を定義して分析する手法である。結果的に次元削減を目的とする。 因子分析は既存の説明変数Xを分解して、「共通因子」なる仮定(想定)の変数での構成する次…

Python scikit-learnによる交互作用の項を考慮した重回帰分析

'20/02/15更新回帰分析後の相関性確認用のグラフ上に、y=axの近似式を入れる仕様にした 本記事では、回帰モデル(回帰式)の項に、相互作用項として「因子A×因子B」や「因子A×因子B×因子C」等が加えられます。 上図のように分析するcsvファイルがあればよい。…