Python pandasにおける~（チルダ）の使用例

~（チルダ）は、NOT演算子として使います。本記事では、pandasにて次の２つの使用例を示します。使用例1：指定した列に対して、指定した要素以外の行データを抽出する使用例2：df.duplicated()と組み合わせることで、重複要素がある行データを除外する ■使…

2024-10-31

Python 時系列データのグラフ描画において、横軸の目盛り表記を固定で指定する

Python pandas グラフ化

本記事では、下図のような行方向に年月の時系列と数値があるデータセットにおいて、行数が揃っていない場合（欠損）がある場合でも、横軸の目盛りを指定してグラフを描画するサンプルコードを載せました。その方法は、欠損している年月データを作成する時に…

2024-05-05

Python 2つのDataFrameを結合する便利な方法「merge関数」

Python pandas

本記事では、二つのデータフレームを結合する雛形コードを6つ載せました。はじめに、その一覧を示します。 #1. 基本的な結合: merged_df = pd.merge(df1, df2, on='key_column') #2. 異なる列名を指定しての結合: merged_df = pd.merge(df1, df2, left_on='l…

2024-05-03

Python 「pandas」複数列を行方向に走査して、所望の文字列を検出して新規列に結果を記入する

Python pandas 抽出

本記事では、下図左のように複数の列「入荷1」,「入荷2」,「入荷3」を行方向に走査して、もし「りんご」の単語があれば、下図右のように新しい列「りんご」に真偽値「True」を代入する雛形コードを載せました。下記は、上記の処理をするpythonスクリプトで…

2024-05-01

Python グループ別データ集計「pandasのgroupby×agg」

Python pandas 抽出

本記事では、pandasデータフレームに対して、所望のグループ毎に統計量を計算する雛形コードを載せました。これは、groupbyのaggメソッドを用いることで簡単にできます。groupby は、データを特定の基準でグループ化するために使用されます。agg メソッドは…

2024-04-28

Python マルチインデックスの棒グラフの横軸２段表示

Python pandas グラフ化

Multi-Index（マルチインデックス）とは、下図のようにインデックスがOne, Twoとa, bのように複数のインデックスがあることを言います。本記事では、上記のようなデータセットに対して、下図右のように横軸が２段表示になるような雛形コードを載せました。…

2024-04-06

Python PySide6によるGUIアプリの作成

Python アプリ化 Excel 抽出 pandas

本記事では、PySide6でデスクトップアプリを作成する雛形コードを載せました。本アプリの動作検証用のサンプルのexcelファイルと雛形コードは、次のgithubにアップしています。https://github.com/hk29-ai/template_for_GUI_app_using_pyside6 ■ライブラリの…

2024-03-01

Python 辞書からpandasデータフレームを作成するパターン別雛形コード

Python pandas

'24/04/06更新：雛形コードを追加した。本記事では、辞書からpandasデータフレームを作成する雛形コードを3パターン載せました。 ■その1. 下図のように、キーに対してバリューが1つの場合の辞書データがあります。これからキーとバリューを列に設定したデー…

2024-02-28

Python pandasで指定列に対して、上位N個もしくは下位N個の行を抽出する

Python pandas 抽出

ソートせずに、メソッド「df.nlargest」、「df.nsmallest」を使うことで簡単にできます。具体例で示します。下図のような506行×14列のデータがあります。この右端の列「PRICE」の上位25個、下位25個のデータ行をそれぞれ抽出します。まずは、上位25個の行デ…

2023-02-28

Python pandasで列名を指定して辞書を作成する

Python pandas

本記事では、下図のようなcsvファイルがあって、2つの列名を指定して辞書を作成したい場合の雛形コードを載せました。下図は、keyに「名前」、valueに「合計点」を指定した場合の実行例です。 ■本プログラム import pandas as pd # csvファイルをpandasで読…

2022-10-31

Python 回帰モデルの精度確認のため、その評価指標を出力する「sklearn.metrics 」

Python scikit-learn pandas 回帰

本記事では、作成した回帰モデルの精度検証のための雛形コードを載せました。下図は、それをするための読み込みデータ例です。N列の「PRICE」が指標の生値で、O列の「Label」が回帰モデルによる指標の予測値です。この2列を比較することによって、回帰モデル…

2022-09-17

Python pandasで特定の要素の値を抽出する「at, iat」

Python pandas 抽出

本記事では、下図のようなpandasデータフレーム形式の表データに対して、行名、列名、もしくは行番号、列番号を指定して、任意の要素の値を抽出する雛形コードを載せました。まず、csvのような表データは、次のようにしてpandasデータフレームで読み込みま…

2022-09-10

Python 列名指定で棒グラフを描く「pandasのplot.bar()とax.patches」

Python pandas グラフ化

本記事では、下図のような棒グラフをpandasのデータフレームにて、列名を指定して描く雛形コードを載せました。df.plot.bar()を使います。グラフの値を記入するには、ax.patchesを用います。上図の元データは、下図のような表データです。これをpandasのDat…

2022-07-18

Python 集合棒グラフ（横並び棒グラフ）

Python グラフ化 pandas numpy

'22/09/10更新：棒グラフの値の表示位置設定とグリッド設定について、引数を明記しました（グラフデザインの柔軟性を高めた雛形コードにするため）。本記事では、下図のような横に並べる棒グラフの雛形コードを載せました。上記のデータ元は、下図のような…

2022-07-01

Python 同じインデックスを抽出して、列データを連結する「Pandasのmerge」

Python pandas 抽出

本記事では、2つのデータフレームがあって、共通のindex（行番号，行名）の行データに対して、列データを連結する手順を載せました。もし、重複する列名がある場合はそれらを削除する操作も記載しています。 import pandas as pd # データ1 df1 = pd.read_cs…

2022-05-21

Python 「Pandas」指定条件にあてはまる or あてはまらない要素を置換する「mask, whereメソッド」

Python pandas 抽出

本記事では、表題を成す雛形コードを2つ載せました。 ▼1. 指定条件にあてはまる要素を置換する場合は、mask()メソッドを使用する import pandas as pd # csvファイルを読み込むdf = pd.read_csv('test_data.csv') df # 特定の列に対して、指定条件にあてはま…

2022-05-06

Python 株価データを取得する「pandas_datareader」

Python 株 pandas 時系列

本記事では、チャートデータを取得する雛形コードを載せました。ライブラリは「pandas_datareader」を使用します。下図は、ある銘柄の現在から過去5年間の期間を指定して取得した例です。 ■インストールは次の通りです pip install pandas-datareader ■本プ…

2022-05-03

Python 特定の列に対する指定条件で、行データ（外れ値）を削除する方法「Pandasのquery」

Python pandas 抽出

本記事では表題のことを成す雛形コードを載せました。例題データには、機械学習でお馴染みのボストンデータセットを用いました。入手方法はネット情報から得られます。 ▼元データのグラフ化 #!/usr/bin/env python # coding: utf-8 # In[1]: import pandas a…

2022-04-28

Python 積み上げ縦棒グラフを作成する「matplotlib」

Python グラフ化 pandas

'22/09/10更新：グリッド設定の引数を追加（明記）しました。本記事では、下図のような積み上げ棒グラフを作成する雛形コードを載せました。次のサイトを参考にして、自分好みの設定にしたものです。https://pystyle.info/matplotlib-stacked-bar-chart/ 上…