抽出
本記事では、下図左のように複数の列「入荷1」,「入荷2」,「入荷3」を行方向に走査して、もし「りんご」の単語があれば、下図右のように新しい列「りんご」に真偽値「True」を代入する雛形コードを載せました。 下記は、上記の処理をするpythonスクリプトで…
本記事では、pandasデータフレームに対して、所望のグループ毎に統計量を計算する雛形コードを載せました。これは、groupbyのaggメソッドを用いることで簡単にできます。groupby は、データを特定の基準でグループ化するために使用されます。agg メソッドは…
'24/04/16更新:メニューバーから実行できるボタン追加のコードを追記しました。 本記事では、スプレッドシートを置いたカレントフォルダ以下を再帰的に探索して、ファイル一覧を書き出すGoogel App Script(GAS)の雛形コードを載せました。下図は、本プロ…
本記事では、PySide6でデスクトップアプリを作成する雛形コードを載せました。本アプリの動作検証用のサンプルのexcelファイルと雛形コードは、次のgithubにアップしています。https://github.com/hk29-ai/template_for_GUI_app_using_pyside6 ■ライブラリの…
本記事では、例えばjpg, jpeg, pngの3種類の画像ファイルを読み込む雛形コードを記載しました。 ■本プログラム import os import glob # カレントディレクトリの取得folder_path = os.getcwd() # 画像ファイルをリストで取得files_path = glob.glob(os.path…
ソートせずに、メソッド「df.nlargest」、「df.nsmallest」を使うことで簡単にできます。具体例で示します。下図のような506行×14列のデータがあります。この右端の列「PRICE」の上位25個、下位25個のデータ行をそれぞれ抽出します。 まずは、上位25個の行デ…
下図はpythonライブラリpytrendsを用いて、ワード「株」を指定して、ここ1週間の関連ワードを抽出した結果です。ターゲット期間は、日, 月, 年単位で指定できます。 ■ライブラリのインストール pip install pytrends ■本プログラム from pytrends.request i…
本記事では、国土地理院の無料のAPIを利用して、指定した地域名の緯度と経度を取得する雛形コードを載せました。そして、ライブラリ「folium」を利用して、下図のように抽出した緯度と経度を中心座標として矩形を描く雛形コードを載せました。 国土地理院のA…
本記事では、下図のようなスプライン曲線を作成する雛形コードを載せました。 上図左のスプライン曲線の作成コード部分には、https://teratail.com/questions/279780#reply-398529 を引用しています。本プログラムでは、上図右のようにスプライン曲線上に任…
本記事では、Google Earth Engine(GEE)を用いて、下図のような衛星画像と 正規化植生指標(NDVI, Normalized Difference Vegetation Index)を取得する雛形コードを載せました。 下図は鳥取砂丘の周辺の地区について、2023年の4月,8月,12月の衛星画像とNDV…
本記事では、下図のように地図を描く雛形コードを載せました。 日本地図のデータは下記リンク先にある「全国」より取得できます。都道府県の地図データは「全国」から抽出することができますし、個別に「都道府県名」より取得することもできます。 nlftp.mli…
pythonライブラリ「pytrends」を用いることで、Googleトレンドにおける直近の人気キーワードを容易に抽出することが出来ます。下記はそのライブラリのHPで、公式ではないAPIです。 github.com ライブラリのインストールは次の通りpipでします。 pip install …
例題として、下図のようなテキストファイルがあります。例えば、文字列LOG_DATAのある行を抽出したいとします。ここでは2箇所あります。 本プログラムを実行すると、下図のように、LOG_DATAのある行を2箇所抽出してcsvファイルとして書き出す雛形コードを載…
本記事では、URLからQRコードを生成する雛形コードを載せました。お気に入りのURLを保存しておきたい場合、あるいはそれを誰かに教えるために他のデバイスに転送したい場合に、URLをQRコード(画像ファイル)にすることでスマートにできます。 例えば、下記…
csvファイルから、sqlite3のデータベース(DB)ファイルを作成するPythonの雛形コード。また、そのDBを読み出して、指定した条件のデータを抽出したり、それをcsvファイルへ出力する雛形コードも載せました。 ちなみに、csvからsqlite3のDBを作成するには、…
本記事では、下図のようなpandasデータフレーム形式の表データに対して、行名、列名、もしくは行番号、列番号を指定して、任意の要素の値を抽出する雛形コードを載せました。 まず、csvのような表データは、次のようにしてpandasデータフレームで読み込みま…
'22/11/14更新:下図のように取得したい開始日の入力を促すコードの追記しました。さらに、日付を跨いでログインもしくはログオフしたことによって、各日のログオンもしくはログオフの片方が存在しない場合はnanを挿入する仕様にした。 本記事では、下図のよ…
例えば、WindowsローカルPCにて、Linuxサーバ等とファイルをやり取りするには、FTPソフトであるFFFTPやWinSCPなどを使用する方法があります。本記事では、そのようなソフトを使用するのではなくて、Pythonスクリプトで同様のことをする雛形コードを載せまし…
本記事では、下図のように多数のファイル名をrename(リネーム)する雛形コードを載せました。 上の例では、各ファイル名にある「スライド」を「slide_」にして、ファイル番号「1, 2, …, 10…」を「01, 02, …, 10…」のように2桁の0埋めに、ファイル名を変更し…
本記事では、下図のような画像ファイル(.jpgや.png)の線図のラインをpathとしたsvgファイルを作成するPythonの雛形コードを作成しました。 作成したsvgファイルは、CADソフトで読み込むことが出来ます。下図は、オープンソースのFreeCADで読み込んだ例です…
本記事では、下図左のような線図の線を検出して、下図右のようにCADで読み込めるsvgファイルを作成する雛形コードを載せました。 線図の線は、領域ごとに閉じたポリゴンとして作成します。そのため、押し出すことができます。下図は、オープンソフトのFreeCA…
本記事では、2つのデータフレームがあって、共通のindex(行番号,行名)の行データに対して、列データを連結する手順を載せました。もし、重複する列名がある場合はそれらを削除する操作も記載しています。 import pandas as pd # データ1 df1 = pd.read_cs…
本記事では、表題を成す雛形コードを2つ載せました。 ▼1. 指定条件にあてはまる要素を置換する場合は、mask()メソッドを使用する import pandas as pd # csvファイルを読み込むdf = pd.read_csv('test_data.csv') df # 特定の列に対して、指定条件にあてはま…
本記事では、csvファイルを外部ライブラリ「pandas」ではなくて、pythonの標準モジュール「csv」で取得する雛形コードを4つ載せました。 # 1. csvを1行ずつリストで抽出する場合 import csv with open('iris-dataset.csv', encoding = 'utf-8', newline = ''…
本記事では表題のことを成す雛形コードを載せました。例題データには、機械学習でお馴染みのボストンデータセットを用いました。入手方法はネット情報から得られます。 ▼元データのグラフ化 #!/usr/bin/env python # coding: utf-8 # In[1]: import pandas a…
本記事では、pandasデータフレームにて、行方向のデータを等分割する雛形コードを載せました。 例えば、下図左はアイリスデータセットで150行あります。これを下図右のように例えば、10行ずつに分割したデータフレームを新たに作成してリストへ格納します。 …
'22/04/13更新:堅牢性のためにエラー処理などを追加 本記事では、下図のようにホテル情報を抽出する雛形コードを載せました。使用するライブラリは「requests」です。 はじめに、楽天IDが必要なので、登録してない場合は登録します。そして、次のリンク先に…
ファイルパスからファイル名を取得するには、次のように、os.path.basename()を使用します。 import os file_path = r'D:\program\python\11_抽出\ファイルパスからファイル名と拡張子を取得する\data_1.csv' # ファイルパスから、ファイル名の取得 file_nam…
本記事では、pandasで特定列を日付型へ変換し、続けて色々操作する雛形コードを載せました。主に下図のような処理をします。 はじめに、日付型(時間型)へ型変換するのは次の通りです。 df['日付'] = pd.to_datetime(df['日付']) そして、一連の処理は下記…
本記事では、html解析により、web上のデータを抜き出し、csvへ書き出す雛形コードを載せました。下図は、日経HPの株の売買ランキングを抽出した場合の例です。証券コードと銘柄名を抽出してcsvへ出力します。 ライブラリのインストールは次の通りです。 pip …