Python 重複プロット点を避ける散布図+近似式

本記事では下図のような散布図を作成する雛形コードを作成しました。これは、seabornのregplotメソッドで、x_jitterを使用することでできます。jitterはゆらぎです。 上記の元データは下図のようなcsvです。x列が横軸にプロットするx値、y列が縦軸にプロット…

Python Excelセルに数式を書き込む。さらに棒グラフを作成する「OpenPyXL」

下図は、例題用に適当に作成した月別のぶどうの売り上げ表です。A列に月、B列に商品単価、C列に売り上げ個数としたエクセルファイルです。 本プログラムを実行すると、下図のようにD列に月別の売り上げをセルに数式で書き込みます。この時、D列の最終行に合…

Windows .msiを管理者権限で実行してインストールする方法

インストーラがmsiファイルの場合、「管理者として実行」は右クリックでは存在しません。管理者として実行するには、コマンドプロンプトでCUIで実行します。 コマンドプロンプトは、下図中の左下の虫眼鏡で「コマンドプロンプト」と打てば候補として出てきま…

Python 複数のテキストファイルを兎に角、ひとつのファイルに書き出す

下図のように、行列数の異なるcsvファイルが複数ある。 本プログラムを実行すると、兎に角、下図のようにひとつのテキストファイルに書き込みます。 ■本プログラム #!/usr/bin/env python # coding: utf-8 # In[1]: import glob import pandas as pd file_li…

Python MOVをmp4へ変換する。ffmpegをsubprocess.callで呼び出す

動画ファイル.movを.mp4へ変換するには、ffmegをコマンドラインで実行するのが簡単です。これをPythonスクリプト内で実行したい場合の雛形コードを載せました。subprocess.call()を使用します。 ■本プログラム import os import subprocess as sp input_file…

Python 音声付きの逆再生動画を作成する

本記事では、mp4動画から逆再生する動画ファイルを作成する雛形コードを載せました。使用するライブラリは4つで、OpenCV, Pillow, MoviePy, Pydubです。 それらのインストールはpipで次のようにします。 pip install opencv-pythonpip install Pillowpip ins…

Python バイオリン図と箱ひげ図を同時描画する「ptitprince」

本記事では、下図のようにviolin plot と box plot を同時プロットする雛形コードを載せました。ライブラリ「ptitprince」を使用します。 使用したサンプルデータは、機械学習でお馴染みのアイリスデータセットです(下図)。x軸にspecies列をy軸にsepal_width…

Python 2列からなるデータに対して、カテゴリ別にデータをリストで抽出する「pandasのgroupby×apply」

下図のような2列のデータがあります。No列には数値、Label列には A, B, Cという3つのカテゴリがあります。ここで、A, B, Cそれぞれに属している数字を抽出したい場合の雛形コードを載せました。 本プログラムを実行すると、下図のようにA, B, Cに属している…

Python リストからn個ずつ取り出す

下図のようなリストがある。要素は15個。 本プログラムを実行すると、下図のように4つずつ取り出してタプルに格納します。 ■本プログラム import numpy as np # Noリスト化を作成する No_list = np.arange(1, 16, 1).tolist() print(No_list) # リストからn…

Python 「Sweetviz」探索的データ解析EDAを数行で行う

本記事では、EDA(Explanatory Data Analysis)を簡単に行うライブラリ「Sweetviz」を使った雛形コードを載せました。 例えば、csvデータから機械学習で使うために訓練データとテストデータを分けた後、その出来栄えを可視化します(下図例)。この例では、…

Python pandasのprint表示設定「set_option」

パンダスデータフレームでプリント表示すると、通常は全部表示されない。例えば、下図の場合には行番号が0~4の5つと、501~505の5つだけが表示されている。 そこで下図のようにデータ行列数を取得して、その数をset_optionで指定することで全部表示できます。…

Python TensorBoardをJupyter上で使用する

本記事では、TensorBoardを使う雛形コードを載せました。下図例はJupyterLab上で、tensorflowはv2.4.1で動作確認しています。 分析内容とそのコードの元は次のリンク先です。違いは、タイトル通りにJupyter上でインタラクティブに、そしてTensorBoardを使う…

Python 2次元ヒストグラムの作成

本記事では、二次元ヒストグラムを作成する雛形コードを2種類記載しました。例題に使用したのは、機械学習で有名なBostonデータセットです。横軸に部屋数「RM」、縦軸に住宅価格「PRICE」を用いました。分布は数を表します。 下図例は、matplotlibのhist2dを…

Python Linux環境下でのRPA「pyautogui」

本記事では、Linux環境下で、Pythonとそのライブラリ「pyautogui」を用いてRPA(Robotic Process Automation)する例として、LibreOffice Calcを操作する雛形コードを載せました。仮想ソフトVirtualBox上のUbuntuで動作確認しています。 ソフトウェアの起動に…

Python Windows環境下でのRPA「pyautogui」

'21/08/15更新:RPAで操作対象アプリを最前面へアクティブ化する関数を追加 本記事では、Windows環境下で、Pythonとそのライブラリ「pyautogui」を用いてRPA(Robotic Process Automation)する例として、メモ帳とエクセルを操作する雛形コードを載せました。 …

Python Excelセルの行列範囲を自動判別して抽出する「openpyxl」

本記事では、下図のようにエクセルファイル中の先頭行ではなくて、中途半端な位置に表データ(行列範囲)がある場合に、特に適用します。この行列範囲を自動で判別して、抽出してpandasデータフレーム形式へ読み込む雛形コードを記載しました。 その仕組みは…

Python ExcelVBAマクロファイルを実行する「pywin32(win32com)」

本記事では、Excelマクロファイル(.xlsm)をPython(.py)で操作する雛形コードを載せました。まずは、WindowsアプリをPythonで操作するライブラリpywin32(win32com)をpipでインストールします。 pip install pywin32 anaconda環境下では次のようにしてインス…

Python 外部プロセスによってバッチ処理する「subprocess.run()」

'23/11/04更新:python3.7以上に対応したコードに刷新しました。 本記事では、Pythonスクリプト内で、外部プロセス(子プロセス, サブプロセス)を実行したい場合の雛形コードを載せました。外部プロセスのコマンド処理の完了を待つ場合、「subprocess.run()…

Python 人を検出してモザイク処理する動画編集「OpenCV」

本記事では、下記リンク先のように人(全身)にモザイク処理する動画編集の雛形コードを載せました。ライブラリは「OpenCV」を活用します。 www.youtube.com 人の全身の他に、顔、目だけなどといったカスケードファイル(学習済み分類学習器)を用いることで…

Python 大文字,小文字を区別せずにソートする。逆順にソートする。sorted()関数

本記事では、リストに対して、組み込み関数sorted()によりリストを作成する例を載せました。次のような小文字と大文字が混在してるアルファベットを要素とするリストを例とします。 my_list = ['a', 'B', 'c', 'D', 'x', 'y', 'Z'] 1. 文字サイズを区別して…

Python 指定列に対して、リスト内の値と一致する要素がある行を複数一括で抽出する「Pandasのquery」

例題データは、機械学習でお馴染みのアイリスデータセットを用いました。150行×5列のデータです。 本記事でやりたいことは、例えば、sepal_lengthという列(カラム)に対して、5, 5.5, 6の値である行を全て抽出したい場合に適用し、次のようにします。リスト…

Python 指定パス内のフォルダ容量の一覧表を作成する

本記事では、指定したパス内にある全てのフォルダ(ディレクトリ)の容量サイズを取得して、降順にソートしてcsvファイルへ出力する雛形コードを載せました。 下図がその実施例で、指定したパス「D:/program/python/98_抽出」内のフォルダ毎の容量をランキン…

Python 行数を増やしつつ、特定の要素へ値を代入する「Pandas」

例えば、下図のように150行のデータがあったとします。 本記事では、例えば、下図のように154行に増やしつつ、列名「petal_width」と「species」に値を代入して、その他の列にはNaN(float型)とする雛形コードを載せました。 ■本プログラム #!/usr/bin/env py…

Python 列名部分一致で列を複数選択する「pandasでstr.contains()」

列名が山ほどあって、列名(カラム名)に特定の文字列がある列だけを抽出したい場合もあるかもしれません。その雛形コードを載せました。 例題データは、機械学習データセットで有名なアイリスを用いました。これのcsvはネットで検索すれば出てきて、例えば…

Python カテゴリ変数の種類と数を調べる「Pandasのgroupby」

'21/07/09更新:カテゴリ変数をリスト化したり、数や平均値でソートする方法を追記しました。 本記事では、例えば下図のように「species」というカテゴリ変数を調べる雛形コードを載せました。例題に使用したデータは、機械学習でお馴染みのアイリスデータセ…

Python ボックスプロットを作成する「seaborn」

本記事では、下図のようなBox Plotを作図する雛形コードを載せました。 使用したサンプルデータは、機械学習でお馴染みのアイリスデータセットです(下図)。 ■本プログラム #!/usr/bin/env python # coding: utf-8 # In[1]: import pandas as pd df = pd.read…

Python 思い出の写真をコメントと共に動画にする「OpenCV」

本記事では画像ファイルを繋げて動画にする雛形コードを載せました。下図は、ここ数年でワタクシが呑んで写真を撮った日本酒の一覧で61枚あります。写真の解像度はバラバラであっても、指定したサイズ(本コード中では1920×1080)に調整する仕様のため問題な…

Python サブフォルダ一覧を取得する。または,指定した拡張子のファイル一覧を取得する「pathlib」

本記事では、表題の2つの雛形コードを載せました。 ■1. カレントディレクトリ以下のサブディレクトリ一覧を取得したい場合 import pathlib # カレントディレクトリ以下のサブディレクトリを取得する get_dir_list = list(pathlib.Path('.').glob('**')) for …

Python 外れ値を除去する

本記事では、外れ値を削除する雛形コードを載せました。判定には、四分位範囲の考え方を用いたコードです。その定義では、下側25%(中央値の下側の更に中央値)、上側75%(中央値の上側の更に中央値)点を取得して、その幅から計算して除去するラインを決…

Bash 変数に値を代入して、その変数で計算した結果変数を使う

変数に値を代入する場合はスペースを入れずに、次のように詰めて書きます。 n=20 つまり、次のようにスペースを入れて書くとエラーになります。 n = 20 次に、演算は先頭に$を付けて2重カッコの中に次のように書きます step=$((計算式)) そして、その結果を…