Python 外れ値を除去する

本記事では、外れ値を削除する雛形コードを載せました。判定には、四分位範囲の考え方を用いたコードです。その定義では、下側25%(中央値の下側の更に中央値)、上側75%(中央値の上側の更に中央値)点を取得して、その幅から計算して除去するラインを決…

Bash 変数に値を代入して、その変数で計算した結果変数を使う

変数に値を代入する場合はスペースを入れずに、次のように詰めて書きます。 n=20 つまり、次のようにスペースを入れて書くとエラーになります。 n = 20 次に、演算は先頭に$を付けて2重カッコの中に次のように書きます step=$((計算式)) そして、その結果を…

Python df.hist()で見た目の良いヒストグラムを作成する方法

ヒストグラムは、pandasを使えばそのデータフレーム形式dfを用いて、df.hist()の一行だけで作図できます。しかし、列数が多い場合に下図のように見栄えがよろしくなくなる場合がある。タイトルが上隣のグラフに重なったり、数字が半分見えなかったりするので…

Python 「matplotlib」*c* argument looks like a single numeric RGB or RGBA sequence

本記事では、表題の警告が出た場合に、表示させないようにするための対策を載せました。下記をインポートして設定します。 from matplotlib.axes._axes import _log as matplotlib_axes_loggermatplotlib_axes_logger.setLevel('ERROR') ちなみに、警告の全…

Bash forループにより、指定した拡張子のファイルを複数取得する。更に、拡張子なしファイル名等を取得する

本記事では、表題のことをなす雛形コードを載せました。下図は、その例で4つの処理結果をechoで表示したものです。上から順に1. 指定したディレクトリ内のcsvファイルのパスを取得、2. 拡張子なしのファイルパス、3. ベースネーム、4. ベースネームに新たな…

Python 動画の再生速度を変更して保存する「OpenCV」

'22/09/03更新:動画編集の進捗状況をprint出力によりわかるようにしました。また、完了後に、処理に要した時間をprint出力するコードも追記しました。 本記事では、表題の雛形コードを載せました。FPS(Frame Per Second)で速度調整します。一枚あたりのフレ…

Python 「Pandas」表示桁数フォーマットを指定する

本記事では、「小数第一表記」と「指数表記」の2つの例を載せました。はじめに、処理前のデータは下記のように小数点以下の桁数が列毎に色々あります。 import pandas as pd df = pd.read_csv('test_data.csv') df それを次のようにフォーマット指定すること…

Python 工程能力指数Cpkを計算する「pandas」

本記事では、csvファイルから各列のCpk(cpu, cplの小さい方)を計算して、csvファイルに出力する雛形コードを載せました。 また、下図のようにヒストグラムも作成します。 使用した例題のcsvデータの作成方法は、次のリンク先を参照下さい。https://hk29.ha…

Python 複数のリストからpandasデータフレームを作成する

本記事では、2つ以上のリストからpandasデータフレームを作成する下記のような雛形コードを載せました。 import pandas as pdA_list = [355, 157, 97, 70, 57, 49, 43, 37, 33, 29]B_list = list(range(1, 11))C_list = [chr(ord("a")+i) for i in range(26)…

Python 円グラフを作成する「matplotlib」

本記事では、下図のような円グラフを横並びで複数作成する雛形コードを載せました。 下図が使用したcsvデータです。 上記数値データは、次のリンク先の値を引用しました。http://www.stat.go.jp/naruhodo/4_graph/shokyu/obi-graph.html ■本プログラム #!/us…

Python 縦棒グラフの上にその数字を表示する「matplotlib」

本記事では、下図のような縦棒グラフを作成する雛形コードを載せました。 例題データは、下図のようなcsvファイルから、データをソート(並び替え)して上図を作成します。 ■本プログラム #!/usr/bin/env python # coding: utf-8 # In[1]: import pandas as …

Python 平均±3σの折れ線図を作成する「matplotlib」

本記事では、表題のことを成す雛形コードを記載しました。点は平均値で、上下に伸びてるエラーバーがここでは±3σを表します。 グラフ化する例題データは、下図のようなcsvファイルです。A列「month」をx軸にして、B列「data」に対してmonthのカテゴリ別に平…

Python 複数のインデックス番号の行を残すor削除する「Pandas」

本記事では、表題の雛形コードを載せました。 # 指定インデックス番号の行を残す場合 target_list = [1, 5, 503, 506] df1 = df.loc[target_list, :]# 指定インデックス番号の行を削除する場合df2 = df.drop(target_list) 例えば、下図のような506行のデータ…

Python 説明変数間が従属関係にある制約条件下での多目的最適化「PyCaret×Optuna」

本記事では、説明変数間が従属関係にある制約条件下での多目的最適化を実施して、下図のようなパレート解を取得する雛形コードを載せました。 下図はその実施例です。説明変数3つ「PTRATIO」「INDUS」「DIS」の和が固定値25という制約下で乱数により、多目的…

Python 帯グラフを作成する

本記事では、下図のような帯グラフ(積み重ね棒グラフ)の雛形コードを載せました。 次のサイトを参考にさせて頂き、前処理の追加や私好みに多少編集しています。matplotlib - 積み上げ棒グラフを作成する方法 - pystyle 使用したデータは下図のようなcsvフ…

Python カテゴリ別に色を指定して、散布図を作成する「JupyterLab向け」

'21/12/22更新:カテゴリの色を指定するコードを追記しました。 上図のデータ元は、下図のように横軸がA列, 縦軸がE列、カテゴリ変数はF列です。 ■本プログラム #!/usr/bin/env python # coding: utf-8 # In[1]: import pandas as pd file_path = 'test_data…

Python Pandasの列に対して桁数を指定して四捨五入する「decimal」

'21/06/12更新:整数の場合に加えて、小数点の場合の例も追記しました。 本記事では、pandas(パンダス)データフレーム形式の列データに対して、四捨五入する雛形コードを載せました。下図はその例で、列名「RM」と「PRICE」は整数に、それ以外の列は小数点…

Python タートルグラフィックスで絵を描く「turtle」

'21/06/13更新:クロソイド曲線の雛形コードを中程に追記しました。 本記事では、下図のように亀で絵を描く雛形コードを載せました。下図中の左側から、丸, 三角, 四角, 花柄模様はネット検索で出てくる基本事項です。一方、下図右側の赤線のsin波は、自作関…

Python 「JupyterLab」セル中の文字列を複数置換する手順

Ctrl+Fを押すと、下図のように検索画面が表示されます。この左側にある「▶」をクリックします。 すると、下図のように置換画面が出現します。 以上 <広告> // リンク

Python クラス数を指定して分類するクラスター分析「k-means」

'22/07/02更新:クラスタリング前の散布図を冒頭に追加 本記事では、クラス数を指定してクラスター分析(クラスタリング)する雛形コードを載せました。分析結果は、グラフ化してcsvファイルに出力する仕様です。 例題データには、siciki-learnにあるワイン…

Python カテゴリ別にプロットする散布図を作成する(カテゴリデータが行方向に塊りである場合)「plt.scatter」

'21/05/26更新:コードの可読性を多少良くしました。 本記事では、例えば、下図のように「t=1, t=2, t=3」をカテゴリとした散布図を作成する雛形コードを載せました。 本プログラムの仕様について説明します。下図のようなcsvファイルがあって、Time_1, Time…

Python Excelファイル「.xlsx」をシート指定で読み込む「pandas × openpyxl × xlrd」

'22/05/01更新:シート名の一覧を取得する方法を追記しました。 本記事では、下図のようなExcelファイル「.xlsx」をpandasで読み込む雛形コードを載せました。 pandasでエクセルファイル(拡張子「.xlsx」)を読むためには、openpyxlとxlrdをインストールす…

Python 指定文字列を欠損値NaN(float型)へ置換する「pandas×numpy」

'22/05/21更新:全体の要素に対する処理方法に加えて、特定の列に対する処理方法も追記しました。 本記事では、pandasデータフレームに対して、各要素の値が指定した文字列の場合に、欠損値NaN(float型)へ置換する雛形コードを載せました。pandasのmask()…

Python 要素数の和が一定値となる制約の元に、整数の乱数を作成する「numpy」

'22/03/12更新:自然な分布になる雛形コードも追記しました。 本記事では、例えば複数のパラメータA, B, Cの3つがあって、それらの和が一定値Sの制約条件の元に、整数の乱数を作成する雛形コードを載せました。下図は、S=150と指定して2000水準作成した例で…

Python 自動でクラス数を決定してクラスタリングする「x-means」と「g-means」

クラスタリング、クラスター分析と言えば、k-meansが有名です。しかし、予めクラス(分類)数を指定する必要があります。この対策として、分類数を自動で決定するアルゴリズムはいくつか存在していて、「x-means」,「g-means」,「Star Clustering」などがあ…

Python 回帰モデルの作成と多目的最適化によるパレート解の作成「PyCaret×Optuna」

本記事では、PyCaretを用いてベストな回帰モデルを自動で作成する雛形コードと、作成した複数の回帰モデル(バイナリファイル)を利用して、Optunaを用いて多目的最適化を行う雛形コードを載せました。 最終的には、複数の目的変数に対して最小値or最大値を…

Python Y軸の列名を指定して散布図の作成「sns.pairplot」。更にY軸の範囲を設定する

'21/12/17更新:カテゴリの識別を色でなくて、マーカーでする場合の雛形コードを追記しました。 本記事では、下図のような散布図を作成する雛形コードを載せました。seabornのpairplotを用います。 Y軸の列名を指定するには下記のようにします。 y_vars = 'P…

Python 動画をアニメ化する「OpenCV」

本記事では、動画をアニメチックに変換する雛形コードを載せました。動画の返還前後の動画は下記です。 www.youtube.com ■本プログラム import os import cv2 from PIL import Image, ImageFont, ImageDraw import moviepy.editor as mp import numpy as np …

Python 写真をアニメ化する「OpenCV」

本記事では、画像ファイルをアニメっぽく変換する雛形コードを載せました。変換例を4つ、下記のように動画にしました。 www.youtube.com ■本プログラム import os, glob import cv2 import numpy as np def main(): for file_path in file_path_list: # ファ…

Python 行列散布図の作成「seaborn」

'22/02/19更新:図中の上にタイトルを記載するコードを追記しました。 本記事では、下図のような行列散布図を作成して、画像ファイルに保存する雛形コードを載せました。 ちなみに、上図のデータは、機械学習の分類で有名なアイリスデータセットです。seabor…