Python 株価の価格帯別出来高をグラフ化する

'23/11/14更新:チャートと価格帯別出来高のグラフサイズの割合を変更したコードに変えました。 本記事では、下図のようなグラフを作成する雛形コードを載せました。下図左にはチャート図、右には価格帯別出来高図を表記します。 下図は、例として読み込んだ…

Python pandasで日付型(時間型)を操作する

本記事では、pandasで特定列を日付型へ変換し、続けて色々操作する雛形コードを載せました。主に下図のような処理をします。 はじめに、日付型(時間型)へ型変換するのは次の通りです。 df['日付'] = pd.to_datetime(df['日付']) そして、一連の処理は下記…

Python 株のSuperTrendのインジケーターを作成する

本記事では、下図のようなスーパートレンドのIndicatorを作成する雛形コードを載せました。株の売買判定をする指標のひとつであるATR(Average True Range)を計算して、チャートに図示します。 必要なのは、株価に関する時系列データで日付と高値、安値、終値…

Python 株ランキングを例に、html解析によってデータを抽出してcsvへ保存する「BeautifulSoup」

本記事では、html解析により、web上のデータを抜き出し、csvへ書き出す雛形コードを載せました。下図は、日経HPの株の売買ランキングを抽出した場合の例です。証券コードと銘柄名を抽出してcsvへ出力します。 ライブラリのインストールは次の通りです。 pip …

Python 楽天証券のマーケットスピードⅡとエクセルRSSから、チャート時系列データをcsvで保存する「win32com」

本記事の雛形コードを実行するには前提条件があり、それは次の通りです。楽天証券で口座を開設していること。また、Windows環境である必要があります。それは、楽天証券のツールであるマーケットスピードII (MarketSpeed2)を使用するためです。 そして、マ…

Python 回帰モデルの予測精度を兎に角、向上する手法スタッキング「PyCaret」

本記事では、Pycaretを用いて、スタッキング(Stacking)回帰モデルを構築する雛形コードを載せました。概要は下記です。 # スタッキング stacked_model = stack_models(estimator_list = [reg], # 合成する回帰モデルをリストで指定。複数指定可 meta_model…

Python ヒストグラムの重ね合わせ

'22/05/03更新:ヒストグラムにしたデータを度数分布表へcsvに出力するコードを追記しました。 本記事では、下図のように2つのデータを重ね合わせる雛形コードを載せました。半透明で表示することで、それぞれの分布が見易くなります。 さらに、下図のように…

Python ファイル名の番号を数値で抜き出す

例えば、下図のようにファイル名に番号があるファイルが複数あるとします。 それを下図のように、リストで数字を抽出します。 その雛形コードは次の通りです。 # ファイル番号を取得する# 変数「file_list」はファイル名のリストです。 No_list = [] for fil…

Python ファイルの改行コードを一括でLFへ変換する

本記事では、テキストファイルの改行コードを一括で、LF(ラインフィード)に変換する雛形コードを載せました。 通常、Windows環境にてテキストファイルを編集したり、Windwosサーバーを介してコピペすると、そのファイルの改行コードは意図せずにCR(キャリ…

Python pipでインストール時に生じるSSLErrorを回避する方法

'23/02/20更新:本記事では、Anaconda環境下ではない場合を想定しています。 pipでインストールする場合、通常は次のようにしてインストールできます。これはpycaretをインストールする場合の例です。 pip install pycaret しかし、SSL認証で次のような接続…

Python カテゴリ変数を作成し、散布図を作成する

本記事では下図の凡例(legend)のRMのようにカテゴリ変数を指定数に分割して作成する。またそれを散布図にする雛形コードを載せました。 下図中にある列名「RM」のデータから、列名「label」というカテゴリ変数を作成します。それを上図のようにカテゴリ別…

Python Anacondaの仮想環境のデフォルトactivateを変更する【Windows】

本記事では、Windowsのアナコンダ環境で、仮想環境の構築後に、その環境を起動時のデフォルトアクティベイトに設定する手順を載せました。 下図は、AnacondaPrompt(アナコンダプロンプト)で「conda info -e」で存在する環境を表示した結果です。「base」と…

Python Jupyter上の画像をクリップボードにコピーする手順

はじめに、マウスをグラフ上に位置させます。次に、シフト(shift)キーを押しながらマウスの右クリックします。すると、下図のように「画像をコピー」を選択できます。 これで、パワポ(PowePoint, パワーポイント)やエクセル(Excel)に画像を貼り付ける…

Bash 変数から指定範囲の文字列を抜き出す

本記事では、例えば、data_12.csvの文字列変数に対して、6番目から2つまでの文字列12を抽出する雛形コードを載せました。下図はその結果例です。12を抜き出して、拡張子に.txtをしてシンボリックリンクを貼っています。 ■本プログラム #!bin/bash my_file="d…

Python カテゴリ別に平均や標準偏差などの統計量を算出する「pandasのpivot_table」

本記事では、表題の雛形コードを載せました。下図は、機械学習で有名なタイタニックのデータセットです。これを例に説明します。 例えば、インデックスにPclass(チケットクラス)、列名にSex(性別)にして、平均値や標準偏差を算出して表にしたい場合に下…

Python グラフの凡例に指定したい色を設定する

'21/12/05更新:折れ線図だけの場合の雛形コードも追記しました。 本記事では、凡例(legend)の順番に従って段階的に変化した色を適応したい場合の雛形コードを載せました。 下図の例では、凡例が0, 1, 2の3つあります。これらが水色から紫へと段階的に変化…

Python 交互作用図を作成する「interaction_plot」

'22/06/10更新:グラフの体裁のため、雛形コードを多少編集しました。 本記事では、下図のような交互作用図を作成する雛形コードを載せました。縦軸は、出力指標Yのデータ平均で,横軸と凡例は入力因子Xです。 例えば、凡例によって線の傾きが異なることがあ…

Python ファイルパスからフォルダパス,フォルダ名,ファイル名,拡張子,拡張子なしファイル名を取得する「pathlib」

'21/12/11更新:新しいファイルパスをリストから作成する方法に変更した。またzip圧縮するコードも追記。 本記事では、下図のようにファイルパスからフォルダパス,フォルダ名,ファイル名,拡張子,拡張子なしファイル名を取得する等の雛形コードを載せまし…

Python 欠損値分析「pandas × missingno」

本記事では、欠損値(NaNや空欄など)をグラフで可視化する「missingno」の雛形コードを載せました。はじめに、インストール方法は次の2通りです。■pipの場合 pip install missingno ■Anacondaの場合 conda install -c conda-forge missingno 本記事で使用し…

Python 実行回数をカウントする。ジェネレータ関数の使い方

本記事では、ジェネレータ関数の記述例を載せました。例えば、あるプログラムの途中で、ある関数が実行された回数を数えたい場合があったとします。この時、同時にこのジェネレータ関数オブジェクトを実行することで実現できます。(もしくは、実行したい内…

Bash シェルスクリプト内で小数点計算をするため、python -cを使用する方法

バッシュスクリプト(Bash Script)の計算では、小数点は切り捨てられて整数になります。例えば、7/4=1.75ですが、bashでは1になります。そこで、スクリプト内でパイソンコマンド(Python Command)の-cを用いることで1.75と計算できます(下図)。 ■本プロ…

Python 小数点以下の桁数で四捨五入する「Decimal」

標準モジュールのdecimalをインポートして使用します。 from decimal import Decimal, ROUND_HALF_UP pai = 3.141592 # 四捨五入して小数第3位までの数字にする(小数第4位を四捨五入) a = Decimal(str(pai)).quantize(Decimal('0.001'), rounding=ROUND_HA…

Python 3次元データを2次元散布図で表記する

本記事では、下図のように3次元データを2次元散布図で表現する雛形コードを載せました。 例題に使用したデータは機械学習でお馴染みのボストンデータセットです。図例では、X軸にRM(部屋数)、Y軸にLSTAT(低所得者の割合)、(Z軸)カラーにPRICE(部屋の価…

Python 確率によって分岐する関数の作成

例えば、コインの表(omote)と裏(ura)の出現確率は、通常50%である。しかし、コンピュータ上でその確率に差を設けることができる。下図は、omoteの確率を10%、uraの確率を90%に設定して、20回試行した結果である。明らかに、omoteの出現数が少ないこと…

Python 重複プロット点を避ける散布図+近似式

本記事では下図のような散布図を作成する雛形コードを作成しました。これは、seabornのregplotメソッドで、x_jitterを使用することでできます。jitterはゆらぎです。 上記の元データは下図のようなcsvです。x列が横軸にプロットするx値、y列が縦軸にプロット…

Python Excelセルに数式を書き込む。さらに棒グラフを作成する「OpenPyXL」

下図は、例題用に適当に作成した月別のぶどうの売り上げ表です。A列に月、B列に商品単価、C列に売り上げ個数としたエクセルファイルです。 本プログラムを実行すると、下図のようにD列に月別の売り上げをセルに数式で書き込みます。この時、D列の最終行に合…

Windows .msiを管理者権限で実行してインストールする方法

インストーラがmsiファイルの場合、「管理者として実行」は右クリックでは存在しません。管理者として実行するには、コマンドプロンプトでCUIで実行します。 コマンドプロンプトは、下図中の左下の虫眼鏡で「コマンドプロンプト」と打てば候補として出てきま…

Python 複数のテキストファイルを兎に角、ひとつのファイルに書き出す

下図のように、行列数の異なるcsvファイルが複数ある。 本プログラムを実行すると、兎に角、下図のようにひとつのテキストファイルに書き込みます。 ■本プログラム #!/usr/bin/env python # coding: utf-8 # In[1]: import glob import pandas as pd file_li…

Python MOVをmp4へ変換する。ffmpegをsubprocess.callで呼び出す

動画ファイル.movを.mp4へ変換するには、ffmegをコマンドラインで実行するのが簡単です。これをPythonスクリプト内で実行したい場合の雛形コードを載せました。subprocess.call()を使用します。 ■本プログラム import os import subprocess as sp input_file…

Python 音声付きの逆再生動画を作成する

本記事では、mp4動画から逆再生する動画ファイルを作成する雛形コードを載せました。使用するライブラリは4つで、OpenCV, Pillow, MoviePy, Pydubです。 それらのインストールはpipで次のようにします。 pip install opencv-pythonpip install Pillowpip ins…