'22/05/01更新:シート名の一覧を取得する方法を追記しました。
本記事では、下図のようなExcelファイル「.xlsx」をpandasで読み込む雛形コードを載せました。
pandasでエクセルファイル(拡張子「.xlsx」)を読むためには、openpyxlとxlrdをインストールする必要があります。入れないと、XLRDError: Excel xlsx file; not supported というエラーが生じます。
■インストール方法
▼シート名を指定してpandasで読み込む方法
シート名がわかってる場合、openpyxlのインポートの明示は不要です。但し、engine = "openpyxl" を指定します。
下図はその結果で、pandasデータフレームで読み込めます。
▼複数のシートを一括で読み込む方法
まず、シート名の一覧を取得する方法については、次のように openpyxlのインポートが必要です。
すると、下記のように、シート名の一覧をリストで取得できます。
そして、pd.read_excelで読み込み時に、引数「sheet_name」に複数シート名のリストで与えると、keyをシート名とした辞書型のデータフレームを取得します。
下図はその結果です。
以上
<広告>
リンク