Python データの前処理において役立つ、集計処理のaggメソッド「Pandas」
データの前処理で使うpandas には、データを要約・集約するための agg メソッドがあり、これを使いこなせるようになると、複雑な集計処理もシンプルに記述できるようになります。本記事では、agg メソッドの使い方を、具体的な例で解説します。
aggメソッドとは?
agg は aggregation(集約) の略で、複数の統計関数を簡単に適用できる pandas のメソッドです。特に、データをグループ化してから計算する際に役立ちます。
基本構文
func: 適用する関数、リスト、または辞書。sumやmeanなどの集計関数を指定します。axis: 処理を適用する軸。0(デフォルト)は行方向、1は列方向を指定します。
実例aggの使い方
1. 単一の関数を適用する場合
まずは、データフレーム全体に対して、1つの関数を適用する基本的な使い方です。
出力:
2. 複数の関数を同時に適用する場合
出力:
3. 列ごとに異なる関数を適用する場合
4. groupby と組み合わせた集約
5. カスタム関数の適用
出力:
よく使われる集約関数
agg に指定できる関数は多数ありますが、よく使われるものを以下にまとめました。
- sum: 合計
- mean: 平均
- max / min: 最大値 / 最小値
- count: 要素の数
- std: 標準偏差
まとめ
agg メソッドを使うことで、pandas のデータフレームに対して効率的かつ柔軟に集約処理を行うことができます。特に、異なる関数を列ごとに適用したり、複数の関数を同時に適用したりする場合には非常に便利です。
以上
<広告>
リンク
リンク
リンク