データの前処理で使うpandas には、データを要約・集約するための agg
メソッドがあり、これを使いこなせるようになると、複雑な集計処理もシンプルに記述できるようになります。本記事では、agg
メソッドの使い方を、具体的な例で解説します。
agg
メソッドとは?
agg
は aggregation(集約) の略で、複数の統計関数を簡単に適用できる pandas のメソッドです。特に、データをグループ化してから計算する際に役立ちます。
基本構文
func
: 適用する関数、リスト、または辞書。sum
やmean
などの集計関数を指定します。axis
: 処理を適用する軸。0
(デフォルト)は行方向、1
は列方向を指定します。
実例agg
の使い方
1. 単一の関数を適用する場合
まずは、データフレーム全体に対して、1つの関数を適用する基本的な使い方です。
出力:
2. 複数の関数を同時に適用する場合
出力:
3. 列ごとに異なる関数を適用する場合
4. groupby
と組み合わせた集約
5. カスタム関数の適用
出力:
よく使われる集約関数
agg
に指定できる関数は多数ありますが、よく使われるものを以下にまとめました。
- sum: 合計
- mean: 平均
- max / min: 最大値 / 最小値
- count: 要素の数
- std: 標準偏差
まとめ
agg
メソッドを使うことで、pandas のデータフレームに対して効率的かつ柔軟に集約処理を行うことができます。特に、異なる関数を列ごとに適用したり、複数の関数を同時に適用したりする場合には非常に便利です。
以上
<広告>
リンク
リンク
リンク