Python 急上昇ワードを抽出する。GoogleトレンドAPI「pytrends」

 pythonライブラリ「pytrends」を用いることで、Googleトレンドにおける直近の人気キーワードを容易に抽出することが出来ます。下記はそのライブラリのHPで、公式ではないAPIです。

github.com

ライブラリのインストールは次の通りpipでします。

pip install pytrends

■本プログラム

from pytrends.request import TrendReq
import datetime
now = datetime.datetime.now()
now = now.strftime("%y%m%d")

# 日本における直近の急上昇ワードを取得する関数
def extract_JP_trend_func():
    # Googleトレンドへの接続
# 引数tzはtime zoneの略で世界標準時(UTC)からの時差を分単位で指定。日本は9h進んでいるため、-540を指定する
pytrends = TrendReq(hl='ja-JP', tz=-540) # 返り値:トレンドキーワードのランキング return pytrends.trending_searches(pn='japan') def main(): ### トレンドキーワードを抽出 trending_searches_df = extract_JP_trend_func() # ランキングをcsvファイルへ出力 trending_searches_df.to_csv(f'{now}_急上昇ワードランキング.csv', encoding = 'shift-jis', header=False, index=False) # リストへ変換 trend_keyword_list = trending_searches_df.loc[:, 0] print(trend_keyword_list) if __name__ == '__main__': main()

 下図は、上記プログラムを実行して取得したcsvファイルです。実行した時点の急上昇ワードの上位20個を抽出したのがわかります。

(備考)上記のコードで人気ワードランキングを取得して、そのキーワードを元にwebスクレイピングして情報収集する仕組みのプログラムを作成すれば、スマートニュースのようなアプリを作成することも可能となるわけです。

(参考)webスクレイピングの雛形コードは下記リンクを参照ください。

hk29.hatenablog.jp

以上

<広告>