pythonライブラリ「pytrends」を用いることで、Googleトレンドにおける直近の人気キーワードを容易に抽出することが出来ます。下記はそのライブラリのHPで、公式ではないAPIです。
github.com
ライブラリのインストールは次の通りpipでします。
pip install pytrends
■本プログラム
from pytrends.request import TrendReq
import datetime
now = datetime.datetime.now()
now = now.strftime("%y%m%d")
def extract_JP_trend_func():
pytrends = TrendReq(hl='ja-JP', tz=-540)
return pytrends.trending_searches(pn='japan')
def main():
trending_searches_df = extract_JP_trend_func()
trending_searches_df.to_csv(f'{now}_急上昇ワードランキング.csv',
encoding = 'shift-jis',
header=False,
index=False)
trend_keyword_list = trending_searches_df.loc[:, 0]
print(trend_keyword_list)
if __name__ == '__main__':
main()
下図は、上記プログラムを実行して取得したcsvファイルです。実行した時点の急上昇ワードの上位20個を抽出したのがわかります。
(備考)上記のコードで人気ワードランキングを取得して、そのキーワードを元にwebスクレイピングして情報収集する仕組みのプログラムを作成すれば、スマートニュースのようなアプリを作成することも可能となるわけです。
(参考)webスクレイピングの雛形コードは下記リンクを参照ください。
hk29.hatenablog.jp
以上
<広告>
リンク
リンク