2025年7月29日火曜日

nba_apiを使いNBAデータを取得する

NBAデータ取得

NBAデータを分析する場合には、まず最初にデータ取得が必要です。
Kaggleなどのデータサイトから検索してもいいし、データサイトからスクレイピングしてる方もいると思います。
そしてPythonのライブラリからもNBAデータを提供してるものがあるので、それを使ってみたいと思います。
nba_apiです。
使用するには
pip install nba_api
でライブラリをインストールします。

nba_apiライブラリ

nba_apiには、沢山のメソッドがあり、かなり詳しいデータが手に入りますが、反面、どこに何のデータが入ってるか使い方に迷います。
https://github.com/swar/nba_api/tree/masterのサイトにexampleなどもありますが少ししかありません。
https://github.com/swar/nba_api/tree/master/docs/nba_api/stats/endpointsから、メソッド名で当たりをつけ、どれが探してるデータか一つ一つ読んで見つけましょう。

今回は、レギュラーシーズンデータを取得してみたいと思います。
PlayerGameLogsが良さそうなので、それを使います。
#! /usr/bin/env python

import numpy as np
import pandas as pd
from nba_api.stats.endpoints import playergamelogs

season_df = playergamelogs.PlayerGameLogs(
    season_nullable = '2024-25',
).player_game_logs.get_data_frame()

print(season_df.head(50))
  
  

引数 season_nullable に取得したいシーズン '2024-25' を入れます。

player_game_logs.get_data_frame()でデータフレーム形式で取得出来ます。


NBA選手のスタッツを偏差値で比べてみる

スタッツの偏差値を求める NBA2025-26のレギュラーシーズンが終了し、様々な分析がされています。  こちらでは日本人に馴染み深い偏差値で比べてみたいと思います。 試合数が少ないと飛び値が出やすいので50試合以上に出場した選手から算出しています。 まずは1試合あたりの平...