サッカーを通じて観戦力と分析力を上げていくブログ

基本的にはサッカー×データに関して試してみたことをまとめています。最近はもっぱらPythonを使った可視化中心。時々自分の好きなガジェットも。

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-関東編-

先日参加したセミナーで鹿島アントラーズの方が「Jリーグの商圏はスタジアムから30km圏内」と言っていたので、各クラブが圏内にどのくらいの人口を持っているのかPythonで可視化してみようと思います。データが多いので地方別にアウトプットしていき、最後にまとめるようにします。

使用するデータ

市区町村別人口データ

総務省HPの「住民基本台帳に基づく人口、人口動態及び世帯数」に記載されている「【総計】平成30年住民基本台帳人口・世帯数、平成29年人口動態(市区町村別)EXCEL」をソースとして利用します。

www.soumu.go.jp

地理データ

こちらは国土交通省の「国土数値情報 ダウンロードサービス」を使用。行政区域のGeoJsonデータを使って可視化します。

nlftp.mlit.go.jp

スタジアムの位置データ

スタジアムの情報は、Jリーグ公認ファンサイト「J’s GOAL」のスタジアム一覧を利用します(地域別にまとめられているので)。この一覧からGeocoding APIを使って、スタジアムの緯度と経度に変換して使用します。

www.jsgoal.jp

ここまでのデータとPythonのライブラリFoliumを使って地図上に可視化していきます。

平均観客数データ

最後に、商圏内の人口と比較するため各クラブの平均観客数のデータも準備しておきます。こちらは「J.LEAGUE Data Site」からクラブ別の2018年平均観客数を取得して利用します。

data.j-league.or.jp

このデータを使って関東圏のクラブの平均観客数をグラフにすると下記になります。

f:id:virgilvd:20190323211259p:plain

バーの色は所属するディビジョンを表しています。この時点で商圏よりもディビジョンの影響を色濃く受けていることが明らかですね。。

商圏と圏内の人口を可視化-北関東-

それでは早速可視化してみます。関東地方はスタジアムが多かったので、北と南に分けて見ていきます。

f:id:virgilvd:20190323210731p:plain

上の図は市区町村が人口によって色分けされており、青が濃くなっているところほど人口が多いことを表しています。色分けは、全国の市区町村の人口を小さい順に並べて、データの数が6等分されるように分けています。一方の赤の半透明の円がスタジアムから30kmの商圏を表しています。

北関東にあるスタジアムは4つで、それぞれ県立カシマサッカースタジアム(鹿島)、ケーズデンキスタジアム(水戸)、栃木県グリーンスタジアム(栃木)、正田醤油スタジアム群馬(群馬) 。水戸、栃木、群馬の3県の商圏内の人口はそこまで変わらないのに対し、鹿島は商圏の半分近くが海に囲まれているために非常に少ないです。にも関わらず先の平均入場者数が4倍近く多いのは、単純なディビジョンの違いだけではなくクラブの戦略等が影響していそうです。

商圏と圏内の人口を可視化-南関東-

f:id:virgilvd:20190323212051p:plain

南関東を見てみると、こちらは14ものスタジアムが集中しており商圏内に被りまくっている状況です。密集しすぎていてこの図から読み取れることは少ないですが、J1内で平均入場者数が少ない柏と湘南の商圏に海部分が多いことが影響しているのかもと思いました。また大宮は、NACK5スタジアム熊谷スポーツ文化公園陸上競技場という2つのホームスタジアムを使用していますが、商圏を広げる意味で割と効果的な位置にあることがこの図からも分かります。

こうして可視化してみると、思っていたほど商圏と観客数は相関がなさそうなことがわかりました。関東圏はクラブもスタジアムも多くあるので、他の地方ではどのような結果になるのか引き続き見ていきたいと思います。

戦術や分析に関して、こういう見方もあるよ、こうして見た方がいいよ、などご意見等ありましたら、コメントで教えていただけると幸いです。ぜひよろしくお願いいたします!