サッカーを通じて観戦力と分析力を上げていくブログ

基本的にはサッカー×データに関して試してみたことをまとめています。最近はもっぱらPythonを使った可視化中心。時々自分の好きなガジェットも。

データ

【データ可視化】プレミアリーグの放映権料を可視化してみる

プレミアリーグの放映権料周りの数字が公式サイトで公開されていたのでサクッと可視化していきます。データ自体は5月に発表されたものですが、プレミアリーグが始まるこのタイミングで改めて見てみたいと思います。

【データ分析】機械学習周りの用語を整理してみる(初心者)

1ヵ月間「Kaggle Masterによるデータ分析技術者養成講座」なるセミナーを受講していました。DeNAでデータサイエンティストとして働く@yukrai17さんが、Pythonを使った機械学習のモデル作りについて教えてくれる講座で、データの作り方やモデルの検証方法まで…

【データ可視化】JクラブのPL周りの数字を可視化してみる-費用・利益編-

前回の収益編に引き続いて、今度は各クラブの費用と利益について可視化していきます。 96lovefootball.hatenablog.com

【データ可視化】JクラブのPL周りの数字を可視化してみる-収益編-

前回Power BIを使って「Jクラブ個別経営情報開示資料」を可視化できるようにしたので、実際に色々と可視化してみます。各クラブがどういった収益構造になっているのか、ビジネスとして成功しているクラブがどこなのかを明らかにしていきます。 96lovefootbal…

【Power BI】PDF形式のJクラブ個別経営情報開示資料を取り込んでみる

個人的に毎年楽しみにしている「Jクラブ個別経営情報開示資料」。各クラブのPLとBSをまとめられているので、財務状況を比較して見ることが出来ます。しかしこの資料、PDF形式になっていて可視化や分析するには少々手間がかかるのです。そこで今回はPower BI…

【データ可視化】チャンピオンズリーグ出場クラブをサプライヤー目線で色々見てみる

下の記事にあるように、サッカークラブはスポーツメーカーと巨額のスポンサー・サプライヤー契約を結んでいます。現在の契約では最高額となるバルサの例では、年間約150億円を受け取る契約となっており、その金額の凄まじさが分かると思います。 www.indepen…

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-九州・沖縄編-

最終回は九州と沖縄編です。ここまで見てきた感じだと「人口が少ないと集客も厳しくなる、ただし多いからといって必ずしも集客が増える訳ではない」といった傾向でしたが、九州・沖縄ではどうでしょうか。早速見ていきたいと思います。記事の最後にこれまで…

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-中四国編-

これまでJクラブのスタジアム商圏と人口を可視化してきましたが、いよいよ残りは2回です。今回は中四国をまとめて見てきます。

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-関西編-

前回から間隔が空いてしまいましたが、引き続き人口とスタジアムの関係を可視化していきたいと思います。今回は関西を見てみます。

【Power BI】Adobeの"ガチ"ダッシュボードをリバースエンジニアリングしてみる-その2-

前回に続いてAdobeのダッシュボードを解読していきます。今回は、Adobeの考えるカスタマージャーニーに沿ったKPIを表示している部分(下図4番)とジャーニーの各フェーズにフォーカスしたページが中心となります。

【Power BI】Adobeの"ガチ"ダッシュボードをリバースエンジニアリングしてみる-その1-

3月26日から米ラスベガスで行われていた「Adobe Summit」。その基調講演の中で、Adobeが実際に社内で使用しているダッシュボードが披露される一幕があったようです。そのダッシュボードを詳しく分解してみることで、Adobeが自分たちのビジネスをどのように捉…

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-中部編-

引き続きJクラブのスタジアムの商圏内の人口を可視化していきます。今回はサッカー王国静岡県のある中部地方を可視化してみます。北海道・東北地方は商圏内の人口が多いほど観客数も多い傾向にありましたが、こちらはどうなのでしょうか。

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-北海道・東北編-

前回に引き続きJクラブのスタジアムの商圏内の人口を可視化していきます。今回は北海道と東北地域を対象に可視化します。

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-関東編-

先日参加したセミナーで鹿島アントラーズの方が「Jリーグの商圏はスタジアムから30km圏内」と言っていたので、各クラブが圏内にどのくらいの人口を持っているのかPythonで可視化してみようと思います。データが多いので地方別にアウトプットしていき、最後に…

【データ可視化×Python】foliumを使って福島県の統計データを地図上に可視化してみる(コロプレス図)

今回はfoliumというPythonのライブラリを使ってコロプレス図を作成してみたいと思います。コロプレス図は、選挙の時などに使用される「データを元に区域毎に色分けされた地図」のことです。地域毎の統計データは豊富にありますし、何より可視化することで直…

【小ネタ】アンダーアーマーのセンサー付きシューズで走ってみる

ガジェットやテクノロジーを扱うギズモードでも取り上げられていたアンダーアーマー社の「HOVR Infinite(ホバー インフィニット)」を手に入れたので、早速走ってみたいと思います。使い方とどんなデータが取れるのかをメインに紹介していきます。 www.gizm…

【Power BI】新機能「Key Influencers visual」を使ってみる

本ブログではPythonを題材にすることが多いのですが、業務ではMicrosoft社製のセルフBIツールである「Power BI」を普段から使っていたりします。マイクロソフトが力を入れているツールの一つらしく、毎月結構な量のアップデートがあり、新機能の追加と痒い所…

【Python】Twitter APIを使ってツイートデータを取得してみる

今回はスクレイピングとはまた違ったデータ取得方法についてです。最近流行りのAPI(アプリケーションプログラミングインターフェイス)を使って、Twitterのデータを取得して見たいと思います。その後のネットワーク分析を見据えて、ハッシュタグをリスト化…

【小ネタ】フィルミーノの変化をタックル数インターセプト数から見てみる

少し前の記事ですが、Twitterのタイムライン上に下記記事が流れてきました。全体として非常に興味深いのですが、個人的に冒頭の「2015年夏の渡英以来、プレミアのFWでタックルとインターセプトの合計数が最も多いという守備の貢献度を示すスタッツ」という一…

【Parsers】Chromeの拡張機能を使ってお手軽にクローリング/スクレイピングをしてみる

分析の環境が整いつつある昨今で大事になってくるのが元となるデータです。そのデータをWebから収集する技術であるスクレイピングに、これまでも何度か挑戦してきましたが、思い通りの結果が出なかったり意外と労力がかかっていました。今回は、そんな少しハ…

【Python】matplotlibを使って出場時間データをヒットマップで可視化してみる

今回は選手別の出場時間のデータから、Pythonの描画ライブラリmatplotlibを使ってグラフィカルに可視化する方法をまとめておきます。グラフィカルに表示することで、下記の記事見たいなことが感覚的に分かります。 96lovefootball.hatenablog.com

【データ分析 × Python】プレミア上位4クラブの選手別出場時間をヒートマップで可視化してみる

Twitterで見つけた可視化にインスピレーションを受けて、プレミアリーグの選手別出場時間をヒートマップで可視化してみました。グラフィカルにすることで直感的に感じれる部分も多々あるので、そこを中心に見ていきます。

【Python】matplotlibで色々な棒グラフを描画してみる

以前の記事で作成したmatplotlibを使った様々な棒グラフの描画方法について、今回も備忘録を兼ねて記載しておきます。 96lovefootball.hatenablog.com

【データ分析 × Watson】Watson Studioを使ってリヴァプールのスタッツから自動でモデルを生成してみる

今回はPythonではなくWatsonです。IBMのAIであるWatsonの機能を利用して、自動で予測モデルを作成してみたいと思います。まずは以前使用したリヴァプールの前半戦スタッツを使ってみますが、データ量が少ないので精度は出ないと思われます。まずはやってみる…

【データ分析 × Python】いわきFC2019年新加入選手のBMIを見てみる

先日ふといわきFCのサイトに訪れたところ、選手情報が最新の情報へ更新されていたので、改めてBMI値を見てみたいと思います。ちなみに2018年末時点でのBMIはこんな感じでした。 96lovefootball.hatenablog.com

【データ分析 × Python】リヴァプールの前半戦をスタッツから振り返ってみる(パス編)

以前の振り返りに引き続き今回はパス周りのスタッツを見ていきます。後半戦を観ていくためにも、リヴァプールのスタッツがどんな値なのか感覚を掴みたいと思います。 96lovefootball.hatenablog.com

【Python】matplotlibで折れ線グラフの見た目を調整してみる

以前の記事で作成したmatplotlibを使った折れ線グラフの描画方法について、備忘録も兼ねて記載しておきます。 96lovefootball.hatenablog.com

【データ分析 × Python】リヴァプールの前半戦をスタッツから振り返ってみる(シュート編)

残念ながら私が応援しているリヴァプールは今節リーグ初黒星を喫しました。やはりシティは強いなぁ、後半戦の優勝争いが激化しそうだなぁ、などと思いつつも、まだ首位はリヴァプールなのでここから切り替えて欲しい次第です。さて今回は、こんなタイミング…

【データ分析 × Python】いわきFCのBMIをポジション別に見てみる

前回JリーグといわきFCの選手情報をそれぞれ集めてBMIを算出して比べてみました。折角なので今回も同じデータを使って、もう少し細かく見てみようと思います。主にはポジション別に見てどんな傾向があるのかを見ていきます。

【データ分析 × Python】「日本のフィジカルスタンダードを変える」いわきFCのフィジカルをBMIから見てみる

2017年の天皇杯で、コンサドーレ札幌を延長戦の上に下した試合が大きな話題を呼んだいわきFC。「日本のフィジカルスタンダードを変える」ことをビジョンの一つに掲げるクラブの選手たちのフィジカルが、現在のJリーグ選手たちと比べてどのようなポジションに…