サッカーを通じて観戦力と分析力を上げていくブログ

基本的にはサッカー×データに関して試してみたことをまとめています。最近はもっぱらPythonを使った可視化中心。時々自分の好きなガジェットも。

分析

【データ分析】機械学習周りの用語を整理してみる(初心者)

1ヵ月間「Kaggle Masterによるデータ分析技術者養成講座」なるセミナーを受講していました。DeNAでデータサイエンティストとして働く@yukrai17さんが、Pythonを使った機械学習のモデル作りについて教えてくれる講座で、データの作り方やモデルの検証方法まで…

【データ可視化】JクラブのPL周りの数字を可視化してみる-費用・利益編-

前回の収益編に引き続いて、今度は各クラブの費用と利益について可視化していきます。 96lovefootball.hatenablog.com

【データ可視化】JクラブのPL周りの数字を可視化してみる-収益編-

前回Power BIを使って「Jクラブ個別経営情報開示資料」を可視化できるようにしたので、実際に色々と可視化してみます。各クラブがどういった収益構造になっているのか、ビジネスとして成功しているクラブがどこなのかを明らかにしていきます。 96lovefootbal…

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-九州・沖縄編-

最終回は九州と沖縄編です。ここまで見てきた感じだと「人口が少ないと集客も厳しくなる、ただし多いからといって必ずしも集客が増える訳ではない」といった傾向でしたが、九州・沖縄ではどうでしょうか。早速見ていきたいと思います。記事の最後にこれまで…

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-中四国編-

これまでJクラブのスタジアム商圏と人口を可視化してきましたが、いよいよ残りは2回です。今回は中四国をまとめて見てきます。

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-関西編-

前回から間隔が空いてしまいましたが、引き続き人口とスタジアムの関係を可視化していきたいと思います。今回は関西を見てみます。

【Power BI】Adobeの"ガチ"ダッシュボードをリバースエンジニアリングしてみる-その2-

前回に続いてAdobeのダッシュボードを解読していきます。今回は、Adobeの考えるカスタマージャーニーに沿ったKPIを表示している部分(下図4番)とジャーニーの各フェーズにフォーカスしたページが中心となります。

【Power BI】Adobeの"ガチ"ダッシュボードをリバースエンジニアリングしてみる-その1-

3月26日から米ラスベガスで行われていた「Adobe Summit」。その基調講演の中で、Adobeが実際に社内で使用しているダッシュボードが披露される一幕があったようです。そのダッシュボードを詳しく分解してみることで、Adobeが自分たちのビジネスをどのように捉…

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-北海道・東北編-

前回に引き続きJクラブのスタジアムの商圏内の人口を可視化していきます。今回は北海道と東北地域を対象に可視化します。

【データ分析×Python】Jリーグスタジアムの商圏(30km)内の人口を可視化してみる-関東編-

先日参加したセミナーで鹿島アントラーズの方が「Jリーグの商圏はスタジアムから30km圏内」と言っていたので、各クラブが圏内にどのくらいの人口を持っているのかPythonで可視化してみようと思います。データが多いので地方別にアウトプットしていき、最後に…

【Power BI】新機能「Key Influencers visual」を使ってみる

本ブログではPythonを題材にすることが多いのですが、業務ではMicrosoft社製のセルフBIツールである「Power BI」を普段から使っていたりします。マイクロソフトが力を入れているツールの一つらしく、毎月結構な量のアップデートがあり、新機能の追加と痒い所…

【Parsers】Chromeの拡張機能を使ってお手軽にクローリング/スクレイピングをしてみる

分析の環境が整いつつある昨今で大事になってくるのが元となるデータです。そのデータをWebから収集する技術であるスクレイピングに、これまでも何度か挑戦してきましたが、思い通りの結果が出なかったり意外と労力がかかっていました。今回は、そんな少しハ…

【Python】matplotlibを使って出場時間データをヒットマップで可視化してみる

今回は選手別の出場時間のデータから、Pythonの描画ライブラリmatplotlibを使ってグラフィカルに可視化する方法をまとめておきます。グラフィカルに表示することで、下記の記事見たいなことが感覚的に分かります。 96lovefootball.hatenablog.com

【データ分析 × Python】プレミア上位4クラブの選手別出場時間をヒートマップで可視化してみる

Twitterで見つけた可視化にインスピレーションを受けて、プレミアリーグの選手別出場時間をヒートマップで可視化してみました。グラフィカルにすることで直感的に感じれる部分も多々あるので、そこを中心に見ていきます。

【Python】matplotlibで色々な棒グラフを描画してみる

以前の記事で作成したmatplotlibを使った様々な棒グラフの描画方法について、今回も備忘録を兼ねて記載しておきます。 96lovefootball.hatenablog.com

【データ分析 × Watson】Watson Studioを使ってリヴァプールのスタッツから自動でモデルを生成してみる

今回はPythonではなくWatsonです。IBMのAIであるWatsonの機能を利用して、自動で予測モデルを作成してみたいと思います。まずは以前使用したリヴァプールの前半戦スタッツを使ってみますが、データ量が少ないので精度は出ないと思われます。まずはやってみる…

【データ分析 × Python】いわきFC2019年新加入選手のBMIを見てみる

先日ふといわきFCのサイトに訪れたところ、選手情報が最新の情報へ更新されていたので、改めてBMI値を見てみたいと思います。ちなみに2018年末時点でのBMIはこんな感じでした。 96lovefootball.hatenablog.com

【データ分析 × Python】リヴァプールの前半戦をスタッツから振り返ってみる(パス編)

以前の振り返りに引き続き今回はパス周りのスタッツを見ていきます。後半戦を観ていくためにも、リヴァプールのスタッツがどんな値なのか感覚を掴みたいと思います。 96lovefootball.hatenablog.com

【Python】matplotlibで折れ線グラフの見た目を調整してみる

以前の記事で作成したmatplotlibを使った折れ線グラフの描画方法について、備忘録も兼ねて記載しておきます。 96lovefootball.hatenablog.com

【データ分析 × Python】リヴァプールの前半戦をスタッツから振り返ってみる(シュート編)

残念ながら私が応援しているリヴァプールは今節リーグ初黒星を喫しました。やはりシティは強いなぁ、後半戦の優勝争いが激化しそうだなぁ、などと思いつつも、まだ首位はリヴァプールなのでここから切り替えて欲しい次第です。さて今回は、こんなタイミング…

【データ分析 × Python】いわきFCのBMIをポジション別に見てみる

前回JリーグといわきFCの選手情報をそれぞれ集めてBMIを算出して比べてみました。折角なので今回も同じデータを使って、もう少し細かく見てみようと思います。主にはポジション別に見てどんな傾向があるのかを見ていきます。

【データ分析 × Python】「日本のフィジカルスタンダードを変える」いわきFCのフィジカルをBMIから見てみる

2017年の天皇杯で、コンサドーレ札幌を延長戦の上に下した試合が大きな話題を呼んだいわきFC。「日本のフィジカルスタンダードを変える」ことをビジョンの一つに掲げるクラブの選手たちのフィジカルが、現在のJリーグ選手たちと比べてどのようなポジションに…

【Python】Beautiful Soupを使ってJリーグ選手の情報をスクレイピングしてみる

データ分析をするにしても、肝心のデータが無ければ始まらないと言うことで、Webからデータを集める方法にも挑戦してみます。集めるといってもEXCEL等に一つ一つコピペしてては日が暮れてしまうので、Pythonでスクレイピングと呼ばれる技術を実装してみたい…

【データ分析 × Python】欧州5大リーグ所属選手の身長が正規分布に近似できるか確認してみる

引き続き、データ遊びをしていきます。最近、大学時代にかじっていた統計学を改めて勉強し直しています。数式のオンパレードで途中血へどを吐きそうになりましたが、なんとかインプットした内容をアウトプットしていきます。まずは、今回から数回に渡りPytho…

【18/19 PL Man City vs Man United】これぞ!なポジショナルプレーを見てみる

18/19シーズン最初のマンチェスターダービーです。リヴァプールを応援している身としては、優勝争いを演じることになるであろうシティに勝ち点を落として欲しかったですが、その期待とは裏腹に圧倒的な強さを見せつけて勝利しました。以前の記事でポジショナ…

【Python】matplotlibでの可視化をもう少し詳しく見てみる

今回は、前回さくっと飛ばしてしまったグラフの描画について、もう少し深く理解していきたいと思います。

【データ分析 × Python】プレミアリーグ所属選手の身長・年齢を可視化してみる

前回に引き続き「Pythonで理解する統計解析の基礎」を参考にして、Pythonを使ったデータ分析の手法を学んでいきます。今回はプレミアリーグ所属選手の身長と年齢を可視化して、より分かりやすく理解出来るようにしてみます。

【データ分析 × Python】プレミアリーグ所属選手の平均身長・年齢を見てみる

前回は「Google Colab」でのファイルの読み込みを試しました。今回は一歩進んでPythonでのデータ準備作業と簡単な計算に挑戦してみます。前回同様worldfootball.netから取得したデータを使って、プレミアリーグに所属する選手の平均身長および平均年齢を求め…

【Python】Google Colaboratoryを使ってみる:ファイルの読み込み

これまでいくつかサッカーの試合を観ながら分析を行ってきましたが、今後はよりスタッツから洞察したりとよりデータに着目していきたいと考えています。そこで今流行りの Pythonをゼロから学んでいき、このブログでアウトプットの場にしていきます。 今回は…

【18/19 PL Chelsea vs Man United】ジョルジーニョへのマンマークの意図を考えてみる

ここ1週間ほどで「モダンサッカーの教科書」や「footballista」の最新号を読んだことで、ポジショナルプレーに興味津々です。ポジショナルプレーという戦術?スタイル?思想?について少しインプットできたところで、それを体現しているチェルシーの戦い方を…