サッカーを通じて観戦力と分析力を上げていくブログ

基本的にはサッカー×データに関して試してみたことをまとめています。最近はもっぱらPythonを使った可視化中心。時々自分の好きなガジェットも。

2019-02-01から1ヶ月間の記事一覧

【小ネタ】Power BIのKey Influencers visualでリヴァプールの勝因を分析してみる

以前、2019年2月のアップデートで追加されたPower BIの新機能「Key Influencers visual」を紹介しました。非常に簡単に要因の分析を行えることが分かったので、今回はリヴァプールのスタッツデータを使用して、その要因分析を行ってみたいと思います。

【Power BI】新機能「Key Influencers visual」を使ってみる

本ブログではPythonを題材にすることが多いのですが、業務ではMicrosoft社製のセルフBIツールである「Power BI」を普段から使っていたりします。マイクロソフトが力を入れているツールの一つらしく、毎月結構な量のアップデートがあり、新機能の追加と痒い所…

【Python】Twitter APIを使ってツイートデータを取得してみる

今回はスクレイピングとはまた違ったデータ取得方法についてです。最近流行りのAPI(アプリケーションプログラミングインターフェイス)を使って、Twitterのデータを取得して見たいと思います。その後のネットワーク分析を見据えて、ハッシュタグをリスト化…

【小ネタ】Twitterの開発アカウント(Twitter Developer account)を取得してみる

Twitterのデータを取得する方法にAPIを使うやり方があるのですが、これには通常のTwitterアカウントに加えて開発者アカウントなるものが必要だそうです。Google先生に尋ねると「審査が厳しくなった」などの記事がよく出てきましたが、意外とさっくり取れたの…

【小ネタ】フィルミーノの変化をタックル数インターセプト数から見てみる

少し前の記事ですが、Twitterのタイムライン上に下記記事が流れてきました。全体として非常に興味深いのですが、個人的に冒頭の「2015年夏の渡英以来、プレミアのFWでタックルとインターセプトの合計数が最も多いという守備の貢献度を示すスタッツ」という一…

【Python】googletransを使って日本語のデータを英語に変換(翻訳)してみる

ネットワーク分析に挑戦した際に、Google Colabだとmatplotlibの日本語表記対応が出来ず詰んでいた(元データは全て日本語だったので)時に思いついた荒技の紹介です。「元データから全部英語に変換しちゃえばいいんじゃね?」との発想でググって見るとGoogl…

【Parsers】Chromeの拡張機能を使ってお手軽にクローリング/スクレイピングをしてみる

分析の環境が整いつつある昨今で大事になってくるのが元となるデータです。そのデータをWebから収集する技術であるスクレイピングに、これまでも何度か挑戦してきましたが、思い通りの結果が出なかったり意外と労力がかかっていました。今回は、そんな少しハ…

【Python】matplotlibを使って出場時間データをヒットマップで可視化してみる

今回は選手別の出場時間のデータから、Pythonの描画ライブラリmatplotlibを使ってグラフィカルに可視化する方法をまとめておきます。グラフィカルに表示することで、下記の記事見たいなことが感覚的に分かります。 96lovefootball.hatenablog.com

【データ分析 × Python】プレミア上位4クラブの選手別出場時間をヒートマップで可視化してみる

Twitterで見つけた可視化にインスピレーションを受けて、プレミアリーグの選手別出場時間をヒートマップで可視化してみました。グラフィカルにすることで直感的に感じれる部分も多々あるので、そこを中心に見ていきます。