2019-02-01から1ヶ月間の記事一覧
以前、2019年2月のアップデートで追加されたPower BIの新機能「Key Influencers visual」を紹介しました。非常に簡単に要因の分析を行えることが分かったので、今回はリヴァプールのスタッツデータを使用して、その要因分析を行ってみたいと思います。
本ブログではPythonを題材にすることが多いのですが、業務ではMicrosoft社製のセルフBIツールである「Power BI」を普段から使っていたりします。マイクロソフトが力を入れているツールの一つらしく、毎月結構な量のアップデートがあり、新機能の追加と痒い所…
今回はスクレイピングとはまた違ったデータ取得方法についてです。最近流行りのAPI(アプリケーションプログラミングインターフェイス)を使って、Twitterのデータを取得して見たいと思います。その後のネットワーク分析を見据えて、ハッシュタグをリスト化…
Twitterのデータを取得する方法にAPIを使うやり方があるのですが、これには通常のTwitterアカウントに加えて開発者アカウントなるものが必要だそうです。Google先生に尋ねると「審査が厳しくなった」などの記事がよく出てきましたが、意外とさっくり取れたの…
少し前の記事ですが、Twitterのタイムライン上に下記記事が流れてきました。全体として非常に興味深いのですが、個人的に冒頭の「2015年夏の渡英以来、プレミアのFWでタックルとインターセプトの合計数が最も多いという守備の貢献度を示すスタッツ」という一…
ネットワーク分析に挑戦した際に、Google Colabだとmatplotlibの日本語表記対応が出来ず詰んでいた(元データは全て日本語だったので)時に思いついた荒技の紹介です。「元データから全部英語に変換しちゃえばいいんじゃね?」との発想でググって見るとGoogl…
分析の環境が整いつつある昨今で大事になってくるのが元となるデータです。そのデータをWebから収集する技術であるスクレイピングに、これまでも何度か挑戦してきましたが、思い通りの結果が出なかったり意外と労力がかかっていました。今回は、そんな少しハ…
今回は選手別の出場時間のデータから、Pythonの描画ライブラリmatplotlibを使ってグラフィカルに可視化する方法をまとめておきます。グラフィカルに表示することで、下記の記事見たいなことが感覚的に分かります。 96lovefootball.hatenablog.com
Twitterで見つけた可視化にインスピレーションを受けて、プレミアリーグの選手別出場時間をヒートマップで可視化してみました。グラフィカルにすることで直感的に感じれる部分も多々あるので、そこを中心に見ていきます。