サッカーを通じて観戦力と分析力を上げていくブログ

基本的にはサッカー×データに関して試してみたことをまとめています。最近はもっぱらPythonを使った可視化中心。時々自分の好きなガジェットも。

【小ネタ】Power BIのKey Influencers visualでリヴァプールの勝因を分析してみる

以前、2019年2月のアップデートで追加されたPower BIの新機能「Key Influencers visual」を紹介しました。非常に簡単に要因の分析を行えることが分かったので、今回はリヴァプールのスタッツデータを使用して、その要因分析を行ってみたいと思います。

Key Influencers visualとは

Power BIに新しく追加されたビジュアルの一つで、説明したい項目とそれを説明しそうな項目を入れるだけで、瞬時にその要因を分析・可視化してくれます。詳しい使い方は下記を参考にしてみて下さい。 

96lovefootball.hatenablog.com

使用するデータ

このブログで何回か使用しているリヴァプールの今シーズン前半戦のスタッツをまとめたものを使用します。ソースはWhoscored.comで、その元はOptaとのこと。前半戦は負けがなかったので分析になるのか怪しいですが、集めるのが大変だったので使い回させてください。。。

f:id:virgilvd:20190224214937p:plain

▲元のデータはこんな感じになっています。

分析結果

今回対処になる項目が100個程あったのですが、流石に全ての項目を対象にすると「インフルエンサが見つかりませんでした」(=要因が見つかりませんでした)となってしまったので対象を減らしてみます。いくつか試してみたところ、「リヴァプール側のスタッツでリヴァプールの勝因分析」と「対戦相手側のスタッツでリヴァプールの引き分け要因分析」で結果が出たので、この2パターンで確認してみます。

リヴァプール側のスタッツでリヴァプールの勝因分析

f:id:virgilvd:20190224220817p:plain

勝利に影響があると導き出された項目は「ゴール数」「空中戦の回数」「中盤でのパス数」「タックルチャレンジ数」「6-yard box内でのシュート数」「ポゼッション」の6つ。ゴール数や6-yard box内でのシュート数が多いほど勝利しやすくなるのは当然として、空中戦の回数やタックルチャレンジ数も勝利に相関があるという結果は面白いですね。どちらもフレッシュな状態だと勝利しやすいということを表しているのでしょうか。

ちなみに「Key Influencers visual」には項目の影響度を測るだけでなく、項目をセグメントに分類する機能もあるのですが、項目数が多いからかこちらは機能していませんでした。

対戦相手側のスタッツでリヴァプールの引き分け要因分析

f:id:virgilvd:20190224221728p:plain

一方こちらで導き出された項目は「パス数」と「キックオフ時間」の2つだけ。そもそも前半戦で引き分けとなった試合が3試合しかなく、十分なデータ量でなかったためにこうした結果になったのかもしれません。ただ、対戦相手のパス数が多いと引き分けになりやすいという結果は、先の結果と合わせても、リヴァプールのやりたいサッカー(中盤で激しくボール奪取)が出来ているか否かで勝敗を分けている感じがしますね。

こちらもセグメントの結果は機能しておらず、サッカーが「この項目とこの項目が高ければ勝てる」みたいな単純には行かないことを物語っている感じがします。今回はスタッツのデータのみを与えていますが、出場選手の情報データを与えてみても面白そうだなと思いました。

戦術や分析に関して、こういう見方もあるよ、こうして見た方がいいよ、などご意見等ありましたら、コメントで教えていただけると幸いです。ぜひよろしくお願いいたします!