サッカーを通じて観戦力と分析力を上げていくブログ

基本的にはサッカー×データに関して試してみたことをまとめています。最近はもっぱらPythonを使った可視化中心。時々自分の好きなガジェットも。

【データ分析 × Python】リヴァプールの前半戦をスタッツから振り返ってみる(シュート編)

残念ながら私が応援しているリヴァプールは今節リーグ初黒星を喫しました。やはりシティは強いなぁ、後半戦の優勝争いが激化しそうだなぁ、などと思いつつも、まだ首位はリヴァプールなのでここから切り替えて欲しい次第です。さて今回は、こんなタイミングで何ですが、リヴァプールの前半戦をデータから振り返ってみたいと思います。俯瞰して見ることで初めて分かることがあれば嬉しいですね。

 

使用するデータ

今回使用するのは、おなじみwhoscored.comで公開されているデータです。リヴァプールプレミアリーグを戦った試合結果ページから、相手チームのスタッツ合わせて100以上の項目を収集してみました。シュート数やパス数といった基本的なものから、中にはパスの方向やパスを狙ったエリア、クロスのブロック数など細かいデータまで揃っています。

f:id:virgilvd:20190105013254p:plain

▲今回収集したデータの一部。whoscored.comではこうしたデータが公開されています。(元データはOptaとのことです)

これらのデータをまとめたcsvファイルを作成しGoogle Driveに保存。分析は毎度お世話になっている「Google Colab(クラウド上のPython実行環境)」を使用して行なっていきます。Google Drive上にあるファイルの読み込み等は下記をご覧いただければと思います。

96lovefootball.hatenablog.com

 

リヴァプールの前半戦(18/19シーズン)を振り返ってみる

・得失点

まずは得失点の推移を見てみます。matplotlibライブラリを使って可視化すると、こんな感じになりました。

f:id:virgilvd:20190105015641p:plain

無得点に終わったのは第8節のシティ戦のみ。4得点と3得点の試合がそれぞれ4度ずつあり、攻撃力は申し分なしです。一方のディフェンスも、クリーンシート12回、2失点以上した試合が0回とこちらもパーフェクトな数字です。

・シュート数、オンターゲット数

これら得点と失点を生み出すのはシュートということで、次はシュートに関するデータを見てみます。まずは、シュート本数とオンターゲット数の推移から。

f:id:virgilvd:20190105020911p:plain

全体の傾向としてシュート数、オンターゲット数共にリヴァプールが上回っている試合が多いようです。リヴァプール以上にシュートを枠に飛ばしたのは、レスター、マンチェスター・シティアーセナルエヴァートンの4チームのみ。確かにこれらのチームは、どこも苦戦させられていた記憶があります。リヴァプールの枠内シュートが少ない=守備が良いと仮定すると、ハーダースフィールド、サウサンプトンボーンマスもかなり健闘したと言えそうです。サラーのハットトリックで快勝したボーンマス戦は、全ての得点にクックのミスが絡んでいた記憶がありますが、それを除けばかなり良い守備をしていたのかもしれません。

リヴァプールの守備という側面から見てみると、1試合あたりの被オンターゲット数は5に満たない試合がほとんど。このデータの定義にもよりますが、如何に危険なシーンを事前に回避しているが伺えます。そんな中でもリヴァプールゴールに多く迫ったのが、レスター、バーンリー、ウルブスの3チーム。ここでも名前が挙がるレスター相手に勝てたことが、現在のポジションに入られている1つの理由な気がしてきます。(明らかに異常な値を示しているユナイテッドの悲惨さには触れないでおきましょう笑)

・シュートエリア

続いてリヴァプールと対戦相手それぞれのシュートエリア(どこからシュートを打ったか)について見ていきます。ここで出てくる「6-yard box」「Penalty Area」「Outside of box」は、それぞれ下記画像で濃い色の順で表されている領域となります。

f:id:virgilvd:20190105024651p:plain

f:id:virgilvd:20190105111234p:plain
まずはリヴァプールのシュートエリアから見てみます 。基本的にはペナルティエリアからのシュートが1試合の中で一番多く、平均して10本程度もシュートを放っていることが分かります。6-yard boxからのシュートも比較的多い中で、1本も打たせてもらえなかったのは、パレス、レスター、チェルシー、シティ、アーセナル、フラム。フラムを除けば苦戦した相手なのは納得です。

f:id:virgilvd:20190105111320p:plain

お次は相手側のスタッツです。先のグラフと高さを揃えて表示していますが、全体的に低くなっているのがひと目で分かります。特筆すべきは6-yard boxからのシュート数で、1試合平均1本以下とここからも守備の良さが垣間見えます。

・シュートシチュエーション

個人的にはあまり見慣れない項目ですが、こちらも見ていきます。「Open Play」「Fastbreak」「Set Pieces」「Penalty」「Own Goal」の5つに分かれていますが、今回は流れの中からのシュートである「Open Play」「Fastbreak」に絞って見ていきます。そもそも言葉の定義についてですが、「Open Play」と近しい言葉「Open Play Goal」の説明がWhoscored.comに載っていました。

f:id:virgilvd:20190105115554p:plain

これによると「Open Play」とは、「セットプレー等から始まり奪われることななくシュートまで持ち込んだ数」となりそうです。一方の「Fastbreak」に関しては公式サイトで説明が見つからず。しかし直訳すると「速攻」となり、「Open Play」との対比から「相手のボールを奪ってからシュートまで持ち込んだ数」となりそうです。

f:id:virgilvd:20190105120401p:plain

被ファストブレイクの数が異様に少ない感じがしますがどうなのでしょう。チェルシーアーセナルには何度かカウンターからピンチを招いたような記憶があるのですが。。同様に奪ってからのショートカウンターのイメージが強いリヴァプールのファストブレイク数の少なさにも驚きです。今季はデータが表す通り本当に少ないのか、データの定義を読み誤っているのか。分かる方がいらっしゃったら教えていただければと思います。

余談ですが、フラム戦の電光石火のカウンターがファストブレイクにカウントされていないのは、先の定義通りセットプレーから始まっているからなのだと納得です。

 
 
 
View this post on Instagram

Liverpool Football Clubさん(@liverpoolfc)がシェアした投稿 -

 データの項目がありすぎて、気付けばそれなりの量になっていたので今回は一旦ここで終わりたいと思います。シュートに関してはシンプルに攻撃力と守備力の高さがデータにも現れていました。データ的には厳しい値を示しているレスターなどに勝てているのが今シーズンの強さを物語っています。

その他のスタッツに関しては、また後日まとめて見ようと思います。今回使ったPythonのコードに関しても、備忘録を兼ねてまとめる予定です。

戦術や分析に関して、こういう見方もあるよ、こうして見た方がいいよ、などご意見等ありましたら、コメントで教えていただけると幸いです。ぜひよろしくお願いいたします!