Sieci podań - czy wiążą się z wynikami?

Analiza danych z Euro 2025

Paulina

3/24/20262 min read

Podobno analityki i data science najlepiej uczymy się wtedy, gdy analizujemy dane, które nas interesują. W moim przypadku będą one dotyczyć kobiecej piłki nożnej, a dokładniej UEFA Women's Euro 2025 rozgrywanego Szwajcarii.

Pierwszy w historii awans naszej reprezentacji na jakikolwiek "dorosły" turniej to wydarzenie epokowe. Z państw zza żelaznej kurtyny do finałów kobiecego Euro od początku ich rozgrywania (czyli od 1984 r.) kwalifikowały się dotąd jedynie Rosja (1997, 2001, 2009, 2013 i 2017) i Ukraina (2009). W rozgrywanym w Anglii Euro 2022 nie wystąpiła żadna drużyna ze wschodniej części Europy. Awans naszej reprezentacji jest jeszcze bardziej imponujący, gdy weźmiemy pod uwagę strukturę PZPN i wysoki poziom seksizmu w polskiej piłce nożnej i społeczeństwie w ogóle.

By uczcić ten sukces, zaciągnęłam swoją rodzinę na tydzień do Lucerny, gdzie Polki rozgrywały dwa ze swoich trzech spotkań.

Jednym z ciekawszych rodzajów analiz są te dotyczące sieci podań.

Dokładne dane zbiera m.in. StatsBomb, udostępniający niewielką część swoich zbiorów na GitHubie.

A co na temat metryk sieci podań ma do powiedzenia nauka? Okazuje się, że sporo, ale nie przytłaczająco sporo.

Oczywiście takie dane możemy zakodować też ręcznie, jeśli dysponujemy ich nagraniami. Żeby przekonać się, ile czasu zajęłoby kodowanie "na dziko" (czyli bez żadnego specjalnego oprogramowania czy wytrenowanego modelu computer vision, mając do dyspozycji jedynie arkusz kalkulacyjny z trzema kolumnami "time", "sender", "receiver"), zakodowałam ręcznie pierwsze 90 sekund niedawnego meczu Chelsea - Aston Villa w Women's Super League, wygranego przez Chelsea 4:3. Zakodowanie półtorej minuty zajęło mi 10 minut, co, zakładając stałe tempo, przekłada się na 10 godzin pracy, by zakodować cały mecz. Jeśli więc

nie jest dla nas ważne, by przeanalizować dane z konkretnego meczu, najlepiej chyba skorzystać z tego, co już jest dostępne.

Mimo kilku kursów z analizy sieci nie czuję się szczególnie

Na dobry początek postanowiłam więc spróbować zreplikować analizy zaraportowane tu, ale z wykorzystaniem danych pobranych ze StatsBomb. Podstawowe pytanie zatem brzmi: Czy właściwości sieci podań w danym meczu wiążą się z jakością występu drużyny?

Głównym problemem wydają się tu zmiany. Wydaje się, że obowiązującą wśród analityków zasadą jest

Dla każdego meczu zgromadziłam - liczbę strzelonych i straconych goli, liczbę strzałów, średnią jakość strzału oraz wynik, jakim zakończył się mecz (przegrana - remis - wygrana).

W następnym wpisie sprawdzę, jak drużyny reagowały na utratę bramki oraz jakie właściwości sieci w w ciągu minionych 5 minut przewidywały strzelenie gola.