Zmiany sieci podań w czasie
Analiza danych z Euro 2025
Paulina
3/24/20262 min read


Podobno analityki i data science najlepiej uczymy się wtedy, gdy analizujemy dane, które nas interesują. W moim przypadku będą one dotyczyć kobiecej piłki nożnej, a dokładniej UEFA Women's Euro 2025 rozgrywanego Szwajcarii.
Pierwszy w historii awans naszej reprezentacji na jakikolwiek "dorosły" turniej to wydarzenie epokowe. Z państw zza żelaznej kurtyny do finałów kobiecego Euro od początku ich rozgrywania (czyli od 1984 r.) kwalifikowały się dotąd jedynie Rosja (1997, 2001, 2009, 2013 i 2017) i Ukraina (2009). W rozgrywanym w Anglii Euro 2022 nie wystąpiła żadna drużyna ze wschodniej części Europy. Awans naszej reprezentacji jest jeszcze bardziej imponujący, gdy weźmiemy pod uwagę strukturę PZPN i wysoki poziom seksizmu w polskiej piłce nożnej i społeczeństwie w ogóle.
By uczcić ten sukces, zaciągnęłam swoją rodzinę na tydzień do Lucerny, gdzie Polki rozgrywały dwa ze swoich trzech spotkań.
Jednym z ciekawszych rodzajów analiz są te dotyczące sieci podań.
Dokładne dane zbiera m.in. StatsBomb, udostępniający niewielką część swoich zbiorów na GitHubie.
A co na temat metryk sieci podań ma do powiedzenia nauka? Okazuje się, że sporo, ale nie przytłaczająco sporo.
Oczywiście takie dane możemy zakodować też ręcznie, jeśli dysponujemy ich nagraniami. Żeby przekonać się, ile czasu zajęłoby kodowanie "na dziko" (czyli bez żadnego specjalnego oprogramowania czy wytrenowanego modelu computer vision, mając do dyspozycji jedynie arkusz kalkulacyjny z trzema kolumnami "time", "sender", "receiver"), zakodowałam ręcznie pierwsze 90 sekund niedawnego meczu Chelsea - Aston Villa w Women's Super League, wygranego przez Chelsea 4:3. Zakodowanie półtorej minuty zajęło mi 10 minut, co, zakładając stałe tempo, przekłada się na 10 godzin pracy, by zakodować cały mecz. Jeśli więc
nie jest dla nas ważne, by przeanalizować dane z konkretnego meczu, najlepiej chyba skorzystać z tego, co już jest dostępne.
Mimo kilku kursów z analizy sieci nie czuję się szczególnie
Na dobry początek postanowiłam więc spróbować zreplikować analizy zaraportowane tu, ale z wykorzystaniem danych pobranych ze StatsBomb. Podstawowe pytanie zatem brzmi: Czy właściwości sieci podań w danym meczu wiążą się z jakością występu drużyny?
W następnym wpisie sprawdzę, jak drużyny reagowały na utratę bramki oraz jakie właściwości sieci w w ciągu minionych 5 minut przewidywały strzelenie gola.