AI ve sportu  Jak data mění fotbal

Radim Ševčík se od roku 2012 na svém blogu Gólové parametry věnuje sportovní analytice.
Radim Ševčík se od roku 2012 na svém blogu Gólové parametry věnuje sportovní analytice. Foto: © archiv Radima Ševčíka

Obránce Ngadeu byl první slavistický přestup opřený o datovou analýzu. Po třech letech z klubu odcházel za desetinásobnou cenu. Data se prosazují i do českého fotbalu a začínají ho měnit. Pokud poroste také jejich dostupnost pro komunitu analytiků, může se nové odvětví posouvat dál rychleji.
 

Plzeňská Viktorka zkouší navázat na své skvělé výkony před několika lety. Jak si vedla v ročníku 2018/2019, kdy naposledy vyhrála českou ligu? Místo procházení tabulek se stačí podívat na graf, který na svém blogu Gólové parametry nabízí Radim Ševčík. Ve vizualizaci označované jako worm charts je přehledně vidět vynikající vstup plzeňských do soutěže, slabší jaro a nakonec obavy o první místo. Podobně by šly zobrazit i jiné kluby. K dispozici je taky přehled vývoje počtu bodů českých celků za devět ročníků v letech 2010-2019.
 
Sportovní analytice se Gólové parametry věnují od roku 2012 (i když už nějaký čas nechává blog čtenáře na nové příspěvky čekat), kdy Radim studoval Vysokou školu ekonomickou.

Data nad zlato

Data jsou cenné zboží, které si analytické společnosti a kluby chrání. Údaje o podstoupených soubojích nebo zachycených přihrávkách sbírají kamery, pohyb a další biometrické hodnoty hlídají speciální vesty s čipem (vypadají jako dámské sportovní podprsenky, u nás je začala jako první loni využívat pražská Sparta). Vše zpracovávají počítače. Přístup k datům proto není pro fanoušky úplně jednoduchý. Už s prvními analýzami Radim rychle zjistil, že sehnat veřejná data pro české prostředí bude opravdu problém. Většinou to řešil pomocí počítačových programů, které data stahovaly z běžně dostupných zdrojů, jako je web nejvyšší fotbalové ligy, Wikipedie, stránky eurofotbal.cz a další.
 
Pro představu, jak náročné může být získat relevantní data: Na počátku zmíněného článku o vývoji bodového zisku v české lize byl poslech podcastů o programovacím jazyku R, kde se mluvilo o záznamech konferencí na YouTube. V jednom z nich zazněla zmínka o souboru fotbalových dat z let 1871-2016. Při pátrání po balíčku dat se ale objevila komplikace – údaje byly neaktuální a nezahrnovaly českou soutěž. Radim se inspiroval, doplnil nedostatky a přinesl výstupy pro českou ligu. Ty pak nabídl veřejně ke stažení. „Od začátku pro mě bylo důležité vše publikovat a dávat k dispozici ostatním včetně dat i kódů,“ vysvětluje fanoušek fotbalu a statistiky.

Jak si vedla Plzeňská Viktorka v ročníku 2018/2019, kdy naposledy vyhrála českou ligu? Jak si vedla Plzeňská Viktorka v ročníku 2018/2019, kdy naposledy vyhrála českou ligu? | © Gólové parametry

Naučte počítač najít si místo na hřišti

V poslední době je podle něj patrná změna. K datům ve strukturované formě se dá dostat jednodušeji než dříve a to umožňuje větší prostor pro inovace: „Myslím, že naprostou špičkou, co se týče práce s daty, jsou například Manchester City. Nedávno mě zaujal jejich společný projekt se společností Google, kde publikovali veřejnou soutěž na optimalizaci rozhodovacích algoritmů ve hře na webu kaggle.com.“ Programátoři se zájmem o fotbal tak mohou učit roboty chovat se víc jako skuteční hráči. Dodejme, že to byl právě Manchester City, který v roce 2012 nakročil k revoluci ve fotbalové analytice, když po dohodě se svým dodavatelem dat Opta Sports zdarma zpřístupnil datový soubor za sezonu 2011/2012 v hodnotě desítek tisíc liber s cílem navzájem se s komunitou analytiků obohatit.
 
Asi většina lidí, kteří se sílícímu trendu využívání dat ve sportu věnují, viděla film Moneyball z roku 2011 inspirovaný stejnojmennou knihou. Hlavní hrdina Billy Beane (hrál ho Brad Pitt), generální manažer týmu Oakland Athletics působícího v americké Major League Baseball, začal v roce 2002 vybírat posily podle podrobné analýzy počítačových dat. Slavil úspěch. Kouzlo bylo v tom, že bral do týmu hráče, které dosud skauti podceňovali, počítačové rozbory ale odhalily jejich kvality. Beaneho metodu následně přebraly i další kluby. Podobné postupy nachází prostor i v českém profesionálním fotbale.

Databáze s čtvrtmilionem hráčů

Vědecké metody uplatňuje například pražská Slavia. Do svého prvního přestupu provedeného na základě datové analýzy se pustila v roce 2016. Tehdy přivedla z Rumunska kamerunského stopera Michaela Ngadeua-Ngadjuiho. „Ngadeu se rychle prosadil do základní sestavy na pozici šestky. Na novém postu uplatnil všechny vytipované dovednosti – výborně bránil prostor, četl hru a neměl problém ve fyzicky náročné soutěži. Ngadeu v první sezóně v Česku vyhrál 8 hlaviček a 14 soubojů každý zápas, což bylo jedno z největších čísel u nás,“ uvádí web české firmy 11Hacks, která klubům nabízí skautingové služby, rozbory zápasů a implementaci analytického know-how opřené o sledování databáze s 250 tisíci hráči.
 
Ngadeu se Slavií vyhrál dva ligové tituly, dvakrát slavil vítězství v českém poháru, zahrál si Evropskou ligu a v roce 2019 byl vyhlášen nejlepším obráncem Fortuna Ligy. Když ve stejném roce odešel do belgického Gentu, získala za něj Slavia 115 milionů korun, tedy téměř desetinásobek oproti původní ceně.
 
Samozřejmě spoléhat se jen na čísla by bylo ošemetné, povolání hledačů talentů rozhodně nezmizí, jen už není nutné, aby tvořili hustou síť po celém světě. Ostatně umělá inteligence se pořád rozvíjí. Počítač například při vyhodnocování záběrů není zcela přesný v rozpoznávání, co hráč na hřišti dělá (vede míč, nebo podstupuje souboj?), aby jeho herní činnost správně zařadil.
 
Když před penaltou přiběhne za bránu k brankářovi asistent, stručně ho proškolí, kam soupeř nejčastěji kope a co lze čekat. Data lze uplatnit při secvičování standardních situací, vhazování autů, vykrývání prostoru a podobně. Postupně po takovém vylepšování taktiky roste poptávka.

Dozvíme se předem, zda padne gól?

Je nezpochybnitelné, že fotbal se pod vlivem datových analýz mění. Hra je měřitelnější, roste tlak na efektivitu. Vznikají i nové parametry, jako je „expected goal“, zkráceně xG, který v rozmezí 0 až 1 hodnotí šanci a udává pravděpodobnost, že z ní padne gól.
 
Naplňují se tak slova filmového Billyho Beaneho: „Jestli vyhraje Světovou sérii jiný tým, budiž mu to přáno. Budou pít šampaňské, dostanou prsten. Jestli ale vyhrajeme my, s naším rozpočtem, s naším týmem, změníme hru. A o to mi jde. Chci, aby to něco znamenalo.“
 
Významný posun ve využívání umělé inteligence v konzervativním (zejména českém) fotbale, by mohlo přinést další zpřístupňování dat. Tohle je možná cesta, jak celý obor sportovní analytiky posunout. „Ve sběru dat a jejich dostupnosti pořád vidím velké rezervy. Přesto se to zlepšuje, výpočetní výkon stále roste. Otevírá se prostor pro lidi, kteří dříve tuhle příležitost neměli. V tom je obrovský potenciál do budoucna,“ věří Radim Ševčík. „Nedávno mě zaujala vizualizace statistiky úspěšnosti střelby daného hráče s míčem v přímém přenosu zápasu NBA. To by mohlo být nové využití metriky xG pro fotbal,“ naznačuje autor projektu Gólové parametry, co můžeme čekat.

Mohlo by vás zajímat

Failed to retrieve recommended articles. Please try again.

Doporučení redakce

Failed to retrieve articles. Please try again.

Nejčtenější články

Failed to retrieve articles. Please try again.