Obránce Ngadeu byl první slavistický přestup opřený o datovou analýzu. Po třech letech z klubu odcházel za desetinásobnou cenu. Data se prosazují i do českého fotbalu a začínají ho měnit. Pokud poroste také jejich dostupnost pro komunitu analytiků, může se nové odvětví posouvat dál rychleji.
Sportovní analytice se Gólové parametry věnují od roku 2012 (i když už nějaký čas nechává blog čtenáře na nové příspěvky čekat), kdy Radim studoval Vysokou školu ekonomickou.
Data nad zlato
Data jsou cenné zboží, které si analytické společnosti a kluby chrání. Údaje o podstoupených soubojích nebo zachycených přihrávkách sbírají kamery, pohyb a další biometrické hodnoty hlídají speciální vesty s čipem (vypadají jako dámské sportovní podprsenky, u nás je začala jako první loni využívat pražská Sparta). Vše zpracovávají počítače. Přístup k datům proto není pro fanoušky úplně jednoduchý. Už s prvními analýzami Radim rychle zjistil, že sehnat veřejná data pro české prostředí bude opravdu problém. Většinou to řešil pomocí počítačových programů, které data stahovaly z běžně dostupných zdrojů, jako je web nejvyšší fotbalové ligy, Wikipedie, stránky eurofotbal.cz a další.Pro představu, jak náročné může být získat relevantní data: Na počátku zmíněného článku o vývoji bodového zisku v české lize byl poslech podcastů o programovacím jazyku R, kde se mluvilo o záznamech konferencí na YouTube. V jednom z nich zazněla zmínka o souboru fotbalových dat z let 1871-2016. Při pátrání po balíčku dat se ale objevila komplikace – údaje byly neaktuální a nezahrnovaly českou soutěž. Radim se inspiroval, doplnil nedostatky a přinesl výstupy pro českou ligu. Ty pak nabídl veřejně ke stažení. „Od začátku pro mě bylo důležité vše publikovat a dávat k dispozici ostatním včetně dat i kódů,“ vysvětluje fanoušek fotbalu a statistiky.
Jak si vedla Plzeňská Viktorka v ročníku 2018/2019, kdy naposledy vyhrála českou ligu? | © Gólové parametry
Naučte počítač najít si místo na hřišti
V poslední době je podle něj patrná změna. K datům ve strukturované formě se dá dostat jednodušeji než dříve a to umožňuje větší prostor pro inovace: „Myslím, že naprostou špičkou, co se týče práce s daty, jsou například Manchester City. Nedávno mě zaujal jejich společný projekt se společností Google, kde publikovali veřejnou soutěž na optimalizaci rozhodovacích algoritmů ve hře na webu kaggle.com.“ Programátoři se zájmem o fotbal tak mohou učit roboty chovat se víc jako skuteční hráči. Dodejme, že to byl právě Manchester City, který v roce 2012 nakročil k revoluci ve fotbalové analytice, když po dohodě se svým dodavatelem dat Opta Sports zdarma zpřístupnil datový soubor za sezonu 2011/2012 v hodnotě desítek tisíc liber s cílem navzájem se s komunitou analytiků obohatit.Asi většina lidí, kteří se sílícímu trendu využívání dat ve sportu věnují, viděla film Moneyball z roku 2011 inspirovaný stejnojmennou knihou. Hlavní hrdina Billy Beane (hrál ho Brad Pitt), generální manažer týmu Oakland Athletics působícího v americké Major League Baseball, začal v roce 2002 vybírat posily podle podrobné analýzy počítačových dat. Slavil úspěch. Kouzlo bylo v tom, že bral do týmu hráče, které dosud skauti podceňovali, počítačové rozbory ale odhalily jejich kvality. Beaneho metodu následně přebraly i další kluby. Podobné postupy nachází prostor i v českém profesionálním fotbale.
Databáze s čtvrtmilionem hráčů
Vědecké metody uplatňuje například pražská Slavia. Do svého prvního přestupu provedeného na základě datové analýzy se pustila v roce 2016. Tehdy přivedla z Rumunska kamerunského stopera Michaela Ngadeua-Ngadjuiho. „Ngadeu se rychle prosadil do základní sestavy na pozici šestky. Na novém postu uplatnil všechny vytipované dovednosti – výborně bránil prostor, četl hru a neměl problém ve fyzicky náročné soutěži. Ngadeu v první sezóně v Česku vyhrál 8 hlaviček a 14 soubojů každý zápas, což bylo jedno z největších čísel u nás,“ uvádí web české firmy 11Hacks, která klubům nabízí skautingové služby, rozbory zápasů a implementaci analytického know-how opřené o sledování databáze s 250 tisíci hráči.Ngadeu se Slavií vyhrál dva ligové tituly, dvakrát slavil vítězství v českém poháru, zahrál si Evropskou ligu a v roce 2019 byl vyhlášen nejlepším obráncem Fortuna Ligy. Když ve stejném roce odešel do belgického Gentu, získala za něj Slavia 115 milionů korun, tedy téměř desetinásobek oproti původní ceně.
Samozřejmě spoléhat se jen na čísla by bylo ošemetné, povolání hledačů talentů rozhodně nezmizí, jen už není nutné, aby tvořili hustou síť po celém světě. Ostatně umělá inteligence se pořád rozvíjí. Počítač například při vyhodnocování záběrů není zcela přesný v rozpoznávání, co hráč na hřišti dělá (vede míč, nebo podstupuje souboj?), aby jeho herní činnost správně zařadil.
Když před penaltou přiběhne za bránu k brankářovi asistent, stručně ho proškolí, kam soupeř nejčastěji kope a co lze čekat. Data lze uplatnit při secvičování standardních situací, vhazování autů, vykrývání prostoru a podobně. Postupně po takovém vylepšování taktiky roste poptávka.
Dozvíme se předem, zda padne gól?
Je nezpochybnitelné, že fotbal se pod vlivem datových analýz mění. Hra je měřitelnější, roste tlak na efektivitu. Vznikají i nové parametry, jako je „expected goal“, zkráceně xG, který v rozmezí 0 až 1 hodnotí šanci a udává pravděpodobnost, že z ní padne gól.Naplňují se tak slova filmového Billyho Beaneho: „Jestli vyhraje Světovou sérii jiný tým, budiž mu to přáno. Budou pít šampaňské, dostanou prsten. Jestli ale vyhrajeme my, s naším rozpočtem, s naším týmem, změníme hru. A o to mi jde. Chci, aby to něco znamenalo.“
Významný posun ve využívání umělé inteligence v konzervativním (zejména českém) fotbale, by mohlo přinést další zpřístupňování dat. Tohle je možná cesta, jak celý obor sportovní analytiky posunout. „Ve sběru dat a jejich dostupnosti pořád vidím velké rezervy. Přesto se to zlepšuje, výpočetní výkon stále roste. Otevírá se prostor pro lidi, kteří dříve tuhle příležitost neměli. V tom je obrovský potenciál do budoucna,“ věří Radim Ševčík. „Nedávno mě zaujala vizualizace statistiky úspěšnosti střelby daného hráče s míčem v přímém přenosu zápasu NBA. To by mohlo být nové využití metriky xG pro fotbal,“ naznačuje autor projektu Gólové parametry, co můžeme čekat.
listopad 2020