Jelentősen átformálhatja a sportot a big data viszonylag új módszere. A nagy mennyiségű adatok gyűjtésével és elemzésével először az üzleti világban és a tudományban bukkantak új összefüggésekre, de mivel az adatok számtalan módon felhasználhatóak, ma már minden téren hódít a big data. Miért éppen a sport volna a kivétel?

Billy Beane, az Oakland Athletics baseballcsapatának igazgatója komoly bajba került a 2002-es szezon előtt. Három kulcsjátékosa távozott, a kassza pedig üresen tátongott, ezért jobbára ismeretlen szabadügynökökkel töltötte fel a keretet. Beane úgy döntött, a tudálékos és sokszor szubjektív játékosügynökök helyett egy matematikus segítségével, újfajta analitikai és mérési módszerekkel választja ki a játékosait.

Beane a hagyományos statisztikák helyett újakat talált ki a játék leírására, így építette fel a lenullázott csapatot. Kissé döcögősen indult a szezon, de a végre az Oakland megdöntötte a saját ligacsúcsát (103–59), produkált egy húszmeccses győztes sorozatot (ami a mai napig is a negyedik leghosszabb a liga történetében), Miguel Tejadát a bajnokság legértékesebb játékosának választották, Barry Zitót pedig a legjobb újoncnak.

Billy Beane most az Oakland alelnöke, és már kelet felé fordult Forrás: AFP/2012 Getty Images/Ezra Shaw

Az Oakland esete azonban csak előrevetítette, milyen hatást gyakorolhat a sportra a big data, ugyanis itt még nem beszélhettünk nagy mennyiségű adatról, csak az adatok újszerű felhasználásáról. A többit megtette a számítástechnika folyamatos fejlődése.

Meglepő következtetések

Az ezredforduló óta rohamosan nőtt a digitális adatmennyiség, aztán az újfajta kütyük, mérőeszközök újabb lendületet adtak a forradalomnak. Ezek segítségével egyrészt korábban sosem látott adatmennyiséget termelhetünk, másrészt sok mindent pontosan lemérhetünk, amit eddig csak szerettünk volna mérni. A big data veleje viszont nem a puszta adatmennyiség, hanem az ezek átfésülésével megtalálható összefüggések, amelyek olykor vakon elfogadott dogmákat dönthetnek meg.

Craig O'Shannessy tevékenysége kitűnő példa a tabudöntésre, de arra is, hogy az adatokkal agyonzsúfolt világban is szükség van az egyéniségekre. Azt gondolhatnánk, hogy a tenisz egy gazdag sport, amely élen jár a játék fejlesztésében, technikai szinten is. A sportág csúcsmeccseit a BBC-nek és a New York Timesnak elemző O'Shannessy az előző mondat mindkét állítását cáfolta - valójában ő kezdte el szisztematikusan feltérképezni a játékot kamera, szoftver és elemzőprogram segítségével.

Mindez nem sokat ért volna, ha a harminc éve edzőként dolgozó O'Shannessy nem jut meglepő következtetésekre. De jutott. Kiderült például, hogy bár a világon mindenhol a hosszú labdameneteket gyakoroltatják, valójában a menetek hetven százaléka négy ütésen belül eldől. A tavalyi AusOpenen férfiaknál 4,2 ütésből állt egy átlagos labdamenet, a nőknél 3,7-ből, semmi értelme tehát a hosszú ütögetést gyakorolni. Tudjuk, hogy a profik világában nüanszok döntenek, számszerűsítve azonban egészen meghökkentő, milyen kicsi a különbség: Rafael Nadal úgy nyert 2004 és 2014 között kilenc Roland Garrost, hogy az összes megnyerhető pontok 56 százalékát szerezte meg. A salakkirály a pontok alig több mint felét megnyerve uralkodott egy évtizedig.



Az ausztrál szakember vizsgálta az ütésfajtákat, a pályán való helyezkedést, a nyerő ütések és a hibák szerepét, és számtalan figyelemre méltó tanulságot szűrt le belőlük. A sok adattól mégsem lett kockafejű: kiváló eredményeket ért el a tanítványaival, és arra a legbüszkébb, hogy világszerte tehet imádott sportja népszerűsítéséért.

Kétezer évnyi zene

A big data egyik kézenfekvő alkalmazási területe az autósport technikai csúcsa, a Forma-1. A versenyzés az elmúlt két évtized során egyre inkább adatvezéreltté vált, így manapság a korábbiakhoz képest sokkal kisebb teret enged az ihletett intuitív döntéseknek például a stratégia terén: elmúltak azok az idők, amikor Ross Brawn egy váratlan húzással a gyorsabb McLarenek elé tudta varázsolni a hátrányból induló Ferrarit, ahogy Michael Schumacherrel tette az 1998-as Magyar Nagydíjon. Most az nyer, akinek a legpontosabbak az adatai, és a leggyorsabban képes feldolgozni őket, kiszűrve a lényegeseket közülük.

Ross Brawn az F1 egyik legnagyobb stratégája volt Forrás: AFP/Tosifumi Kitamura

Az F1-ben aztán tényleg elképesztő mennyiségű adatról van szó. Az AT&T szerint egyetlen futamhétvége alatt, a 2014-es USA Nagydíjon a csapatok közösen 243 terabyte adatot generáltak – ez több, mint a világ legnagyobb könyvtára, az amerikai Kongresszusi Könyvtár teljes gyűjteménye.

A legnyilvánvalóbb forrás az autók „egészségi állapotát" folyamatosan monitorozó telemetria. A pontos értékeket mindenhol titkolják, de mintegy 150-200 szenzor követi nyomon a különféle paramétereket a gumik (több ponton mért) hőmérsékletétől és nyomásától kezdve a futómű mozgásán és az üzemanyagszinten át a motorolaj hőmérsékletéig. Sőt még a pilótákon is vannak különféle érzékelők: nemcsak a pulzusukat figyelik, hanem a fülhallgatójukba épített gyorsulásmérőn keresztül a fejüket érő erőhatásokat is egy ütközés esetén.

Mindez összesen nagyjából kétezer adatcsatornát jelent, amelyeket a sávszélesség korlátai miatt nem lehet mind élőben beküldeni a bokszba, miközben az autó a pályán van. Bizonyos adatokat csak a garázsban töltenek le, ezért a Mercedes számára az egyik IT partnere például olyan, a hagyományos Wi-Finél gyorsabb kommunikációs protokollt fejlesztett ki, amellyel már akkor elkezdhető az adatok szinkronizálása, amikor az autó még csak a bokszutcában gurul. Mivel így nem kell megvárni, amíg betolják a garázsba, és rádugják az adatkábeleket, a csapat edzésenként több percet is megspórolhat, ami hatékonyabb felkészülési programot tesz lehetővé. A letöltött adatok létfontosságúak az autók biztonságos üzemeltetéséhez; egy apró anomália például már előre figyelmeztetheti a mérnököket a küszöbön álló hibára.

Ugyanakkor szüntelenül figyelik az ellenfelek tevékenységét is, és az aktuális állás alapján valós időben futtatnak részletes stratégiai szimulációkat, hogy megpróbáljanak felkészülni a következő sakklépésre a futamok során. Mivel a körök rövidek, az elemzés és helyzetfelismerés gyorsasága különösen fontos: aki meg tudja jósolni, hogy a riválisa mikor fog kiállni a bokszba, annak nyert ügye van.

A töméntelen mennyiségű letöltött adat nem csupán a versenyhelyszíni mérnöki irodába fut be, hanem alig három tizedmásodperces késéssel egy titkosított intraneten keresztül a csapatok főhadiszállására is, ahol a több tucat mérnökből álló stáb nyugodtabb körülmények között elemzi őket. A tavalyi Monacói Nagydíjon láthattuk, hogy mi történhet, ha az adatáramlás valahol elakad: Daniel Ricciardo a győzelmet vesztette el, amikor a szerelői egy kommunikációs gikszer miatt rossz gumikkal várták a garázs előtt.

És ez még mind csak a jéghegy csúcsa, hiszen az autók tervezési folyamata és alkatrészellátása szintén elképesztő adatmennyiséget produkál. A Red Bullnál az egész évet nézve átlagosan 18 percenként születik egy új terv – természetesen CAD-rajz formájában –, de adatok jönnek ki a szélcsatornából, a számítógépes áramlásmodellekből (CFD), és a szimulátorba is minél pontosabb adatokat kell betáplálni, hogy valósághűen viselkedhessen.

Ha egy F1-es csapat által évente előállított teljes adatmennyiségről van szó, nem is tera-, hanem petabyte-okban kell gondolkodnunk. Mennyi is egy petabyte? Ha átlagosan tömörített MP3-ban kezdenénk hallgatni, kétezer évig tartana végighallgatni.

A szurkolókra is gondolnak

A fenti példák csak azt mutatták meg, hogyan változtatja meg a big data magát a sportot. Van azonban egy másik alapvető aspektus: a szurkolói élmény felturbózása. Ezt a terepet jellemzően az okostelefonos appok uralják.

A Chelsea tervezett új stadionjába élmény lesz kijárni Forrás: Hammersmith & Fulham Council/Chelsea FC

A helyszíni meccsélményt statisztikákkal, videóbejátszásokkal felpörgetni evidens ötlet, ahogy a meccs előtt/után segíteni az autóval közlekedő drukkereket parkolóhelyet találni vagy megmutatni nekik a legrövidebb utat szintén az. Vannak viszont játékok, akciók, ahol tényleg kizárólag a fantázia szab határt a több tízezres tömeg szórakoztatásának.

Németországban volt focimeccs, amelyen egy alkalmazás segítségével két szektor versenyzett egymással, tippelni kellett a kedvenc csapatukkal kapcsolatos kérdésre, majd a győztes szektor a szünetben akciósan kapta a sört. A meccs emberét a szurkolók is megválaszthatják, vagy a szünetben felcsendülő dalokat is kiválaszthatják.

Egy Wi-Fivel gondosan ellátott stadionban könnyen kitalálható számos ínyencség a szurkolók kiszolgálására, de az appok az olyan pályaversenyeket is megváltoztathatják, mint a Tour de France. A verseny szervezői eleve a tévéközvetítések kiegészítésére kérték a Dimension Data IT-céget. Így született meg a mobilra, tabletre és laptopra szánt Race Center, amelyen a tévében nem látott videókat és képeket találnak a szurkolók, továbbá valós idejű adatokat az összes csapat összes versenyzőjéről. És nem ám csak annyit, hogy hol állnak a versenyben: mutatják a sebességüket, a köztük lévő távolságot, a szélirányt, a szélsebességet és az időjárási körülményeket is. Ezeket az adatokat a Tour történetében először 2016-ban találhatták meg egy helyen a drukkerek. Ráadásul a cég már több más komoly kerékpárverseny technológiai partnere lett, köztük a Vueltának és a Párizs-Nizzának.

A sportszakmai szempontok és a szurkolók kiszolgálása mellett is lehetnek területek, ahol a big data megváltoztatja a sportot. Ide tartozhat számtalan szabadidősport, amelyeket már egyáltalán nem újdonság különböző kütyükkel feldobni, térképre tenni a lefutott útvonalat, számon tartani egyéni rekordokat, mérni a pulzust és az elégetett kalóriákat.

Ebbe a körbe tartozik a Babolat által kifejlesztett okos teniszütő, amely épp csak labdát szedni nem tud, de lehetnek váratlan kapcsolódási területek is, mint az NBA esetében.

Van, ami nem változik

A nagy amerikai ligákban már az utazás is komoly terhelést jelent, a játékosok olykor szó szerint nem tudják, melyik városban vannak. Éppen ezért kulcskérdés a versenynaptár összeállítása. Az NBA-ben harminc évig egyetlenegy ember, Matt Winick oldotta meg ezt a feladatot. Bár ő is használt számítógépet, az előző szezon naptárja már egy új szoftverrel készült el. Nagyrészt.

"Összesen 1230 alapszakasz-meccs van, ezeket próbálják meg elosztani, amikor elkészítik a naptárt - magyarázta Szaniszló Csaba, a Sport TV NBA-kommentátora. - Az első lépés ezzel együtt emberi feladat maradt: fel kell hívni minden egyes csapatot, hogy mikor szabad a csarnokuk."

Második körben kiderítik, melyik csapat mikor nem tud otthon játszani. Ez is az ember feladata, mert csak az ember tudja megmondani, mikor lesz Rihanna-koncert a Staples Centerben. Amikor a hasonló információk mind megvannak, akkor vetik be a szoftvert, amely úgy optimalizálja a versenynaptárt, hogy minél kevesebbet kelljen utazni, és lehetőleg ne legyen két, egymást követő napon meccs, illetve ne legyen öt nap alatt négy meccse egyik csapatnak sem."

Most nem Rihanna-koncert van, Russell Westbrook zsákol a Staples Centerben Forrás: AFP/2017 Getty Images/Harry How

A cél a sűrű terhelés miatti rengeteg sérülés kiszűrése, illetve a repülési távok csökkentése, amivel kevésbé terhelik a környezetet a csapatok, és még spórolnak is.

"Most nagyjából a naptár 25-30 százalékát teszi ki az ember által összeállított kötelező rész, a többit a számítógép rakja össze. Tavaly a nagydöntőt 3-1-ről elbukó Golden State Warriors utazta a legtöbbet, panaszkodtak is eleget a csapatnál - mondja az NBA-szakérő. - Ráadásul éppen a legyőzőjük, a Cleveland Cavs utazta a legkevesebbet."

Talán tényleg az döntött LeBron Jamesék javára, hogy 18 ezer mérföldnyivel kevesebbet ültek a repülőn, mint Steph Curryék. De a városok fekvésén még a legprímább szoftver sem képes változtatni.

A Forma-1-es részt Farkas Péter, a GPHírek.hu szakírója jegyzi.