Bisnode Group Analytics on ühendanud jõud kohalike analüütikute meeskondadega, et teada saada, kas andmeteadust ja masinõpet saab kasutada ennustamiseks, milline rahvusmeeskond võidab jalgpalli aasta tähtsaima võistluse. Kõigi ajalooandmete abil rahvusmeeskondade mängude kohta viimase nelja aasta jooksul on Bisnode välja töötanud mudeli, mis ennustab võidu, viigi või kaotuse võimalust, samuti väravate vahet kõikide tulevikumängude puhul võistluses osalevate meeskondade vahel.

“Meie peamine eesmärk oli välja töötada mudel, mis suudaks ennustada võitu, viiki või kaotust, samuti väravate vahet kõikide toimuvate mängude puhul kahe rahvusmeeskonna vahel,” ütleb Gauthier Doquire, projekti andmeteadur. “Teine eesmärk oli kõiki andmeid arvestava simulatsiooni abil teha kindlaks kõige tõenäolisem võistluse kulgemise stsenaarium ja mängude tulemused.”

Esimene mudel põhines ajalooandmetel turniiri tüübi, mängukoha, skoori, meeskondade pingerea jm kohta. Need andmed sisestati iga mängu võimalike tulemuste arvutamiseks masinõppemudelisse, kasutades eXtreme Gradient Boosting tehnikat. Selle ennustusmudeli abil teostas Bisnode Group Analytics simulatsioone mängude kohta, mis hakkavad aset leidma.

“Miljonite simulatsioonide loomise abil tuletasime iga meeskonna kohta, mis on turniiri mingisse etappi jõudnud, tõenäosuslikud andmed,” ütleb Goran Loncar, Group Analytics’i direktor. “Meie lähenemine võimaldas meil mitte ainult ennustada meeskonna teatud etappi jõudmise tõenäosust, vaid see pakkus ka kõige tõenäolisema stsenaariumi kogu turniiri kohta, samuti iga meeskonna üldise võimaluse kogu võistluste võitmiseks.”

Kuidas seda tehti?

Bisnode kasutas masinõpet (machine learning), arvutiteaduse alamvaldkonda, mis annab arvutitele võime õppida ilma neid spetsiaalselt midagi konkreetset tegema programmeerimata. Masinõpe kasutab mustrite uurimisest ja tehisintellekti arvutusliku õppe teooriast lähtuvalt algoritme, mis suudavad õppida ja teha saadud andmete põhjal ennustusi.

Bisnode kasutas andmekaevet (data mining), analüüsitehnikat, milles keskendutakse mustrite ja trendide leidmisele, et anda vajalikud lähteandmed ennustusmudeli jaoks.

Tulemused

Bisnode'i analüüsi tulemusena lähevad kõige tõenäolisemalt finaalis kokku Saksamaa ja Brasiilia ning karika tõstab enda pea kohale Brasiilia - täpselt nii, nagu juhtus 2002. aastal.