Il Machine Learning prevede la vincitrice della

Coppa del mondo

La Coppa del mondo di calcio del 2018 inizia il 14 giugno in Russia. Aziende e bookmaker in tutto il mondo stanno fornendo quote e odds sulle squadre e implicitamente ci dicono chi ritengono sia la squadra con la maggior probabilità di vincere.

Un team di ricercatori ha sviluppato la previsione in un progetto molto sfidante sia dal punto di vista di utilizzo di un nuovo metodo, rispetto agli algoritmi da sempre utilizzati dai bookmaker, sia per la complessità del fenomeno, il calcio appunto i cui risultati sono condizionati da una serie elevata di fattori di svariata natura. Una volta che la tecnica di previsione è stata costruita con tecniche di apprendimento automatico (Machine Learning) i ricercatori hanno simulato i risultati del torneo per 100.000 volte, prima di arrivare ad accettare le stime di bontà ed accuratezza di quanto sviluppato.

Che cosa prevedono queste nuove tecniche come probabile risultato della Coppa del Mondo 2018?

In primis il team ha utilizzato una combinazione di apprendimento automatico e statistica convenzionale (random forest approah). La tecnica della “foresta casuale” è un approccio matematico per descrivere statisticamente scenari in cui entrano in gioco molte variabili e tantissimi esiti. Il termine “foresta” poiché la metodologia si fonda sugli alberi di decisione. Questo approccio ha vantaggi significativi, ad esempio non soffre del problema di overfitting e inoltre rivela quali fattori sono più importanti nel determinare l’esito.  

I dati e i dataset utilizzati sono i più svariati e contengono informazioni sul calcio come la classifica delle squadre nazionali della FIFA, le classifiche utilizzate dai bookmaker, la nazionalità dell’allenatore, i risultati delle partite dal 2002 al 2014, l’età media dei giocatori, il loro valore di mercato, il numero di giocatori della Champions League, se hanno un vantaggio a casa, etc., ma anche fattori economici come il PIL, la popolazione di un paese,etc. 

È qui che fa il suo ingresso sul campo il Machine Learning (apprendimento automatico in italiano): l’algoritmo viene messo in gioco ed inizia la sua fase di addestramento su un database di “training” costituito dai dati delle partite dei mondiali giocati tra il 2002 e il 2014. In questa fase l’algoritmo impara a capire quali variabili contano e quanto pesano, cioè quanto contano l’una rispetto all’altra. Ma cosa fa in concreto? Viene deciso in modo automatico, a priori e casualmente, da qui il nome di foresta casuale, quanto pesa ogni variabile e in base a questo criterio l’algoritmo costruisce un albero, iterando questo processo centinaia di migliaia di volte. I risultati degli alberi generati vengono confrontati con quello contenente i risultati reali delle partite giocate. Da questo confronto l’algoritmo riesce a capire quali sono i fattori (le variabili) che dal punto di vista statistico sono significative e più rilevanti.

 

Chi vincerà la coppa del mondo? Dipende

.

La squadra indicata come favorita all’inizio del torneo è la Spagna a cui viene assegnata il 17,8% di probabilità di vittoria. La Spagna all’inizio del torneo è data come favorita rispetto alla Germania perché quest’ultima ha gironi ed eventuali incroci negli ottavi di finale con avversari considerati più forti rispetto a quelli che potenzialmente potrebbe incontrare la Spagna.

 

Però se entrambe le squadre, Spagna e Germania, superano gli ottavi la situazione cambia

 

I ricercatori hanno fatto nuove simulazioni considerando la situazione ai quarti e in questo caso la previsione vede la Germania vincitrice della coppa del mondo 2018, con probabilità di vedere una finale Brasile – Germania.

Come si vede la risposta è dipende poiché siamo di fronte a simulazioni di probabili esiti, dove il termine probabile va valutato in funzione della complessità di quello che si sta studiando (il calcio, gioco complesso per essere “simulato”) e dal numero molto elevato di situazioni e scenari che si possono manifestare.

Solo il 15 luglio sapremo se i ricercatori hanno contribuito alla divulgazione scientifica con un progetto che alla prova dei fatti ha previsto scenari reali.

 

World Cup Russia 2018 ricercatori sviluppano algoritmi di Machine Learning per prevedere la squadra vincitrice la coppa del mondo

La ricerca è molto accurata e complessa, qui potete consultare l’intero paper  “Prediction of the FIFA World Cup 2018 – A random forest approach with an emphasis on estimated team ability parameters”

 

 

Excelle sviluppa soluzioni e progetti di Machine Learning per molti settori industriali. Se sei interessato a queste soluzioni contattaci saremo lieti di fornirti tutte le informazioni e rispondere alla tue domande.

All’interno della nostra Accademia del Dato eroghiamo anche corsi di formazione in ambito Machine Learning & Data Intelligence.

Rimani sempre aggiornato con la nostra newsletter. Se non sei ancora iscritto clicca qui


Warning: in_array() expects parameter 2 to be array, boolean given in /web/htdocs/www.excelle.it/home/wordpress/wp-content/plugins/exit-popup/exit-popup.php on line 180