31. januar 2006

Fotball og kunstig intelligens



Skal man tro stereotypene er det ikke mange som interesserer seg for både sport og kunstig intelligens. Så dette blir en smal posting. Til gjengjeld snakker jeg om noe jeg kan.

Det har vært EM-trekning i fotball, og Norge hadde griseflaks. Vår gruppe består av oss, Hellas, Tyrkia, Bosnia, Ungarn, Malta og Moldova. Vi kunne like gjerne fått Ukrainas skjebne, de må spille mot Frankrike og Italia. Tre VM-klare nasjoner i den gruppen, null i vår. MOHAHAHA...gurgle.

Sist var vi ikke like heldige, skulle vi gått til VM 2006 måtte vi slått ut enten Italia eller Tsjekkia, to av verdens aller beste lag. Mens Trinidad til slutt kunne kvalifisere seg mot fryktinngytende (not..) Bahrain.

Disse ujevnhetene skyldes seedingen. Seeding betyr at man vurderer hvem som er de beste lagene før turneringen, og legger opp trekningen slik at disse ikke kan møte hverandre. Men gang på gang møtes de beste likevel. Det er det flere grunner til:
  • Man blander inn momenter som ikke har med rankingmetoden å gjøre, som at hjemmelag eller regjerende mester skal toppseedes (derfor fikk vi Hellas). Det grelleste eksempelet på dette kom i damefotball under Sydney-OL hvor de to toppseedete var USA (best) og Australia (dårligst men hjemmelag). Slik ble det faktisk en ulempe for USA å være toppseedet.
  • Maktpolitikk. FIFA liker å vente til rett før trekningen, etter kampene er spilt, med å velge seedingsmetode. Slik er de sikre på at de får en seeding de liker.
  • Dårlig rankingingmetode. Rankingmetoden som brukes i fotball nå er ganske enkelt lagenes poengsnitt fra siste EM- og siste VM-kvalifisering. Den tar ikke hensyn til storseire eller motstanders kvalitet, og er basert på ganske få kamper. FIFA-rankingen er en bedre metode, særlig for lag fra samme verdensdel. Men den sluttet de å bruke, etter forslag fra den svenske UEFA-bossen Johansson. Skiftet kom ganske rett etter at vår daværende landslagstrener Semb snakket med svenskene om at Norge hadde en mann som hadde knekt den hemmelige utregningsmetoden bak FIFA-rankingen. Svenskene ble meget interesserte, de spurte til og med om telefonnummeret til denne fyren. Men de ringte meg aldri. Istedet foreslo de dagens seedingsmetode. Om det er tilfeldig eller om Norge indirekte selv har skylda/æren for den lett ujevne seedingen nå, vites ikke.

Ranking er min greie. Å finne beste mulige rankingmetode for idrettskonkurranser var det jeg jobbet med i hovedfaget mitt. Best mulig rankingmetode definerte jeg som den rankingen som i størst mulig grad forutsier resultatet av neste konkurranse. Altså vil beste mulige rankingmetode også være det beste utgangspunktet for en som skal tippe, spille på oddsen, etc.

Jeg brukte kunstig intelligens til å hjelpe meg med å vektlegge viktigheten av målforskjell, viktigheten av form, hjemmebane, fjorårets resultater, tidligere resultater fra samme oppgjør osv. Datamaskinen lagde en rankingmetode på måfå, testet den på tusenvis av fotballkamper som har vært spilt, og målte hvor god metoden er til å forutsi resultatene. Dårlige metoder drepes, en god metode krysses med andre gode metoder etter samme prinsipp som da DNA-strenger ble krysset når genene dine ble lagd. Gjør man dette gjennom mange generasjoner får man survival of the fittest. (Dette kalles genetisk programmering).

Jeg ble sittende med en metode som veide målforskjell tungt. Jeg falt for fristelsen til å spille på oddsen med denne metoden. Den doblet kjapt pengene, deretter holdt den jevnt nivå i flere år. Den spilte altså jevnt med oddsselskapene, det skulle bety at metoden er noen prosent bedre enn deres, siden de tar seg prosenter før de setter oddsen. Men ikke god nok til å tjene penger.


Metoden gjør store brølere iblant. Maskinen vet f.eks. ikke om en skadet spiller, avgått trener etc. er viktig for laget. Et eksempel: Fiorentina solgte Batistuta. Alle oddssetterne visste at Batistuta var viktig for Fiorentina. Dermed påvirket det oddsen. Maskinen min satte sine egne odds, og spilte de kampene hvor den var mest uenig med oddsselskapene, dermed spiller den også hardest på de kampene den tar mest feil i. Maskinen ville veldig gjerne at jeg skulle spille på Fiorentina.

Når man spiller kan man korrigere sånt, men det var ikke hovedpoenget med oppgaven, jeg skulle som sagt finne en god rankingmetode. Problemet jeg ikke kom forbi var at i et seedingsystem kunne man ikke gå inn og flytte ned for eksempel Slovenia etter Zahovic la opp, selv om "alle" visste at laget ble svekket av det.

Dessuten visste ikke "alle" det. Jeg må innrømme, jeg visste ikke om Batistutas betydning for Fiorentina før jeg lærte det på pungen. Og en italiensk oddstipper ville kanskje ikke visst om Iversens betydning for VIF. Ingen vet alt hver for seg, men til sammen har mennesker ganske god peiling. For eksempel: når man spør publikum i Vil du bli millonær tar de sjeldnere feil enn ett enkelt menneske vill gjort. Denne demokratiske intelligensen kan utnyttes til å lage god idrettsranking.

Etter mange år har jeg derfor forkastet matematikken(!) og landet på denne modellen som den ultimate måten å seede på. Fungerer for all idrett:

Før trekningen vurderer alle deltagerne sine motstandere med terningkast en til seks. Så stryker man et antall av de høyeste og laveste karakterene (som man gjør i skihopp og turn). Deretter legger man sammen resten av terningkastene for hvert land, rangerer dem, og deler inn i seedingsgrupper slik at de første på rankingen blir toppseedet. Seedingen skulle da stemme godt med allmenn oppfatning.

For å holde deltagerne dønn ærlige når de triller terning sørger vi for at vurderingen de gjør får konsekvenser. Seks betyr "denne motstanderen vil vi helst slippe", en betyr "dette laget møter vi gjerne". Når lagene blir trukket opp blir de plassert i den puljen de selv har rangert som den enkleste (av de gjenstående gruppene). Så hvis Norge vil ødelegge for f.eks. Italia, ved å gi dem en ener, øker det sjansene for at Norge møter Italia. Det øker også sjansene for at Norge møter enda et topplag i tillegg til italienerne, siden Italia kan bli seedet på nivå to som følge av eneren fra Norge. Da vil alle de andre landene sky denne gruppen med Italia og et annet topplag, mens Norge vil trekkes til den. Slik blir det en stor tabbe å ikke være ærlig i terningkastsettingen.

Den siste effekten er at deltagerne vil tendere mot å få motstandere de liker.

Et eksempel på hvordan trekningen vil foregå for en fotballkvalifisering: De lavest seedede lagene, dvs typisk Luxembourg, San Marino, Færøyene ol. fordeles på gruppene uten trekning. Så trekker man lag fra den nest laveste seedingsgruppen. Island kommer opp først. Island har terningkast 1 på Færøyene og havner i deres gruppe. De slipper for eksempel den lange reisen til Aserbajdsjan siden de hadde terningkast 2 på dem. Man trekker de sju lagene fra dette seedingsnivået. Moldova hadde terningkast 1 på Malta og havner sammen med dem. Deretter trekker man seedingsgruppe 5. Her er Ungarn, som ikke eier respekt for Moldava og Malta, har terningkast 1 på begge og havner i den gruppen. På seedingsnivå 4 har Bosnia respekt for Ungarn, men trekkes ut sist, og har ikke annet valg enn å havne i gruppe med Ungarn. Så trekkes Norge ut fra seedingsnivå 3, osv, osv, jeg tror du har skjønt det nå.

Skulle likt å se en slik trekning. Men det har gått for mye politikk i idretten til at det er sannsynlig at det skjer.

Bilde 1: Norge, her ved Solveig Gulbrandsen, vant Sydney-OL.
Bilde 2: Gabriel Batistuta søler med pengene mine

Ingen kommentarer: