AI-modellen verschillen fors over WK-kansen Oranje: alleen Gemini ziet halve finale

Intro

Vijf veelgebruikte AI-modellen komen tot uiteenlopende conclusies over de kansen van Oranje op het WK 2026. Alleen Gemini plaatst Nederland in de halve finale, terwijl alle onderzochte systemen Argentinië in de finale zien.

De uitkomst van de vergelijking roept vragen op over hoe AI voorspellingen vormt en wat supporters en analisten aan die uitkomsten hebben.

Verschillende uitkomsten, één constante

AI-expert Constantijn Rijsdijk (Cegeka) voerde een directe vergelijking uit tussen ChatGPT, Claude, Gemini, DeepSeek en Perplexity. Elk model kreeg hetzelfde toernooischema en dezelfde open opdracht om wedstrijden te voorspellen. De resultaten lopen uiteen: Gemini is het enige model dat Oranje in de halve finale plaatst. Andere modellen laten Nederland al eerder uitstappen, variërend van de kwartfinale tot zelfs de groepsfase.

Een opvallende overeenkomst tussen de vijf modellen is dat ze allemaal Argentinië in de finale zetten. Over de uiteindelijke wereldkampioen bestaat wél verdeeldheid: de voorspellingen variëren tussen Brazilië, Frankrijk, Spanje en Argentinië, afhankelijk van het model.

Hoe redeneert elk model?

Rijsdijk constateert dat de modellen verschillende ‘persoonlijkheden’ hebben. ChatGPT geeft vaker een stap-voor-stapanalyse, Claude brengt meer nuance en context, DeepSeek werkt relatief kwantitatief, Perplexity betrekt externe bronnen sterker en Gemini structureert informatie snel en overzichtelijk. Die verschillen in aanpak leiden rechtstreeks tot andere sportieve uitkomsten.

Concreet ziet Gemini een route voor Oranje langs Turkije en Canada naar de halve finale, waar Duitsland te sterk zou zijn. Claude en Perplexity voorspellen een kwartfinale-uit tegen Frankrijk, DeepSeek verwacht een kwartfinaleverlies tegen Duitsland, en ChatGPT is het meest pessimistisch en laat Nederland al in de groepsfase stranden.

Wat betekent dit voor supporters en analyses?

Voor fans bieden dergelijke AI-uitkomsten gespreksstof en scenario’s om over te debatteren, maar ze zijn geen vervanging voor traditionele sportanalyse. Belangrijke variabelen zoals actuele vorm, blessures, schorsingen of laatste selectie-informatie werden niet vooraf meegegeven in de testopdracht. Daardoor zijn de voorspellingen vooral illustratief voor de redeneerstijl van het model, niet voor het daadwerkelijke verwachtingspatroon rondom Oranje.

Supporters en analisten moeten zich bewust zijn van die beperking: een model kan overtuigend klinken maar op andere aannames gebaseerd zijn dan een menselijke bondcoach of een statistisch model dat wél actuele data verwerkt.

Methode en beperkingen

De vergelijking gebruikte dezelfde open prompt voor alle modellen en voerde groepswedstrijden per speelronde in aparte sessies, zonder dat modellen elkaars output mochten gebruiken. Er is niet gewerkt met realtime data over blessures of vorm. Sommige systemen, zoals Perplexity en Gemini, hebben wel mogelijkheden om actuele bronnen te raadplegen, maar die opties werden in deze opzet niet uniform ingezet. De resultaten zijn driemaal gevalideerd en kleine inconsistenties werden gecorrigeerd.

Conclusie

De oefening laat zien dat AI geen eenduidige voorspeller is maar een gereedschap dat resultaten produceert afhankelijk van model, productlaag en aannames. Voor supporters creëert dit interessante scenario’s en gespreksmateriaal, maar wie op zoek is naar harde voorspellingen van het WK-verloop moet rekening houden met de beperkingen van de gebruikte data en methode. Zoals onderzoekt Rijsdijk aangeeft: de uitkomst zegt vooral iets over hoe een model redeneert, niet noodzakelijkerwijs over de werkelijkheid op het veld.