Update (31 maart): Google heeft aangekondigd dat Gemini 2.5 Pro nu ook gratis te gebruiken is. Vorige week hadden alleen betalende Advanced-gebruikers toegang tot het nieuwste model van Google.
Gemini 2.5 Pro is voortaan te selecteren als één van de LLM’s binnen de Gemini-app en Google AI Studio.
Oorspronkelijk bericht, 26 maart 09:11:
Google heeft aangekondigd dat het zijn vlaggenschipreeks van Gemini-kunstmatige intelligentiemodellen bijwerkt met de introductie van een experimentele versie. Het is Gemini 2.5 Pro.
Volgens Google is Gemini 2.5 Pro het meest intelligente model tot nu toe. Het beschikt over think-mogelijkheden. Alle aankomende Gemini 2.5-modellen zullen zogenaamde think-modellen zijn. Die zijn in staat om taken op te splitsen in meerdere stappen en deze logisch te doorlopen voordat ze antwoorden. Het bedrijf gaf aan dat dit leidt tot betere prestaties. En tot een hogere nauwkeurigheid.
Koray Kavukcuoglu, chief technology officer van Google DeepMind legt aan SilliconANGLE uit dat het redeneervermogen van een AI-systeem verder gaat dan enkel classificatie en voorspelling. Het omvat ook het analyseren van informatie en het trekken van logische conclusies. Naast het meenemen van context en nuance, en het nemen van onderbouwde beslissingen.
Deze redeneercapaciteit werd voor het eerst geïntroduceerd in het Gemini 2.0 Flash Thinking Experimental AI-model, dat het bedrijf in december lanceerde. Voor het ontwikkelen van dit model maakte het men gebruik van technieken zoals reinforcement learning en chain-of-thought prompting.
Bij Gemini 2.0 Flash Thinking konden gebruikers deze denkfunctie activeren door op een knop te klikken tijdens het invoeren van een prompt, waarna het model begon te redeneren. Het toonde daarbij ook zijn denkproces, zodat gebruikers konden zien hoe het tot zijn conclusie was gekomen.
Google voegt aanduiding Thinking niet meer toe
Volgens het bedrijf heeft Gemini 2.5 Pro Experimental dankzij natraining een hoger prestatieniveau bereikt dan het basismodel. Google beschouwt het als het meest geavanceerde model voor complexe taken. Het behaalde de hoogste score op de LMArena-ranglijst, die gebaseerd is op menselijke voorkeuren.
Ook scoorde het model 18,8% op Humanity’s Last Exam, een dataset die is ontworpen door honderden experts en gericht is op menselijke kennis en redeneervermogen. Ter vergelijking: OpenAI’s o3-mini behaalde hier 14% en DeepSeek R1 8,6%. Zowel o3-mini als R1 zijn eveneens denkmodellen die complexe redeneringen aankunnen, net als Gemini 2.5 Pro Experimental.
Kavukcuoglu gaf aan dat het bedrijf zich richt op de prestaties bij coderen, en dat Gemini 2.5 een aanzienlijke sprong voorwaarts betekent ten opzichte van versie 2.0, met nog meer verbeteringen in het vooruitzicht.
Om de nieuwe mogelijkheden van het model te demonstreren, vroegen Google-onderzoekers het om een eindeloze runner-videogame met een dinosaurus te genereren in HTML, CSS en JavaScript op basis van slechts één prompt. Het model wist dit in één keer succesvol uit te voeren.
Uitbreiding naar 2 miljoen tokens
De experimentele Gemini 2.5 Pro beschikt over een contextvenster van 1 miljoen tokens, wat betekent dat het zeer grote documenten, audio- en videobestanden kan verwerken – ongeveer 1,5 miljoen woorden. Google gaf aan dat het dit venster wil uitbreiden naar 2 miljoen tokens.
Dankzij het grote contextvenster en de hoge prestaties biedt Gemini 2.5 Pro een sterke basis voor AI-agenten. Hierdoor kunnen zij grote datasets verwerken en complexe problemen effectiever aanpakken. Omdat AI-agenten autonoom opereren en plannen, zal het verbeterde redeneervermogen van het model hun vermogen om gegevens te begrijpen en hulpmiddelen te gebruiken om taken uit te voeren, aanzienlijk verbeteren.
Ontwikkelaars en zakelijke gebruikers kunnen nu al experimenteren met Gemini 2.5 Pro in Google AI Studio, en gebruikers van Gemini Advanced kunnen het model direct selecteren op desktop en mobiel. Gebruikers van Vertex AI, het beheerde machine learning-platform van Google voor het bouwen en inzetten van AI, krijgen in de komende weken toegang tot het model.