OpenAI introduceert drie nieuwe modellen in de API: GPT-4.1, GPT-4.1 mini en GPT-4.1 nano. Deze modellen presteren beter dan GPT-4o op alle vlakken, vooral bij programmeren en het opvolgen van instructies. Ze ondersteunen tot 1 miljoen tokens.
De lancering van GPT-4.1 komt niet onverwacht. Eerder deze week lekte al uit dat OpenAI werkt aan een opvolger voor GPT-4o. Interessant is dat deze nieuwe modellen niet beperkt blijven tot één variant, maar dat OpenAI kiest voor een volledige familie van modellen met verschillende capaciteiten en kostenniveaus.
Sprongen in programmeervaardigheid
Voor ontwikkelaars is vooral de verbeterde codeercapaciteit een belangrijke stap voorwaarts. GPT-4.1 scoort 54,6% op SWE-bench Verified, een aanzienlijke verbetering van 21,4% ten opzichte van GPT-4o. Deze benchmark wordt gevalideerd door mensen en toont aan in hoeverre het model in staat is softwareproblemen op te lossen. De combinatie van betere codering met het volgen van instructies maakt deze modellen bijzonder geschikt voor het bouwen van autonome agents.
Wat GPT-4.1 verder onderscheidt, is de verbeterde omgang met lange context. Het model kan nu tot 1 miljoen tokens verwerken en scoort 72% op Video-MME, een benchmark voor multimodale begrip van lange context. Dat is 6,7% beter dan GPT-4o kon bereiken.
Mini en Nano: kleinere modellen, grote impact
Naast het vlaggenschip GPT-4.1 introduceert OpenAI ook GPT-4.1 mini en GPT-4.1 nano. GPT-4.1 mini overtreft GPT-4o op verschillende benchmarks terwijl het bijna de helft sneller is en 83% minder kost. GPT-4.1 nano is het snelste en goedkoopste model, ideaal voor classificatie of autoaanvulling.
Deze kleinere varianten behouden ondanks hun formaat een indrukwekkende context-window van 1 miljoen tokens. GPT-4.1 nano scoort zelfs hoger dan GPT-4o mini op diverse tests. Dit betekent dat ook voor toepassingen die weinig latentie vereisen, er nu krachtige oplossingen beschikbaar zijn.
Opvallend is dat GPT-4.1 alleen beschikbaar komt via de API, niet in ChatGPT. Voor gebruikers van de chatdienst worden de verbeteringen geleidelijk doorgevoerd in de bestaande GPT-4o versie.
Voor API-ontwikkelaars die grote bestanden bewerken, is GPT-4.1 betrouwbaarder bij code-diffs in verschillende formaten. Ook is de uitvoerlimiet verhoogd van 16.384 tokens naar 32.768 tokens, waardoor grotere bestanden in één keer kunnen worden verwerkt.