De in Parijs gevestigde AI-startup Mistral AI meldt dat het een nieuw, lichtgewicht AI-model genaamd Mistral Small 3.1 open-source maakt. Het bedrijf beweert dat dit model beter presteert dan vergelijkbare modellen van OpenAI en Google LLC.
Deze stap zal de race naar krachtige, maar kostenefficiënte large language models (LLM’s) verder aanwakkeren. Mistral Small 3.1 kan tekst en afbeeldingen verwerken met slechts 24 miljard parameters. Dit betekent dat het een fractie van de grootte is van veel geavanceerde modellen, maar toch met hen kan concurreren.
In een blogpost legt Mistral uit dat Mistral Small 3.1 verbeterde tekstprestaties, multimodale verwerking en een uitgebreidere contextwindow tot 128.000 tokens biedt, vergeleken met zijn voorganger Mistral Small 3.
Daarnaast kan het model gegevens verwerken met snelheden van ongeveer 150 tokens per seconde. Dit maakt het bijzonder geschikt voor toepassingen die snelle reacties vereisen. Het technologische succes benadrukt Mistral AI’s alternatieve strategie. In plaats van simpelweg steeds meer rekenkracht in te zetten, focust het bedrijf op algoritmische verbeteringen en optimalisatietechnieken. Dit om de prestaties van compacte modelarchitecturen te maximaliseren.
Meer toegankelijk en duurzamer
Het grootste voordeel van Mistral AI’s aanpak is dat het AI toegankelijker maakt. Doordat het bedrijf krachtige modellen bouwt die draaien op relatief bescheiden infrastructuur – zoals een enkele RTX 4090 GPU of een Mac-laptop met 32 GB RAM – kunnen geavanceerde AI-toepassingen worden ingezet op kleinere apparaten en op afgelegen locaties.
Deze strategie zou zich op termijn ook als duurzamer kunnen bewijzen dan het voortdurend opschalen van AI-modellen. Nu bedrijven zoals het Chinese DeepSeek een soortgelijke aanpak volgen, hebben beter gefinancierde concurrenten mogelijk geen andere keuze dan dit pad te volgen.
Mistral AI werd in 2023 opgericht door voormalige AI-onderzoekers van Google DeepMind en Meta, en heeft zich al gevestigd als Europa’s toonaangevende AI-bedrijf. Tot nu toe heeft het meer dan $1,04 miljard opgehaald en wordt het gewaardeerd op ongeveer $6 miljard—een aanzienlijk bedrag, maar nog altijd bescheiden vergeleken met de $80 miljard waardering van OpenAI.
De kracht van open-source
Een van de meest opvallende keuzes van Mistral AI is hun commitment aan open-source, in tegenstelling tot de gesloten, propriëtaire modellen van de concurrentie. Dit heeft al geleid tot de ontwikkeling van uitstekende redeneringsmodellen gebaseerd op Mistral Small 3, wat aantoont dat open samenwerking AI-ontwikkeling kan versnellen.
Door modellen open-source te maken, profiteert Mistral van een bredere R&D-capaciteit vanuit de AI-community. Tegelijkertijd maakt dit het lastiger om inkomsten te genereren, omdat het bedrijf in plaats daarvan moet focussen op gespecialiseerde diensten, bedrijfsimplementaties en unieke AI-toepassingen.
Mistral Small 3.1 is beschikbaar om te downloaden via Hugging Face en toegankelijk via de Mistral API en Google Cloud’s Vertex AI. Binnenkort zal het model ook beschikbaar zijn via Nvidia’s NIM-microservices en Microsoft Azure AI Foundry.