De Allen Institute for AI (Ai2) heeft OLMoTrace gelanceerd. Onderzoekers en ontwikkelaars kunnen hiermee zien welke bronnen een taalmodel gebruikt voor het genereren van tekst. Op die manier moet het eenvoudiger worden om te begrijpen hoe de AI tot output komt.
Ai2 stelt dat OLMoTrace de eerste functie in zijn soort is. Gebruikers zijn in staat de output van taalmodellen direct te herleiden naar de oorspronkelijke trainingsdocumenten. Deze functionaliteit is beschikbaar voor Ai2’s vlaggenschip open model, OLMo 2 32B, dat is getraind op een dataset van meer dan 3,2 miljard documenten.
“OLMoTrace is een cruciale stap voorwaarts voor de toekomst van AI-ontwikkeling. Het legt de basis voor transparantere AI-systemen die onderzoekers en ontwikkelaars beter kunnen begrijpen”, aldus Jiacheng Liu, hoofdonderzoeker voor OLMoTrace. “Door meer inzicht te bieden in hoe AI-modellen hun antwoorden genereren, kan iedereen die onze modellen gebruikt, ervoor zorgen dat de data achter hun uitvoer betrouwbaar en verifieerbaar is.”
Eenvoudig te gebruiken, krachtig in resultaat
Na het genereren van een antwoord van OLMo in de Ai2 Playground, kunnen gebruikers de tool activeren via de knop “Show OLMoTrace” onder de uitvoer. De tool doorzoekt vervolgens alle 3,2 miljard documenten uit het trainingsproces van het model en markeert tekstfragmenten in het antwoord die overeenkomen met het trainingsmateriaal.
Elk gemarkeerd fragment is gekoppeld aan een set documenten, waardoor gebruikers de originele bronnen kunnen verkennen. Ze zien waar en in welke context deze zinnen voorkwamen. De tool zorgt ervoor dat de meest unieke en relevante fragmenten prioriteit krijgen, met matches gerangschikt op basis van een relevantiescore.
OLMoTrace is vanaf nu beschikbaar op de Ai2 Playground voor de OLMo 2 32B Instruct, OLMo 2 13B Instruct en OLMoE 1B 7B Instruct modellen. De dienst wordt gehost door Google Cloud.