IBM komt met mainframe z17 voor on-premises AI

IBM komt met mainframe z17 voor on-premises AI

IBM heeft de z17 aangekondigd, voorzien van de Telum II-processor en de Spyre Accelerator. Deze IBM-componenten maken het mogelijk om generatieve AI-modellen en agentic AI on-premises te draaien. Data moet toegankelijk zijn tegen de laagst mogelijk latency.

De nieuwe IBM z17 is ontworpen om de meest kritische transacties te verwerken. Momenteel loopt ongeveer 70 procent van alle financiële transacties wereldwijd via IBM-mainframes, stelt Big Blue. Met de introductie van de Telum II-processor en de Spyre Accelerator maakt IBM een significante sprong in het verbeteren van AI-mogelijkheden voor enterprise organisaties.

De Spyre Accelerator, die in het vierde kwartaal van 2025 beschikbaar komt, is het resultaat van jarenlange ontwikkeling door IBM Research. Deze 32-core accelerator wordt aangeboden als optionele PCIe-kaart, waarbij meerdere kaarten kunnen worden toegevoegd naar behoefte. De accelerator bouwt voort op de originele Telum-chip, die in de z16 systemen zat.

In vroege tests verwerkte een prototype van Spyre meer dan drie keer zoveel afbeeldingen per seconde per watt elektriciteit dan high-end GPU’s. Dit is een belangrijke vooruitgang, gezien de enorme energiebehoefte die AI-workloads met zich meebrengen.

On-chip AI-acceleratie

De Telum II-processor vormt samen met de Spyre Accelerator het hart van het z17-systeem. De processor bevat een ingebouwde AI-accelerator core, vergelijkbaar met zijn voorganger in de z16, maar met verbeterde prestaties.

“We hebben een complete accelerator gebouwd”, zegt Jeff Burns, director IBM Research AI Hardware Center. “Het is een system-on-chip, een PCIe-kaart, een compiler, een runtime, een device driver — en zo verder.” Deze functies maken het mogelijk dat data scientists Spyre kunnen gebruiken zonder speciale aanpassingen.

Ontworpen voor toekomstige workloads

Een grote uitdaging bij het ontwerpen van AI-chips is de timeline. Workloads veranderen snel, maar chips ontwikkelen duurt jaren. IBM heeft dit probleem aangepakt door zich te richten op watsonx, het AI-platform van IBM, als leidraad. De AI-roadmap van watsonx, die jaren geleden werd ontwikkeld, voorzag dat in 2025 specifiek ontworpen hardware generatieve AI op nieuwe manieren zou helpen schalen.

De Spyre-accelerator is geoptimaliseerd voor generatieve en agentic AI, in plaats van voor modellen die in de sector minder relevant worden, zoals classificatiemodellen. Daarmee is deze technologie klaar voor de toekomstige ontwikkelingen in AI.

Tip: IBM huwt AI-platform met zoveel mogelijk data: wat is Watsonx?