Gimlet Labs Haalt $80 Miljoen op in de Strijd tegen de Hoge Kosten van AI-Inferentie

Written by Olivia Nolan

mei 28, 2026

Terwijl de focus in de media vaak ligt op het trainen van grootschalige AI-modellen, schuilt de ware financiële uitdaging voor de meeste organisaties in de operationele fase: de zogenaamde 'inference'. Het draaiend houden van AI-applicaties en het genereren van output voor eindgebruikers is een continu proces dat 80 tot 90 procent van de totale AI-kosten kan opslokken. Deze exploderende **kosten van AI-inferentie** vormen een significant obstakel voor de brede adoptie en schaalbaarheid van kunstmatige intelligentie. In een poging dit probleem aan te pakken, heeft de startup Gimlet Labs onlangs een indrukwekkende Series A-financieringsronde van $80 miljoen afgesloten. Dit signaleert een groeiende erkenning in de markt dat de economische levensvatbaarheid van AI afhangt van fundamentele innovaties in de onderliggende hardware- en software-infrastructuur, een cruciaal aandachtspunt binnen elke volwassen FinOps-strategie.

Luister naar dit artikel:

De kern van het kostenprobleem ligt in de architectuur van de huidige computerinfrastructuur. Moderne AI-modellen, en met name Large Language Models (LLM's), zijn voor hun rekenkracht sterk afhankelijk van gespecialiseerde grafische processors (GPU's). Deze GPU's zijn ontworpen voor parallelle verwerking van grote databatches, een aanpak die uitstekend werkt tijdens de trainingsfase. Echter, tijdens de inferentiefase komen gebruikersverzoeken vaak één voor één binnen. Dit leidt tot een aanzienlijke inefficiëntie: een dure, energieverslindende GPU is vaak onderbenut of draait stationair terwijl hij wacht op voldoende verzoeken om een batch te vullen. Deze onderutilisatie vertaalt zich direct naar verspilde cloud-uitgaven. Bedrijven betalen voor de volledige capaciteit van de hardware, zelfs als ze slechts een fractie daarvan gebruiken. Dit maakt nauwkeurige forecasting en kostenbeheersing extreem complex en drijft de totale cost of ownership (TCO) van AI-diensten onhoudbaar op.
Gimlet Labs benadert het inferentieprobleem niet met een software-oplossing bovenop bestaande hardware, maar door de hele stack opnieuw op te bouwen. Het bedrijf ontwikkelt een volledig geïntegreerd systeem, inclusief eigen hardware en een softwarelaag, dat specifiek is ontworpen om de inefficiënties van inferentie-workloads te elimineren. Door de computerarchitectuur te optimaliseren voor de verwerking van individuele, latency-gevoelige verzoeken, beoogt Gimlet de kosten per inferentie drastisch te verlagen en tegelijkertijd de prestaties te verbeteren. Deze 'purpose-built' aanpak staat in contrast met het gebruik van generieke GPU's van cloudproviders, die een compromis zijn tussen verschillende soorten workloads. De aanzienlijke investering van $80 miljoen onderstreept het vertrouwen van investeerders in deze visie: de toekomst van schaalbare en kosteneffectieve AI ligt niet in het slimmer gebruiken van generieke tools, maar in het ontwikkelen van gespecialiseerde infrastructuur die is afgestemd op de unieke eisen van AI-inferentie.

advertenties

advertenties

advertenties

advertenties

De opkomst van bedrijven zoals Gimlet Labs markeert een belangrijke evolutie voor het FinOps-vakgebied. Waar kostenoptimalisatie voor AI-workloads zich voorheen voornamelijk richtte op rightsizing, reserveringen en het opruimen van ongebruikte resources, verschuift de focus nu naar meer fundamentele, architecturale keuzes. FinOps-teams moeten steeds vaker samenwerken met engineering- en data science-afdelingen om de onderliggende technologie-stack te evalueren. De keuze is niet langer alleen tussen verschillende cloud-instanties, maar mogelijk ook tussen het gebruik van een generieke cloudprovider en een gespecialiseerd inferentieplatform. Dit vereist een dieper technisch inzicht en een focus op unit economics, zoals de 'kost per inferentie' of 'kost per gebruiker'. De belofte van drastisch lagere operationele kosten dwingt organisaties om hun cloudstrategie voor AI opnieuw te evalueren, waarbij de rol van FinOps essentieel is om de business case te valideren en de economische voordelen te realiseren.

Olivia Nolan is redacteur bij MSP2Day, waar zij zich richt op het vertalen van complexe IT- en technologische ontwikkelingen naar toegankelijke en inspirerende artikelen. Met haar ervaring als content manager en social media expert weet zij inhoud niet alleen informatief, maar ook aantrekkelijk en relevant te maken voor een breed publiek.