Gimlet Labs pakt het kostenprobleem van AI-inferentie aan met $80M investering

Written by Olivia Nolan

mei 24, 2026

De recente investering van $80 miljoen in Gimlet Labs markeert een belangrijk moment in de evolutie van kunstmatige intelligentie. Terwijl de aandacht vaak uitgaat naar de immense rekenkracht die nodig is voor het *trainen* van AI-modellen, verschuift de focus nu naar een veel grotere, doorlopende kostenpost: de operationele fase. **Het kostenprobleem van AI-inferentie** – het proces waarbij een getraind model wordt gebruikt om voorspellingen te doen op basis van nieuwe data – vormt een significante barrière voor de brede adoptie en schaalbaarheid van AI. In tegenstelling tot de eenmalige, intensieve trainingsfase, is inferentie een continue activiteit. Elke zoekopdracht, elke aanbeveling en elke gegenereerde afbeelding vereist rekenkracht. Voor bedrijven die AI op grote schaal inzetten, kunnen deze operationele kosten exponentieel oplopen, waardoor de businesscase onder druk komt te staan en de noodzaak voor efficiëntiebeheer cruciaal wordt.

Luister naar dit artikel:

De hoge kosten van AI-inferentie worden veroorzaakt door een combinatie van factoren. Centraal staat de afhankelijkheid van gespecialiseerde en dure hardware, zoals GPU's (Graphics Processing Units). Deze chips zijn geoptimaliseerd voor de parallelle berekeningen die AI-modellen vereisen, maar worden vaak inefficiënt benut. Veel AI-modellen gebruiken slechts een fractie van de beschikbare capaciteit van een GPU, wat leidt tot kostbare onderbenutting. Daarnaast zorgt de onvoorspelbare vraag naar AI-diensten voor een planningsuitdaging. Bedrijven moeten vaak overprovisioneren om piekbelastingen aan te kunnen, waardoor resources een groot deel van de tijd ongebruikt blijven. De toenemende complexiteit en omvang van moderne modellen, zoals Large Language Models (LLM's), versterken dit probleem verder, omdat elke individuele taak meer rekenkracht vereist.
Gimlet Labs adresseert dit efficiëntieprobleem niet met nieuwe hardware, maar met een innovatieve softwarelaag die functioneert als een besturingssysteem voor AI-inferentie. Deze laag positioneert zich tussen de AI-modellen en de fysieke chips en heeft als doel de benutting van de bestaande GPU-capaciteit te maximaliseren. Door het werk van meerdere, verschillende AI-modellen intelligent te orkestreren en tegelijkertijd op één enkele GPU uit te voeren, doorbreekt Gimlet de één-op-één-relatie tussen model en hardware. Dit stelt organisaties in staat om significant meer waarde uit hun hardware-investeringen te halen. De aanpak vermindert de noodzaak om extra hardware aan te schaffen en verlaagt de operationele cloudkosten die gepaard gaan met het draaiende houden van onderbenutte, krachtige machines. Het resultaat is een efficiëntere en kosteneffectievere AI-infrastructuur.

advertenties

advertenties

advertenties

advertenties

De opkomst van oplossingen zoals die van Gimlet Labs onderstreept de groeiende noodzaak voor een FinOps-benadering van AI-workloads. Het beheren van AI-kosten gaat verder dan alleen het monitoren van cloudfacturen; het vereist een diepgaand technologisch begrip van de kostendrijvers. FinOps-teams moeten nauw samenwerken met data scientists en MLOps-engineers om optimalisatiestrategieën te implementeren. Dit omvat niet alleen het efficiënter inzetten van hardware, maar ook technieken als modelkwantisering (het verkleinen van modellen) en het selecteren van de juiste instance types voor specifieke taken. Het uiteindelijke doel is het maximaliseren van de business value per euro die in AI wordt geïnvesteerd. Door technologie, financiën en business te verbinden, speelt FinOps een cruciale rol in het duurzaam en schaalbaar maken van kunstmatige intelligentie binnen de organisatie.

Olivia Nolan is redacteur bij MSP2Day, waar zij zich richt op het vertalen van complexe IT- en technologische ontwikkelingen naar toegankelijke en inspirerende artikelen. Met haar ervaring als content manager en social media expert weet zij inhoud niet alleen informatief, maar ook aantrekkelijk en relevant te maken voor een breed publiek.