HPE bouwt geavanceerde AI en supercomputers voor U.S. Department of Energy: Een FinOps-perspectief

november 2, 2025

De recente aankondiging dat Hewlett Packard Enterprise (HPE) de opdracht heeft gekregen om een reeks geavanceerde AI en supercomputers te bouwen voor het Amerikaanse Ministerie van Energie (Department of Energy, DOE), markeert een significante stap in de evolutie van high-performance computing (HPC). Deze systemen, die deel uitmaken van de geavanceerde HPE Cray EX-lijn, zijn bestemd voor de drie nationale laboratoria van de National Nuclear Security Administration (NNSA): Lawrence Livermore, Los Alamos en Sandia. De primaire missie van de NNSA is het handhaven van de veiligheid, beveiliging en betrouwbaarheid van de Amerikaanse nucleaire voorraad zonder de noodzaak van ondergrondse tests. Dit vereist extreem complexe simulaties en data-analyses die alleen mogelijk zijn op de krachtigste supercomputers ter wereld. De investering, met een waarde van meer dan 600 miljoen dollar, onderstreept niet alleen het strategische belang van technologische superioriteit voor nationale veiligheid, maar werpt ook een belangrijk licht op de immense operationele en financiële uitdagingen die gepaard gaan met het beheren van dergelijke grootschalige, on-premise infrastructuur. In een tijdperk waarin cloud computing de norm lijkt, toont dit project aan dat voor de meest veeleisende workloads, on-premise supercomputing onvervangbaar blijft. Dit dwingt organisaties echter om de principes van financieel beheer en kostenefficiëntie, bekend uit de wereld van FinOps, toe te passen op een geheel nieuwe schaal. Het maximaliseren van de wetenschappelijke en strategische waarde van elke geïnvesteerde dollar wordt hierbij de ultieme maatstaf voor succes. Het gaat niet langer alleen om het bouwen van de snelste machine, maar om het creëren van een duurzaam ecosysteem waarin rekenkracht, data en budgetten op een intelligente en verantwoorde manier worden beheerd. Deze samenwerking tussen HPE en het DOE kan dan ook gezien worden als een casestudy voor de toepassing van FinOps-denkwijzen in de wereld van HPC, waar elke compute-cyclus telt en de Total Cost of Ownership (TCO) tot in de kleinste details moet worden geanalyseerd.

Luister naar dit artikel:

De technologische kern van deze nieuwe systemen wordt gevormd door de HPE Cray EX-supercomputerarchitectuur, een platform dat specifiek is ontworpen voor het exascale-tijdperk, waarin computers in staat zijn tot een quintiljoen (10^18) berekeningen per seconde. Wat deze architectuur onderscheidt, is de diepe integratie van rekenkracht, dataopslag en netwerkconnectiviteit, geoptimaliseerd voor de convergentie van traditionele simulatie-workloads en moderne AI- en machine learning-toepassingen. Een cruciaal onderdeel hiervan is de HPE Slingshot Interconnect, een netwerktechnologie die is ontworpen om de enorme datastromen te verwerken die kenmerkend zijn voor AI-training en complexe wetenschappelijke modellen. In tegenstelling tot traditionele netwerken, biedt Slingshot een hoge bandbreedte, lage latentie en geavanceerde congestion control-mechanismen die voorkomen dat 'data-opstoppingen' de prestaties van duizenden parallel werkende processors vertragen. Deze combinatie van krachtige CPU's en GPU's met een geavanceerd netwerk stelt de NNSA-laboratoria in staat om modellen met een ongekende resolutie en complexiteit te draaien. Denk hierbij aan 3D-simulaties van de fysica van materialen onder extreme omstandigheden, het modelleren van complexe aerodynamica of het doorrekenen van klimaatveranderingsscenario's. De integratie van AI-mogelijkheden is hierbij transformatief. AI-modellen kunnen worden getraind op de output van traditionele simulaties om snellere, surrogaatmodellen te creëren, of ze kunnen worden gebruikt om 'real-time' data uit experimenten te analyseren en de volgende simulatieparameters te voorspellen. Dit creëert een symbiotische cyclus waarin HPC de data genereert om AI te trainen, en AI de HPC-simulaties versnelt en verbetert. Voor de wetenschappers en ingenieurs van het DOE betekent dit een drastische verkorting van de tijd tot inzicht, waardoor ze sneller en met meer zekerheid complexe vraagstukken rondom nationale veiligheid en fundamentele wetenschap kunnen beantwoorden.

Hoewel de term FinOps primair is ontstaan in de context van variabele, on-demand public cloud-uitgaven, zijn de onderliggende principes van financiële verantwoording, kostentransparantie en waarde-optimalisatie direct toepasbaar op de enorme kapitaal- en operationele investeringen in on-premise supercomputers. Het beheren van een HPC-omgeving zoals die van de NNSA vereist een uiterst gedisciplineerde benadering die verder gaat dan alleen de aanschafprijs. De Total Cost of Ownership (TCO) omvat gigantische uitgaven voor stroomverbruik en koeling – vaak gemeten in megawatts – evenals de kosten voor de fysieke datacenters, gespecialiseerd personeel voor beheer en onderhoud, en complexe softwarelicenties. Een FinOps-benadering voor HPC begint met het creëren van transparantie in het gebruik. Dit kan worden bereikt door het implementeren van geavanceerde monitoring- en rapportagesystemen die inzicht geven in welke onderzoeksgroepen, projecten of zelfs specifieke simulaties de meeste rekenkracht verbruiken. Dit leidt tot mechanismen voor 'showback' of 'chargeback', waarbij de kosten (al dan niet financieel) worden toegewezen aan de verbruikers. Dit creëert een bewustzijn en een prikkel om efficiënt met de schaarse en dure resources om te gaan. Een ander kernprincipe is continue optimalisatie, wat in de HPC-wereld neerkomt op 'workload-optimalisatie'. Dit is het equivalent van 'rightsizing' in de cloud. Het omvat het analyseren van de prestaties van applicaties, het optimaliseren van code om beter gebruik te maken van de parallelle architectuur, en het slim plannen van taken (job scheduling) om de bezettingsgraad van de supercomputer te maximaliseren. Een suboptimale code kan honderden of duizenden core-uren verspillen, wat neerkomt op een aanzienlijke kapitaalvernietiging. Tot slot is er de discipline van 'forecasting'. Het plannen, budgetteren en aanschaffen van een supercomputer is een meerjarenproces. Door historisch gebruiksdata te analyseren en te anticiperen op toekomstige wetenschappelijke behoeften, kan het DOE de capaciteit nauwkeuriger plannen en technologische vernieuwingen budgetteren, waardoor een maximale return on investment (ROI) op deze cruciale nationale assets wordt gegarandeerd.

advertenties

De investering van het Amerikaanse Ministerie van Energie in de systemen van HPE moet ook worden gezien in een bredere, geopolitieke context. Er is een wereldwijde technologische wedloop gaande op het gebied van supercomputing en kunstmatige intelligentie, met name tussen de Verenigde Staten en China. Het bezit van de krachtigste computersystemen wordt steeds meer gezien als een indicator van economische kracht, wetenschappelijk leiderschap en nationale veiligheid. Deze systemen zijn essentieel voor doorbraken in uiteenlopende velden, van de ontwikkeling van nieuwe medicijnen en materialen tot het ontwerpen van efficiëntere energiebronnen en het begrijpen van de complexe dynamiek van het klimaat. Door te investeren in exascale-capabele systemen, positioneert de VS zich om aan de frontlinie van deze wetenschappelijke en technologische revolutie te blijven. Dit project is tevens een uitstekend voorbeeld van een succesvolle publiek-private samenwerking. De overheid (DOE) definieert de missie-kritische behoeften en levert de financiering, terwijl een technologisch bedrijf als HPE de expertise, R&D en schaal levert om de complexe systemen te ontwerpen, bouwen en onderhouden. Deze synergie versnelt innovatie op een manier die geen van beide partijen alleen zou kunnen bereiken. De technologie die wordt ontwikkeld voor deze 'grand challenge'-problemen, vindt uiteindelijk zijn weg naar commerciële toepassingen, wat de bredere economie ten goede komt. De uiteindelijke erfenis van deze supercomputers zal niet alleen worden gemeten in petaflops of exaflops, maar in de wetenschappelijke ontdekkingen en de strategische voordelen die ze mogelijk maken. Om die potentie volledig te realiseren, is een holistische en datagedreven beheerstrategie onontbeerlijk. Door de principes van FinOps – transparantie, accountability en continue optimalisatie – te omarmen, kan de overheid ervoor zorgen dat deze monumentale investering niet alleen resulteert in de krachtigste hardware, maar ook in de maximale wetenschappelijke en maatschappelijke waarde voor de komende jaren.

Olivia Nolan is redacteur bij MSP2Day, waar zij zich richt op het vertalen van complexe IT- en technologische ontwikkelingen naar toegankelijke en inspirerende artikelen. Met haar ervaring als content manager en social media expert weet zij inhoud niet alleen informatief, maar ook aantrekkelijk en relevant te maken voor een breed publiek.

De Transformatie naar Kostenefficiënte Innovatie: AI-kostenbeheer met FinOps