Redactie - 26 maart 2024

NVIDIA onthult nieuwe technologieën voor het generatieve AI-tijdperk

NVIDIA-oprichter en CEO Jensen Huang kondigde tijdens zijn keynote op de GTC-conferentie een reeks baanbrekende technologieën aan die de toekomst van AI zullen bepalen.

Generatieve AI belooft een revolutie teweeg te brengen in elke sector waarmee het in aanraking komt. Het enige dat nodig is, is de technologie om de uitdaging aan te gaan aldus NVIDIA-oprichter en CEO Jensen Huang (foto). Hij introduceerde die technologie – het nieuwe Blackwell-computerplatform van het bedrijf – toen hij de grote vooruitgang schetste die grotere rekenkracht kan opleveren voor alles, van software tot diensten, van robotica tot medische technologie en meer.

“Versneld computergebruik heeft het omslagpunt bereikt – computergebruik voor algemene doeleinden is opraken,” vertelde Huang aan ruim 11.000 GTC-deelnemers die persoonlijk bijeen waren gekomen – en nog vele tienduizenden meer online – voor zijn keynote speech in de spelonkachtige SAP Center-arena van Silicon Valley. .

“We hebben een andere manier nodig om computers te gebruiken – zodat we kunnen blijven schalen, zodat we de kosten van computers kunnen blijven verlagen, zodat we steeds meer computers kunnen blijven consumeren terwijl we duurzaam zijn. Versneld computergebruik is een dramatische versnelling ten opzichte van algemeen computergebruik, in elke afzonderlijke sector.”

Huang sprak voor enorme beelden op een 12 meter hoog 8K-scherm ter grootte van een tennisbaan voor een menigte vol CEO's en ontwikkelaars, AI-enthousiastelingen en ondernemers, die samen 20 minuten naar de arena liepen vanaf het San Jose Convention Center op een schitterende lentedag.

Huang leverde een enorme upgrade voor de AI-infrastructuur ter wereld en introduceerde het NVIDIA Blackwell-platform om real-time generatieve AI te ontketenen op grote taalmodellen met biljoen parameters.

Huang presenteerde NVIDIA NIM – een verwijzing naar NVIDIA-inferentiemicroservices – een nieuwe manier om software te verpakken en te leveren die ontwikkelaars verbindt met honderden miljoenen GPU’s om allerlei soorten aangepaste AI te implementeren.

En door AI naar de fysieke wereld te brengen, introduceerde Huang Omniverse Cloud API's om geavanceerde simulatiemogelijkheden te bieden.

Huang onderstreepte deze belangrijke aankondigingen met krachtige demo's, partnerschappen met enkele van 's werelds grootste ondernemingen en meer dan een twintigtal aankondigingen waarin zijn visie gedetailleerd werd beschreven.

GTC – dat in vijftien jaar tijd is uitgegroeid van de beslotenheid van een plaatselijke hotelbalzaal tot ‘s werelds belangrijkste AI-conferentie – keert voor het eerst in vijf jaar terug naar een fysiek evenement.

Dit jaar zijn er meer dan 900 sessies – waaronder een paneldiscussie over transformatoren onder leiding van Huang met de acht pioniers die de technologie voor het eerst ontwikkelden, meer dan 300 tentoonstellingen en ruim twintig technische workshops.

Het is een evenement dat zich op het kruispunt van AI en zo ongeveer alles bevindt. In een verbluffende openingsact van de keynote toonde Refik Anadol, 's werelds toonaangevende AI-kunstenaar, een enorme real-time AI-datasculptuur met golfachtige wervelingen in groen, blauw, geel en rood, die over het scherm crashen, draaien en ontrafelen.

Toen hij zijn lezing begon, legde Huang uit dat de opkomst van multimodale AI – die in staat is om diverse gegevenstypen te verwerken die door verschillende modellen worden verwerkt – AI een groter aanpassingsvermogen en meer kracht geeft. Door hun parameters te vergroten, kunnen deze modellen complexere analyses aan.

Maar dit betekent ook een aanzienlijke toename van de behoefte aan rekenkracht. En naarmate deze samenwerkende, multimodale systemen ingewikkelder worden – met maar liefst een biljoen parameters – wordt de vraag naar geavanceerde computerinfrastructuur steeds groter.

“We hebben nog grotere modellen nodig”, zei Huang. “We gaan het trainen met multimodale data, niet alleen met tekst op internet, we gaan het trainen met teksten en afbeeldingen, grafieken en diagrammen, en net zoals we leerden door tv te kijken, zullen er een hele hoop zijn van het kijken naar video.”

De volgende generatie versneld computergebruik

Kortom, Huang zei: “we hebben grotere GPU’s nodig.” Het Blackwell-platform is gebouwd om deze uitdaging aan te gaan. Huang haalde een Blackwell-chip uit zijn zak en hield hem zij aan zij met een Hopper-chip, die kleiner werd.

Vernoemd naar David Harold Blackwell – een wiskundige van de University of California, Berkeley, gespecialiseerd in speltheorie en statistiek, en de eerste zwarte geleerde die is opgenomen in de National Academy of Sciences – is de nieuwe architectuur de opvolger van de NVIDIA Hopper-architectuur, die twee jaar geleden werd gelanceerd.

Blackwell levert 2,5x de prestaties van zijn voorganger in FP8 voor training, per chip, en 5x met FP4 voor gevolgtrekking. Het beschikt over een NVLink-interconnect van de vijfde generatie die twee keer zo snel is als Hopper en opschaalbaar is tot 576 GPU's.

En de NVIDIA GB200 Grace Blackwell Superchip verbindt twee Blackwell NVIDIA B200 Tensor Core GPU's met de NVIDIA Grace CPU via een 900 GB/s NVLink chip-naar-chip interconnect met ultralaag vermogen.

Huang hield een bord met het systeem omhoog. “Deze computer is de eerste in zijn soort waarbij zoveel rekenkracht in zo’n kleine ruimte past”, zegt Huang. "Omdat dit geheugen coherent is, hebben ze het gevoel dat het één grote, gelukkige familie is die samen aan één applicatie werkt."

Voor de hoogste AI-prestaties kunnen GB200-aangedreven systemen worden verbonden met de NVIDIA Quantum-X800 InfiniBand- en Spectrum-X800 Ethernet-platforms, die ook vandaag zijn aangekondigd , en die geavanceerde netwerken leveren met snelheden tot 800 Gb/s.

“De hoeveelheid energie die we besparen, de hoeveelheid netwerkbandbreedte die we besparen, de hoeveelheid verspilde tijd die we besparen, zal enorm zijn”, zei Huang. “De toekomst is generatief… daarom is dit een geheel nieuwe industrie. De manier waarop we rekenen is fundamenteel anders. We hebben een processor gemaakt voor het generatieve AI-tijdperk.”

Om Blackwell op te schalen, bouwde NVIDIA een nieuwe chip genaamd NVLink Switch. Elke verbinding kan vier NVLink-interconnects verbinden met een snelheid van 1,8 terabyte per seconde en het verkeer elimineren door in-netwerkreductie te bewerkstelligen.

NVIDIA Switch en GB200 zijn belangrijke componenten van wat Huang omschreef als ‘één gigantische GPU’, de NVIDIA GB200 NVL72 , een multi-node, vloeistofgekoeld rack-scale systeem dat Blackwell gebruikt om supercharged rekenkracht te bieden voor modellen met biljoen parameters, met 720 petaflops aan AI-trainingsprestaties en 1,4 exaflops aan AI-inferentieprestaties in één rack.

“Er zijn op dit moment maar een paar, misschien drie exaflop-machines op de planeet”, zei Huang over de machine, die 600.000 onderdelen verpakt en 3.000 pond weegt. “En dit is dus een exaflop AI-systeem in één enkel rack. Laten we eens naar de achterkant ervan kijken.”

NVIDIA gaat nog groter en kondigt vandaag ook zijn AI-supercomputer van de volgende generatie aan – de NVIDIA DGX SuperPOD, mogelijk gemaakt door NVIDIA GB200 Grace Blackwell Superchips – voor het verwerken van modellen met biljoen parameters met constante uptime voor superschaal generatieve AI-training en inferentieworkloads.

De nieuwe DGX SuperPOD is voorzien van een nieuwe, zeer efficiënte, vloeistofgekoelde architectuur op rackschaal, is gebouwd met NVIDIA DG GB200-systemen en biedt 11,5 exaflops aan AI-supercomputing met FP4-precisie en 240 terabytes aan snel geheugen - uitbreidbaar naar meer met extra racks.

“In de toekomst zullen datacenters worden gezien als AI-fabrieken,” zei Huang. “Hun doel in het leven is het genereren van inkomsten, in dit geval intelligentie.”

De industrie heeft Blackwell al omarmd.

Het persbericht waarin Blackwell wordt aangekondigd, bevat steunbetuigingen van Alphabet en Google CEO Sundar Pichai, Amazon CEO Andy Jassy, ​​Dell CEO Michael Dell, Google DeepMind CEO Demis Hassabis, Meta CEO Mark Zuckerberg, Microsoft CEO Satya Nadella, OpenAI CEO Sam Altman, Oracle-voorzitter Larry Ellison , en Elon Musk, CEO van Tesla en xAI.

Blackwell wordt omarmd door elke grote wereldwijde cloudserviceprovider, baanbrekende AI-bedrijven, systeem- en serverleveranciers en regionale cloudserviceproviders en telecombedrijven over de hele wereld.

“De hele industrie maakt zich op voor Blackwell”, wat volgens Huang de meest succesvolle lancering in de geschiedenis van het bedrijf zou zijn.

Een nieuwe manier om software te maken

Generatieve AI verandert de manier waarop applicaties worden geschreven, zei Huang.

In plaats van software te schrijven, legde hij uit, zullen bedrijven AI-modellen samenstellen, ze missies geven, voorbeelden geven van werkproducten, plannen beoordelen en tussentijdse resultaten.

Deze pakketten – NVIDIA NIM’s – zijn opgebouwd uit NVIDIA’s versnelde computerbibliotheken en generatieve AI-modellen, legt Huang uit.

“Hoe bouwen we software in de toekomst? Het is onwaarschijnlijk dat je het helemaal opnieuw zult schrijven of een hele reeks Python-code of iets dergelijks zult schrijven, 'zei Huang. “Het is zeer waarschijnlijk dat je een team van AI’s samenstelt.”

De microservices ondersteunen industriestandaard API's, zodat ze eenvoudig te verbinden zijn, werken in de grote CUDA-installaties van NVIDIA, opnieuw zijn geoptimaliseerd voor nieuwe GPU's en voortdurend worden gescand op beveiligingsproblemen en -risico's.

Huang zei dat klanten kant-en-klare NIM-microservices kunnen gebruiken, of dat NVIDIA kan helpen bij het bouwen van eigen AI en copiloten, waarbij ze een model aanleren van gespecialiseerde vaardigheden die alleen een specifiek bedrijf kent om nieuwe services van onschatbare waarde te creëren.

“De zakelijke IT-industrie zit op een goudmijn”, zegt Huang. “Ze beschikken over al deze geweldige tools (en gegevens) die door de jaren heen zijn gecreëerd. Als ze die goudmijn zouden kunnen omzetten in copiloten, kunnen deze copiloten ons helpen dingen te doen.”

Grote technologiespelers zetten het al aan het werk. Huang legde uit hoe NVIDIA Cohesity, NetApp, SAP, ServiceNow en Snowflake al helpt bij het bouwen van copiloten en virtuele assistenten. En ook industrieën komen tussenbeide.

Op het gebied van telecom kondigde Huang de NVIDIA 6G Research Cloud aan, een generatief AI- en Omniversum-aangedreven platform om het volgende communicatietijdperk vooruit te helpen. Het is gebouwd met NVIDIA's Sionna neurale radioframework, NVIDIA Aerial CUDA-versneld radiotoegangsnetwerk en de NVIDIA Aerial Omniverse Digital Twin voor 6G.

Op het gebied van het ontwerp en de productie van halfgeleiders heeft Huang aangekondigd dat NVIDIA, in samenwerking met TSMC en Synopsys, zijn baanbrekende computationele lithografieplatform, cuLitho, in productie gaat nemen. Dit platform zal de meest rekenintensieve werklast in de halfgeleiderproductie met 40-60x versnellen.

Huang kondigde ook de NVIDIA Earth Climate Digital Twin aan. Het cloudplatform – nu beschikbaar – maakt interactieve simulatie met hoge resolutie mogelijk om klimaat- en weersvoorspellingen te versnellen.

De grootste impact van AI zal in de gezondheidszorg plaatsvinden, zei Huang. Hij legde uit dat NVIDIA al actief is in beeldvormingssystemen, in instrumenten voor gensequencing en samenwerkt met toonaangevende chirurgische roboticabedrijven.

NVIDIA lanceert een nieuw type biologiesoftware. NVIDIA heeft vandaag meer dan twintig nieuwe microservices gelanceerd waarmee gezondheidszorgbedrijven over de hele wereld kunnen profiteren van de nieuwste ontwikkelingen op het gebied van generatieve AI, waar dan ook en in elke cloud. Ze bieden geavanceerde beeldvorming, natuurlijke taal- en spraakherkenning, en het genereren, voorspellen en simuleren van digitale biologie.

Omniverse brengt AI naar de fysieke wereld

De volgende golf van AI zal AI zijn die leert over de fysieke wereld, zei Huang.

“We hebben een simulatie-engine nodig die de wereld digitaal weergeeft voor de robot, zodat de robot een sportschool heeft waar hij kan leren hoe hij een robot moet zijn”, zei hij. “Wij noemen die virtuele wereld Omniversum.”

Daarom heeft NVIDIA vandaag aangekondigd dat NVIDIA Omniverse Cloud beschikbaar zal zijn als API's, waardoor het bereik van 's werelds toonaangevende platform voor het creëren van industriële digitale dubbele applicaties en workflows over het hele ecosysteem van softwaremakers wordt vergroot.

Met de vijf nieuwe Omniverse Cloud-applicatieprogrammeringsinterfaces kunnen ontwikkelaars eenvoudig Omniverse-kerntechnologieën rechtstreeks integreren in bestaande ontwerp- en automatiseringssoftwareapplicaties voor digital twins, of hun simulatieworkflows voor het testen en valideren van autonome machines zoals robots of zelfrijdende voertuigen.

Om te laten zien hoe dit werkt, deelde Huang een demo van een robotmagazijn – met behulp van waarneming en tracking met meerdere camera’s – die over de werknemers waakt en robotheftrucks orkestreert, die autonoom rijden terwijl de volledige robotstapel draait.

Huang kondigde ook aan dat NVIDIA Omniverse naar Apple Vision Pro brengt, waarbij de nieuwe Omniverse Cloud API's ontwikkelaars in staat stellen interactieve industriële digitale tweelingen naar de VR-headsets te streamen.

Enkele van 's werelds grootste producenten van industriële software omarmen Omniverse Cloud API's, waaronder Ansys, Cadence, Dassault Systèmes voor het merk 3DEXCITE, Hexagon, Microsoft, Rockwell Automation, Siemens en Trimble.

Robotica

Alles wat beweegt zal robotachtig zijn, zei Huang. De auto-industrie zal daar een groot deel van uitmaken. NVIDIA-computers zijn al aanwezig in auto's, vrachtwagens, bezorgbots en robotaxis.

Huang heeft aangekondigd dat BYD, 's werelds grootste autonome voertuigbedrijf, de volgende generatie computer van NVIDIA heeft geselecteerd voor zijn AV, en zijn volgende generatie EV-vloten op DRIVE Thor heeft gebouwd.

Om robots te helpen hun omgeving beter te zien, kondigde Huang ook de Isaac Perceptor-softwareontwikkelingskit aan met ultramoderne visuele odometrie met meerdere camera's, 3D-reconstructie en bezettingskaart, en dieptewaarneming.

En om manipulatoren, of robotarmen, beter aanpasbaar te maken, kondigt NVIDIA Isaac Manipulator aan: een ultramoderne bibliotheek voor robotarmperceptie, padplanning en kinematische besturing.

Ten slotte kondigde Huang Project GR00T aan, een algemeen basismodel voor humanoïde robots, ontworpen om het werk van het bedrijf te bevorderen en doorbraken op het gebied van robotica en belichaamde AI te bewerkstelligen.

Ter ondersteuning van die inspanning onthulde Huang een nieuwe computer, Jetson Thor, voor humanoïde robots, gebaseerd op het NVIDIA Thor-systeem-op-een-chip en aanzienlijke upgrades van het NVIDIA Isaac-roboticaplatform.

In zijn laatste minuten bracht Huang een paar kleine, door NVIDIA aangedreven robots van Disney Research op het podium.

“De ziel van NVIDIA – het kruispunt van computergraphics, natuurkunde en kunstmatige intelligentie”, zei hij. “Het kwam allemaal op dit moment tot stand.”