Projet Ceiba

Construction de l’un des plus grands superordinateurs IA au monde dans le cloud

Construction de l’un des plus grands superordinateurs IA au monde dans le cloud

Le projet Ceiba, une collaboration révolutionnaire entre AWS et NVIDIA, vise à repousser les limites de l’intelligence artificielle (IA) en construisant l’un des plus grands superordinateurs IA dans le cloud. Hébergé exclusivement sur AWS, ce superordinateur de pointe alimentera les efforts de recherche et développement de NVIDIA dans le domaine de l’IA.

Favorisez l’innovation de pointe

Les équipes de recherche et développement de NVIDIA exploiteront l’immense puissance du projet Ceiba pour faire avancer un large éventail de domaines de pointe, notamment les grands modèles de langage (LLM), le graphisme (images, vidéos et génération 3D), la simulation, la biologie numérique, la robotique, les véhicules autonomes, les prévisions climatiques avec NVIDIA Earth-2, et bien plus encore. Cette initiative révolutionnaire propulsera les travaux de NVIDIA visant à faire progresser l’IA générative, façonnant ainsi l’avenir de l’intelligence artificielle et de ses applications dans divers domaines.

Modèle de conception

Infrastructure d’IA évolutive

Le projet Ceiba sera disponible via l’architecture NVIDIA DGX Cloud. DGX Cloud est une plateforme d’IA évolutive de bout en bout destinée aux développeurs, offrant des capacités évolutives basées sur la dernière architecture NVIDIA et co-conçue à chaque niveau avec AWS. DGX Cloud sera disponible sur AWS dans le courant de cette année, et AWS sera le premier fournisseur de services cloud à proposer DGX Cloud basé sur l’architecture NVIDIA Blackwell avec les GB200. Le projet Ceiba repose sur l’infrastructure d’IA spécialement conçue par AWS, conçue pour offrir l’immense échelle, la sécurité renforcée et les performances inégalées nécessaires à un superordinateur de cette envergure.

Modèle de conception

exaflops d’IA traités, environ 375 fois plus puissants que le superordinateur Frontier, le plus rapide au monde

par superpuce, permettant un transfert et un traitement de données ultrarapides

Les GPU NVIDIA Blackwell, le premier superordinateur du genre

Caractéristiques

Ce projet conjoint a posé plusieurs jalons déterminants pour l’industrie :
La configuration du projet Ceiba comprend 20 736 superpuces NVIDIA GB200 Grace Blackwell. Ce superordinateur unique en son genre est construit à l’aide du dernier GB200 NVL72 de NVIDIA, un système rackable refroidi par liquide et doté de la technologie NVLink de cinquième génération, qui peut accueillir 20 736 GPU Blackwell connectés à 10 368 processeurs NVIDIA Grace. Ce superordinateur est capable de traiter 414 exaflops d’IA, soit 375 fois plus puissant que le supercalculateur Frontier, le plus rapide au monde actuel. Si la capacité de supercalcul mondiale actuelle était combinée, elle n’atteindrait pas 1 % de la puissance de calcul représentée par 414 exaflops. Pour donner un ordre d’idée, cela équivaut à avoir plus de 6 milliards d’ordinateurs portables parmi les plus avancés au monde fonctionnant de concert. Pour mettre les choses en perspective, si chaque être humain sur Terre effectuait un calcul par seconde, il lui faudrait plus de 1 660 ans pour atteindre ce que le projet Ceiba peut réaliser en une seconde seulement.

Le projet Ceiba est le premier système à tirer parti des capacités de mise à l’échelle massives rendues possibles par la mise en réseau d’AWS Elastic Fabric Adapter (EFA) de quatrième génération, fournissant un débit réseau sans précédent de 1 600 Gbit/s par superpuce à faible latence et à bande passante élevée, permettant un transfert et un traitement de données ultrarapides. 

Le refroidissement liquide existe depuis des années. Les joueurs l’auront pour leur ordinateur de jeu personnel. Bien qu’il ne s’agisse pas d’une nouvelle technologie, AWS a délibérément choisi le refroidissement par air plutôt que le refroidissement liquide avant le projet Ceiba, pour des raisons de rentabilité. Pour relever les défis liés à la densité de puissance et fournir cette puissance de calcul inégalée dans le cadre du projet Ceiba, AWS a été le premier à utiliser le refroidissement liquide à grande échelle dans les centres de données pour des solutions informatiques hautes performances plus efficaces et durables.

Le projet Ceiba intégrera des fonctionnalités de sécurité de pointe conçues pour protéger même les données d’IA les plus sensibles. L’architecture GPU Blackwell de NVIDIA, qui fournit une communication sécurisée entre les GPU intégrés à AWS Nitro System et aux technologies EFA, permettra de sécuriser les données chiffrées de bout en bout pour les charges de travail de l’IA générative. Cette solution conjointe permet de déchiffrer et de charger des données sensibles d’IA dans les GPU tout en maintenant une isolation complète des opérateurs d’infrastructure. Et ceci tout en vérifiant l’authenticité des applications utilisées pour traiter les données. Grâce à Nitro System, les clients peuvent valider de manière cryptographique leurs applications auprès d’AWS Key Management System (KMS) et ne déchiffrer les données que lorsque les contrôles nécessaires sont réussis, garantissant ainsi un chiffrement de bout en bout de leurs données lorsqu’elles circulent via des charges de travail d’IA génératives. Lisez ce blog et visitez la page Web sur l’IA sécurisée pour en savoir plus.