Pourquoi choisir les instances Amazon EC2 P4 ?
Les instances P4d Amazon Elastic Compute Cloud (Amazon EC2) offrent des performances élevées pour la formation du machine learning ML et les applications de calcul haute performance (HPC) dans le cloud. Les instances P4d sont optimisées par les GPU NVIDIA A100 Tensor Core et offrent un débit élevé de premier ordre et une mise en réseau à faible latence. Ces instances prennent en charge la mise en réseau d'instances à 400 Gbit/s. Les instances P4d permettent de réduire jusqu'à 60 % le coût d'entraînement des modèles de ML, avec une performance moyenne 2,5 fois supérieure pour les modèles de deep learning par rapport aux instances P3 et P3dn de la génération précédente.
Les instances P4d sont déployées dans des clusters à très grande échelle appelés UltraClusters d'Amazon EC2, et comprenant un calcul, une mise en réseau et du stockage haute performance dans le cloud. Chaque UltraCluster EC2 figure parmi les supercalculateurs les plus puissants au monde, ce qui vous permet d'exécuter l'entraînement ML multinœuds et les charges de travail HPC distribuées les plus complexes. Vous pouvez facilement passer de quelques GPU NVIDIA A100 à des milliers dans les UltraClusters EC2 en fonction des besoins de vos projets en ML ou HPC.
Les chercheurs, les scientifiques des données et les développeurs peuvent utiliser les instances P4d pour entraîner des modèles ML pour des cas d'utilisation, tels que le traitement du langage naturel, la détection et la classification d'objets, et les moteurs de recommandation. Ils peuvent également les utiliser pour exécuter des applications HPC comme la découverte de médicaments, l'analyse sismique et la modélisation financière. Contrairement aux systèmes sur site, vous pouvez accéder à une capacité de calcul et de stockage pratiquement illimitée, faire évoluer votre infrastructure en fonction des besoins de votre entreprise et lancer en quelques minutes une tâche d'entraînement ML multinœuds ou une application HPC distribuée étroitement couplée, sans frais d'installation ou de maintenance.
Annonce des nouvelles instances Amazon EC2 P4d
Avantages
Caractéristiques
Témoignages de clients
Voici quelques exemples de la manière dont les clients et partenaires ont atteint leurs objectifs commerciaux grâce aux instances Amazon EC2 P4.
-
Toyota Research Institute (TRI)
Le Toyota Research Institute (TRI), fondé en 2015, s'emploie à développer la conduite automatisée, la robotique et d'autres technologies d'amplification humaine pour Toyota.
-
TRI-AD
-
TRI-AD
-
GE Healthcare
GE Healthcare est un leader mondial de l'innovation en matière de technologies médicales et de solutions numériques. GE Healthcare permet aux praticiens de prendre des décisions plus rapides et éclairées grâce à des dispositifs intelligents, une analytique des données, des applications et des services, tous pris en charge par la plateforme d'intelligence Edison.
-
HEAVY.AI
HEAVY.AI est un pionnier de l'analytique accélérée. La plateforme HEAVY.AI est utilisée dans les entreprises et les administrations pour identifier des informations dans les données au-delà des limites des outils analytiques traditionnels.
-
Zenotech Ltd.
Zenotech Ltd redéfinit l'ingénierie en ligne grâce à l'utilisation de clouds HPC offrant des modèles de licence à la demande ainsi que des avantages en termes de performances extrêmes grâce à l'utilisation des GPU.
-
Aon
Aon est une entreprise mondiale de services professionnels de premier plan qui propose une large gamme de solutions en matière de risques, de retraite et de santé. Aon PathWise est une solution de gestion des risques HPC basée sur les GPU et pouvant être mise à l'échelle, que les assureurs et réassureurs, les banques et les fonds de pension peuvent utiliser pour relever les principaux défis du moment, tels que les tests de stratégies de couverture, les prévisions réglementaires et économiques, et la budgétisation.
-
Rad AI
Composée d'experts en radiologie et en IA, Rad AI fabrique des produits qui maximisent la productivité des radiologues, ce qui a pour effet de rendre les soins de santé plus largement accessibles et d'améliorer les résultats pour les patients. Consulter l'étude de cas pour en savoir plus
Informations sur le produit
Taille de l'instance | Processeurs virtuels | Mémoire des instances (Gio) | GPU – A100 | Mémoire de GPU | Bande passante du réseau (Gbit/s) | GPUDirect RDMA | Pair à pair GPU | Stockage d'instance (Go) | Bande passante EBS (Gbit/s) | Prix/heure pour les instances à la demande | Tarif horaire effectif des instances réservées sur 1 an* | Tarif horaire effectif des instances réservées sur 3 ans* |
---|---|---|---|---|---|---|---|---|---|---|---|---|
p4d.24xlarge | 96 | 1 152 | 8 | 320 Go HBM2 |
400 ENA et EFA | Oui | NVSwitch 600 Go/s | 8 disques SSD NVMe de 1 000 | 19 | 32,77 USD | 19,22 USD | 11,57 USD |
p4de.24xlarge (version de prévisualisation) | 96 | 1 152 | 8 | 640 Go HBM2e |
400 ENA et EFA | Oui | NVSwitch 600 Go/s | 8 disques SSD NVMe de 1 000 | 19 | 40,96 USD | 24,01 USD | 14,46 USD |
Les instances P4d sont désormais disponibles dans les régions USA Est (Virginie du Nord et Ohio), USA Ouest (Oregon), Asie-Pacifique (Séoul et Tokyo) et Europe (Francfort et Irlande). Les instances P4de sont disponibles dans les régions USA Est (Virginie du Nord) et USA Ouest (Oregon).
Les clients peuvent acheter des instances P4d et P4de sous forme d'instances à la demande, d'instances réservées, d'instances Spot, d'hôtes dédiés ou avec une offre Savings Plan.
Démarrer avec les instances P4d pour ML
Démarrer avec les instances P4d pour le HPC
Les instances P4d sont une plateforme idéale pour exécuter des simulations d'ingénierie, des calculs financiers, des analyses sismiques, des modélisations moléculaires, de la génomique, du rendu et d'autres charges de travail HPC basées sur des GPU. Les applications HPC exigent souvent des performances réseau élevées, un stockage rapide, d'importantes capacités de mémoire, des capacités de calcul élevées ou tous ces éléments. Les instances P4d sont compatibles avec EFA qui permet aux applications HPC utilisant l'interface MPI (Message Passing Interface) de mettre à l'échelle des milliers de GPU. AWS Batch et AWS ParallelCluster aident les développeurs HPC à créer et mettre à l'échelle rapidement des applications HPC distribuées.