¿Por qué elegir las Instancias P4 de Amazon EC2?
Las instancias P4d de Amazon Elastic Compute Cloud (Amazon EC2) ofrecen un alto rendimiento para el entrenamiento del machine learning (ML) y las aplicaciones de computación de alto rendimiento (HPC) en la nube. Las instancias P4d cuentan con la tecnología de las GPU A100 Tensor Core de NVIDIA y brindan un rendimiento líder del sector y redes de baja latencia. Estas instancias admiten redes de instancias de 400 Gbps. Las instancias P4d ofrecen un costo hasta un 60 % más bajo de entrenamiento de modelos de ML, además de un rendimiento 2,5 veces mejor en promedio para los modelos de aprendizaje profundo, en comparación con las instancias P3 y P3dn de las generaciones anteriores.
Las instancias P4d se implementan en clústeres de hiperescala llamados UltraClusters de Amazon EC2, que se componen de informática, redes y almacenamiento de alto rendimiento de la nube. Cada UltraCluster de EC2 es una de las supercomputadoras más poderosas del mundo, que le ayuda a ejecutar su entrenamiento de ML de varios nodos y cargas de trabajo de HPC distribuidas más complejas. Puede escalar fácilmente de unos pocos a miles de GPU NVIDIA A100 en los UltraClusters EC2, según las necesidades de su proyecto de ML o HPC.
Tanto investigadores, como científicos de datos y desarrolladores pueden usar las instancias P4d para entrenar modelos de ML para casos de uso, como el procesamiento de lenguaje natural, la detección y clasificación de objetos, y los motores de recomendación. También pueden usarlas para ejecutar aplicaciones de HPC, como el descubrimiento farmacéutico, el análisis sísmico y la modelización financiera. A diferencia de los sistemas locales, puede acceder a una capacidad informática y de almacenamiento prácticamente ilimitada, escalar su infraestructura según las necesidades de su negocio y poner en marcha un entrenamiento de ML de varios nodos o una aplicación de HPC distribuida estrechamente asociada en minutos, sin costos de instalación ni de mantenimiento.
Presentación de las nuevas instancias P4d de Amazon EC2
Beneficios
Características
Testimonios de clientes
Estos son algunos ejemplos de cómo los clientes y socios lograron sus objetivos empresariales con las instancias P4 de Amazon EC2.
-
Toyota Research Institute (TRI)
Toyota Research Institute (TRI), fundado en 2015, trabaja para desarrollar la conducción automatizada, robótica y otras tecnologías de amplificación humana para Toyota.
-
TRI-AD
-
TRI-AD
-
GE Healthcare
GE Healthcare es un innovador líder a nivel mundial de tecnología médica y soluciones digitales. GE Healthcare les permite a los médicos tomar decisiones más rápidas e informadas gracias a dispositivos inteligentes, análisis de datos, aplicaciones y servicios, compatibles con Edison, su plataforma de inteligencia.
-
HEAVY.AI
HEAVY.AI es pionera en los análisis acelerados. La plataforma HEAVY.AI se usa en los negocios y el Gobierno para encontrar información en los datos más allá de los límites de las herramientas analíticas generales.
-
Zenotech Ltd.
Zenotech Ltd. redefine la ingeniería online mediante el uso de nubes de HPC que ofrecen modelos de licencia bajo demanda además de beneficios extremos de rendimiento al aprovechar las GPU.
-
Aon
Aon es una empresa de servicios profesionales líder en el mundo que ofrece una gran variedad de soluciones de riesgos, jubilación y salud. Aon PathWise es una solución de administración de riesgos de HPC basada en GPU y escalable que pueden utilizar las aseguradoras, las reaseguradoras, los bancos y los fondos de retiro para abordar los desafíos principales de la actualidad, como la prueba de estrategias de cobertura, el pronóstico regulatorio y económico, y la generación de presupuestos.
-
Rad AI
Compuesta por expertos en IA y radiología, Rad AI desarrolla productos que maximizan la productividad de los radiólogos, lo que, en última instancia, hace que la sanidad sea mucho más accesible y que mejoren los resultados de los pacientes. Lea el caso práctico para obtener más información
Detalles del producto
Tamaño de la instancia | vCPU | Memoria de la instancia (GiB) | GPU: A100 | Memoria de GPU | Ancho de banda de la red (Gbps) | GPUDirect RDMA | GPU de pares | Almacenamiento de instancias (GB) | Ancho de banda de EBS (Gbps) | Precio de la instancia bajo demanda por hora | Por hora real en una instancia reservada por 1 año* | Por hora real en una instancia reservada por 3 años* |
---|---|---|---|---|---|---|---|---|---|---|---|---|
p4d.24xlarge | 96 | 1152 | 8 | 320 GB HBM2 |
400 ENA y EFA | Sí | 600 GB/s NVSwitch | 8 x 1000 SSD NVMe | 19 | 32,77 USD | 19,22 USD | 11,57 USD |
p4de.24xlarge (versión preliminar) | 96 | 1152 | 8 | 640 GB HBM2e |
400 ENA y EFA | Sí | 600 GB/s NVSwitch | 8 x 1000 SSD NVMe | 19 | 40,96 USD | 24,01 USD | 14,46 USD |
Las instancias P4d están disponibles en las regiones de Este de EE. UU. (Norte de Virginia y Ohio), Oeste de EE. UU. (Oregón), Asia-Pacífico (Seúl y Tokio) y Europa (Fráncfort e Irlanda). Las instancias P4de están disponibles en las regiones de AWS Este de EE. UU. (Norte de Virginia) y Oeste de EE. UU. (Oregón).
Los clientes pueden adquirir instancias P4d y P4de como instancias bajo demanda, instancias reservadas, instancias de spot, hosts dedicados o como parte de Savings Plans.
Introducción a las instancias P4d para ML
Introducción a las instancias P4d para HPC
Las instancias P4d son ideales para ejecutar simulaciones de ingeniería, finanza computacional, análisis sísmico, modelado molecular, genómica, representaciones y otras cargas de trabajo de HPC con GPU. Con frecuencia, las aplicaciones de HPC exigen un alto nivel de rendimiento de red, almacenamiento ágil, gran capacidad de memoria, capacidades informáticas altas o todas estas características juntas. Las instancias P4d son compatibles con EFA, que permite que las aplicaciones de HPC que utilizan Message Passing Interface (MPI) escalen a miles de GPU. AWS Batch y AWS ParallelCluster ayudan a los desarrolladores de HPC a crear y escalar rápidamente aplicaciones de HPC distribuidas.