Por que usar as instâncias P4 do Amazon EC2?
As instâncias P4d do Amazon Elastic Compute Cloud (Amazon EC2) fornecem alta performance para treinamento de machine learning (ML) e aplicações de computação de alta performance (HPC) na nuvem. As instâncias P4d estão equipadas com GPUs NVIDIA A100 Tensor Core e oferecem alto throughput e redes com baixa latência que são líderes do setor. Essas instâncias oferecem suporte a redes de instâncias de 400 Gbps. As instâncias P4d oferecem custo até 60% inferior para treinar modelos de ML, inclusive uma média de performance 2,5 vezes melhor para modelos de aprendizado profundo em comparação com as instâncias P3 e P3dn da geração anterior.
As instâncias P4d são implantadas em clusters de hiperescala chamados Amazon EC2 UltraClusters, compostos pela mais alta performance de computação, redes e armazenamento na nuvem. Cada EC2 UltraCluster é um dos supercomputadores mais poderosos do mundo, que ajuda a executar seus mais complexos treinamentos de ML de vários nós e workloads de HPC distribuídas. Você pode escalar com facilidade de algumas a milhares de GPUs NVIDIA A100 nos EC2 UltraClusters com base em suas necessidades de projeto de ML ou HPC.
Pesquisadores, cientistas de dados e desenvolvedores podem usar instâncias P4d para treinar modelos de ML para casos de uso, como processamento de linguagem natural, detecção e classificação de objetos e mecanismos de recomendação. Também podem ser usadas para executar aplicações de HPC, como descoberta farmacêutica, análise sísmica e modelagem financeira. Ao contrário dos sistemas on-premises, você pode acessar capacidade virtualmente ilimitada de computação e armazenamento, escalar a infraestrutura com base nas necessidades de negócios e ativar um trabalho de treinamento de ML de vários nós ou uma aplicação de HPC distribuída fortemente acoplada em minutos, sem custos de configuração ou de manutenção.
Anúncio das novas instâncias P4d do Amazon EC2
Benefícios
Recursos
Depoimentos de clientes
Aqui estão alguns exemplos de como clientes e parceiros alcançaram suas metas de negócios com as instâncias P4 do Amazon EC2.
-
Toyota Research Institute (TRI)
Fundado em 2015, o Toyota Research Institute (TRI) está trabalhando para desenvolver direção automatizada, robótica e outras tecnologias de amplificação humana para a Toyota.
No TRI, estamos trabalhando para construir um futuro em que todos tenham a liberdade de se locomover. As instâncias P3 da geração anterior nos ajudaram a reduzir o tempo de treinamento de modelos de ML de dias para horas, e estamos ansiosos para utilizar as instâncias P4d, pois a memória de GPU adicional e os formatos flutuantes mais eficientes permitirão que nossa equipe de machine learning treine com modelos mais complexos em uma velocidade ainda maior.
Mike Garrison, líder técnico de engenharia de Infraestrutura do TRI -
TRI-AD
No TRI-AD, estamos trabalhando para construir um futuro no qual todos tenham a liberdade de se locomover e passear, e nos concentramos na redução de acidentes e mortes em veículos usando direção adaptativa e cidade inteligente. Usando as instâncias P4d do Amazon EC2, conseguimos reduzir nosso tempo de treinamento para reconhecimento de objetos em 40% em comparação com instâncias de GPU da geração anterior sem qualquer modificação nos códigos existentes.
Junya Inada, diretora de direção automatizada (reconhecimento) do TRI-AD -
TRI-AD
Usando as instâncias P4d do Amazon EC2, conseguimos reduzir instantaneamente nosso custo de treinamento em comparação com as instâncias de GPU da geração anterior, o que nos possibilitou aumentar o número de equipes trabalhando no treinamento de modelo. Os aprimoramentos das redes em P4d nos permitiu escalar com eficiência para dezenas de instâncias, o que nos deu uma agilidade significativa para otimizar, retreinar e implantar modelos em carros de teste ou em ambientes de simulação para testes adicionais com rapidez.
Jack Yan, diretor sênior de engenharia de infraestrutura do TRI-AD -
GE Healthcare
A GE Healthcare é líder global em tecnologia médica e inova em soluções digitais. A GE Healthcare permite que os profissionais de saúde tomem decisões mais rápidas e embasadas usando dispositivos inteligentes, análise de dados, aplicações e serviços, com o suporte de sua plataforma de inteligência Edison.
Na GE Healthcare, oferecemos aos profissionais de saúde ferramentas que ajudam a agregar dados, aplicar IA e análise a esses dados e a descobrir insights para melhorar os resultados do paciente, aumentar a eficiência e eliminar erros. Nossos dispositivos de geração de imagiologia médica geram grandes quantidades de dados que precisam ser processados por cientistas de dados. Com os clusters de GPU anteriores, levaria dias para treinar modelos complexos de IA, como GANs progressivos, para simulações e visualização dos resultados. A utilização das novas instâncias P4d reduziu o tempo de processamento de dias para horas. Observamos uma velocidade de duas a três vezes maior em modelos de treinamento com vários tamanhos de imagem, ao mesmo tempo em que alcançamos melhor performance com lotes maiores e maior produtividade com um ciclo de desenvolvimento de modelo mais rápido.
Karley Yoder, vice-presidente e gerente geral de inteligência artificial da GM Healthcare -
HEAVY.AI
A HEAVY.AI é pioneira em análise acelerada. A plataforma HEAVY.AI é usada em empresas e agências governamentais para encontrar insights em dados além dos limites das ferramentas de análise convencionais.
Na HEAVY.AI, estamos trabalhando para construir um futuro em que a ciência de dados e a análise convergem para detalhar e fundir silos de dados. Os clientes estão utilizando enormes quantidades de dados capazes de incluir localização e hora para criar uma imagem completa não apenas do que está acontecendo, mas quando e onde, por meio da visualização detalhada de dados espaço-temporais. Nossa tecnologia permite ver tanto a floresta como as árvores. Usando as instâncias Amazon EC2 P4d, fomos capazes de reduzir o custo de implantação de nossa plataforma significativamente em comparação com as instâncias de GPU da geração anterior, o que nos permitiu escalar conjuntos de dados massivos com bom custo-benefício. Os aprimoramentos das redes no A100 aumentaram nossa eficiência ao escalar para bilhões de linhas de dados e permitiram que nossos clientes obtivessem insights ainda mais rapidamente.
Ray Falcione, vice-presidente de setor público dos EUA da HEAVY.AI -
Zenotech Ltd.
A Zenotech Ltd está redefinindo a engenharia on-line usando nuvens de HPC que oferecem modelos de licenciamento sob demanda, juntamente com benefícios de performance extremos utilizando as GPUs.
Na Zenotech, estamos desenvolvendo as ferramentas para permitir que designers criem produtos mais eficientes e sustentáveis. Trabalhamos em vários setores, e nossas ferramentas oferecem melhor insight da performance do produto por meio do uso de simulação em grande escala. O uso das instâncias P4d da AWS nos permite executar simulações 3,5 vezes mais rápido em comparação com a geração anterior de GPUs. Essa maior velocidade reduz significativamente o tempo de resolução, permitindo que nossos clientes coloquem projetos no mercado mais rapidamente ou façam simulações com mais fidelidade do que era possível antes.
Jamil Appa, diretor e cofundador da Zenotech -
Aon
A Aon é uma empresa líder global de serviços profissionais que oferece uma ampla variedade de soluções de risco, aposentadoria e saúde. A Aon PathWise é uma solução de gerenciamento de risco de HPC escalável e baseada em GPU que seguradoras e resseguradoras, bancos e fundos de pensão podem usar para enfrentar os principais desafios atuais, como testes de estratégia de hedge, previsão regulatória e econômica e orçamento.
Na PathWise Solutions Group LLC, nosso produto permite que seguradoras, resseguradoras e fundos de pensão tenham acesso a tecnologia inovadora para resolver rapidamente os principais desafios atuais no setor de seguros, como machine learning, testes de estratégia de hedge, relatórios regulatórios e financeiros, planejamento de negócios e previsão econômica e desenvolvimento de novos produtos e preços. Usando as instâncias P4d do Amazon EC2, podemos oferecer melhorias surpreendentes na velocidade de cálculos de precisão simples e dupla em comparação às instâncias de GPU da geração anterior para cálculos mais exigentes, permitindo que clientes façam uma nova gama de cálculos e previsões pela primeira vez. A velocidade é importante, e continuamos oferecendo valor significativo e a tecnologia mais atual aos nossos clientes graças às novas instâncias da AWS.
Van Beach, líder global de soluções de vida do Aon Pathwise Strategy and Technology Group -
Rad AI
Formada por especialistas em radiologia e IA, a Rad AI desenvolve produtos que maximizam a produtividade do radiologista, tornando os cuidados de saúde mais acessíveis e melhorando os resultados do paciente. Leia o estudo de caso para saber mais
Na Rad AI, nossa missão é ampliar o acesso e a qualidade dos cuidados de saúde para todos. Com foco no fluxo de trabalho de imagiologia médica, a Rad AI poupa tempo dos radiologistas, reduz o esgotamento profissional e aumenta a precisão. Usamos IA para automatizar fluxos de trabalho e ajudar a agilizar os relatórios de radiologia. Com as novas instâncias EC2 P4d, observamos uma inferência mais rápida e a capacidade de treinar modelos 2,4 vezes mais rápido, com maior precisão do que nas instâncias P3 da geração anterior. Isso permite diagnósticos mais rápidos e precisos e maior acesso a serviços de radiologia de alta qualidade fornecidos por nossos clientes nos Estados Unidos.
Doktor Gurson, cofundador da Rad AI
Detalhes do produto
Tamanho da instância | vCPUs | Memória da instância (GiB) | GPU: A100 | Memória de GPU | Largura de banda de rede (Gbps) | RDMA GPUDirect | Peer-to-peer de GPUs | Armazenamento de instâncias (GB) | Largura de banda do EBS (Gbps) | Preço/hr sob demanda | Instância reservada por 1 ano – por hora * | Instância reservada por 3 anos – por hora * |
---|---|---|---|---|---|---|---|---|---|---|---|---|
p4d.24xlarge | 96 | 1.152 | 8 | 320GB HBM2 |
ENA e EFA de 400 | Sim | NVSwitch de 600 GB/s | 8 x 1000 NVMe SSD | 19 | USD 32,77 | USD 19,22 | USD 11,57 |
p4de.24xlarge (pré-visualização) | 96 | 1.152 | 8 | 640 GB HBM2e |
ENA e EFA de 400 | Sim | NVSwitch de 600 GB/s | 8 x 1000 NVMe SSD | 19 | USD 40,96 | USD 24,01 | USD 14,46 |
As instâncias P4d estão disponíveis nas regiões: Leste dos EUA (N. da Virgínia e Ohio), Oeste dos EUA (Oregon), Ásia-Pacífico (Seul e Tóquio) e Europa (Frankfurt e Irlanda). As instâncias P4de estão disponíveis nas regiões Leste dos EUA (N. da Virgínia) e Oeste dos EUA (Oregon).
Os clientes podem adquirir instâncias P4d e P4de como instâncias sob demanda, instâncias reservadas, instâncias spot, hosts dedicados ou parte de um Savings Plan.
Conceitos básicos de instâncias P4d para ML
Conceitos básicos de instâncias P4d para HPC
As instâncias P4d são ideais para executar simulações de engenharia, finanças computacionais, análise sísmica, modelagem molecular, genômica, renderização e outras workloads de HPC baseadas em GPUs. Geralmente, os aplicativos de HPC exigem redes de alta performance, armazenamento rápido, grandes quantidades de memória, recursos elevados de computação ou todos esses itens. As instâncias P4d oferecem suporte EFA, possibilitando que aplicações de HPC usem a Message Passing Interface (MPI) para escalar milhares de GPUs. O AWS Batch e o AWS ParallelCluster ajudam desenvolvedores de HPC a desenvolver e escalar rapidamente aplicações de HPC distribuídas.