Por que usar instâncias P3 do Amazon EC2?
As instâncias P3 do Amazon EC2 fornecem computação de alta performance na nuvem com até 8 GPUs com NVIDIA® V100 Tensor Core e taxa de transferência de rede de até 100 Gbps para machine learning e aplicativos de HPC. As instâncias possuem até 1 petaflop de desempenho de precisão mista para acelerar significativamente o machine learning e os aplicativos de computação de alta performance. As instâncias P3 do Amazon EC2 demonstraram ser capazes de reduzir o tempo de treinamento de machine learning de dias para minutos, além de aumentar o número de simulações finalizadas para computação de alta performance em 3-4x.
Com até quatro vezes a largura de banda de instâncias P3.16xlarge, as instâncias P3dn.24xlarge do Amazon EC2 são os membros mais novos da família P3, otimizadas para aplicações HPC e machine learning distribuído. Essas instâncias fornecem até 100 Gbps de taxa de transferência de redes, 96 vCPUs Intel® Xeon® escaláveis (Skylake) personalizadas, 8 GPUs NVIDIA® V100 Tensor Core com 32 GiB de memória cada e 1,8 TB de armazenamento SSD baseado em NVMe. As instâncias P3dn.24xlarge também oferecem suporte ao Elastic Fabric Adapter (EFA), que acelera as aplicações distribuídas de machine learning que usam a NVIDIA Collective Communications Library (NCCL). O EFA pode escalar milhares de GPUs, melhorando consideravelmente o rendimento e a escalabilidade dos modelos de treinamento de aprendizagem profunda e possibilitando resultados mais rápidos.
Visão geral de instâncias P3 do Amazon EC2
Benefícios
Depoimentos de clientes
Aqui estão alguns exemplos de como clientes e parceiros alcançaram suas metas de negócios com as instâncias P3 do Amazon EC2.
-
Airbnb
A Airbnb está usando o machine learning para otimizar recomendações de pesquisa e aprimorar a orientação para a definição de preço dinâmica para os anfitriões. O resultado: aumento das conversões das reservas. Com as instâncias P3 do Amazon EC2, a Airbnb pode agilizar a execução de cargas de trabalho de treinamento, executar mais iterações, criar melhores modelos de machine learning e reduzir custos.
-
Celgene
A Celgene é uma empresa de biotecnologia global que está desenvolvendo terapias direcionadas para buscar o melhor tratamento para cada paciente. A empresa executa seu volume de trabalho de HPC para o sequenciamento de genoma de próxima geração e simulações químicas nas instâncias P3 do Amazon EC2. Com este poder computacional, a Celgene pode treinar modelos de aprendizagem profunda para distinguir células malignas das benignas. Antes de começar a usar as instâncias P3, a empresa levava dois meses para executar tarefas de larga escala computacional. Agora, leva apenas quatro horas. A tecnologia da AWS permitiu à Celgene acelerar o desenvolvimento de medicamentos terapêuticos para câncer e doenças inflamatórias.
-
Hyperconnect
A Hyperconnect é especializada na aplicação de novas tecnologias baseadas em machine learning no processamento de imagens e vídeos e foi a primeira empresa a desenvolver webRTC para plataformas móveis.
-
NerdWallet
A NerdWallet é uma startup de finanças pessoais que fornece ferramentas e conselhos para facilitar aos clientes o pagamento de dívidas, a escolha dos melhores produtos e serviços financeiros e lidar com os principais objetivos da vida, como comprar uma casa ou poupar para a aposentadoria. A empresa depende muito de ciência de dados e machine learning (ML) para conectar clientes com produtos financeiros personalizados.
-
PathWise Solutions Group
Líder em soluções de sistemas de qualidade, o PathWise da Aon é um conjunto de aplicações SaaS baseado em nuvem voltado para a modelagem de gerenciamento de riscos corporativos que fornece velocidade, confiabilidade, segurança e serviços sob demanda a uma variedade de clientes.
-
Pinterest
O Pinterest usa treinamento de precisão mista em instâncias P3 na AWS para acelerar o treinamento de modelos de aprendizagem profunda. Também usa essas instâncias para acelerar a inferência desses modelos, permitindo uma experiência de descoberta rápida e exclusiva para os usuários. O Pinterest utiliza PinSage, criado usando PyTorch na AWS. Este modelo de IA agrupa imagens com base em determinados temas. Com 3 bilhões de imagens na plataforma, há 18 bilhões de associações diferentes que conectam as imagens. Essas associações ajudam o Pinterest a contextualizar temas e estilos e a produzir experiências de usuário mais personalizadas.
-
Salesforce
A Salesforce está usando o machine learning para impulsionar o Einstein Vision, permitindo que os desenvolvedores aproveitem o poder do reconhecimento de imagens para casos de uso, como pesquisa visual, detecção de marca e identificação de produto. As instâncias P3 do Amazon EC2 permitem que os desenvolvedores treinem modelos de aprendizado profundo com mais rapidez para que possam atingir rapidamente suas metas de machine learning.
-
Schrodinger
A Schrodinger usa a computação de alta performance (HPC) para desenvolver modelos preditivos a fim de ampliar a escala da descoberta e da otimização e oferecer aos clientes a capacidade de acelerar a disponibilização no mercado de medicamentos que salvam vidas. As instâncias P3 do Amazon EC2 permitem que a Schrodinger realize quatro vezes mais simulações em um dia do que com instâncias P2.
-
Subtle Medical
A Subtle Medical é uma empresa de tecnologia da área de saúde que trabalha para melhorar a eficiência das imagens médicas e a experiência do paciente com soluções inovadoras de aprendizado profundo. Sua equipe é formada por renomados cientistas de imagem, radiologistas e especialistas em AI de Stanford, MIT, MD Anderson dentre outras.
-
Western Digital
A Western Digital usa HPC para executar dezenas de milhares de simulações de ciências de materiais, fluxos de calor, magnetismo e transferência de dados para melhorar a performance e a qualidade das unidades de disco e armazenamento. Com base nos testes iniciais, as instâncias P3 permitem que as equipes de engenharia executem simulações pelo menos três vezes mais rápido do que as soluções implantadas anteriormente.
Instâncias P3 do Amazon EC2 e Amazon SageMaker
Instâncias P3 do Amazon EC2 e AMIs do AWS Deep Learning
Ambientes de desenvolvimento pré-configurados para iniciar rapidamente a criação de aplicativos de aprendizado profundo
Uma alternativa ao Amazon SageMaker para desenvolvedores que tenham requisitos mais personalizados, as AMIs do AWS Deep Learning fornecem aos profissionais e pesquisadores de machine learning a infraestrutura e as ferramentas para acelerar o aprendizado profundo na nuvem, em qualquer escala. Você pode executar rapidamente instâncias P3 do Amazon EC2 que já contêm estruturas de aprendizado profundo comuns, como TensorFlow, PyTorch, Apache MXNet, Microsoft Cognitive Toolkit, Caffe, Caffe2, Theano, Torch, Chainer, Gluon e Keras para treinar modelos de IA sofisticados e personalizados, experimentar novos algoritmos ou aprender novas habilidades e técnicas. Saiba mais
Instâncias P3 do Amazon EC2 e computação de alta performance
Resolva problemas computacionais de grande porte e obtenha novos insights usando os recursos avançados de HPC na AWS
As instâncias P3 do Amazon EC2 são uma plataforma ideal para executar simulações de engenharia, finanças computacionais, análise sísmica, modelagem molecular, genômica, renderização e outras cargas de trabalho de computação de GPU. A Computação de Alta Performance (HPC) permite que cientistas e engenheiros solucionem esses problemas complexos e que fazem uso intenso de computação. Geralmente, os aplicativos de HPC exigem redes de alta performance, armazenamento rápido, grandes quantidades de memória, recursos elevados de computação ou todos esses itens. A AWS permite aumentar a velocidade da pesquisa e reduzir o tempo para a obtenção de resultados executando HPC na nuvem e escalando para comportar uma quantidade de tarefas em paralelo maior que a possível em ambientes locais. Por exemplo, instâncias P3dn.24xlarge oferecem suporte ao Elastic Fabric Adapter (EFA), que permite que aplicativos de HPC usem a Message Passing Interface (MPI – Interface de passagem de mensagens) para escalar milhares de GPUs. A AWS ajuda a reduzir custos fornecendo soluções otimizadas para aplicativos específicos, sem necessidade de grandes investimentos de capital. Saiba mais
Suporte para o NVIDIA RTX Virtual Workstation
As AMIs com o NVIDIA RTX Virtual Workstation oferecem alta performance gráfica usando as avançadas instâncias P3 com GPUs NVIDIA Volta V100, executadas na Nuvem AWS. Essas AMIs contam com o mais recente software gráfico de GPU NVIDIA, pré-instalado juntamente com os mais recentes drivers RTX e certificações NVIDIA ISV com compatibilidade com até quatro resoluções de desktop 4K. As instâncias P3 com GPUs NVIDIA V100 combinadas com RTX vWS oferecem uma estação de trabalho de alta performance na nuvem com até 32 GiB de memória de GPU, ray tracing rápido e renderização alimentada por IA.
As novas AMIs estão disponíveis no AWS Marketplace com suporte para Windows Server 2016 e Windows Server 2019.
Instâncias P3dn.24xlarge do Amazon EC2
Detalhes do produto da instância P3 do Amazon EC2
Tamanho de instância | GPUs – Tesla V100 | Peer-to-peer de GPUs | Memória de GPU (GB) | vCPUs | Memória (GB) | Largura de banda de rede | Largura de banda do EBS | Preço sob demanda/hora* | Instância reservada por 1 ano – por hora* | Instância reservada por 3 anos – por hora* |
---|---|---|---|---|---|---|---|---|---|---|
p3.2xlarge | 1 | N/D | 16 | 8 | 61 | Até 10 Gbps | 1,5 Gbps | 3,06 USD | 1,99 USD | 1,05 USD |
p3.8xlarge | 4 |
NVLink | 64 | 32 | 244 | 10 Gbps | 7 Gbps | 12,24 USD | 7,96 USD | 4,19 USD |
p3.16xlarge | 8 | NVLink | 128 | 64 | 488 | 25 Gbps | 14 Gbps | 24,48 USD | 15,91 USD | 8,39 USD |
p3dn.24xlarge | 8 | NVLink | 256 | 96 | 768 | 100 Gbps | 19 Gbps | 31,218 USD | 18,30 USD | 9,64 USD |
* - Os preços apresentados são para Linux/Unix na região da AWS no Leste dos EUA (Norte da Virgínia) e arredondados para o centavo mais próximo. Para obter detalhes de preços completos, consulte a página de definição de preço do Amazon EC2.
Os clientes podem adquirir instâncias P3 como instâncias sob demanda, instâncias reservadas, instâncias spot ou hosts dedicados.
Faturamento a cada segundo
Uma das muitas vantagens da computação em nuvem é a natureza elástica do provisionamento ou do desprovisionamento de recursos conforme necessário. Ao realizarmos o faturamento a cada segundo, permitimos que os clientes aumentem a elasticidade, economizem dinheiro e otimizem a alocação de recursos para atingir suas metas de machine learning.
Definição de preço de instância reservada
As instâncias reservadas proporcionam um desconto significativo (até 75%) em comparação com a definição de preço das instâncias sob demanda. Além disso, quando as instâncias reservadas são atribuídas a uma zona de disponibilidade específica, elas disponibilizam uma reserva de capacidade, proporcionando a você uma segurança adicional com relação à sua capacidade de executar instâncias quando for necessário.
Definição de preço do spot
Com as instâncias spot, você paga o preço spot em vigor pelo período de execução das instâncias. Os preços de instâncias spot são definidos pelo Amazon EC2 e ajustados gradualmente de acordo com tendências de longo prazo da oferta e da demanda de capacidade de instâncias spot. As instâncias spot estão disponíveis com um desconto de até 90% quando comparadas à definição de preço das instâncias sob demanda.
A maior disponibilidade global
As instâncias P3.2xlarge, P3.8xlarge e P3.16xlarge do Amazon EC2 estão disponíveis em 14 regiões da AWS para que os clientes tenham a flexibilidade de treinar e implantar modelos de machine learning onde quer que os dados estejam armazenados. A instância P3 está disponível nas regiões da AWS Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Canadá (Central), Europa (Irlanda), Europa (Frankfurt), Europa (Londres), Ásia-Pacífico (Tóquio), Ásia-Pacífico (Seul), Ásia-Pacífico (Sydney), Ásia-Pacífico (Cingapura), China (Pequim), China (Ningxia) e GovCloud (Oeste dos EUA).
As instâncias P3dn.24xlarge estão disponíveis nas regiões da AWS Ásia-Pacífico (Tóquio), Europa (Irlanda), Leste dos EUA (Norte da Virgínia), Oeste dos EUA (Oregon), GovCloud (Oeste dos EUA) e GovCloud (Leste dos EUA).
Comece a usar as instâncias P3 do Amazon EC2 para machine learning
Para começar a usar em poucos minutos, saiba mais sobre o Amazon SageMaker ou use a AMI do AWS Deep Learning, que contém estruturas comuns de aprendizado profundo pré-instaladas, como Caffe2 e MXNet. Como alternativa, você também pode usar a AMI NVIDIA com o driver da GPU e o toolkit do CUDA pré-instalados.