為什麼選擇 Amazon EC2 P3 執行個體?
Amazon EC2 P3 執行個體提供雲端環境的高效能運算技術,配備高達 8 個 NVIDIA® V100 Tensor 核心 GPU 和 100 Gbps 的網路輸送量,能支援機器學習和 HPC 應用程式。每個執行個體可提供高達 1 petaflop 的混合精度,能大幅加快機器學習和高效能運算應用的速度。經證實,Amazon EC2 P3 執行個體可將機器學習訓練時間從數天縮短至數分鐘,並使高效能運算執行模擬的次數提升 3-4 倍。
Amazon EC2 P3dn.24xlarge 執行個體為目前最新推出的 P3 系列執行個體,網路頻寬較 P3.16xlarge 執行個體提升 4 倍,可讓分散式機器學習和 HPC 應用程式得到最佳化的使用效能。這些執行個體可提供高達 100 Gbps 的聯網輸送量,並搭載 96 個客製化 Intel Xeon 可擴充處理器 (Skylake) vCPU、8 個 NVIDIA® Tesla® V100 核心 GPU、32 GiB 記憶體,以及 1.8 TB 容量的本機 NVMe 型 SSD 儲存空間。P3dn.24xlarge 執行個體還支援 Elastic Fabric Adapter (EFA),可加速使用 NVIDIA Collective Communications Library (NCCL) 的分散式機器學習應用程式。EFA 可擴展至數千個 GPU,顯著提高深度學習培訓模型的輸送量和擴展能力,從而更快獲致結果。
Amazon EC2 P3 執行個體概觀
優勢
客戶見證
以下是客戶和合作夥伴如何透過 Amazon EC2 P3 執行個體實現業務目標的範例。
-
Airbnb
Airbnb 使用機器學習來優化搜尋建議,並為旅館老闆改進動態定價指南,這兩方面都可以轉化為更高的訂房轉換率。使用 Amazon EC2 P3 執行個體,Airbnb 有能力更快地執行訓練工作負載、更常重複使用、建立更好機器學習模型並降低成本。
-
Celgene
Celgene 是一家全球生物技術公司,正在開發與患者相匹配治療的針對性療法。該公司在 Amazon EC2 P3 執行個體上執行其 HPC 工作負載,用於新一代基因組測序和化學模擬。憑藉此計算能力,Celgene 可以訓練深度學習模型,以區分惡性細胞和良性細胞。在使用 P3 執行個體之前,執行大規模的計算工作需要兩個月,現在只需四個小時。AWS 技術讓 Celgene 能夠加快針對癌症和炎性疾病卡發藥物治療。
-
Hyperconnect
-
NerdWallet
NerdWallet 是一家個人金融新創公司,提供的工具和建議使客戶可以輕鬆償還債務、選擇最佳的金融產品和服務,並實現主要的人生目標,如購房或退休儲蓄。該公司高度依賴資料科學和機器學習 (ML) 來將客戶與個人化金融產品聯繫起來。
-
PathWise Solutions Group
Aon 是品質系統解決方案的領導者,其 PathWise 是以雲端為基礎的 SaaS 應用套件,專門用於企業風險管理建模,可為一系列客戶提供快速、可靠、安全的隨需服務。
-
Pinterest
Pinterest 使用 AWS 上的 P3 執行個體中的混合精確度訓練,加快深度學習模型的訓練,並使用這些執行個體來更快速推論這些模型,為使用者提供快速而獨特的探索體驗。Pinterest 使用了使用 AWS 上的 PyTorch 製作的 PinSage。此 AI 模型根據特定主題將圖像組合在一起。平台上有 30 億張圖像,有 180 億個不同的關聯可以連接圖像。這些關聯協助 Pinterest 全盤了解主題、樣式,以及提供更個人化的使用者體驗。
-
Salesforce
Salesforce 將機器學習運用在 Einstein Vision,讓開發人員能夠將影像辨識功能應用在視覺搜尋、品牌偵測和產品識別等使用案例。Amazon EC2 P3 執行個體可讓開發人員更快地訓練深度學習模型,以便更迅速地實現機器學習目標。
-
Schrodinger
Schrodinger 使用高效能運算 (HPC) 開發預測模型,以擴大探索和優化的規模,並讓我們的客戶能夠更快地將救命藥物推向市場。相較於 P2 執行個體,Amazon EC2 P3 執行個體可讓 Schrodinger 在一天內執行四倍的模擬。
-
Subtle Medical
Subtle Medical 是一家醫療保健技術公司,致力於透過創新的深度學習解決方案,提高醫學成像效率和患者體驗。其團隊由斯坦福、麻省理工學院、MD Anderson 等著名的影像科學家、放射學家和 AI 專家組成。
-
Western Digital
Western Digital 使用 HPC,為材料科學、熱流動、磁性和資料傳輸執行數以萬計的模擬,以提高磁碟機和儲存解決方案的效能和品質。根據早期的測試,相較於之前部署的解決方案,P3 執行個體可讓工程團隊將執行模擬的速度提高至少三倍。
Amazon EC2 P3 執行個體和 Amazon SageMaker
Amazon EC2 P3 執行個體和 AWS 深度學習 AMI
預先安裝的開發環境,快速開始建立深度學習應用程式
對於有更多客製化需求的開發人員,可使用 AWS Deep Learning AMI 來代替 Amazon SageMaker,該 AMI 可為機器學習從業人員和研究人員提供各種基礎設施和工具,以加速雲端中各種規模的深度學習。您可以快速啟動已預先安裝常用深度學習架構 (例如 TensorFlow、PyTorch、Apache MXNet、Microsoft Cognitive Toolkit、Caffe、Caffe2、Theano、Torch、Chainer、Gluon 和 Keras) 的 Amazon EC2 P3 執行個體,以訓練複雜的自訂 AI 模型、試驗新的演算法,或學習新的技能和技術。 進一步了解
Amazon EC2 P3 執行個體和高效能運算
使用 AWS 上的 HPC 功能解決大型運算問題並取得全新洞見
Amazon EC2 P3 執行個體是執行工程模擬、計算金融、地震分析、分子建模、基因體、轉譯和其他 GPU 運算工作負載的理想平台。高效能運算 (HPC) 可讓科學家和工程師解決這些複雜、運算密集的問題。HPC 應用程式通常需要高速網路效能、快速儲存、大量記憶體、超強運算能力,也可能需要以上所有特點。AWS 透過在雲端執行 HPC,並能擴展到超過大部分現場部署環境實際可行的大量平行任務,讓您加快研究速度,又能縮短得出結果的時間。例如,P3dn.24xlarge 執行個體支援 Elastic Fabric Adapter (EFA),可讓 HPC 應用程式利用訊息傳遞介面 (MPI) 擴展至數千個 GPU。AWS 提供針對特定應用程式優化的解決方案來降低成本,無須投資大量資本。 進一步了解
支援 NVIDIA RTX Virtual Workstation
NVIDIA RTX Virtual Workstation AMI 使用強大的 P3 執行個體搭配 AWS 雲端中執行的 NVIDIA Volta V100 GPU,交付高圖形效能。這些 AMI 已預先安裝最新的 NVIDIA GPU 圖形軟體和最新的 RTX 驅動程式和 NVIDIA ISV 認證,並支援高達四個 4K 桌面解析度。採用 NVIDIA V100 GPU 的 P3 執行個體與 RTX vWS 結合,可在雲端交付高效能工作站,其中包含高達 32 GiB 的 GPU 記憶體、快速光線追蹤和 AI 驅動轉譯功能。
全新的 AMI 可在 AWS Marketplace 取得並支援 Windows Server 2016 和 Windows Server 2019。
Amazon EC2 P3dn.24xlarge 執行個體
Amazon EC2 P3 執行個體產品詳細資訊
執行個體大小 | GPU – Tesla V100 | GPU P2P | GPU 記憶體 (GB) | vCPU | 記憶體 (GB) | 網路頻寬 | EBS 頻寬 | 隨需價格/小時* | 1 年預留執行個體實際小時費率* | 3 年預留執行個體實際小時費率* |
---|---|---|---|---|---|---|---|---|---|---|
p3.2xlarge | 1 | 無 | 16 | 8 | 61 | 高達 10 Gbps | 1.5Gbps | 3.06 USD | 1.99 USD | 1.05 USD |
p3.8xlarge | 4 |
NVLink | 64 | 32 | 244 | 10Gbps | 7Gbps | 12.24 USD | 7.96 USD | 4.19 USD |
p3.16xlarge | 8 | NVLink | 128 | 64 | 488 | 25Gbps | 14Gbps | 24.48 USD | 15.91 USD | 8.39 USD |
p3dn.24xlarge | 8 | NVLink | 256 | 96 | 768 | 100Gbps | 19Gbps | 31.218 USD | 18.30 USD | 9.64 USD |
* - 所示價格是針對美國東部 (維吉尼亞北部) AWS 區域的 Linux/Unix,四捨五入到最接近的分。如需完整的定價詳情,請參閱 Amazon EC2 定價頁面。
客戶能以隨需執行個體、預留執行個體、Spot 執行個體及專用主機等形式購買 P3 執行個體。
按秒計費
雲端運算的諸多優勢之一是能在需要時,可彈性佈建或取消佈建資源。我們精準到秒計費,讓客戶能夠提高彈性、節省費用,並使他們能夠優化資源分配,實現機器學習目標。
預留執行個體定價
相較於隨需執行個體的定價,預留執行個體可提供您更多的折扣 (最多 75%)。此外,將預留執行個體指派到特定可用區域時,可提供容量保留,讓您更能夠確信可在需要時啟動執行個體。
Spot 定價
在 Spot 執行個體執行的這段時間,您將持續支付生效的 Spot 價格。Spot 執行個體的價格由 Amazon EC2 制定,然後根據 Spot 執行個體容量的長期供需趨勢逐漸調整。相較於隨需定價,Spot 執行個體可獲得高達 90% 的折扣。
最廣泛的全球可用性
Amazon EC2 P3.2xlarge、P3.8xlarge 和 P3.16xlarge 執行個體可在 14 個 AWS 區域中使用,因此客戶可以靈活地在資料存放所在地訓練和部署機器學習模型。可使用 P3 的區域包括美國東部 (維吉尼亞北部)、美國東部 (俄亥俄)、美國西部 (奧勒岡)、加拿大 (中部)、歐洲 (愛爾蘭)、歐洲 (法蘭克福)、歐洲 (倫敦)、亞太區域 (東京)、亞太區域 (首爾)、亞太區域 (雪梨)、亞太區域 (新加坡)、中國 (北京)、中國 (寧夏) 和 GovCloud (美國西部) 等 AWS 區域。
亞太地區 (東京)、歐洲 (愛爾蘭)、美國東部 (維吉尼亞北部)、美國西部 (奧勒岡)、GovCloud (美國西部) 和 GovCloud (美國東部) AWS 區域提供 P3dn.24xlarge 執行個體。
開始使用 Amazon EC2 P3 執行個體進行機器學習
若要在幾分鐘內開始使用,請進一步了解 Amazon SageMaker,或使用已預先安裝熱門深度學習架構 (如 Caffe2 和 MXNet) 的 AWS 深度學習 AMI。此外,您也可以使用 NVIDIA AMI,搭配預先安裝的 GPU 驅動程式和 CUDA 工具組。