料金設定の概要
Amazon SageMaker AI は、機械学習 (ML) に特化した幅広い一連の機能をまとめることで、データサイエンティストとデベロッパーが質の高い ML モデルを迅速に準備、構築、トレーニング、デプロイできるようにサポートします。SageMaker AI は主要な機械学習フレームワーク、ツールキット、およびプログラミング言語をサポートします。
SageMaker AI では、使用した分についての料金のみをお支払いいただきます。支払いの選択肢は 2 つあります。1 つ目はオンデマンド料金で、最低料金や前払いの義務はありません。2 つ目の Amazon SageMaker Savings Plans は、一定の使用量の確約と引き換えに、柔軟な使用量ベースの料金モデルを提供します。
Amazon SageMaker AI 無料利用枠
Amazon SageMaker AI は無料でお試しいただけます。AWS 無料利用枠の一環として、Amazon SageMaker AI の使用を無料で開始できます。無料利用枠は、初めて SageMaker AI リソースを作成した最初の月から始まります。Amazon SageMaker AI の無料利用枠の詳細は、以下の表でご確認いただけます。
Amazon SageMaker AI の機能 | 最初の 2 か月間は 1 か月あたりの無料利用枠を利用可能 |
スタジオノートブック、およびノートブックインスタンス | Studio ノートブックで 250 時間の ml.t3.medium インスタンス、またはノートブックインスタンスで 250 時間 の ml.t2 medium インスタンスまたは ml.t3.medium インスタンス |
RStudio on SageMaker | RSession アプリケーションの ml.t3.medium インスタンスを 250 時間分、および RStudioServerPro アプリケーションの ml.t3.medium インスタンスを無料で提供 |
Data Wrangler | 25 時間の ml.m5.4xlarge インスタンス |
特徴量ストア | 1,000 万書き込みユニット、1,000 万読み取りユニット、25 GB ストレージ (標準オンラインストア) |
トレーニング | 50 時間の m4.xlarge または m5.xlarge インスタンス |
Amazon SageMaker with TensorBoard | 300 時間の ml.r5.large インスタンス |
リアルタイム推論 | 125 時間の m4.xlarge または m5.xlarge インスタンス |
サーバーレス推論 | 150,000 秒のオンデマンド推論時間 |
キャンバス | セッション時間は160時間/月 |
HyperPod | 50 時間の m5.xlarge インスタンス |
オンデマンド料金
-
スタジオクラシック
-
JupyterLab
-
コードエディタ
-
RStudio
-
ノートブックインスタンス
-
処理
-
TensorBoard
-
Data Wrangler
-
Feature Store
-
トレーニング
-
MLflow
-
リアルタイム推論
-
非同期推論
-
バッチ変換
-
サーバーレス推論
-
JumpStart
-
Profiler
-
HyperPod
-
推論の最適化
-
Sagemaker パートナーの AI アプリケーション
-
スタジオクラシック
-
Amazon SageMaker Studio クラシック
Studio Classic は、従来の IDE エクスペリエンスの中でもワンステップの Jupyter notebooks を提供します。基盤となるコンピューティングリソースは完全に伸縮自在であり、ノートブックは他の人と簡単に共有できるため、シームレスなコラボレーションが可能になります。使用期間に基づいて、選択したインスタンスタイプについて課金されます。 -
JupyterLab
-
Amazon SageMaker JupyterLab
フルマネージド型 JupyterLab を数秒で起動できます。ノートブック、コード、データ用の最新の Web ベースのインタラクティブ開発環境を使用してください。使用期間に基づいて、選択したインスタンスタイプについて課金されます。 -
コードエディタ
-
Amazon SageMaker コードエディター
Code-OSS (Visual Studio Code — オープンソース) をベースにしたコードエディターを使用すると、分析コードや ML コードの記述、テスト、デバッグ、実行を行うことができます。SageMaker Studio と完全に統合されており、Open VSX 拡張レジストリで利用可能な IDE 拡張機能をサポートしています。 -
RStudio
-
RStudio
RStudio は、モデル開発を加速し、生産性を向上させるためのオンデマンドクラウドコンピューティングリソースを提供します。 RStudio Session アプリケーションと RStudio Server Pro アプリケーションを実行するために選択したインスタンスタイプに対して課金されます。
RStudioServerPro アプリケーション
-
ノートブックインスタンス
-
ノートブックインスタンス
ノートブックインスタンスは、Jupyter Notebook アプリを実行するコンピューティングインスタンスです。使用期間に基づいて、選択したインスタンスタイプについて課金されます。
-
処理
-
Amazon SageMaker Processing
Amazon SageMaker Processing を使用すると、フルマネージド型のインフラストラクチャで前処理、後処理、およびモデル評価のワークロードを簡単に実行できます。使用期間に基づいて、選択したインスタンスタイプについて課金されます。
-
TensorBoard
-
Amazon SageMaker with TensorBoard
Amazon SageMaker with TensorBoard は、Amazon SageMaker トレーニングジョブのモデルコンバージェンスの問題を視覚化およびデバッグするためのホスト型 TensorBoard エクスペリエンスを提供します。
-
Data Wrangler
-
Amazon SageMaker Data Wrangler
Amazon SageMaker Data Wrangler は、機械学習用のデータを集約して準備するのにかかる時間を数週間から数分に短縮します。データのクレンジング、探索、および視覚化に使用した時間について料金をお支払いいただきます。SageMaker Data Wrangler インスタンスを実行しているお客様には、以下の価格が適用されます。* SageMaker Canvas ワークスペースインスタンスで SageMaker Data Wrangler を実行しているお客様には、SageMaker Canvas の料金が適用されます。詳細については、SageMaker Canvas の料金ページをご覧ください。
Amazon SageMaker Data Wrangler ジョブ
Amazon SageMaker Data Wrangler ジョブは、データフローが SageMaker Data Wrangler からエクスポートされるときに作成されます。SageMaker Data Wrangler ジョブを使用すると、データ準備ワークフローを自動化できます。SageMaker Data Wrangler ジョブは、データ準備ワークフローを新しいデータセットに再適用して時間を節約するのに役立ち、秒単位で請求されます。
-
Feature Store
-
Amazon SageMaker Feature Store
Amazon SageMaker Feature Store は、機械学習のために特徴量を取り込み、保存し、提供するための一元的なリポジトリです。SageMaker Feature Store への特徴量グループでの書き込み、読み取り、およびデータストレージには料金がかかりますが、標準オンラインストアとインメモリオンラインストアでは料金が異なります。標準オンラインストアでは、データストレージは 1 か月あたり GB 単位で課金されます。スループットについては、オンデマンドまたはプロビジョニングされたキャパシティーモードを選択できます。オンデマンドの場合、書き込みは KB あたりの書き込みリクエストユニットとして課金され、読み取りは 4 KB あたりの読み取りリクエストユニットとして課金されます。プロビジョニングされたキャパシティーモードでは、アプリケーションに必要と予想される読み込みと書き込みのキャパシティーを指定します。Sagemaker Feature Store では、1 秒あたりの書き込みごとに 1 つの WCU (最大 1 KB)、1 秒あたりの読み取りごとに 1 つの RCU (最大 4 KB) が課金されます。特徴量グループにプロビジョニングされたスループットキャパシティ (読み取りと書き込み) については、プロビジョニングされた容量を完全に利用しなかった場合でも課金されます。
インメモリオンラインストアでは、書き込みは KB ごとに書き込みリクエストユニットとして課金され、書き込み 1 回につき最低 1 ユニット、読み取りは KB ごとに読み取りリクエストユニットとして課金され、読み取り 1 回につき最低 1 ユニット、データストレージは 1 時間あたり GB あたりで課金されます。インメモリオンラインストアには、1 時間あたり 5 GiB (5.37 GB) の最小データストレージ料金がかかります。
-
トレーニング
-
Amazon SageMaker トレーニング
Amazon SageMaker は、モデルのトレーニング、調整、およびデバッグに必要なすべてを提供することで、機械学習 (ML) モデルのトレーニングを容易にします。選択したインスタンスタイプの使用料金が請求されます。Amazon SageMaker Debugger を使用してトレーニング中に問題をデバッグし、リソースをモニタリングする場合、組み込みルールを使用してトレーニングジョブをデバッグしたり、独自のカスタムルールを記述したりできます。組み込みルールを使用したトレーニングジョブのデバッグには、追加料金はかかりません。カスタムルールについては、使用期間に基づいて、選択したインスタンスタイプについて課金されます。
-
MLflow
-
Amazon SageMaker と MLflow
Amazon SageMaker と MLflow を利用すると、お支払いいただくのは使用した分の料金のみです。お客様には、コンピューティングとストレージのコストに基づいて MLflow トラッキングサーバーの料金をお支払いいただきます。
お客様には、トラッキングサーバーのサイズと実行時間数に基づいてコンピューティング料金をお支払いいただきます。さらに、MLflow トラッキングサーバーに保存されているメタデータの料金もお支払いいただきます。
-
リアルタイム推論
-
Amazon SageMaker ホスティング: リアルタイム推論
Amazon SageMaker は、リアルタイムの予測が必要なユースケースにリアルタイムの推論を提供します。選択したインスタンスタイプの使用料金が請求されます。Amazon SageMaker Model Monitor を使用して、リアルタイムの推論を提供する高精度のモデルを維持する場合、組み込みルールを使用してモデルをモニタリングしたり、独自のカスタムルールを記述したりできます。組み込みルールについては、最長 30 時間のモニタリングを無料でご利用いただけます。追加料金は使用期間に基づきます。独自のカスタムルールを使用する場合は、別途料金が発生します。
-
非同期推論
-
Amazon SageMaker 非同期推論:
Amazon SageMaker 非同期推論は、受信したリクエストをキューに入れて非同期に処理する、ほぼリアルタイムの推論オプションです。このオプションは、データが到着したときに大規模なペイロードを処理する必要がある場合や、推論処理時間が長く、サブ秒のレイテンシー要件を持たないモデルを実行する場合に使用します。選択したインスタンスの種類に応じて課金されます。 -
バッチ変換
-
Amazon SageMaker バッチ変換
Amazon SageMaker バッチ変換を使用すると、データセットを複数のチャンクに分けたりリアルタイムのエンドポイントを管理したりする必要はありません。SageMaker バッチ変換により、大小のバッチデータセットに対する予測を実行できます。使用期間に基づいて、選択したインスタンスタイプについて課金されます。
-
サーバーレス推論
-
Amazon SageMaker Serverless Inference
Amazon SageMaker Serverless Inference を使用すると、基盤となるインフラストラクチャを設定または管理することなく、推論用の機械学習モデルをデプロイできます。 オンデマンドの Serverless Inference を使用するか、予測可能なパフォーマンスを実現するためにエンドポイントに Provisioned Concurrency を追加することができます。オンデマンドの Serverless Inference では、推論要求の処理に使用されるコンピューティング性能、ミリ秒単位の請求、および処理されるデータの量に対してのみ料金を支払います。コンピューティング料金は、選択したメモリ設定によって異なります。
Provisioned Concurrencyオプションで、サーバーレスエンドポイントで Provisioned Concurrency を有効にすることもできます。Provisioned Concurrency を使用すると、指定された数の同時リクエストと指定された時間に対してエンドポイントを温存することで、予測可能なパフォーマンスと高いスケーラビリティを備えたサーバーレスエンドポイントにモデルをデプロイすることができます。オンデマンドのサーバーレス推論と同様に、Provisioned Concurrency が有効になっている場合は、推論リクエストの処理に使用されたコンピューティング容量 (ミリ秒単位) と処理されたデータ量に対して料金が発生します。また、設定されたメモリ、プロビジョニングされた期間、有効になっている同時実行の量に基づいて、プロビジョニングされた同時実行の使用量に対しても支払いが発生します。
-
JumpStart
-
Amazon SageMaker JumpStart
Amazon SageMaker JumpStart は、人気のモデルコレクション (「モデルズー」とも呼ばれる) にワンクリックでアクセスできるため、機械学習をすばやく簡単に始めることができます。Jumpstart は、一般的な機械学習ユースケースを解決するエンドツーエンドソリューションも提供しており、お客様のニーズに合わせてカスタマイズすることができます。JumpStart のモデルやソリューションの使用には、追加料金はかかりません。基礎となるトレーニングおよび推論インスタンスの使用時間については、手動で作成した場合と同じように課金されます。
-
Profiler
-
Amazon SageMaker Profiler は、システムレベルのデータを収集して、高解像度の CPU および GPU トレースプロットを視覚化します。このツールは、データサイエンティストやエンジニアが深層学習モデルにおけるハードウェア関連のパフォーマンスのボトルネックを特定できるように設計されており、エンドツーエンドのトレーニング時間とコストを節約できます。現在、SageMaker Profiler は ml.g4dn.12xlarge、ml.p3dn.24xlarge、および ml.p4d.24xlarge トレーニングコンピュートインスタンスタイプを利用したトレーニングジョブのプロファイリングのみをサポートしています。
地域: 米国東部 (オハイオ)、米国東部 (バージニア北部)、米国西部 (オレゴン)、欧州 (フランクフルト)、欧州 (アイルランド)、イスラエル (テルアビブ)。Amazon SageMaker Profiler は現在プレビュー段階であり、サポート対象地域のお客様は無料でご利用いただけます。
-
HyperPod
-
Amazon SageMaker HyperPod
Amazon SageMaker ハイパーポッドは、基盤モデル (FM) の開発を加速させることを目的として設計されています。FM トレーニングの耐障害性を高めるため、クラスターの状態を継続的に監視し、障害のあるノードをその場で修復および交換し、頻繁なチェックポイントを保存して、進行状況を失うことなく自動的にトレーニングを再開します。SageMaker HyperPod には SageMaker 分散トレーニングライブラリがあらかじめ設定されているため、クラスターのコンピューティングとネットワークインフラストラクチャを最大限に活用しながら FM トレーニングのパフォーマンスを改善できます注: SageMaker HyperPod の料金には、Amazon EKS、Amazon FSx for Lustre、Amazon Simple Storage Service (Amazon S3) など、HyperPod クラスターに接続されたサービスの料金は含まれていません。
-
推論の最適化
-
推論最適化ツールキットを使用すると、最新の推論最適化手法を簡単に実装して、デベロッパーの時間を数か月節約しながら、Amazon SageMaker で最先端 (SOTA) のコストパフォーマンスを実現できます。SageMaker が提供するさまざまな人気の最適化手法から選択して、事前に最適化ジョブを実行し、モデルのパフォーマンスと精度のメトリクスをベンチマーキングしてから、最適化されたモデルを推論のために SageMaker エンドポイントにデプロイできます。
-
Sagemaker パートナーの AI アプリケーション
-
-
Lakera Guard
-
Comet
-
DeepChecks LLM evaluation
-
Fiddler
-
Lakera Guard
-
-
Comet
-
-
DeepChecks LLM evaluation
-
-
Fiddler
-
-
インスタンスの詳細
Amazon SageMaker P5 インスタンスの製品詳細
インスタンスサイズ | vCPU | インスタンスメモリ (TiB) | GPU モデル | GPU | GPU メモリの合計 (GB) | GPU あたりのメモリ (GB) | ネットワーク帯域幅 (Gbps) | GPUDirect RDMA | GPU Peer to Peer | インスタンスストレージ (TB) | EBS 帯域幅 (Gbps) |
ml.p5.48xlarge | 192 | 2 | NVIDIA H100 | 8 | 640 HBM3 | 80 | 3200 EFAv2 | 有 | 900 GB/秒 NVSwitch | 8x3.84 NVMe SSD | 80 |
Amazon SageMaker P4d インスタンスの製品詳細
インスタンスサイズ | vCPU | インスタンスメモリ (GiB) | GPU モデル | GPU | GPU メモリの合計 (GB) | GPU あたりのメモリ (GB) | ネットワーク帯域幅 (Gbps) | GPUDirect RDMA | GPU Peer to Peer | インスタンスストレージ (GB) | EBS 帯域幅 (Gbps) |
ml.p4d.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 320 HBM 2 | 40 | 400 ENA および EFA | はい | 600 GB/秒 NVSwitch | 8x1000 NVMe SSD | 19 |
ml.p4de.24xlarge | 96 | 1152 | NVIDIA A100 | 8 | 640 HNM2e | 80 | 400 ENA および EFA | はい | 600 GB/秒 NVSwitch | 8X1000 NVMe SSD | 19 |
Amazon SageMaker P3 インスタンスの製品詳細
インスタンスサイズ | vCPU | インスタンスメモリ (GiB) | GPU モデル | GPU | GPU メモリの合計 (GB) | GPU あたりのメモリ (GB) | ネットワーク帯域幅 (Gbps) | GPU Peer to Peer | インスタンスストレージ (GB) | EBS 帯域幅 (Gbps) |
ml.p3.2xlarge | 8 | 61 | NVIDIA V100 | 1 | 16 | 16 | 最大 10 | 該当なし | EBS のみ | 1.5 |
ml.p3.8xlarge | 32 | 244 | NVIDIA V100 | 4 | 64 | 16 | 10 | NVLink | EBS のみ | 7 |
ml.p3.16xlarge | 64 | 488 | NVIDIA V100 | 8 | 128 | 16 | 25 | NVLink | EBS のみ | 14 |
ml.p3dn.24xlarge | 96 | 768 | NVIDIA V100 | 8 | 256 | 32 | 100 | NVLink | 2 x 900 NVMeSSD | 19 |
Amazon SageMaker P2 インスタンスの製品詳細
インスタンスサイズ | vCPU | インスタンスメモリ (GiB) | GPU モデル | GPU | GPU メモリの合計 (GB) | GPU あたりのメモリ (GB) | ネットワーク帯域幅 (Gbps) | EBS 帯域幅 (Gbps) |
ml.p2.xlarge | 4 | 61 | NVIDIA K80 | 1 | 12 | 12 | 最大 10 | 高 |
ml.p2.8xlarge | 32 | 488 | NVIDIA K80 | 8 | 96 | 12 | 10 | 10 |
ml.p2.16xlarge | 64 | 732 | NVIDIA K80 | 16 | 192 | 12 | 25 | 20 |
Amazon SageMaker G4 インスタンスの製品詳細
インスタンスサイズ | vCPU | インスタンスメモリ (GiB) | GPU モデル | GPU | GPU メモリの合計 (GB) | GPU あたりのメモリ (GB) | ネットワーク帯域幅 (Gbps) | インスタンスストレージ (GB) | EBS 帯域幅 (Gbps) |
ml.g4dn.xlarge | 4 | 16 | NVIDIA T4 | 1 | 16 | 16 | 最大 25 | 1 x 125 NVMe SSD | 最大 3.5 |
ml.g4dn.2xlarge | 8 | 32 | NVIDIA T4 | 1 | 16 | 16 | 最大 25 | 1 x 125 NVMe SSD | 最大 3.5 |
ml.g4dn.4xlarge | 16 | 64 | NVIDIA T4 | 1 | 16 | 16 | 最大 25 | 1 x 125 NVMe SSD | 4.75 |
ml.g4dn.8xlarge | 32 | 128 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 NVMe SSD | 9.5 |
ml.g4dn.16xlarge | 64 | 256 | NVIDIA T4 | 1 | 16 | 16 | 50 | 1 x 900 NVMe SSD | 9.5 |
ml.g4dn.12xlarge | 48 | 192 | NVIDIA T4 | 4 | 64 | 16 | 50 | 1 x 900 NVMe SSD | 9.5 |
Amazon SageMaker G5 インスタンスの製品詳細
インスタンスサイズ | vCPU | インスタンスメモリ (GiB) | GPU モデル | GPU | GPU メモリの合計 (GB) | GPU あたりのメモリ (GB) | ネットワーク帯域幅 (Gbps) | EBS 帯域幅 (Gbps) | インスタンスストレージ (GB) |
ml.g5n.xlarge | 4 | 16 | NVIDIA A10G | 1 | 24 | 24 | 最大 10 | 最大 3.5 | 1x250 |
ml.g5.2xlarge | 8 | 32 | NVIDIA A10G | 1 | 24 | 24 | 最大 10 | 最大 3.5 | 1x450 |
ml.g5.4xlarge | 16 | 64 | NVIDIA A10G | 1 | 24 | 24 | 最大 25 | 8 | 1x600 |
ml.g5.8xlarge | 32 | 128 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x900 |
ml.g5.16xlarge | 64 | 256 | NVIDIA A10G | 1 | 24 | 24 | 25 | 16 | 1x1900 |
ml.g5.12xlarge | 48 | 192 | NVIDIA A10G | 4 | 96 | 24 | 40 | 16 | 1x3800 |
ml.g5.24xlarge | 96 | 384 | NVIDIA A10G | 4 | 96 | 24 | 50 | 19 | 1x3800 |
ml.g5.48xlarge | 192 | 768 | NVIDIA A10G | 8 | 192 | 24 | 100 | 19 | 2x3800 |
Amazon SageMaker Trn1 インスタンスの製品詳細
インスタンスサイズ | vCPU | メモリ (GiB) | Trainium アクセラレーター | アクセラレーターメモリの合計 (GB) | アクセラレーターあたりのメモリ (GB) | インスタンスストレージ (GB) | ネットワーク帯域幅 (Gbps) | EBS 帯域幅 (Gbps) |
ml.trn1.2xlarge | 8 | 32 | 1 | 32 | 32 | 1 x 500 NVMe SSD | 最大 12.5 | 最大 20 |
ml.trn1.32xlarge | 128 | 512 | 16 | 512 | 32 | 4 x 2000 NVMe SSD | 800 | 80 |
Amazon SageMaker Inf1 インスタンスの製品詳細
インスタンスサイズ | vCPU | メモリ (GiB) | Inferentia アクセラレーター | アクセラレーターメモリの合計 (GB) | アクセラレーターあたりのメモリ (GB) | インスタンスストレージ | アクセラレーター間インターコネクト | ネットワーク帯域幅 (Gbps) | EBS 帯域幅 (Gbps) |
ml.inf1.xlarge | 4 | 8 | 1 | 8 | 8 | EBS のみ | 該当なし | 最大 25 | 最大 4.75 |
ml.inf1.2xlarge | 8 | 16 | 1 | 8 | 8 | EBS のみ | 該当なし | 最大 25 | 最大 4.75 |
ml.inf1.6xlarge | 24 | 48 | 4 | 32 | 8 | EBS のみ | はい | 25 | 4.75 |
ml.inf1.24xlarge | 96 | 192 | 16 | 128 | 8 | EBS のみ | 有 | 100 | 19 |
Amazon SageMaker Inf2 インスタンスの製品詳細
インスタンスサイズ | vCPU | メモリ (GiB) | Inferentia アクセラレーター | アクセラレーターメモリの合計 (GB) | アクセラレーターあたりのメモリ (GB) | インスタンスストレージ | アクセラレーター間インターコネクト | ネットワーク帯域幅 (Gbps) | EBS 帯域幅 (Gbps) |
ml.inf2.xlarge | 4 | 16 | 1 | 32 | 32 | EBS のみ | 該当なし | 最大 25 | 最大 10 |
ml.inf2.8xlarge | 32 | 128 | 1 | 32 | 32 | EBS のみ | 該当なし | 最大 25 | 10 |
ml.inf2.24xlarge | 96 | 384 | 6 | 196 | 32 | EBS のみ | 有 | 50 | 30 |
ml.inf2.48xlarge | 192 | 768 | 12 | 384 | 32 | EBS のみ | はい | 100 | 60 |
Amazon SageMaker Studio
Amazon SageMaker Studio は、完全な ML 開発を実現する単一のウェブベースのインターフェイスで、フルマネージド型の統合開発環境 (IDE) と専用ツールを選択できます。SageMaker Studio には無料でアクセスできます。SageMaker Studio 内のさまざまな IDE や ML ツールに使用した基盤となるコンピューティングとストレージに対してのみ課金されます。
SageMaker Studio、AWS SDK for Python (Boto3)、または AWS コマンドラインインターフェイス (AWS CLI) から、次のような多くのサービスを使用できます。
- SageMaker Studio 上の IDE は、JupyterLab、コード OSS (Visual Studio Code - オープンソース) に基づくコードエディター、RStudio など、さまざまなフルマネージド IDE を使用して完全な ML 開発を実行できます
- 機械学習ワークフローを自動化および管理する SageMaker Pipelines
- 完全な可視性を備えた機械学習モデルを自動的に作成する SageMaker Autopilot
- トレーニングジョブとバージョンを整理および追跡する SageMaker Experiments
- トレーニング中に異常をデバッグする SageMaker Debugger
- 高品質のモデルを維持する SageMaker Model Monitor
- 機械学習モデルをより適切に説明しバイアスを検出する SageMaker Clarify
- 多くのユースケースに機械学習ソリューションを簡単にデプロイする SageMaker JumpStart。 ソリューションで使用される他の AWS のサービスから、Amazon SageMaker がお客様に代わって行う、基盤となる API コールの料金が課金される場合があります。
- 適切なエンドポイント設定のレコメンデーションを取得するための SageMaker Inference Recommender
使用量に基づいて、SageMaker 内の基盤となるコンピューティングおよびストレージリソースまたは他の AWS のサービスについての料金のみをお支払いいただきます。
Jupyter Lab とコードエディタで Amazon Q Developer 無料利用枠を使用するには、こちらの手順に従ってください。Jupyter Lab で Amazon Q Developer Pro を使用するには、Amazon Q Developer に登録する必要があります。Amazon Q Developer の料金はこちらで確認できます。
Amazon SageMaker HyperPod の柔軟なトレーニングプラン
SageMaker HyperPod の柔軟なトレーニングプランは、タイムラインと予算内で生成 AI モデルをトレーニングするのに役立ちます。予算、希望修了日、モデルトレーニングに消費したいコンピューティングリソースの最大量を指定します。HyperPod は次に、コンピューティングキャパシティの複数のブロックからコンピューティングリソースを使用する極めてコスト効率の高いトレーニングプランの作成をサポートします。
基礎モデル評価
SageMaker Clarify は、自動評価方法と人間ベースの評価方法の両方で基礎モデル評価をサポートしています。これらはそれぞれ価格が異なります。アカウントにまだデプロイされていない Amazon SageMaker JumpStart の基盤モデルを評価している場合、SageMaker は推論の間、SageMaker インスタンスに JumpStart モデルを一時的にデプロイします。特定のインスタンスは、そのモデルについて JumpStart が提供する推奨インスタンスに準拠します。
自動評価:
ファンデーションモデルの評価は SageMaker の処理ジョブとして実行されます。評価ジョブは SageMaker 推論を呼び出します。お客様には、推論と評価ジョブの料金がかかります。お客様への請求は、評価ジョブの期間中のみ行われます。評価ジョブのコストは、評価インスタンスの 1 時間あたりのコストとホスティングインスタンスの 1 時間あたりのコストの合計になります。
人間ベースの評価:
人力ベースの評価機能を使用して従業員を派遣する場合、1) 推論に使用される SageMaker インスタンス、2) 人間による評価をホストする SageMaker 処理ジョブの実行に使用されるインスタンス、3) 完了した人的評価タスクにつき 0.21 USD の料金の 3 項目について課金されます。ヒューマンタスクとは、人間の作業者が単一のプロンプトとそれに関連する推論応答の評価をヒューマン評価ユーザーインターフェイスに送信したこととして定義されます。評価業務に1つまたは2つのモデルがある場合でも、独自の推論を持ち込んでも価格は同じです。また、評価ディメンションと評価方法をいくつ含めても同じです。1 タスクあたり 0.21 USD の料金は、すべての AWS リージョンで同じです。人件費はお客様負担となりますので、別途人件費はかかりません。
AWS が管理する評価:
AWS が管理する専門家による評価では、AWS 専門家評価チームと連携しながら、プライベート契約でお客様の評価ニーズに合わせて価格をカスタマイズします。
Amazon SageMaker Studio Lab
Amazon SageMaker Studio Lab を使用して、機械学習モデルを無料で構築およびトレーニングできます。 SageMaker Studio Lab は、デベロッパー、学者、データサイエンティストに、追加料金なしで機械学習について学び実験するための設定なしで開発できる環境を提供します。
Amazon SageMaker Canvas
Amazon SageMaker Canvas は、ビジネスアナリストが、視覚的なポイントアンドクリックインターフェイスを使用して正確な機械学習予測を生成することができるようにすることで、機械学習を利用しやすくします。コーディングや、機械学習の経験は必要ありません。
Amazon SageMaker Data Labeling
Amazon SageMaker Data Labeling は、Amazon SageMaker Ground Truth Plus と Amazon SageMaker Ground Truth の 2 つのデータラベリングサービスを提供します。フルマネージド型のデータラベル付けサービスで、機械学習のための高精度なトレーニングデータセットを簡単に構築することができる Amazon SageMaker Data Labeling の詳細をご覧ください。
Amazon SageMaker のシャドウテスト
SageMaker は、新しい機械学習モデルを本番リリース前に評価するために、現在デプロイされているモデルに対してそのパフォーマンスをテストするシャドーテストの実行を支援します。シャドウモデルをホストするためにプロビジョニングされた ML インスタンスと ML ストレージの使用料金を除いて、SageMaker シャドウテストに追加料金はかかりません。ML インスタンスと ML ストレージディメンションの料金は、前の料金表で指定されているリアルタイム推論オプションと同じです。シャドウ デプロイメントの内外で処理されるデータに追加料金はかかりません。
Amazon SageMaker Edge
エッジデバイスのフリートで機械学習モデルを最適化、実行、およびモニタリングするための Amazon SageMaker Edge の料金設定について、詳細をご覧ください。
Amazon SageMaker Savings Plans
Amazon SageMaker Savings Plans は、コストを最大 64% 削減するのに役立ちます。このプランは、インスタンスファミリー、サイズ、リージョンに関係なく、SageMaker Studio ノートブック、SageMaker ノートブックインスタンス、SageMaker Processing、SageMaker Data Wrangler、SageMaker Training、SageMaker Real-Time Inference、SageMaker Batch Transform などの対象となる SageMaker 機械学習インスタンスの使用量に自動的に適用されます。例えば、米国東部 (オハイオ) で実行されている CPU インスタンス ml.c5.xlarge から米国西部 (オレゴン) の ml.Inf1 インスタンスにいつでも推論ワークロードの使用量を変更し、自動的に Savings Plans の料金を引き続き支払うことができます。
Amazon SageMaker で総保有コスト (TCO)
Amazon SageMaker は、他のクラウドベースのセルフマネージドソリューションと比較して、3 年間で総保有コスト (TCO) を少なくとも 54% 削減します。Amazon SageMaker の TCO 分析について、詳細をご覧ください。
料金の例
-
料金例 #1: JupyterLab
データサイエンティストは、JupyterLab を 20 日間使用して、ml.g4dn.xlarge インスタンスで 1 日あたり 6 時間、ノートブック、コード、データをすばやく実験します。JupyterLab IDE にアクセスするには、JupyterLab スペースを作成して実行します。コンピューティングは、JupyterLab スペースが実行されているときに使用されたインスタンスに対してのみ課金されます。JupyterLab スペースのストレージ料金は、削除されるまで発生します。コンピューティング
インスタンス 期間 日数 合計期間 1 時間あたりのコスト 合計 ml.g4dn.xlarge 6 時間 20 6 × 20 = 120 時間 0.7364ドル 88.368ドル ストレージ
汎用 SSD ストレージは 480 時間 (24 時間 × 20 日間) 使用できます。1 か月あたり 1 GB あたり 0.1125 USD を請求するリージョンの場合:
1 GB あたり 0.112 USD* 5 GB * 480/(24 時間/日 * 30 日間) = 0.373 USD -
料金例 #2: コードエディター
ML エンジニアは、ml.g4dn.xlarge インスタンスで 20 日間、ML プロダクションコードの編集、実行、およびデバッグにコードエディターを使用して、1 日あたり 6 時間費やします。コードエディタ IDE にアクセスするには、コードエディタスペースを作成して実行します。コンピュート料金は、コードエディタースペースが実行されているときに使用されたインスタンスに対してのみ課金されます。コードエディタスペースのストレージ料金は、削除されるまで発生します。コンピューティング
インスタンス 期間 日数 合計期間 1 時間あたりのコスト 合計 ml.g4dn.xlarge 6 時間 20 6 × 20 = 120 時間 0.7364ドル 88.368ドル ストレージ
汎用 SSD ストレージは 480 時間 (24 時間 × 20 日間) 使用できます。1 か月あたり 1 GB あたり 0.1125 USD を請求するリージョンの場合:
1 GB あたり 0.112 USD* 5 GB * 480/(24 時間/日 * 30 日間) = 0.373 USD
-
料金例 #3: スタジオクラシック
データサイエンティストは、Amazon SageMaker Studio ノートブックを使用しながら次の一連のアクションを実行します。
- ml.c5.xlarge インスタンスの TensorFlow カーネルでノートブック 1 を開き、このノートブックで 1 時間作業を行います。
- ml.c5.xlarge インスタンスでノートブック 2 を開きます。ノートブック 1 を実行しているインスタンスと同じ ml.c5.xlarge インスタンスで自動的に開きます。
- ノートブック 1 とノートブック 2 で同時に 1 時間動作します。
- データサイエンティストには、ml.c5.xlarge を使用した合計 2 時間分の料金が請求されます。ノートブック 1 とノートブック 2 で同時に行った重複作業時間の場合、各カーネルアプリケーションは 0.5 時間として計測され、1 時間分が請求されます。
カーネルアプリケーション ノートブックインスタンス 時間 1 時間あたりのコスト 合計 TensorFlow ml.c5.xlarge 1 0.204 USD 0.204 USD TensorFlow ml.c5.xlarge 0.5 0.204 USD 0.102 USD データサイエンス ml.c5.xlarge 0.5 0.204 USD 0.102 USD 0.408 USD -
料金の例 #4: RStudio
データサイエンティストは、RStudio を使用しながら次の一連のアクションを実行します。
- ml.c5.xlarge インスタンスで RSession 1 を起動し、このノートブックで 1 時間作業を行います。
- ml.c5.xlarge インスタンスで RSession 2 を起動します。RSession 1 を実行しているインスタンスと同じ ml.c5.xlarge インスタンスで自動的に開きます。
- RSession 1 と RSession 2 を同時に 1 時間使用します。
- データサイエンティストには、ml.c5.xlarge を使用した合計 2 時間分の料金が請求されます。RSession 1 と RSession 2 で同時に行った重複作業時間の場合、各 RSession アプリケーションは 0.5 時間として計測され、1 時間分が請求されます。
その間、RSessions が動いているか否かにかかわらず、RServer は 24 時間 365 日動いています。管理者が「スモール」(ml.t3.medium) を選択した場合は、無料で利用できます。管理者が「ミディアム」(ml.c5.4xlarge) または「ラージ」(ml.c5.9xlarge) を選択した場合、SageMaker ドメインで RStudio が有効になっている限り、時間単位で料金が発生します。
RSession アプリケーション RSession インスタンス 時間 1 時間あたりのコスト 合計 Base R ml.c5.xlarge 1 0.204 USD 0.204 USD Base R ml.c5.xlarge 0.5 0.204 USD 0.102 USD Base R ml.c5.xlarge 0.5 0.204 USD 0.102 USD 0.408 USD -
料金の例 #5: 処理
Amazon SageMaker Processing は、ジョブが実行されている間に使用されたインスタンスのみ料金がかかります。Simple Storage Service (Amazon S3) の処理向けにインプットデータを提供する場合、Amazon SageMaker は、ジョブの処理開始時に Simple Storage Service (Amazon S3) からローカルファイルストレージにデータをダウンロードします。
データ分析は、10分のジョブ時間にて2 ml.m5.4xlarge で処理ジョブを実行してデータを処理、有効します。処理ジョブのインプットとして S3 の 100 GB のデータセットをアップロードします。また、アウトプットデータ (ほぼ同じサイズ) が S3 に戻されて保存されます。
時間 処理インスタンス 1 時間あたりのコスト 合計 1 * 2 * 0.167 = 0.334 ml.m5.4xlarge 0.922 USD 0.308 USD 汎用 (SSD) ストレージ (GB) 1 時間あたりのコスト 合計 100 GB * 2 = 200 0.14 USD 0.0032 USD Amazon SageMaker 処理ジョブの小計 = 0.308 USD。
200 GB 汎用 SSD ストレージの小計 = 0.0032 USD。
この例の総額は 0.3112 USD です。
-
料金の例 #6: Data Wrangler
表に基づくと、データを準備するために、Amazon SageMaker Data Wrangler を 3 日間にわたって合計 18 時間使用します。さらに、SageMaker Data Wrangler ジョブを作成して、更新されたデータを毎週準備します。各ジョブは 40 分続き、ジョブは 1 か月間毎週実行されます。
Data Wrangler の使用にかかる合計月額料金 = 16.596 USD + 2.461 USD = 19.097 USD
アプリケーション SageMaker Studio インスタンス 日数 期間 合計期間 1 時間あたりのコスト 費用小計 SageMaker Data Wrangler ml.m5.4xlarge 3 6 時間 18 時間 0.922 USD 16.596 USD SageMaker Data Wrangler ジョブ ml.m5.4xlarge - 40 分 2.67 時間 0.922 USD 2.461 USD データサイエンティストとして、3 日間にわたり、Amazon SageMaker Data Wrangler を使用してデータを 1 日 6 時間クレンジング、探索、および視覚化します。その後、データ準備パイプラインを実行するために、毎週実行するようにスケジュールされている SageMaker Data Wrangler ジョブを開始します。
以下の表は、その月の合計使用量と、Amazon SageMaker Data Wrangler の使用に関連して発生する料金をまとめたものです。
-
料金の例 #7: 特徴量ストア
++ すべての小数の読み取り単位は次の整数に丸められます
データストレージ
保存されたデータの合計 = 31.5 GB
データストレージの月額料金 = 31.5 GB * 0.45 USD = 14.175 USDAmazon SageMaker Feature Store の月額合計料金 = 56.875 USD + 3.185 USD + 14.175 USD = 74.235 USD
その月における日 書き込み総数 合計書き込みユニット 読み込み総数 合計読み取りユニット 1~10 日 100,000 回の書き込み
(10,000 回の書き込み * 10 日間)2,500,000
(100,000 * 25KB)100,000
(10,000 * 10 日間)700,000++
(100,000 * 25/4 KB)11 日目 200,000 回の書き込み 5,000,000
(200,000 * 25KB)200,000 回の読み取り 1,400,000++
(200,000* 25/4KB)12~30 日 1,520,000 回の書き込み
(80,000 * 19 日間)38,000,000
(1,520,000 * 25KB)1,520,000 回の書き込み
(80,000 * 19 日間)10,640,000++
(1,520,000 * 25/4KB)合計請求対象ユニット 45,500,000 書き込みユニット 12,740,000 読み取りユニット 書き込みと読み取りの月額料金 56.875 USD
(4,550 万書き込みユニット * 100 万書き込みあたり 1.25 USD)3.185 USD
(1,274 万読み取りユニット * 100 万読み取りあたり 0.25 USD)Amazon SageMaker Feature Store に対してそれぞれ 25 KB の読み取りと書き込みを発行するウェブアプリケーションがあります。月の最初の 10 日間は、アプリケーションへのトラフィックがほとんどなく、SageMaker Feature Store への書き込みと読み取りは毎日それぞれ 10,000 回発生します。その月の 11 日にアプリケーションがソーシャルメディアで注目を集めたため、その日の書き込みと読み取りはそれぞれ 200,000 回となり、アプリケーションのトラフィックが跳ね上がりました。その後、アプリケーションは通常のトラフィックのパターンに落ち着き、月末まで 1 日平均の書き込みと読み取りはそれぞれ 80,000 回となりました。
以下の表は、その月の合計使用量と、Amazon SageMaker Feature Store の使用に関連して発生する料金をまとめたものです。
-
料金の例 #8: トレーニング
この例でのデバッグおよびトレーニングの総額は、2.38 USD です。コンピューティングインスタンスと、Amazon SageMaker Debugger 組み込みルールで使用される汎用ストレージボリュームについては、追加料金は発生しません。
トレーニング用汎用 (SSD) ストレージ (GB) デバッガ―ビルトインルール用汎用 (SSD) ストレージ (GB) デバッガ―カスタムルール用汎用 (SSD) ストレージ (GB) GB あたりの月額料金 小計 使用容量 3 2 1 料金 0 USD ビルトインストレージボリュームに追加料金は発生しません 0 USD 0.10 USD 0 USD 時間 トレーニングインスタンス デバッグインスタンス 1 時間あたりのコスト 小計 4 * 0.5 = 2.00 ml.m4.4xlarge 該当なし 0.96 USD 1.92 USD 4 * 0.5 * 2 = 4 該当なし ビルトインインスタンスに追加料金は発生しません 0 USD 0 USD 4 * 0.5 = 2 ml.m5.xlarge 該当なし 0.23 USD 0.46 USD ------- 2.38 USD データサイエンティストが新しい考えに対するモデルについて 1 週間仕事をしたとします。彼女は、作成した 2 つのビルトインルールと 1 つのカスタムルールを使用して Amazon SageMaker デバッガーを有効にして、トレーニング実行ごとに 30 分間、ml.m4.4xlarge でモデルを 4 回トレーニングします。カスタムルールでは、ml.m5.xlarge インスタンスを特定しました。Simple Storage Service (Amazon S3) の 3 GB トレーニングデータを使用してトレーニングを行い、1 GB モデルアウトプットを Simple Storage Service (Amazon S3) に押し込めます。SageMaker は、各トレーニングインスタンス用に、汎用 SSD (gp2) ボリュームを作成します。SageMaker はまた、特定された各ルール用にも汎用 SSD (gp2) ボリュームを作成します。この例では、合計で 4 つの汎用 SSD (gp2) ボリュームが作成されます。SageMaker デバッガ―は、お客様の Simple Storage Service (Amazon S3) バケットに 1 GB のデバッグデータを送信します。
-
料金の例 #9: MLflow
データサイエンティストのチームが 2 つあります。1 つのチームには 10 人のデータサイエンティストが所属しており、もう 1 つのチームには 40 人のデータサイエンティストが所属しています。これらの 2 つのチームに対応するために、2 つの異なる MLflow トラッキングサーバー (1 つは Small、もう 1 つは Medium) を有効にすることを選択します。各チームは機械学習 (ML) 実験を実施しており、トレーニングの試行によって生成されたメトリクス、パラメータ、およびアーティファクトを記録する必要があります。チームは MLflow トラッキングサーバーを 1 か月あたり 160 時間使用したいと考えています。各データサイエンスチームが実験の実行を追跡するために 1 GB のメタデータを保存すると仮定します。月末に発行される請求書は、次のように計算されます。
Small インスタンスのコンピューティング料金: 160 * 0.60 USD = 96 USD
Medium インスタンスのコンピューティング料金: 160 * 1.40 USD = 166.4 USD
2 つのチームのストレージ料金: 2 * 1 * 0.10 = 0.20 USD合計 = 262.60 USD
-
料金の例 #10: リアルタイム推論
トレーニング、ホスティング、およびモニタリングの小計 = 305.827 USD。毎月のホスティングのための入力データ処理量 3,100 MB と出力データ処理量 310 MB の小計 = 0.054 USD。この例の合計料金は、月額 305.881 USD になります。
ml.m5.xlarge インスタンスのビルトインルールでは、毎月すべてのエンドポイントで集計モニタリング時間が最大 30 時間無料になります。
1 か月あたりデータの入力 - ホスティング 月あたりデータ出力 – ホスティング 入力または出力料金 (GB 単位) 合計 100 MB * 31 = 3,100 MB 0.016 USD 0.0496 USD 10 MB * 31 = 310 MB 0.016 USD 0.00496 USD 1 か月あたりの時間 ホスティングインスタンス モデルモニターインスタンス 1 時間あたりのコスト 合計 24 * 31 * 2 = 1488 ml.c5.xlarge 0.204 USD 303.522 USD 31*0.08 = 2.5 ml.m5.4xlarge 0.922 USD 2.305 USD その後、例 #5 のモデルは、信頼性の高いマルチ AZ ホスティングのために、2 つの ml.c5.xlarge インスタンスに本番としてデプロイされます。Amazon SageMaker Model Monitor は、1 つの ml.m5.4xlarge インスタンスで有効化され、1 日 1 回、ジョブがモニタリングされます。各ジョブのモニタリングは完了するまで5分かかります。このモデルはデータを毎日 100 MB を受信し、インファレンスは入力データのサイズの 10 分の 1 でした。
-
料金の例 #11: 非同期推論
SageMaker 非同期推論の小計 = 15.81 USD + 0.56 USD + 2 * .0048 = 16.38 USD。この例の非同期推論の合計料金は、月額 16.38 USD になります。
月あたりデータ入力 月あたりデータ出力 入力または出力料金 (GB 単位) 合計 10 KB * 1,024 * 31 = 310 MB 10 KB * 1,024 * 31 = 310 MB 0.02 USD 0.0048 10 KB * 1,024 * 31 = 310 MB 0.02 USD 0.0048 汎用 (SSD) ストレージ (GB) GB あたりの月額料金 合計 4 0.14 USD 0.56 USD 1 か月あたりの時間 ホスティングインスタンス 1 時間あたりのコスト 合計 2.5 * 31 * 1 = 77.5 ml.c5.xlarge 0.20 USD 15.81 USD Amazon SageMaker 非同期推論は、エンドポイントで使用されるインスタンスに対して課金されます。アクティブにリクエストを処理していないときは、コストを節約するためにインスタンスをゼロにスケールするようにオートスケーリングを設定できます。Simple Storage Service (Amazon S3) の入力ペイロードの場合、同じリージョンでの Simple Storage Service (Amazon S3) からの入力データの読み取りや S3 への出力データの書き込みにコストは発生しません。
例 #5 のモデルは、SageMaker 非同期推論エンドポイントを実行するために使用されます。このエンドポイントは、1 つの ml.c5.xlarge インスタンスで実行され、アクティブにリクエストを処理していないときは、インスタンスをゼロにスケールダウンするように設定されています。エンドポイントの ml.c5.xlarge インスタンスには,4 GB の汎用 (SSD) ストレージが接続されています。この例では、エンドポイントは 1 日 2 時間、インスタンス 1 を維持し、30 分間のクールダウン期間を経て、残りの時間はインスタンス 0 にスケールダウンします。したがって、1 日あたり 2.5 時間の使用に対して課金されます。
エンドポイントは 1 日あたり 1,024 件のリクエストを処理します。各呼び出しリクエスト/レスポンスボディのサイズは 10 KB で、Simple Storage Service (Amazon S3) の各推論リクエストペイロードは 100 MB です。推論出力は入力データの 1/10 のサイズで、同じリージョンの Simple Storage Service (Amazon S3) に戻って保存されます。この例では、データ処理料金はリクエストとレスポンスボディに適用されますが、Simple Storage Service (Amazon S3) との間で転送されるデータには適用されません。
-
料金の例 #12: バッチ変換
この例での推論料金の合計は 2.88 USD です。
時間 ホスティングインスタンス 1 時間あたりのコスト 合計 3 * 0.25 * 4 = 3 時間 ml.m4.4xlarge 0.96 USD 2.88 USD 例 #5 のモデルを使用して SageMaker バッチ変換を実行します。データサイエンティストは、3 個の ml.m4.4xlarge 上で 4 つの別々の SageMaker バッチ変換ジョブを、1 回のジョブ実行につき 15 分間実行します。実行ごとに 1 GB の評価データセットを S3 にアップロードし、推論のサイズは入力データの 1/10 で、S3 に戻って保存されます。
-
料金の例 #13: オンデマンド Serverless Inference
月額データ処理料金
データ処理 (GB) 入力または出力料金 (GB 単位) 月額データ処理料金 10 GB 0.016 USD 0.16 USD オンデマンド SageMaker Serverless Inference 期間料金の小計 = 40 USD。10 GB のデータ処理料金の小計 = 0.16 USD。この例の合計請求額は 40.16 USD です。
月額コンピューティング料金
リクエストの数 各リクエストの期間 合計推論時間 (秒) 1 秒 あたりのコスト 月額推論期間料金 1000 万 100 ms 100 万 0.00004 USD 40 USD
オンデマンドの Serverless Inference では、推論要求の処理に使用されるコンピューティング性能、ミリ秒単位の請求、および処理されるデータの量に対してのみ料金を支払います。コンピューティング料金は、選択したメモリ設定によって異なります。
エンドポイントに 2 GB のメモリ量を割り当て、1 か月に 1,000 万回実行し、毎回 100 ミリ秒間実行し、合計 10 GB のデータ入力/出力を処理した場合、料金の計算は以下のようになります。
-
料金の例 #14: サーバーレス推論におけるプロビジョニングされた同時実行
給与処理会社向けのチャットボットサービスを運営しているとしましょう。税務申告期限前の 3 月末には、顧客からの問い合わせが急増すると予想されます。ただし、当月のそれ以外の期間は、トラフィックは少ないと予想されます。つまり、2 GB のメモリを搭載したサーバーレスエンドポイントをデプロイし、月の最後の 5 日間、午前 9 時~午後 5 時 (8 時間) にプロビジョニングされた同時実行数を 100 個追加します。その間、エンドポイントは 1,000 万件のリクエスト、合計 10,000 GB のデータ入出力を処理します。今月のそれ以外の期間は、チャットボットはオンデマンドの Serverless Inference で稼働し、300 万のリクエストと 3GB のデータ入出力を処理します。各リクエストの持続時間を 100 ミリ秒と仮定しましょう。
プロビジョニングされた同時実行数 (PC) 料金:
PC の価格は 0.000010 ドル/秒
PC 使用時間 (秒) = 5 日* 100 PC* 8 時間* 3600 秒 = 14,400,000 秒
PC 使用料 = 14,400,000 秒* 0.000010 ドル/秒 = 144 ドル。プロビジョニングされた同時実行性によって処理されるトラフィックの推論時間料金
推論時間の料金は 1 秒あたり 0.000023 ドル
PC の推論時間の合計 (秒) = 10M* (100 ミリ秒) /1000 = 100 万秒。
PC の推論時間料金 = 1,000,000 秒 * 0.000023 ドル/秒 = 23 ドルオンデマンド推論時間料金
1 か月のコンピューティング料金は 1 秒につき 0.00004 USD で、無料利用枠は 150,000 秒です。
合計コンピューティング (秒) = (3) M * (100 ミリ秒) /1000 = 30 万秒。
合計コンピューティング – 無料利用枠 = 1 か月の請求コンピューティング秒
30 万秒 - 15万秒 = 15万秒
1 か月のコンピューティング料金 = 150k * 0.00004 USD = 6 USDデータ処理
イン/アウト処理されるデータの GB あたりのコスト = 0.016 USD
処理された合計ギガバイト数 = 10+3 = 13
合計コスト= 0.016 USD *13= 0.208 USD
3 月の合計料金
合計料金 = プロビジョニングされた同時実行料金 + プロビジョニングされた同時実行の推論時間 + オンデマンドコンピューティングの推論時間 + データ処理料金
= 144 USD + 23 USD + 6 USD + 0.208 USD = 173.2 USD -
料金の例 #15: JumpStart
お客様は JumpStart を使用して、お客様レビューのセンチメントを肯定的または否定的に分類するために事前にトレーニングされた BERT Base Uncased モデルをデプロイします。
この顧客は、信頼性の高いマルチ AZ ホスティングのために、2 つの ml.c5.xlarge インスタンスにモデルをデプロイします。このモデルはデータを毎日 100 MB を受信し、インファレンスは入力データのサイズの 10 分の 1 でした。
1 か月あたりの時間 ホスティングインスタンス 1 時間あたりのコスト 合計 24 * 31 * 2 = 1488 ml.c5.xlarge 0.204 USD 303.55 USD 1 か月あたりデータの入力 - ホスティング 月あたりデータ出力 – ホスティング 入力または出力料金 (GB 単位)
合計
100 MB * 31 = 3,100 MB 0.02 USD 0.06 USD 10 MB * 31 = 310 MB 0.02 USD 0.01 USD トレーニング、ホスティング、およびモニタリングの小計 = 305.827 USD。毎月のホスティングのための入力データ処理量 3,100 MB と出力データ処理量 310 MB の小計 = 0.06 USD。この例の合計料金は、月額 305.887 USD になります。
-
料金の例 #16: HyperPod クラスター
モデル開発をサポートするために、インスタンスごとに追加の 100 GB のストレージを備えた 4 個の ml.g5.24xlarge のクラスターを 1 か月間 (30 日間) プロビジョニングするとします。 この例では、クラスターと追加のストレージの合計料金は 29,374.40 です。コンピューティング
インスタンス 期間 インスタンス 1 時間あたりのコスト 小計 ml.g5.24xlarge 30 日間 * 24 時間 = 720 時間 4 10.18 USD 29,318.40 USD ストレージ
汎用 (SSD) ストレージ 期間 インスタンス GB-月あたりの料金 小計 100 GB 30 日間 * 24 時間 = 720 時間 4 0.14 USD 56.00 USD -
料金例 #17: 基盤モデルの評価 (自動評価)
SageMaker Clarify による基盤モデル評価では、自動評価ジョブの実行中に使用されたインスタンスに対してのみ課金されます。自動評価タスクとデータセットを選択すると、SageMaker は Amazon S3 のプロンプトデータセットを SageMaker 評価インスタンスにロードします。
次の例では、ML エンジニアが米国東部 (バージニア北部) で Llama2 7B モデルの要約タスクの精度を評価しています。Llama 2 7B の推論に推奨されるインスタンスタイプは ml.g5.2xlarge です。評価に推奨される最小インスタンスは ml.m5.2xlarge です。この例では、ジョブは 45 分間実行されます (データセットのサイズによって異なります)。この例では、評価作業と詳細な結果のコストは 1.48 USD になります。ジョブ時間の処理 (例)
リージョン
インスタンスタイプ
インスタンス
1 時間あたりのコスト
料金
0.45
US-east-1
LLM ホスティング
ml.g5.2xlarge
1.52 USD
1.14 USD
0.45
US-east-1
評価
ml.m5.2xlarge
0.46 USD
0.35 USD
合計
1.48 USD
次の例では、バージニア州の同じエンジニアが、要約タスクの精度を高めるために別の評価ジョブを実行していますが、Llama 2 7B のカスタマイズバージョンを使用してアカウントにデプロイし、稼働させています。この場合、モデルはすでにアカウントにデプロイされているため、追加コストは評価インスタンスのみになります。
ジョブ時間の処理
リージョン
インスタンスタイプ
インスタンス
1 時間あたりのコスト
料金
0.45
US-east-1
評価
ml.m5.2xlarge
0.46 USD
0.35 USD
合計
0.35 USD
-
料金例 #18: 基盤モデルの評価 (人間ベースの評価)
次の例では、米国東部 (バージニア北部) の機械学習エンジニアが、Llama-2-7B の要約タスクの正確性を人間ベースで評価し、その評価には各自の個人スタッフを使用しています。ラマ2-7B の推奨インスタンスタイプは ml.g5.2xlarge です。人間ベースの評価処理ジョブの推奨最小インスタンスは ml.t3.medium です。Llama-2-7B での推論は45分間実行されます (データセットのサイズによって異なります)。データセットには 50 個のプロンプトが含まれており、開発者は各プロンプト/応答セットを評価するために 2 人のワーカーを必要とします (評価ジョブの作成で「プロンプトあたりのワーカー数」パラメーターとして設定可能)。この評価ジョブには 100 個のタスクが含まれます (各ワーカーごとにプロンプト/レスポンスのペアごとに 1 つのタスク:2 人の作業者 x 50 個のプロンプト応答セット = 100 個のヒューマンタスク)。評価作業における100件の評価タスクをすべて完了するには、人員が1日 (24時間) かかります (作業者の数とスキルレベル、プロンプトと推論応答の長さ/複雑さによって異なります)。
コンピューティング時間
ヒューマンタスク
リージョン
インスタンスタイプ
インスタンス
1 時間あたりのコスト
ヒューマンタスクあたりのコスト
合計コスト
0.45
米国東部 (バージニア北部)
LLM ホスティング
ml.g5.2xlarge
1.52 USD
1.14 USD
24
米国東部 (バージニア北部)
処理ジョブ
ml.t3.medium
0.05 USD
1.20 USD
100
任意
0.21 USD
21.00 USD
合計
23.34 USD
次の例では、米国東部 (バージニア北部) の同じエンジニアが同じ評価ジョブを実行していますが、アカウントに既にデプロイされて稼働している Llama-2-7B を使用しています。この場合、唯一の増加コストは、評価処理ジョブとヒューマンタスクにかかるコストになります。
コンピューティング時間
ヒューマンタスク
リージョン
インスタンスタイプ
インスタンス
1 時間あたりのコスト
ヒューマンタスクあたりのコスト
合計コスト
24
米国東部 (バージニア北部)
処理ジョブ
ml.t3.medium
0.05 USD
1.20 USD
100
任意
0.21 USD
21.00 USD
合計
22.20