Amazon Bedrock の料金

料金設定の概要

Amazon Bedrock は、単一の API を通じて種々の高性能な基盤モデル (FM) を提供するフルマネージドサービスであり、セキュリティ、プライバシー、責任ある AI により生成 AI アプリケーションを構築するために必要な幅広い機能を備えています。

Amazon Bedrock では、モデルの推論とカスタマイズに料金がかかります。推論については、2 つの料金プランからお選びいただけます: 1.オンデマンド: このモードでは、時間ベースの期間に関する確約をすることなく、従量制料金で FM を使用できます。2.プロビジョンドスループット: このモードでは、時間ベースの期間に関する確約をする代わりに、アプリケーションのパフォーマンス要件を満たす十分なスループットをプロビジョニングできます。

料金モデル

オンデマンドとバッチ

オンデマンドモードでは、使用した分のみのお支払いとなり、時間ベースの契約はありません。テキスト生成モデルでは、入力トークンの処理および出力トークンの生成ごとに課金されます。埋め込みモデルでは、入力トークンの処理ごとに課金されます。トークンは数文字で構成されており、ユーザー入力と、結果を生成するためのプロンプトを理解するためにモデルが学習する基本単位です。画像生成モデルでは、生成されたすべての画像について課金されます。

クロスリージョン推論: オンデマンドモードは、一部のモデルのクロスリージョン推論もサポートしています。これにより、デベロッパーはさまざまな AWS リージョンでコンピューティングを活用してトラフィックバーストをシームレスに管理し、より高いスループット制限と強化された回復力を活用できます。クロスリージョン推論の使用には追加料金は発生せず、料金はリクエストを実行したリージョン (ソースリージョン) に基づいて計算されます。

バッチモードでは、一連のプロンプトを単一の入力ファイルとして提供し、応答を単一の出力ファイルとして受け取ることができるため、大規模な予測を同時に取得できます。レスポンスは処理され、Amazon S3 バケットに保存されるため、後でアクセスできます。Amazon Bedrock は、Anthropic、Meta、Mistral AI、Amazon などの主要な AI プロバイダーから提供される厳選した基盤モデル (FM) を、オンデマンド推論料金と比較して 50% 低い料金でバッチ推論のために提供しています。こちらのモデルリストをご覧ください。

レイテンシー最適化 (パブリックプレビュー)

Amazon Bedrock の基盤モデルのレイテンシー最適化推論は、モデルの応答時間を短縮し、生成 AI アプリケーションの応答性を向上させるのに役立ちます。Anthropic の Claude 3.5 Haiku モデルと Meta の Llama 3.1 405B および 70B モデルには、レイテンシー最適化推論を使用できます。Anthropic が検証したように、Amazon Bedrock でレイテンシーを最適化した推論により、Claude 3.5 Haiku は AWS 上で他のどこよりも高速に動作します。さらに、Bedrock のレイテンシー最適化推論により、Llama 3.1 405B と 70B は、他の主要なクラウドプロバイダーよりも AWS 上で高速に動作します。詳細はこちらをご覧ください。

プロビジョンドスループット

プロビジョンドスループットモードでは、特定のベースモデルまたはカスタムモデルのモデルユニットを購入できます。プロビジョンドスループットモードは、主に、スループットの保証を必要とする大規模で一貫性のある推論ワークロード向けに設計されています。カスタムモデルには、プロビジョンドスループットを使用してのみアクセスできます。モデルユニットは、1 分あたりに処理される入力トークンまたは出力トークンの最大数によって測定される特定のスループットを提供します。時間単位で課金されるこのプロビジョンドスループット料金設定では、1 か月または 6 か月の契約期間を柔軟に選択できます。

カスタムモデルインポート

カスタムモデルインポートにより、以前に設備投資してカスタマイズしたモデルを Amazon Bedrock 内で活用し、それらのモデルを Bedrock の既存のホストされた基盤モデルと同じフルマネージドで使用できます。サポートされているモデルアーキテクチャのカスタム重みをインポートし、オンデマンドモードを使用してカスタムモデルを提供できます。カスタムモデルの Bedrock へのインポートに料金はかかりません。モデルをインポートすると、コントロールプレーンアクションを実行する必要なく、オンデマンドでそのモデルにアクセスできるようになります。モデルの推論についてのみ課金されます。課金は推論ボリュームを処理するために必要なカスタムモデルのコピー数と、各モデルコピーがアクティブな期間に基づいて、5 分間のウィンドウごとに課金されます。モデルコピーは、推論リクエストを処理する準備が整っているインポートされたモデルの単一インスタンスです。モデルコピーごとの 1 分あたりの料金は、アーキテクチャ、コンテキストの長さ、AWS リージョン、コンピューティングユニットのバージョン (ハードウェア世代) などの要因によって異なり、モデルコピーのサイズによって階層化されます。

Marketplace モデル

Amazon Bedrock Marketplace を使用すると、Bedrock で 100 を超える人気の基盤モデル、新しい基盤モデル、および専門的な基盤モデルを見つけて、テストし、使用できます。Amazon Bedrock Marketplace モデルはエンドポイントにデプロイされ、そこで必要なインスタンス数とインスタンスタイプを選択できるほか、ワークロードの需要を満たすように自動スケーリングポリシーを設定できます。独自のモデルの場合、モデルプロバイダーによって設定されたソフトウェア料金 (時間単位、秒単位の増分での請求、またはリクエスト単位) と、選択したインスタンスに基づくインフラストラクチャ料金が課金されます。これらの料金は、プロバイダーモデルをサブスクライブする前に確認できるほか、AWS Marketplace のモデル一覧からも確認できます。公開モデルの場合、選択したインスタンスに基づくインフラストラクチャ料金のみが課金されます。こちらで詳細をご覧ください。

カスタマイズと最適化

モデルのカスタマイズ

Amazon Bedrock を使用すると、データを使用して FM をカスタマイズし、特定のタスクやビジネスコンテキストに合わせてカスタマイズされた応答を提供できます。ラベル付けされたデータを使用してモデルを微調整することも、ラベル付けされていないデータで継続的な事前トレーニングを行うこともできます。テキスト生成モデルのカスタマイズでは、モデルが処理したトークンの数 (トレーニングデータコーパス内のトークン数 x エポック数) に基づいてモデルトレーニング費用が課金されます。また、モデルのストレージはモデルごとに毎月課金されます。エポックとは、微調整プロセス中にトレーニングデータセットを 1 回完全に通過することを指します。カスタマイズされたモデルを使用した推論は、プロビジョニングされたスループットプランに基づいて課金され、プロビジョニングされたスループットを購入する必要があります。カスタマイズされたモデルでは、1 つのモデルユニットが契約期間なしで、推論に使用できます。この単一モデルユニットがカスタムモデルの推論に使用した時間数に対して課金されます。スループットを 1 つのモデルユニットを超えて増やしたい場合は、1 か月または 6 か月の契約期間を購入する必要があります。

モデル蒸留

Amazon Bedrock モデル蒸留では、使用した分の料金のみをお支払いいただきます。合成データの生成は、選択した教師モデルのオンデマンド料金に基づいて課金されます。生徒モデルのファインチューニングは、モデルのカスタマイズ料金に基づいて課金されます。蒸留モデルはカスタマイズされたモデルであるため、カスタマイズされたモデルを使用した推論はプロビジョンドスループットプランに基づいて課金され、お客様はプロビジョンドスループットを購入する必要があります。

プロンプトキャッシュ

Amazon Bedrock でのプロンプトキャッシュを使用すると、複数の API コールで繰り返されるコンテキストをキャッシュして、コストを削減し、応答のレイテンシーを低減できます。プロンプトには、長いマルチターンの会話、多ショットの例、モデルの動作を改善する詳細な手順など、共通のコンテキストまたはプレフィックスが含まれることがよくあります。既存の Amazon Bedrock API を使用して、AWS アカウント固有のキャッシュに 5 分間にわたってキャッシュするプロンプトプレフィックスを指定できます。その間、一致するプレフィックスを持つリクエストでは、キャッシュされたトークンで最大 90% の割引を受けることができるほか、レイテンシーが最大 85% 改善されます。料金とパフォーマンスにおける改善はモデルとプロンプトの長さによって異なりますが、キャッシュは常に AWS アカウントに分離されます。

ツール

ガードレールを設定

Amazon Bedrock のガードレールは、生成 AI アプリケーションのためにカスタマイズされたセーフガードと責任ある AI ポリシーを実装するのに役立ちます。FM が提供するネイティブ保護に加えて、カスタマイズ可能な追加の安全保護を提供します。これは大手クラウドプロバイダーが提供する唯一の責任ある AI 機能であり、お客様が単一のソリューションで生成 AI アプリケーションの安全性、プライバシー、および真正性の保護を構築およびカスタマイズできるようにするのに役立ちます。ガードレールは、Amazon Bedrock のすべての FM、およびファインチューニングされたモデルで動作します。Bedrock のガードレールは、責任ある AI ポリシーに適合する生成 AI アプリケーションを構築するために、Amazon Bedrock のエージェントやナレッジベースと統合することも可能です。さらに、Bedrock 以外のカスタムまたはサードパーティー FM によって生成されたユーザー入力とモデル応答を評価するのに役立つよう、ApplyGuardrail API を提供します。

ナレッジベースとデータオートメーション

Amazon Bedrock のナレッジベースは、フルマネージド検索拡張生成 (RAG) ワークフローです。これにより、お客様は独自のデータソースから取得したコンテキスト情報を組み込むことで、高精度、低レイテンシー、安全なカスタム生成 AI アプリケーションを作成できます。プレビューでは、S3、Confluence、Salesforce、SharePoint などのさまざまなデータソースをサポートしています。ストリーミングデータのドキュメント取り込みも提供しています。Bedrock のナレッジベースは、非構造化データを埋め込みに変換し、ベクトルデータベースに保存して、さまざまなデータストアからの取得を可能にします。また、マネージド取得のために Kendra と統合し、自然言語から SQL への変換を使用して構造化データの取得をサポートします。

Amazon Bedrock のデータオートメーションは、インテリジェントドキュメント処理、動画分析、RAG などのユースケース向けに、非構造化マルチモーダルコンテンツを構造化データ形式に変換します。Bedrock のデータオートメーションは、動画のシーンごとの説明、音声文字起こし、自動ドキュメント分析など、モダリティ固有の事前定義済みのデフォルトを使用して、標準出力コンテンツを生成できます。お客様は、独自のデータスキーマに基づいてブループリントで出力要件を指定することでカスタム出力を追加で作成し、既存のデータベースまたはデータウェアハウスに簡単にロードできます。ナレッジベースとの統合により、Bedrock のデータオートメーションを使用して RAG アプリケーション用にコンテンツを解析することもできます。これにより、画像とテキストの両方に埋め込まれた情報を含めることで、結果の精度と関連性を高めることができます。

エージェント

Amazon Bedrock のエージェントを使用すると、アプリケーション内で自律エージェントを構築および設定できます。これらのエージェントは、会社のデータソースに安全に接続するとともに、ユーザーリクエストを適切な情報で補足して、正確な応答を生成します。わずか数ステップで単一およびマルチエージェントのアプリケーションを作成できるため、生成 AI アプリケーションの構築にかかる時間を短縮できます。これらのエージェントは、コードを動的に生成して実行するコード解釈と Return of control をサポートしているため、アクションスキーマを定義して、エージェントがアクションを呼び出すたびにコントロールを取り戻すことができます。さらに、Amazon Bedrock のエージェントは、複数のやり取りにまたがって記憶を維持できるため、よりシームレスでパーソナライズされたユーザーエクスペリエンスを実現できます。

Flows

Amazon Bedrock Flows は、生成 AI アプリケーション向けの Bedrock のワークフローオーサリングおよび実行機能です。直感的なビジュアルビルダーと一連の API により、ユーザー定義の生成 AI ワークフローの作成、テスト、デプロイを加速します。これにより、最新の基盤モデル、プロンプト、エージェント、ナレッジベース、ガードレール、AWS サービス (Amazon Lex、AWS Lambda、Amazon S3 など) をビジネスロジックとシームレスにリンクして、生成 AI ワークフローを構築できます。独自のインフラストラクチャを構築しなくても、ビジュアルインターフェイスや API を通じてワークフローを簡単にテストおよびバージョン管理し、安全なサーバーレス環境で実行できます。

評価

モデル評価: Amazon Bedrock のモデル評価では、使用した分だけ料金を支払うことができ、プロンプトやレスポンスの数に対する最小ボリューム制限はありません。自動評価 (プログラムによる) の場合は、評価で選択したモデルから推論した分のみお支払いいただきます。自動生成されたアルゴリズムスコアは追加料金なしで提供されます。自動 (モデル/LLM-as-a-judge) 評価のパブリックプレビュー中は、選択したジェネレーターモデルとエバリュエーターモデルから推論した分のみお支払いいただきます。LLM-as-a-judge モデル評価ジョブでは、組み込みのメトリクスは、各メトリクスに固有のシステム判断プロンプトテンプレートと、トークンの使用量の一部として課金される利用可能な判断モデルを使用します。判断プロンプトは、透明性を高めるために公開されている AWS ドキュメントで入手できます。自分の作業チームを連れてくる人間ベースの評価では、評価におけるモデル推論の料金と、完了したヒューマンタスクごとに0.21ドルの料金がかかります。ヒューマンタスクとは、人間の作業者が単一のプロンプトとそれに関連する推論応答の評価をヒューマン評価ユーザーインターフェイスに送信したこととして定義されます。評価業務にモデルが 1 つでも 2 つでも料金は同じで、評価指標や評価方法をいくつ含めても同じです。ヒューマンタスクの料金は AWS 請求書の Amazon SageMaker セクションに表示され、すべての AWS リージョンで同じです。人件費はお客様負担となりますので、別途人件費はかかりません。AWS が管理する専門家による評価では、AWS 専門家評価チームと連携しながら、プライベート契約でお客様の評価ニーズに合わせて価格をカスタマイズします。

Amazon Bedrock ナレッジベース評価 (RAG 評価): Amazon Bedrock ナレッジベース評価 (RAG 評価) では、使用した分だけ料金が発生し、プロンプトやレスポンスの数に対する最小ボリューム制限はありません。パブリックプレビュー中は、選択したジェネレーターモデルとエバリュエーターモデル (評価ジョブでは LLM-as-a-judge を使用) から推論した分と、Amazon Bedrock のナレッジベースの料金に従って評価ジョブでナレッジベースを使用したことで発生した料金のみお支払いいただきます。ナレッジベース評価 (RAG 評価) ジョブでは、組み込みのメトリクスは、各メトリクスに固有のシステム判断プロンプトテンプレートと、トークンの使用量の一部として課金される利用可能な判断モデルを使用します。判断プロンプトは、透明性を高めるために公開されている AWS ドキュメントで入手できます。メトリクスによっては、入力プロンプトに加えて、ナレッジベースから取得したコンテキストや実施検証データから得られた回答に基づいて判断モデルの推論を行う必要があるため、各メトリクスに関連するコストに影響が及びます。各メトリクスの詳細については、AWS の評価に関する公開ドキュメントを参照してください。

料金の詳細

料金は、モダリティ、プロバイダー、モデルによって異なります。詳細な料金を確認するには、モデルプロバイダーを選択してください。

Amazon Bedrock は、Anthropic、Meta、Mistral AI、Amazon などの主要な AI プロバイダーから提供される厳選した基盤モデル (FM) を、オンデマンド推論料金と比較して 50% 低い料金でバッチ推論用に提供しています。モデルのリストについては、こちらをご覧ください。

AI21 Labs

AI21 Labs

オンデマンド料金

AI21 Labs モデル	入力トークン 1,000 個あたりの価格	1,000 出力トークンあたりの料金
Jamba 1.5 Large	0.002 USD	0.008 USD
Jamba 1.5 Mini	0.0002 USD	0.0004 USD
Jurassic-2 Mid	0.0125 USD	0.0125 USD
Jurassic-2 Ultra	0.0188 USD	0.0188 USD
Jamba-Instruct	0.0005 USD	0.0007 USD

Amazon
- Amazon Nova
- Amazon Titan
- その他の Amazon
- Amazon Nova
- Amazon Nova
  
  モデルを理解するための料金
  
  クリエイティブコンテンツ生成モデルの料金
- Amazon Titan
- Amazon Titan
- その他の Amazon
Anthropic

Anthropic

オンデマンド料金とバッチ料金

リージョン: 米国リージョン

Anthropic のモデル	入力トークン 1,000 個あたりの価格	1,000 出力トークンあたりの料金	1,000 入力トークンあたりの料金 (バッチ)	1,000 出力トークンあたりの料金 (バッチ)	1,000 入力トークンあたりの料金 (キャッシュ書き込み)	1,000 入力トークンあたりの料金 (キャッシュ読み取り)
Claude 3.7 Sonnet***	0.003 USD	0.015 USD	該当なし	該当なし	0.00375 USD	0.0003 USD
Claude 3.5 Sonnet**	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD	0.00375 USD	0.0003 USD
Claude 3.5 Haiku	0.0008 USD	0.004 USD	0.0005 USD	0.0025 USD	0.001 USD	0.00008 USD
Claude 3 Opus*	0.015 USD	0.075 USD	0.0075 USD	0.0375 USD	NA	NA
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD	NA	NA
Claude 3 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD	NA	NA
Claude 2.1	0.008 USD	0.024 USD	NA	該当なし	該当なし	NA
Claude 2.0	0.008 USD	0.024 USD	NA	該当なし	該当なし	NA
Claude Instant	0.0008 USD	0.0024 USD	NA	該当なし	該当なし	NA
*Claude 3 Opus は現在、米国西部 (オレゴン) リージョンでご利用いただけます
**Claude 3.5 Sonnet の料金は、Claude 3.5 Sonnet の各バージョン (v1 および v2) に適用されます – Claude 3.5 Sonnet v2 は現在、米国西部 (オレゴン) リージョンでご利用いただけます
***Claude 3.7 Sonnet は、米国東部 (オハイオ) リージョンでもご利用いただけます

Anthropic のモデル	入力トークン 1,000 個あたりの価格	1,000 出力トークンあたりの料金	1,000 入力トークンあたりの料金 (バッチ)	1,000 出力トークンあたりの料金 (バッチ)	1,000 入力トークンあたりの料金 (キャッシュ書き込み)	1,000 入力トークンあたりの料金 (キャッシュ読み取り)
Claude 3.5 Sonnet**	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD	0.00375 USD	0.0003 USD
Claude 3.5 Haiku	0.001 USD	0.005 USD	0.0005 USD	0.0025 USD	0.001 USD	0.00008 USD
Claude 3 Opus*	0.015 USD	0.075 USD	0.0075 USD	0.0375 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD
Claude 3 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 2.1	0.008 USD	0.024 USD	該当なし	該当なし
Claude 2.0	0.008 USD	0.024 USD	該当なし	該当なし
Claude Instant	0.0008 USD	0.0024 USD	該当なし	該当なし
*Claude 3 Opus は現在、米国西部 (オレゴン) リージョンでご利用いただけます
**Claude 3.5 Sonnet の料金は、Claude 3.5 Sonnet の各バージョン (v1 および v2) に適用されます - Claude 3.5 Sonnet v2 は現在、米国西部 (オレゴン) リージョンでご利用いただけます

リージョン: 欧州 (ロンドン)

Anthropic モデル	入力トークン 1,000 個あたりの価格	1,000 出力トークンあたりの料金	1,000 入力トークンあたりの料金 (バッチ)	1,000 出力トークンあたりの料金 (バッチ)
Claude 3 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD

リージョン: 欧州 (チューリッヒ)

Anthropic モデル

入力トークン 1,000 個あたりの価格

1,000 出力トークンあたりの料金

1,000 入力トークンあたりの料金 (バッチ)

1,000 出力トークンあたりの料金 (バッチ)

Claude 3.5 Sonnet

0.003 USD

0.015 USD

0.0015 USD

0.0075 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

リージョン: 南米 (サンパウロ)

Anthropic モデル

入力トークン 1,000 個あたりの価格

1,000 出力トークンあたりの料金

1,000 入力トークンあたりの料金 (バッチ)

1,000 出力トークンあたりの料金 (バッチ)

Claude 3 Sonnet

0.003 USD

0.015 USD

0.0015 USD

0.0075 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

リージョン: カナダ (中部)

Anthropic モデル

入力トークン 1,000 個あたりの価格

1,000 出力トークンあたりの料金

1,000 入力トークンあたりの料金 (バッチ)

1,000 出力トークンあたりの料金 (バッチ)

Claude 3 Sonnet

0.003 USD

0.015 USD

0.0015 USD

0.0075 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

リージョン: アジアパシフィック (ムンバイ)

Anthropic のモデル

入力トークン 1,000 個あたりの価格

1,000 出力トークンあたりの料金

1,000 入力トークンあたりの料金 (バッチ)

1,000 出力トークンあたりの料金 (バッチ)

Claude 3 Sonnet

0.003 USD

0.015 USD

0.0015 USD

0.0075 USD

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

リージョン: アジアパシフィック (シドニー)

Anthropic モデル	入力トークン 1,000 個あたりの価格	1,000 出力トークンあたりの料金	1,000 入力トークンあたりの料金 (バッチ)	1,000 出力トークンあたりの料金 (バッチ)
Claude 3.5 Sonnet v2	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 3 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD

リージョン: アジアパシフィック (東京)

Anthropic モデル	入力トークン 1,000 個あたりの価格	1,000 出力トークンあたりの料金	1,000 入力トークンあたりの料金 (バッチ)	1,000 出力トークンあたりの料金 (バッチ)
Claude Instant	0.0008 USD	0.0024 USD	該当なし	該当なし
Claude 2.0/2.1	0.008 USD	0.024 USD	該当なし	該当なし
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD
Claude 3.5 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD

リージョン: アジアパシフィック (シンガポール)

Anthropic モデル	入力トークン 1,000 個あたりの価格	1,000 出力トークンあたりの料金	1,000 入力トークンあたりの料金 (バッチ)	1,000 出力トークンあたりの料金 (バッチ)
Claude Instant	0.0008 USD	0.0024 USD	0.0004 USD	0.0012 USD
Claude 2.0/2.1	0.008 USD	0.024 USD	0.004 USD	0.012 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD
Claude 3.5 Sonnet	0.003 USD	0.015 USD	該当なし	該当なし

リージョン: 欧州 (パリ)

Anthropic モデル

入力トークン 1,000 個あたりの価格

1,000 出力トークンあたりの料金

1,000 入力トークンあたりの料金 (バッチ)

1,000 出力トークンあたりの料金 (バッチ)

Claude 3 Haiku

0.00025 USD

0.00125 USD

0.000125 USD

0.000625 USD

Claude 3 Sonnet

0.003 USD

0.015 USD

0.0015 USD

0.0075 USD

リージョン: 欧州 (フランクフルト)

Anthropic モデル	入力トークン 1,000 個あたりの価格	1,000 出力トークンあたりの料金	1,000 入力トークンあたりの料金 (バッチ)	1,000 出力トークンあたりの料金 (バッチ)
Claude Instant	0.0008 USD	0.0024 USD	該当なし	該当なし
Claude 2.0/2.1	0.008 USD	0.024 USD	該当なし	該当なし
Claude 3 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 3.5 Sonnet	0.003 USD	0.015 USD	0.0015 USD	0.0075 USD
Claude 3 Haiku	0.00025 USD	0.00125 USD	0.000125 USD	0.000625 USD

リージョン: アジアパシフィック (ソウル)

Anthropic モデル

入力トークン 1,000 個あたりの価格

1,000 出力トークンあたりの料金

1,000 入力トークンあたりの料金 (バッチ)

1,000 出力トークンあたりの料金 (バッチ)

Claude 3.5 Sonnet

0.003 USD

0.015 USD

該当なし

Claude 3 Haiku

0.00025 USD

0.00125 USD

該当なし

リージョン: 米国東部 (オハイオ)

Anthropic モデル

入力トークン 1,000 個あたりの価格

1,000 出力トークンあたりの料金

1,000 入力トークンあたりの料金 (バッチ)

1,000 出力トークンあたりの料金 (バッチ)

Claude 3.5 Sonnet

0.003 USD

0.015 USD

該当なし

Claude 3 Haiku

0.00025 USD

0.00125 USD

該当なし

リージョン: AWS GovCloud (米国西部) および AWS GovCloud (米国東部)

Anthropic モデル	入力トークン 1,000 個あたりの価格	1,000 出力トークンあたりの料金
Claude 3.5 Sonnet	0.0036 USD	0.018 USD
Claude 3 Haiku	0.0003 USD	0.0015 USD

レイテンシー最適化推論

リージョン: 米国東部 (オハイオ)

	1,000 入力トークンあたりの料金	1,000 出力トークンあたりの料金
Claude 3.5 Haiku	0.001 USD	0.005 USD

リージョン: 米国東部 (バージニア北部)

	1,000 入力トークンあたりの料金	1,000 出力トークンあたりの料金
Claude 3.5 Haiku	0.001 USD	0.005 USD

リージョン: 米国西部 (オレゴン)

	1,000 入力トークンあたりの料金	1,000 出力トークンあたりの料金
Claude 3.5 Haiku	0.001 USD	0.005 USD

プロビジョンドスループットの料金

米国東部 (バージニア北部) と米国西部 (オレゴン)

Anthropic モデル	モデルごとの1時間あたりの価格とコミットメントなし	1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金	6 か月契約の 1 モデルあたりの時間料金
Claude Instant	44.00 USD	39.60 USD	22.00 USD
Claude 2.0/2.1	70.00 USD	63.00 USD	35.00 USD

Anthropic モデル	モデルごとの1時間あたりの価格とコミットメントなし	1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金	6 か月契約の 1 モデルあたりの時間料金
Claude Instant	44.00 USD	39.60 USD	22.00 USD
Claude 2.0/2.1	70.00 USD	63.00 USD	35.00 USD

親リージョン: アジアパシフィック (東京)

Anthropic モデル	1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金	6 か月契約の 1 モデルあたりの時間料金
Claude Instant	53.00 USD	29.00 USD
Claude 2.0/2.1	86.00 USD	48.00 USD

AWS リージョン: 欧州 (フランクフルト)

Anthropic モデル	1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金	6 か月契約の 1 モデルあたりの時間料金
Claude Instant	49.00 USD	27.00 USD
Claude 2.0/2.1	79.00 USD	44.00 USD

モデルユニットの詳細については、AWS アカウントチームにお問い合わせください。

Cohere

Cohere

オンデマンド料金

Cohere モデル	1,000 入力トークンあたりの料金	1,000 出力トークンあたりの料金	画像あたりの料金
Command	0.0015 USD	0.0020 USD	該当なし
Command-Light	0.0003 USD	0.0006 USD	該当なし
Command R+	0.0030 USD	0.0150 USD	該当なし
Command R	0.0005 USD	0.0015 USD	該当なし
Embed 3 English	0.0001 USD	該当なし	0.0001 USD
Embed 3 Multilingual	0.0001 USD	該当なし	0.0001 USD

Cohere モデル	1,000 クエリあたりの料金**
Rerank 3.5	2.00 USD
** 1 つのクエリに最大 100 個のドキュメントチャンクを含めることができるクエリの数に対して課金されます。クエリに 100 個を超えるドキュメントチャンクが含まれている場合は、複数のクエリとしてカウントされます。たとえば、リクエストに 350 のドキュメントが含まれている場合、4 つのクエリとして扱われます。各ドキュメントには最大 500 個のトークン (クエリとドキュメントの合計トークンを含む) しか含めることができず、トークンの長さが 512 トークンを超える場合は複数のドキュメントに分割されることに注意してください。

モデルのカスタマイズ (微調整) の料金:

Cohere モデル	1000 個のトークンをトレーニングする場合の料金*	各カスタムモデルの 1 か月あたりの保存料金	1 時間あたり 1 モデルユニットに対するカスタムモデルから推測する料金 (契約なしのプロビジョンドスループット料金)
Cohere Command	0.004 USD	1.95 USD	49.50 USD
Cohere Command-Light	0.001 USD	1.95 USD	8.56 USD

*トレーニングされたトークンの総数 = トレーニングデータコーパス内のトークン数 x エポック数

プロビジョンドスループットの料金

Cohere モデル	モデルごとの 1 時間あたりの価格コミットメントなしで	1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金	6 か月契約の 1 モデルあたりの時間料金
Cohere Command	49.50 USD	39.60 USD	23.77 USD
Cohere Command - Light	8.56 USD	6.85 USD	4.11 USD
Embed 3 English	7.12 USD	6.76 USD	6.41 USD
Embed 3 Multilingual	7.12 USD	6.76 USD	6.41 USD

モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。

Luma AI

オンデマンド料金

Luma AI モデル	ビデオ解像度	生成された動画の 1 秒あたりの料金
Luma Ray2	720p、24 fps	1.50 USD
Luma Ray2	540p、24 fps	0.75 USD

Meta Llama

Meta Llama

Llama 3.3

オンデマンド料金とバッチ料金

Llama 3.2

オンデマンド料金とバッチ料金

Llama 3.1

オンデマンド料金とバッチ料金

モデルのカスタマイズ (微調整) の料金

プロビジョンドスループットの料金

Llama 3

オンデマンド料金

Llama 2

オンデマンド料金

リージョン: 米国東部 (バージニア北部) と米国西部 (オレゴン)

Meta のモデル	入力トークン 1,000 個あたりの価格	出力トークン 1,000 個あたりの価格
Llama 2 Chat (13B)	0.00075 USD	0.001 USD
Llama 2 Chat (70B)	0.00195 USD	0.00256 USD

モデルのカスタマイズ (微調整) の料金

メタモデル	1000 個のトークンをトレーニングする場合の料金*	各カスタムモデルの 1 か月あたりの保存料金	1 時間あたり 1 モデルユニットに対するカスタムモデルから推測する料金 (契約なしのプロビジョンドスループット料金)
Llama 2 Pretrained (13B)	0.00149 USD	1.95 USD	23.50 USD
Llama 2 Pretrained (70B)	0.00799 USD	1.95 USD	23.50 USD

*カスタムモデルストレージ = 1.95 USD

プロビジョンドスループットの料金

メタモデル	1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金	6 か月契約の 1 モデルあたりの時間料金
Llama 2 Pretrained と Chat (13B)	21.18 USD	13.08 USD
Llama 2 Pretrained (70B)	21.18 USD	13.08 USD

*Llama 2 Pretrained モデルは、カスタマイズ後にプロビジョニングされたスループットでのみ利用可能です。

モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。

Mistral AI
Mistral AI
Stability AI

Stability AI

オンデマンド料金

Stability AI モデル	生成画像あたりの料金
Stable Diffusion 3.5 Large	0.08 USD
Stable Image Core	0.04 USD
Stable Diffusion 3 Large	0.08 USD
Stable Image Ultra	0.14 USD

Stability AI が提供する、前世代の画像モデルは、ステップ数と画像解像度に応じて、画像ごとに料金設定されています。

Stability AI モデル	画像解像度	標準画質 (50ステップ以下) で生成された画像1枚あたりの価格	高品質で生成された画像あたりの料金 (50 ステップ超)
SDXL 1.0	1024 x 1024 まで	0.04 USD	0.08 USD

プロビジョンドスループットの料金

Stability AI モデル	1 か月契約の 1 モデルユニットあたり 1 時間あたりの料金*	6 か月契約の 1 モデルあたりの時間料金*
SDXL 1.0	49.86 USD	46.18 USD

*ベースモデルとカスタムモデルの推論を含みます。

モデルユニットの詳細については、AWS アカウントまたは営業チームにお問い合わせください。

現在、モデルのカスタマイズ (ファインチューニング) は、Amazon Bedrock での Stability AI モデルではサポートされていません。

カスタムモデルインポート