Amazon SageMaker AI

フルマネージドインフラストラクチャ、ツール、ワークフローを使用して、あらゆるユースケースのために ML モデル (FM を含む) を構築、トレーニング、デプロイする

SageMaker AI を使用すべき理由

Amazon SageMaker AI は、あらゆるユースケースで高性能で低コストの機械学習 (ML) を実現する幅広いツールを統合したフルマネージドサービスです。SageMaker AI では、Notebook、Debugger、Profiler、Pipeline といった MLOps ツールを使用して、ML モデルの構築、トレーニング、デプロイを単一の統合開発環境 (IDE) で大規模に行うことができます。SageMaker AI は、アクセスコントロールの簡素化と ML プロジェクトの透明性により、ガバナンス要件をサポートします。さらに、基盤モデル (FM) のファインチューニング、実験、再トレーニング、デプロイを行うための専用ツールを使用して、独自の FM、つまり膨大なデータセットでトレーニングされた大規模モデルを構築できます。 また、SageMaker AI は、公開されている FM を含む何百もの事前トレーニング済みモデルへのアクセスを提供します。これらはいくつかの簡単なステップでデプロイできます。

SageMaker AI の利点

データサイエンティストには IDE を、ビジネスアナリストにはノーコードインターフェイスを提供し、より多くの人々が ML でイノベーションを起こすのをサポートします。
統合専用ツールと、高性能で費用対効果の高いインフラストラクチャを使用して、生成 AI アプリケーションを強化する FM を含む独自の ML モデルを構築します。
MLOps のプラクティスとガバナンスを組織全体で自動化および標準化し、透明性と監査可能性をサポートします。
機械学習のライフサイクル全体にわたる人間のフィードバックの力を活用して、ヒューマンインザループ機能を備えた FM の精度と関連性を向上させましょう。
データの準備とモデルトレーニングからモデルのデプロイまで、ML 開発ジャーニー全体を通じて支援を受けることができます。Amazon Q Developer は、コードの提案を生成し、質問に答え、エラーが発生したときにトラブルシューティングの支援を提供できます。

SageMaker AI の料金と AWS 無料利用枠

SageMaker AI の AWS 無料利用枠は、ノートブックの使用のために t2.medium または t3.medium を 250 時間/月、トレーニングのために m4.xlarge または m5.xlarge を 50 時間/月、ホスティングのために m4.xlarge または m5.xlarge を 125 時間/月、それぞれ提供する、2 か月間の無料トライアルを提供します。SageMaker AI の AWS 無料利用枠のオファリングとコスト効率の高い料金オプションの詳細については、SageMaker AI の料金にアクセスしてください。

生成 AI のための SageMaker AI の使用

SageMaker AI は、データサイエンティストや ML エンジニアがゼロから FM を構築し、高度な手法で FM を評価およびカスタマイズして、精度、レイテンシー、コストについての厳しい要件を満たす必要がある生成 AI ユースケースのために、きめ細かいコントロールを備えた FM をデプロイするのに役立ちます。

FM をゼロから構築する

SageMaker AI は、FM を最初から事前トレーニングするためのツールを提供するため、生成 AI アプリケーションのために社内で使用したり、他の企業に提供したりできます。

高度な手法を使用して FM をカスタマイズする

SageMaker AI は、公開されている何百もの FM や、モデルを評価し、特定のユースケースやデータに合わせて完全にカスタマイズするためのツールへのアクセスを提供します。

推論のために FM をデプロイする

SageMaker AI を利用すると、FM を簡単にデプロイして、どのようなユースケースでも極めて高い料金パフォーマンスで推論リクエストを実行できます。

主要な ML フレームワーク、ツールキット、プログラミング言語のサポート

Jupyter のロゴ
TensorFlow のロゴ
PyTorch のロゴ
MXNet のロゴ
Hugging Face のロゴ
Scikit-learn のロゴ
Python のロゴ
R のロゴ

高性能、低コストの機械学習を大規模に

1.5 兆 USD 以上

1 か月あたりの推論リクエスト数

40%

データラベリングのコストを削減

<10 ミリ秒

推論オーバーヘッドレイテンシー