Amazon SageMaker のデータと AI ガバナンス

データと AI を安全に発見、管理、共同作業

概要

次世代の Amazon SageMaker は、レイクハウス、AI モデル、アプリケーション全体にわたるデータや AI の検出、ガバナンス、コラボレーションを簡素化します。Amazon DataZone 上に構築された Amazon SageMaker Catalog では、ユーザーが生成 AI 作成のメタデータを用いたセマンティック検索を使用して承認されたデータやモデルをセキュアに検出してアクセスすることができ、Amazon Q Developer にデータを見つけるよう自然言語で指示することも可能です。ユーザーは、Amazon SageMaker Unified Studio (プレビュー) できめ細かなアクセスコントロールを用いた単一の許可モデルを一元的に使用して、アクセスポリシーを一貫した方法で定義および適用できます。簡単なパブリッシュとサブスクライブのワークフローを通じて、データと AI アセットをシームレスに共有し、コラボレーションできます。SageMaker では、Amazon Bedrock のガードレールを使用して AI モデルを保護するとともに、責任ある AI ポリシーを実装することができます。データ品質の監視とオートメーション、機密データの検出、データと機械学習 (ML) のリネージを通じて、組織全体で信頼性を築きましょう。

利点

Amazon DataZone 上に構築された SageMaker Catalog を使用して、データと AI アセットを大規模に検出しましょう。生成 AI でデータ検出を強化してデータとメタデータをビジネスコンテキストで自動的に充実させ、すべてのユーザーがデータを簡単に検索、理解、使用できるようにします。テーブルや列の名前、またはビジネス用語集の用語でのフィルタリングを使用して、データ、AI モデル、プロンプト、生成 AI アセットを共有します。各データセットにとって有益な列と関連する分析アプリケーションを自動的に推奨することで、適切なデータを使用して適切なモデルを迅速に構築できるようにします。プロジェクトを通じてワークフローの公開とサブスクリプションを 1 つのエクスペリエンスで行うことで、シームレスなデータと AI の共有により一元管理型と分散管理型の両方のモデルをサポートします。

SageMaker でデータ品質、データ、ML リネージをリアルタイムで可視化することで、信頼を獲得します。データプロファイリングとデータ品質推奨を自動化し、データ品質ルールを監視して、アラートを受信します。ルールベースのアプローチと機械学習アプローチを用いてエンティティを照合することで見つけにくいデータ品質上の課題を解決し、自信を持ってビジネス上の意思決定を行うための高品質データを提供できるようにします。ビルトインのモデルモニタリング機能でデータパイプラインや AI プロジェクトの透明性を高め、バイアスを検出したり、特徴がモデル予測にどのように寄与するかを報告したりできます。
きめ細かなアクセス制御、データ分類、ガードレールを使用して SageMaker でデータと AI のセキュリティを一元化し、データ、分析、AI モデルが適切に使用されるようにします。アクセス許可を一度定義すれば、データとモデル全体に適用できます。Amazon Bedrock IDE (プレビュー) がネイティブに統合されているため、お客様はその生成 AI アプリケーションで、有害なコンテンツをブロックし、ハルシネーションをフィルタリングして、プライバシー、安全性、正確性を確保するためのカスタマイズ可能な保護対策を有効化する Amazon Bedrock のガードレールを活用できます。Amazon Comprehend を使用してパイプライン内の機密情報を自動的に識別します。
データ使用とモデルのログ記録と監視により、監査と規制コンプライアンスに対応できます。プロジェクトベースの分離により、企業全体で分析と AI アセットの適切な使用をサポートします。レイクハウス全体でデータとモデルの使用状況を把握して、セキュリティを強化しましょう。Amazon SageMaker Clarify を使用すると、責任ある AI 基準に沿って、モデルのバイアス、精度、堅牢性をモニタリングできます。コストをビジネスの取り組みに合わせて調整し、ビジネス投資を明確に把握しましょう。

特徴

コンテキストと検索可能性を考慮して精選されたデータ

SageMaker Catalog は、ビジネスコンテキストをテクニカルメタデータに取り込み、データをビジネスコンテキストで充実させることを可能にします。すべてのユーザーが迅速かつ容易にデータを見つけ、理解し、信頼できるように、ビジネスコンテキストとともにデータを表示することができます。

メタデータの自動推奨

データへのビジネス内容や名前の追加を自動化します。これは、コンテキストを理解しやすくすると同時に、わかりにくい技術的な名前に対処する必要をなくします。この自動化は、精度と一貫性を高めるために大規模言語モデル (LLM) によって強化されています。

すべてのアプリケーションで一貫したレベルの AI 安全性を実現

Amazon Bedrock のガードレールは、ユースケース固有のポリシーに基づいてユーザー入力と基盤モデル (FM) 応答を評価するために役立ち、基盤となる FM が何であるかにかかわらず、追加の保護レイヤーを提供します。

モデルの迅速な監査と追跡

統合されたビューを通じて、すべてのモデル、エンドポイント、モデルモニタリングジョブのパフォーマンスの監査とラブルシューティングを迅速に実行します。予想されるモデル動作からの逸脱や、欠落または非アクティブ状態のモニタリングジョブの追跡には、自動化されたアラートを使用します。

データ品質

データ品質に関する統計情報を使用すると、データの利用者は AWS またはサードパーティーのシステムからのデータ品質に関するメトリクスを確認できます。データの利用者は、意思決定に使用するデータソースを信頼して、アセットを検索する際にデータ品質のコンテキストを把握することができます。また、データプロデューサーや IT チームは、API を使用してサードパーティーシステムからのデータ品質に関する統計情報をコンソール外の統合ポータルに組み込むことも可能です。

データと ML リネージ

時間の経過に合わせてデータとモデルの動きを把握できます。リネージは、データがどこから来たのか、どのように変化したのか、どのように利用されているのかをデータ利用者が理解できるようにすることで、信頼性と組織のデータと AI のリテラシーを高めるのに役立ちます。データ、AI アセット、およびそれらの関係のマッピング、パイプラインのトラブルシューティングと開発、データと AI ガバナンスの慣行のアサーションに費やす時間を短縮できます。