Amazon SageMaker による機械学習ガバナンス

アクセスコントロールを簡素化し透明性を向上

機械学習ガバナンスの理由

Amazon SageMaker AI は、責任を持って機械学習を実装するのに役立つ専用のガバナンスツールを提供します。Amazon SageMaker Role Manager を使用すると、管理者は最小限の権限を数分で定義できます。Amazon SageMaker Model Cards により、構想からデプロイまで、使用目的、リスク評価、トレーニングの詳細など、重要なモデル情報を簡単にキャプチャ、取得、共有できます。Amazon SageMaker モデルダッシュボードは、本番環境でのモデルの動作に関する情報をすべて一元的に提供します。Amazon SageMaker AI と Amazon DataZone の統合により、機械学習とデータガバナンスの合理化がもっと容易になります。

SageMaker 機械学習ガバナンスのメリット

エンタープライズグレードのセキュリティ制御により、機械学習の開発環境を数分でプロビジョニングして、プロジェクト内の機械学習とデータ資産へのアクセスを管理できます。
機械学習 (ML) の実践者がより迅速に SageMaker を使用開始できるようにするカスタマイズされたロールを生成
モデルドキュメンテーションを簡素化し、構想からデプロイまでの主要な仮定、特性、アーティファクトを可視化
統合されたビューを使用して、すべてのモデル、エンドポイント、およびモデルモニタリングジョブのパフォーマンスを迅速に監査およびトラブルシューティングします。自動化されたアラートを使用して、予期されるモデルの動作からの逸脱、およびモニタリングジョブの欠落や非アクティブを追跡

Amazon DataZoneとの統合

設定制御とプロビジョニング

IT 管理者は、Amazon DataZone で企業とユースケースに固有のインフラストラクチャコントロールと許可を定義できます。その後、数回クリックするだけで適切なSageMaker環境を作成し、SageMaker Studio内で開発プロセスを開始できます。

アセットの検索と発見

SageMaker Studio では、組織のビジネスカタログにあるデータや ML アセットを効率的に検索して見つけることができます。また、プロジェクトで使用する必要のあるアセットを購読することで、そのアセットへのアクセスをリクエストすることもできます。

アセットを検索および検出

資産を消費する

サブスクリプションリクエストが承認されると、JupyterLab と SageMaker Canvas を使用して、これらのサブスクライブされたアセットを SageMaker Studio 内のデータ準備、モデルトレーニング、機能エンジニアリングなどの ML タスクで使用できます。

アセットの公開

ML タスクが完了すると、データサイエンティストと ML エンジニアは、データ、モデル、特徴量グループをビジネスカタログに公開して、ガバナンスと見つけやすさを実現できます。

アセットの公開

権限を定義

機械学習アクティビティの権限の簡素化

SageMaker Role Manager は、事前に構築された AWS Identity および Access Management (IAM) ポリシーのカタログを通じて、機械学習アクティビティとペルソナのための権限のベースラインセットを提供します。機械学習アクティビティにはデータの準備とトレーニングを含めることができ、ペルソナには機械学習エンジニアとデータサイエンティストを含めることができます。基本的な権限を維持することも、特定のニーズに基づいてさらにカスタマイズすることもできます。

ロールマネージャー権限の簡略化

IAM ポリシー生成の自動化

ネットワークアクセスの境界や暗号化キーなど、一般的なガバナンスの構成は、いくつかのセルフガイドプロンプトですぐに入力できます。SageMaker Role Manager は、IAM ポリシーを自動的に生成します。生成されたロールと関連するポリシーは、AWS IAM コンソールで確認できます。

マネージドポリシーのアタッチ

ユースケースに合わせて権限をさらに調整するには、マネージド IAM ポリシーを、SageMaker Role Manager で作成した IAM ロールにアタッチします。タグを追加して、AWS サービス間でロールを識別および整理することもできます。

管理ポリシーをアタッチ

文書化を効率化

モデル情報の取得

SageMaker Model Cards は、Amazon SageMaker コンソールのモデル情報のリポジトリであり、責任を持って機械学習を実装できるようにモデルドキュメンテーションを一元化および標準化するのに役立ちます。入力データセット、トレーニング環境、トレーニング結果などのトレーニングの詳細を自動入力して、ドキュメンテーションプロセスを高速化できます。モデルの目的やパフォーマンスの目標などの詳細を追加することもできます。

sagemaker コンソールのモデル情報

評価結果の可視化

バイアスや品質指標などのモデル評価結果をモデルカードに添付し、グラフなどの視覚化を追加して、モデルのパフォーマンスに関する重要なインサイトを得ることができます。

モデルカードで評価結果を可視化

モデルカードの共有

モデルカードを PDF 形式にエクスポートして、ビジネス関係者、社内チームや顧客と簡単に共有できます。

モデル・モニタリング

モデルの動作の追跡

SageMaker Model Dashboard は、デプロイされたモデルとエンドポイントの包括的な概要を提供し、リソースとモデルの動作違反を 1 か所で追跡することができます。モデルの動作は、データ品質、モデル品質、バイアスドリフト、フィーチャーアトリビューションドリフトの 4 つの次元で監視できます。SageMaker Model Dashboard は、Amazon SageMaker Model Monitor および Amazon SageMaker Clarify との統合を通じて動作を監視します。

モデル・ダッシュボード

アラートを自動化

SageMaker Model Dashboard は、モデルモニタリングジョブの欠落や非アクティブとモデル動作の逸脱に対するアラートを設定および受信するための統合エクスペリエンスを提供します。

アラートを自動化

モデル偏差のトラブルシューティング

さらに、個々のモデルを検査し、モデルのパフォーマンスに影響を与える要因を時系列で分析することができます。そして、機械学習実践者のフォローアップを行い、是正措置を講じることができます。