Domande frequenti sulla governance dei dati e dell'IA di Amazon SageMaker

Governance dei dati e dell'IA

La nuova generazione di Amazon SageMaker semplifica l'individuazione, la governance e la collaborazione per i dati e l'IA nel tuo lakehouse, nei modelli di intelligenza artificiale e nelle applicazioni. Con Amazon SageMaker Catalog, creato su Amazon DataZone, gli utenti possono individuare e accedere in modo sicuro a dati e modelli approvati utilizzando la ricerca semantica con metadati creati dall'IA generativa, oppure possono semplicemente chiedere a Q Developer con linguaggio naturale di trovare i propri dati. Gli utenti possono definire e applicare le policy di accesso in modo coerente utilizzando un unico modello di autorizzazione con controlli di accesso granulari centralmente in SageMaker Unified Studio (anteprima). Condividi e collabora senza problemi su dati e risorse di IA attraverso flussi di lavoro di semplice pubblicazione e sottoscrizione. Con Amazon SageMaker, puoi salvaguardare e proteggere i tuoi modelli di IA con guardrail Amazon Bedrock e implementare policy di IA responsabile. Crea fiducia in tutta l'organizzazione con il monitoraggio e l'automazione della qualità dei dati, il rilevamento dei dati sensibili e il lineage di dati e ML.

Puoi accedere a SageMaker Catalog tramite Amazon SageMaker Unified Studio (anteprima), un ambiente unico per lo sviluppo di dati e intelligenza artificiale. Per impostare, configurare o integrare in modo programmatico i processi esistenti, SageMaker Catalog dispone di API pubblicate con linee guida su come utilizzare le API di Amazon DataZone.

  • Difficoltà nel reperimento e nella condivisione dei dati tra i team: i produttori e i consumatori di dati spesso affrontano difficoltà nell'individuare e condividere rapidamente i set di dati pertinenti all'interno dell'organizzazione. Questa inefficienza comporta perdite di tempo nella ricerca dei dati e limita la collaborazione.
  • Mancanza di fiducia nella qualità dei dati e negli output dei modelli di intelligenza artificiale: le organizzazioni hanno difficoltà a fidarsi della qualità dei dati e dell'accuratezza degli output dei modelli di intelligenza artificiale a causa della mancanza di visibilità sull'origine dei dati, nonché sulla loro qualità e sui modelli di accesso.
  • Accesso incoerente ai dati e violazioni della privacy: le organizzazioni hanno difficoltà ad applicare policy di accesso ai dati coerenti, con conseguente potenziale accesso non autorizzato a informazioni sensibili.
  • Difficoltà a mantenere la conformità alle normative e alle policy interne: le organizzazioni hanno difficoltà a mantenere la conformità alle normative e ad aderire alle policy interne, a causa della mancanza di strumenti completi di audit e monitoraggio.

La governance dei dati e dell'IA Amazon in Amazon SageMaker aiuta i team di dati a raggiungere i seguenti obiettivi:

  • Individuazione dei dati e collaborazione più rapide: gli utenti possono trovare e condividere rapidamente i dati pertinenti in tutta l'organizzazione, riducendo il tempo dedicato alla ricerca di informazioni e promuovendo il lavoro in team.
  • Maggiore fiducia grazie alla derivazione e alla qualità: monitorare l'origine e migliorare la qualità dei dati per aumentare la fiducia nelle decisioni basate sui dati e nei risultati dei modelli di intelligenza artificiale.
  • Sicurezza avanzata dei dati e dei modelli di intelligenza artificiale: proteggendo dati e modelli, in modo che siano accessibili solo tramite i progetti, si assicura che solo le persone autorizzate a vedere le risorse nel progetto possano accedervi, mantenendo gli standard di sicurezza e privacy.
  • Riduzione del rischio aziendale e migliore conformità normativa: le attività di registrazione aiutano le organizzazioni ad allinearsi alle normative di settore e alle policy interne, contribuendo a ridurre i rischi organizzativi.
  • Sblocca la produttività aziendale con la ricerca e il rilevamento di risorse: cerca e rileva dati e risorse di intelligenza artificiale per potenziare i team, ridurre il tempo dedicato alla ricerca di risorse critiche e guidare un processo decisionale più rapido e basato sui dati.
  • Gestione centralizzata delle policy di accesso ai dati: definisci e gestisci le regole di accesso ai dati da un unico punto, ricavando un'applicazione coerente tra vari servizi AWS e ambienti di terze parti.
  • Arricchimento dei dati con contesto e classificazione aziendali: aggiungi metadati e categorizzazione ai set di dati, rendendo più facile per gli utenti comprendere la pertinenza e l'applicabilità dei dati a specifiche esigenze aziendali.
  • Registra le attività per utenti e sistemi: monitora e registra le interazioni con i dati e i sistemi di intelligenza artificiale, fornendo visibilità sui modelli di utilizzo e sui potenziali problemi di sicurezza.
  • Implementazione della governance dei dati di IA/ML: estendi i principi di governance dei dati ai processi di intelligenza artificiale e machine learning, assicurando che nell'addestramento dei modelli vengano utilizzati solo i dati approvati e che i sistemi di intelligenza artificiale aderiscano alle autorizzazioni definite e alle linee guida etiche.

Amazon SageMaker Catalog è basato su Amazon DataZone e offre le stesse funzionalità di governance in un'esperienza utente unificata. L'esperienza Amazon DataZone continua a rimanere invariata per consentire ai clienti Amazon DataZone esistenti di continuare a utilizzare l'interfaccia familiare, se lo desiderano.

I dettagli dei prezzi sono disponibili qui: https://aws.amazon.com/datazone/pricing/.