Amazon Polly - AI 語音產生器

部署數十種語言的高品質、自然的人聲

什麼是 Amazon Polly?

Amazon Polly 是一項全受管服務,可隨需產生語音,將任何文字轉換為音訊串流。使用深度學習技術轉換文章、網頁、PDF 文件和其他文字轉換語音 (TTS)。Polly 提供多種語言的數十種逼真語音,您可用來打造參與並轉化的語音啟動應用程式。滿足各地理區域和市場使用者的各種語言、可存取性和學習需求。強大的神經網路和生成式語音引擎在背景工作,為您合成語音。將 Amazon Polly API 整合到現有的應用程式,快速做好語音準備。 

功能

Amazon Polly 具有多種功能,包括下方列出的一些功能

逼真的聲音

在持續快速的回應時間內,提供交談式使用者體驗

請求 Amazon Polly 輸出時,您可以從數十種逼真的語音和各種語言中進行選擇。每個語音都是使用母語人士建立的,即使是同一種語言也有語音的變化。大多數語言都包含一或多個男性和女性語音,因此您可以選擇最適合您的使用案例的語音。

穿著黃色夾克站在橋上玩手機的女士

可自訂輸出

視需要自訂和控制語音輸出

Amazon Polly 可讓您建立自訂文字轉換語音輸出,吸引並留住觀眾的注意力。使用自訂詞彙來修改縮寫、公司名稱、內部術語或您選擇的任何其他單詞的發音。Amazon Polly 的語音合成標記語言 (SSML) 標籤還可讓您調整重音、音調、語調和風格。產生最適合您業務的語音 AI 輸出。

在辦公室工作的男士的影像

生成式 AI 能力

以低成本存取內建生成式 AI 功能

Amazon Polly 支援多個語音引擎,您可以從中選擇以將文字轉換語音。引擎部署了一個數十億參數的轉換器,以增量且可串流的方式產生語音。這款 AI 語音產生器可創造出自信、情感投入和高度口語化的合成語音,類似於真正的人類聲音。

年輕企業家攜手合作新專案

控制和安全

以標準格式安全地儲存和轉散佈語音

將文字轉換語音輸出儲存在標準音訊檔案 (例如 MP3 和 OGG) 中,以便用於轉散佈、分析、封存或任何其他使用案例,無需額外費用。如果需要,快取檔案以便更快地擷取。您的內容的安全、信任和隱私權是 AWS 的首要任務。Amazon Polly 不會保留您提交文字的內容。

員工手搭在電腦上工作的影像

使用案例

將語音新增至擁有全球受眾的應用程式,例如 RSS 摘要、網站或影片。

進一步了解語音的產生

透過互動式或自動語音回應系統儲存和重播 Amazon Polly 語音輸出,以提示來電者。

進一步了解神經文字轉換語音 (TTS)

使用 SSML (一種採用 W3C 標準、適用於語音合成應用程式的 XML 型標記語言) 支援語調、重音與音調的常見 SSML 標籤。

進一步了解 SSML

常見問答集

是。Amazon Polly 在您註冊後一年內提供免費的文字轉換語音 AI 服務,最多到最低用量閾值。根據您選擇的語音引擎,閾值從 10 萬個字元到 500 萬個字元不等。如需詳細資訊,請參閱 Amazon Polly 定價
Amazon Polly 提供超過 40 種語言和語言變體的 60 種以上男性和女性標準語音。AWS 不斷更新並增加我們的語音功能。
Amazon Polly 產生 MP3、ogg 和其他標準音訊檔案格式,採樣率為 8,000 Hz、16,000 Hz 和 22,050 Hz。
否。Alexa 與 Amazon Polly 是不同的技術。Alexa 是一個與使用者直接通訊的虛擬語音助理。Amazon Polly 是一種文字轉換語音轉換器,組織用於大規模建置語音 AI 應用程式。
否。Amazon Polly 是全受管雲端 AI 服務。您使用程式碼中的 API 與它進行通訊。您無法在環境中下載或部署 Amazon Polly 原始程式碼。但是,您可以在開始後 12 個月內免費使用 Amazon Polly (最多到預先決定的用量閾值限制)。如需詳細資訊,請參閱 Amazon Polly 定價

探索更多 AWS 服務