什麼是生成式 AI?
生成式人工智慧 (亦稱生成式 AI) 是一種可以製作全新內容和想法的人工智慧 (AI),包含對話、故事、影像、影片和音樂。它可以學習人類語言、程式設計語言、藝術、化學、生物學或任何複雜的主題。它會重複運用所知來解決新的問題。
例如,生成式 AI 可以學習英語詞彙,並根據所處理的單詞來寫成一首詩。
您的組織可以將生成式 AI 用於各種目的,例如聊天機器人、媒體創作,以及產品開發和設計。
生成式 AI 範例
生成式 AI 在各個產業中有多個使用案例
金融服務
金融服務公司可使用生成式 AI 工具的強大功能,在降低成本同時為客戶提供更好的服務:
- 金融機構可以使用聊天機器人產生產品建議並回應客戶查詢,從而改善整體客戶服務。
- 貸款機構可為金融服務不足的市場 (特別是開發中國家) 快速核准貸款。
- 銀行能迅速偵測索賠、信用卡和貸款中的詐騙行為。
- 投資公司可利用生成式 AI 的強大功能,以低成本為客戶提供安全、個人化的理財建議。
醫療保健與生命科學
生成式 AI 最有前景的使用案例之一是加速藥物發現和研究。生成式 AI 可建立具有特定特性的新型蛋白質序列,以此設計抗體、酶、疫苗和基因療法。
醫療保健和生命科學公司可使用生成式 AI 工具來設計合成基因序列,以供合成生物學和代謝工程應用層面之用。例如,這些公司可以建立新的生物合成途徑或最佳化用於生物製造的基因表達。
生成式 AI 工具還可以建立合成患者和醫療保健資料。這些資料可用於訓練 AI 模型、模擬臨床試驗或研究罕見疾病,而無需存取大型真實世界資料集。
汽車與製造業
汽車公司可將生成式 AI 技術用於多種用途,從工程到車內體驗和客戶服務。例如,這些公司可以最佳化機械零件的設計以減少車輛設計中的阻力或調整輔助系統的設計。
汽車公司正在使用生成式 AI 工具,藉由快速回答最常見的客戶問題來提供更好的客戶服務。生成式 AI 可建立新材料、晶片和零件設計,以最佳化製造流程並降低成本。
另一個生成式 AI 使用案例是合成資料來測試應用程式。這對於通常未包含在測試資料集中的資料 (例如缺陷或邊緣情況) 特別有用。
電信
生成式 AI 在電信產業中的使用案例,焦點放在重新塑造客戶體驗上,這些客戶體驗是由客戶旅程所有接觸點上的累積互動來定義。
例如,電信組織可以運用生成式 AI,透過類似人類的即時對話代理程式來改善客戶服務。他們也可以透過個人化的一對一銷售助理來重新塑造客戶關係。他們還可以透過分析網路資料來推薦修復方法,從而最佳化網路效能。
媒體與娛樂
從動畫和劇本到完整電影,生成式 AI 模型僅需傳統製作所需的一小部分成本和時間,即可產生新穎內容。
創意產業其他生成式 AI 的使用案例包含:
- 藝術家可利用 AI 生成的音樂來補充及加強其專輯,創造全新體驗。
- 媒體組織可利用生成式 AI 提供個人化內容和廣告來改善觀眾體驗,藉此增加收入。
- 遊戲公司可利用生成式 AI 來開發新遊戲,並能讓玩家建立遊戲中化身。
生成式 AI 優勢
根據 Goldman Sachs 的資料,生成式 AI 可能會推動全球國內生產毛額 (GDP) 成長 7 個百分點 (或近 7 兆美元),並在 10 年內逐步將生產力成長提升 1.5 個百分點。接下來,我們將介紹生成式 AI 的更多優點。
生成式 AI 技術如何演變?
過去幾十年來,統計學中一直使用基本生成式模型來協助進行數值資料分析。神經網路和深度學習是現代生成式 AI 的最新先驅技術。2013 年開發而成的變分自動編碼器是第一個可以產生逼真影像和語音的深度生成式模型。
VAE
VAE (變動自動編碼器) 引入建立多種資料類型創新變體的功能。該功能推動其他生成式 AI 模型的迅速出現,例如生成式對抗網路和擴散模型。這些創新側重于讓產生的資料日益類似於真實資料,儘管這些資料是人為建立的。
轉換器
2017 年,隨著轉換器的推出,AI 研究發生進一步的轉變。轉換器將編碼器和解碼器架構與注意機制無縫整合。轉換器以卓越的效率和多功能性簡化語言模型的訓練過程。像 GPT 這樣的著名模型已成為基礎模型,它們能夠在廣泛的原始文字語料庫上進行預訓練,並針對不同的任務進行微調。
轉換器變革自然語言處理可能實現的功能。它們為從翻譯、摘要到回答問題等任務提供了生成式功能。
未來
許多生成式 AI 模型持續取得長足進步,並且已經形成跨行業應用。最近的創新側重于完善模型以使用專有資料。研究人員還希望建立越來越類似人類行為的文字、影像、視訊和語音。
生成式 AI 如何運作?
像所有人工智慧一樣,生成式 AI 的運作方式是使用機器學習模型,機器學習模型是依據大量資料進行預訓練的超大型模型。
基礎模型
基礎模型 (FM) 是在廣泛的廣義和未標記資料上訓練的機器學習模型。它們能夠執行各種一般任務。
FM 是數十年來不斷演進技術的最新進展成果。通常,FM 使用學習的模式和關係來預測序列中的下一個項目。
例如,在產生影像時,模型會分析影像並建立更清晰、更明確定義的影像版本。同樣,對於文字,模型會依據之前的字詞及其情境預測文字字串中的下一個字詞。後,模型使用概率分佈技術選擇下一個字詞。
大型語言模型
大型語言模型 (LLM) 是一類基礎模型。例如,OpenAI 的生成式預訓練轉換器 (GPT) 模型是 LLM。LLM 專門處理基於語言的任務,例如摘要、文字產生、分類、開放式對話和資訊擷取。
LLM 的與眾不同在於它們能夠執行多項任務。實現此功能的原因是 LLM 包含許多參數,使其能夠學習進階概念。
像 GPT-3 這樣的 LLM 可以考慮數十億個參數,並且能夠依據很少量的輸入產生內容。透過在預訓練中接觸各種形式和多種模式的網際網路規模資料,LLM 學會在各種環境中運用它們的知識。
生成式 AI 模型如何運作?
傳統的機器學習模型具有辨別性,或者側重於對資料點進行分類。它們嘗試確定已知因素和未知因素之間的關係。例如,這些模型檢視影像,即圖元排列、線條、顏色和形狀等已知資料,然後將它們映射到字詞,即未知因素。從數學上講,這些模型的運作方式是識別可以用數值方式將未知和已知因素映射為 x 和 y 變數的方程。生成式模型在此基礎上更進一步。這些模型不是在給定某些特徵的情況下預測標籤,而是在給定特定標籤的情況下嘗試預測特徵。從數學上講,生成式建模計算 x 和 y 同時出現的概率。該模型學習不同資料特徵的分佈及其關係。例如,生成式模型分析動物影像以記錄變數,例如不同的耳朵形狀、眼睛形狀、尾巴特徵和皮膚圖案。這些模型學習特徵及其關係,以了解不同動物的總體外觀。然後,它們可以重新建立訓練集中沒有的新動物影像。接下來,我們給出幾大類生成式 AI 模型。
擴散模型
擴散模型透過對初始資料樣本進行反覆運算性的受控隨機變更來建立新資料。這些模型以原始資料為起點,然後加入細微的變化 (雜訊),逐漸使其與原始資料不那麼相似。這種雜訊經過精心控制,以確保產生的資料保持一致且逼真。
在多次反覆運算中新增雜訊之後,擴散模型反轉該程序。反向消噪會逐漸消除雜訊,以產生類似原始資料的新資料樣本。
生成式對抗網路
生成式對抗網路 (GAN) 是另一個以擴散模型概念為基礎的生成式 AI 模型。
GAN 透過以競爭性的方式訓練兩個神經網路來運作。第一個網路稱為產生器,透過新增隨機雜訊來產生虛假的資料樣本。第二個網路稱為鑑別器,其嘗試區分真實資料和產生器產生的虛假資料。
在訓練過程中,產生器不斷提高其建立逼真資料的能力,而鑑別器日益加強區分真假資料的能力。這種對抗過程一直持續到產生器產生的資料令人信服,以至於鑑別器無法將其與真實資料區分。
GAN 廣泛用於產生逼真的影像,風格轉換和資料增強任務。
变分自动编码器
變動自動編碼器 (VAE) 學習稱為「潛在空間」的資料緊湊表示。潛在空間是資料的數學表示。可以將潛在空間視為唯一的程式碼,根據資料的所有屬性來表示資料。例如,如果研究面部,則潛在空間包含代表眼睛形狀、鼻子形狀、顴骨和耳朵的數字。
VAE 使用兩個神經網路 — 編碼器和解碼器。編碼器神經網路將輸入資料映射為潛在空間每個維度的均值和方差。該神經網路從高斯 (正態) 分佈中產生隨機樣本。此樣本是潛在空間中的一個點,表示輸入資料的壓縮簡化版本。
解碼器神經網路從潛在空間中取得此取樣點,然後將其重新建構回與原始輸入相似的資料。使用數學函數衡量重新建構的資料與原始資料的相符程度。
以轉換器為基礎的模型
以轉換器為基礎的生成式 AI 模型建立在 VAE 的編碼器和解碼器概念之上。以轉換器為基礎的模型為編碼器新增更多層,以提高理解、翻譯和創意寫作等文字式任務的處理效能。
以轉換器為基礎的模型使用自注意力機制。在處理序列中的每個元素時,這些模型權衡輸入序列中不同部分的重要性。
另一個關鍵功能是這些 AI 模型實作情境嵌入。序列元素的編碼不僅取決於元素本身,還取決於其序列中的情境。
以轉換器為基礎的模型如何運作
要理解基於轉換器的模型如何運作,可以將語句想像成字詞序列。
自注意力可以協助模型在處理每個字詞時將注意力集中在相關的字詞上。為擷取字詞之間不同類型的關係,基於轉換器的生成式 AI 採用稱為「注意力頭」的多個編碼器層。每個「注意力頭」會學著了解輸入序列的不同部分,使模型能同時顧及資料的各個面向。
每一層會再改善情境嵌入,使模型具更豐富的資訊,並捕捉語法到複雜語義的所有內容。
初學者的生成式 AI 培訓
生成式 AI 培訓從瞭解基礎的機器學習概念開始。學習者也必須探索神經網路和 AI 架構。擁有 Python 程式庫 (例如 TensorFlow 或 PyTorch) 的實務經驗,對於實作和實驗不同模型而言是相當重要的經驗。您也必須學習模型評估、微調和提示詞工程技能。
人工智慧或機器學習領域的學位可提供深度培訓。參加線上短期課程與認證,讓專業發展如虎添翼。在 AWS 上的生成式 AI 培訓包含由 AWS 專家就以下主題所提供的認證:
生成式 AI 的限制是什麼?
儘管生成式 AI 系統不斷進步,但有時可能會生成錯誤或誤導性的資訊。因為這類系統仰賴他們被投餵的模式和資料,可以反映資料中存在的偏見或錯誤。其他與資料訓練相關的問題包括
安全性
如果以專屬資料自訂生成式 AI 模型,則會產生資料隱私權和安全問題。我們必須確保生成式 AI 工具產生的回應能防止未授權存取專屬資料。如果 AI 模型的決策方式既草率又缺乏透明度,也會導致安全性問題。
了解使用 AWS 生成式 AI 的安全方法
創造力
生成式 AI 雖然可以產生創意內容,但通常缺乏真正的原創性。AI 的創造力受訓練資料限制,因此可能生成重複或相似的輸出內容。人類創造力涉及更深入的理解和情緒共鳴,對 AI 而言,要複製這方面特性仍具挑戰。
費用
訓練和執行生成式 AI 模型需要大量的運算資源。相較於從零開始建置新模型,雲端生成式 AI 模型更容易取得且划算。
可解釋
由於其複雜和高深莫測的特性,生成式 AI 模型通常被視為「黑盒子」。要了解這些模型如何產生特定輸出內容也不簡單。如果要增加信任和普及率,就需要提高模型的可解釋性和透明度。
生成式 AI 的採用有哪些最佳實務?
如果組織想要實作生成式 AI 解決方案,請考慮採用以下最佳實務來強化工作。
AWS 如何協助生成式 AI?
藉助 Amazon Web Services (AWS),您可以針對自己的資料、使用案例和客戶輕鬆建置和擴展生成式 AI 應用程式。使用 AWS 上的生成式 AI,您可以取得企業級安全性和隱私權,存取業界領先的 FM、生成式 AI 驅動的應用程式以及資料優先方法。