什麼是生成型AI?簡明解說其種類、優點及應用方法
什麼是生成AI?
生成AI是一種技術,能根據用戶的指示(提示),利用事先學習的數據,自動生成文章、圖片、程式碼、影片、音訊等各種內容。
其中一個代表性例子是2022年11月由OpenAI公司發布的「ChatGPT」。
ChatGPT能生成如同人類思考般自然的文章,因此在商業的各種場景中具有廣泛應用,並被期望能大幅提高工作效率和降低成本。
生成AI的開發在近年來迅速推進,每天都有新的服務在全球發布,吸引了許多領域的關注。
生成AI受關注的原因
過去,電腦的發明以及互聯網和手機的普及給人們的生活帶來了巨大變革,如今AI也逐漸成為現代社會中不可或缺的存在。
特別是生成AI,因其可能取代人類勞動,正在快速發展,並引發了巨大的社會關注,已經成為無法忽視的存在。
生成AI與傳統AI的區別
傳統AI的主要功能是從學習數據中「提取」與提示相符的信息並輸出結果,而生成AI則是根據學習數據「生成」新的輸出,這是其主要特徵。
由於這一特徵,生成AI能夠不受學習數據的限制,生成獨特的表達和創意,但另一方面,輸出的質量很大程度上取決於用戶的提示工程(為了從AI獲得理想輸出而輸入最佳提示的技能),這也是一個缺點。
生成AI的機制
支撐這些生成AI的核心技術是「機器學習(machine learning)」。
機器學習是一系列技術,通過從輸入的大量數據中發現和學習模式和規則,對新輸入的數據進行分類和預測。在生成AI的開發中,通常採用機器學習中的「深度學習(deep learning)」方法。
通過深度學習,可以從輸入數據中提取更多層次的特徵,從而實現更複雜和高精度的任務處理。
一般來說,經過這些機器學習生成的基礎模型中,適合更具體任務的被稱為「已學習模型」,將其嵌入產品或服務中的總稱為「生成AI」。
簡而言之,根據「具體任務」的內容,生成AI有各種不同的種類。
生成AI的種類
以下將解釋生成AI的主要種類。
文本生成AI
以「ChatGPT」和「Bard」為代表的文本生成AI,搭載了「GPT-4」和「PaRM」等大型語言模型(LLM: Large Language Model)。
大型語言模型是基於自然語言處理的基礎模型,擁有數十億到數百億的參數,能夠生成非常自然的文本。
因此,可以在會議記錄的製作、郵件回覆、廣告文案的創作以及小說寫作等多種場景中應用。
圖像生成AI
以「Stable Diffusion」和「Midjourney」為代表的圖像生成AI,能夠從文本或圖像生成新的圖像。例如,可以通過輸入最終想要的圖像的文本描述(t2t: text to image)或基於輸入的圖像重新構建不同的圖像(i2i: image to image),根據目的和用途有多種選擇。
語音生成AI
語音生成AI是輸入語音數據後,生成新的語音數據的AI。
例如,通過大量輸入某個人物或角色的語音並進行學習,可以用該語音朗讀各種文本。
此外,還可以根據特定情感調整語調,並進行多語言朗讀,因此一旦學習了語音,就可以在旁白和呼叫中心的自動應答等多種場景中應用。
Google的「Text-to-Speech AI」等非常有名。
影片生成AI
影片生成AI是從文本或圖像中,AI自動組合影像和音源,生成新影片的技術。
2024年2月,OpenAI發表的「Sora」能夠從文本生成影片,與只能生成幾秒短影片的傳統影片生成AI相比,最長可生成1分鐘的影片,並且在多場景影片中保持角色和空間的一致性,正確反映物理法則,重現自然動作,因此成為目前備受關注的生成AI之一。
3D模型生成AI
3D模型生成AI是從文本或圖像中,AI自動生成3D模型的技術。
在遊戲角色和物件、動畫和電影的CG內容製作等行業中,預計將得到廣泛應用,是目前勢頭強勁的生成AI種類之一。
「LumaAI」、「Tripo」和「Meshy」等是代表例。
生成AI活用的優點
如上所述,生成AI日益層出不窮,並且在各個行業中被寄予厚望。
透過活用生成AI,不僅可以大幅提高業務效率和降低成本,還能獲得啟示,發現新的創意和模式。這一點與傳統的AI不同,顯示出其在應用上的巨大優勢。
生成AI的商業應用場景
具體來說,可以在以下的商業場景中考慮使用生成AI。
客戶支援中的自動化和輔助
電子郵件回覆和電話應對等客戶支援工作,是日常業務中需要大量時間和精力的作業之一,但這些業務與生成AI的相性良好。
透過文本生成AI,不僅可以理解客戶的詢問內容並生成適當的回覆,還可以結合語音生成AI,提供24小時365天自動電話應對的服務。目前,許多企業已經在實際業務中導入生成AI。
廣告文案和網頁文章的創意發想和草稿製作
如前所述,利用生成AI的新輸出特性,在廣告文案、網頁文章及其他內容創作中進行創意發想和草稿製作也是非常有效的應用方法。
只需指定商品特徵、目標群體、字數等提示,即可生成更適合的輸出。此外,生成AI能比人類更快地提出大量創意,從而大幅提升生產力。
數據分析的支援和報告的自動生成
生成AI能迅速處理大量數據,並發現人類可能忽略的模式和趨勢,因此可用於數據分析和預測,甚至基於這些分析和預測生成報告。
只需指定輸出格式等,即可根據需求自訂格式,這也是其優點之一。
生成AI使用時的注意事項
如上所述,生成AI有很大的應用優勢,但同時,為了正確使用它,也有不少需要注意的地方。
AI的幻覺(hallucinations)
生成AI僅根據學習數據,對提示進行概率和統計上的「最可能」回答,因此輸出虛假信息並不罕見(這種問題通常稱為「hallucinations」)。
此外,由於某些生成AI的學習數據獲取期間有限制,可能會輸出未反映最新信息的回答。
因此,在業務中使用生成AI的輸出時,必須經過人工的品質確認和驗證等過程。
安全性方面
此外,企業在使用生成AI時,特別需要注意的是安全性方面。
某些生成AI可能會將輸入的數據用於機器學習,如果輸入了個人信息或企業機密,可能會導致無法挽回的情況。
因此,關於輸入數據的處理,請務必在使用條款等中仔細確認。
法律規範等
此外,近年來,關於生成AI的法律規範,如日本著作權法和日本個人信息保護法等,討論非常活躍,並且根據行業和業種的不同,有些領域還制定了獨特的AI倫理。因此,作為企業的合規性,還需要關注法律規範和這些AI倫理的動向。
考慮注意事項後,推薦使用Azure OpenAI Service
在這方面,Microsoft Azure 提供的「Azure OpenAI Service」是唯一能在 Microsoft Azure 上使用 OpenAI 公司提供的 AI 服務(文本、代碼和圖像生成)的服務。此服務的特點是輸入的數據不會被用於機器學習,並且可以使用 Microsoft Azure 的安全功能,因此在安全性方面具有很高的保障。
此外,儘管主要的生成 AI 服務多數來自海外,Azure OpenAI Service 遵循日本法律,並且可以與東京地方法院(Tokyo District Court)簽訂專屬管轄協議,因此在法律風險的可預測性方面也非常值得推薦。
總結:生成AI的應用可望提高效率,但風險管理必不可少
日益湧現的生成AI服務,如果能夠有效利用,預期可以大幅提高業務效率並降低成本。
然而,另一方面,為了有效利用生成AI服務,有必要在正確理解其風險的基礎上,慎重考慮與計劃導入的業務相關的功能和規格,以便抑制風險。
特別是在企業中,制定內部指導方針、向員工宣導並進行培訓等對策也非常重要。在將生成AI服務導入業務時,建議從這些多角度出發,對各種服務進行比較和考量。
Category: IT