生成式 AI 崛起,與 ChatGPT「聊出新未來」

作者 | 發布日期 2023 年 04 月 14 日 7:50 | 分類 AI 人工智慧 , 軟體、系統 line share follow us in feedly line share
生成式 AI 崛起,與 ChatGPT「聊出新未來」


ChatGPT 的出現,顯示原本需高度專業才能完成的任務,在生成式 AI 協助下變成人人可為。金融業必然是深受影響的產業之一,數位金融、財富管理、客戶服務、行銷銷售、風險管理等工作態樣與職能都可能改變。

ChatGPT為自然語言處理模型,可與人類對話(Chat)的人工智慧,如平地驚雷異峰突起,倏然攫取世人關注,一時間彷彿所有人都在談論世界將因ChatGPT改變。不過這幾個大寫字母到底代表什麼意思?

GPT說文解字

GPT是「生成式(Generative)預訓練(Pretrained)轉換器(Transformer)」的縮寫。

「生成式」(G)意指AI可模擬人類創造力與想像力,自動產生新內容。內容表現形式包括文字、聲音、圖像與影片。如ChatGPT大型語言模型就具備產生文字的能力。Stable Diffusion、DALL‧E、Mid journey、Deep Dream Generator都是圖像產生器,只需使用者輸入簡短描述性字句,就可幾秒內產生圖片。Amper Music則能產生適合廣告或電子遊戲等用途的音樂。

「預訓練」(P)是指AI執行特定任務前,先接受大量資料訓練的非監督式學習。ChatGPT就藉閱讀龐大文本,學習使用文字語義和語境及通用語言規則,目標是讓AI根據人類輸入文字適當回應,並接續前文產生最適合文字,完成初步自然語言處理任務。為了有更精確的語言理解與運用能力,ChatGPT預訓練後還需「微調」(Fine-Tuning)。微調會使用人工標記資料,讓以預訓練為基礎的模型執行監督式學習。此外,微調還可針對任務具體需求,調整模型結構和參數,使模型適應特定任務的資料特性,提升AI執行成效。

「轉換器」(T)為專有名詞,代表深度學習模型之一,最早由Google團隊2017年發表的論文〈Attention Is All You Need〉提出,此論文據Google Scholar數據引用超過6萬次!論文標題的Attention是Transformer的關鍵架構,這種深度學習模型構造上可視為「卷積神經網路」(CNN)的推廣,功能則是取代傳統序列模型如「循環神經網路」(RNN),提升自然語言處理成效。

Transformer萃取文句字與字的關聯,據相關性程度賦予重要詞語較高權重,以利長文本仍能保留重要資訊。因Transformer更恰當捕捉長距離字詞的相關性,並平行化訓練,因此有效提高自然語言處理的精確度。Transformer模型用途廣泛,不只限於人類產生文本,如近期已有生醫企業使用Transformer模型,以處理文字字串方式處理胺基酸鏈,描述蛋白質摺疊方式,更深入了解象徵生命之源的蛋白質,以加速新藥物開發。

ChatGPT的前世今生

OpenAI是位於美國加州的人工智慧研究實驗室,創立於2015年。主業務有人工智慧研究與人工智慧產品開發,研究重點聚焦自然語言處理、機器學習、深度學習等領域。

2017年Google發表Transformer模型後,OpenAI團隊開始研究將Transformer模型用於自然語言任務,2018年6月完成GPT-1。2019年初,OpenAI訓練出GPT-2,在GPT-1的基礎上提高性能,兩代模型主要差異在參數量與預訓練資料量多寡。GPT-2參數量約GPT-1的12倍,預訓練資料量是8倍,訓練資料取自社群網站Reddit文章,約800萬篇。同年7月,微軟宣布投資OpenAI 10億美元,至2023年累計投資約110億美元。

2020年5月GPT-3問世,算力與模型規模大幅升級,參數高達1,750億個(GPT-2為15億個),預訓練資料量到45TB(GTP-2只有40GB),把能從網路取得的論文、書籍、新聞等各種資訊都加入訓練資料庫。模型將大量非監督式學習和監督式學習成果結合,再次提升自然語言產生和互動能力。之後OpenAI開始微調,以增強模型對話能力。

2022年11月30日OpenAI推出ChatGPT,是基於GPT-3的最佳化(GPT-3.5),旨在與人類更流暢自然的對話。

如何與新興物種共存?

ChatGPT表現遠超過以前傻頭傻腦的聊天機器人,實際用過的人應都能體會。然而ChatGPT帶來的啟示,並不只把機器原本會做但做不好的事做得更好,而是神祕的盒子已打開,但從裡面跑出什麼東西,我們並不十分清楚。ChatGPT及生成式同類與快速演化的後代,的確是這個世界的新物種。

ChatGPT不僅能以高度成熟的方式產生各種語言,還可按文字指示寫程式。程式碼即使不是每次都立即可用,但雖不中亦不遠,對專業程式設計師等於如虎添翼,可大幅提升工作效率,縮減時間成本。對門外漢而言,可有效降低入行門檻。甚至可說用AI學AI的時代已到來,這是過去未曾發生的情境。

上述功能只顯示人機協作即將開啟新篇章的例子之一,今後各類專家都有望找到與自己互補的AI,填補對方能力或資源空缺。如作家創作不再是孤獨的心靈之旅,可請ChatGPT撰擬初稿,自己再校正修飾。除了必須提供原創故事構想(即使這點也可能大部分由AI代勞),作家其餘工作更像編輯。又如投資分析師也不必再指揮助理收集數據,一字一句敲出投資分析報告,交給ChatGPT處理就好了,只是要記得檢查結論是否正確。不過當然也有例外,例如投資分析師助理,或文字翻譯者,與AI的關係可能是替代性大於互補性。

需搭配人類主觀意志判斷調整

新技術當然有令人擔憂的一面。即使表面上與人類對答如流,ChatGPT也不是真正理解人類語言,終究只是產生看似有意義文句的演算法,本質上可能更接近極為高明的「鸚鵡學舌」。另一方面,ChatGPT容易沾染人類的壞習性,不太願意承認無知,反倒振振有詞提供想像、捏造、空泛答案;即使相同問題有不一樣回覆,照樣面不改色。但目前看來還缺乏有效機制驗證ChatGPT產生文本的真實性或正確性。因此ChatGPT使用還有限制,最好不要問它真假難辨的問題,但可請它設計行銷文案或規劃教學大綱,這類較沒有客觀標準答案的建議,再搭配人類主觀意志調整。

此外,ChatGPT也有價值觀或道德相關爭議。我們並不知道訓練資料庫都有什麼資訊,如何確信不讓資料庫偏見以某種方式潛伏於產生內容?又如作家要求ChatGPT協助撰稿時,會不會無意抄襲他人作品(因資料庫有),侵犯他人著作權而不自知?雖然ChatGPT經微調會拒絕回答違反善良風俗的問題,但只要拐個彎再問一次,還是可能套出答案。如ChatGPT雖不肯傳授如何詐騙,可是改成問如何防範詐騙,說明詐騙方法或舉幾個詐騙案例,它就欣然接受,且回答非常仔細。

無論如何,ChatGPT出現表示世界不知不覺又產生劇變,工作傳統界限被迫重新定義。原本需高度專業才能完成的任務,生成式AI協助下變成人人可為。一些苦學有成的技能失去價值,被新技能取而代之。金融業必然是深受影響的產業之一,至少數位金融、財富管理、客戶服務、行銷銷售、風險管理及其他許多業務工作模式與職能都極有可能改變。現在該是時候好好問自己,生成式AI會為你所在機構與工作帶來什麼變化;又會以什麼形式整合至職場與生活,以及AI代表什麼意義。

(作者:張凱君;本文由 台灣銀行家 授權轉載;首圖來源:shutterstock)