最新 AI 生成文本技術 GPT-4 升級程度?專家:超級多語言的口譯員

作者 | 發布日期 2023 年 03 月 22 日 11:28 | 分類 AI 人工智慧 , 機器人 , 科技教育 line share follow us in feedly line share
最新 AI 生成文本技術 GPT-4 升級程度?專家:超級多語言的口譯員


OPEN AI 正式推出 GPT-4,透過大量資料訓練,改善原本 GPT-3 的問題,並產生更多創造力,不僅可以解讀圖片,回答也變得更精準,但仍有不少人對使用 AI 語言模型有許多顧慮,台灣科技媒體中心邀請專家說明,ChatGPT 就是一個會超級多語言的口譯員。

GPT-4 仍有一定模型偏見

中央大學資訊電機學院資訊工程學系教授蔡宗翰表示,GPT-4 透過學習大量的文字和圖像資料,獲得更高的創造力和想像力,能生成更有趣和獨特的文字和圖像描述,並具備解讀圖片的能力,可以從圖像中發掘關鍵資訊,生成相關的文字描述。

蔡宗翰提醒,GPT-4 在生成文字時可能會編造非事實性的回答,而這可能會對使用者造成誤導和負面影響,所以可以考慮引入更多的事實驗證機制和檢查機制,同時需要給予模型更加高品質的訓練資料。

蔡宗翰認為,語言模型的訓練資料可能存在一定的模型偏見,例如性別、種族、文化背景等方面的偏見,為了解決這個問題,需要更加細緻的調整和訓練模型,同時更加嚴格的審查和檢查模型的輸出結果。

GPT-4 是一個會超級多語言的口譯員

政治大學傳播學院助理教授李怡志說明,一般人因為先會使用 Google 才會使用 ChatGPT,所以常以 Google 的概念來看 ChatGPT,Google 是一個資料索引目錄,當你輸入關鍵字,索引目錄協助你找到資料。

李怡志表示,ChatGPT 是學習資料後建立模型,當你輸入提示,ChatGPT 會解讀你的提示之後,給你 GPT 學會的東西,若將這兩個角色擬人化後,Google 是一個圖書館員,它不會告訴你任何東西,只會幫你找東西,而 ChatGPT 是一個會超級多語言的口譯員,它不會幫你找東西,但是很愛幫你「翻譯」或「轉譯」,並樂於自己補充,簡單來說,前者是用「查」,後者用「翻譯」。

李怡志建議,使用 ChatGPT 比較好的方式是讓它好好地「翻譯」,讓它提供開放型的內容,也就是說,如果內容有明確的「是非對錯」,最好不要完全依賴它,但如果答案只有「好壞高下」,那麼可以開始練習如何使用它。

李怡志說明,如果看到一篇文章,已經註明利用 ChatGPT 或人工智慧工具完成或協作,那就要假設裡面的事實可能有錯、會腦補,但假如沒有註明,那就跟平常看到任何文章一樣,隨時保持注意,保持懷疑,若對內容有任何疑慮,就回頭求助圖書館員。

GPT-4 文字處理效率更好

政治大學應用數學系副教授兼學務長蔡炎龍表示,GPT-4 比 GPT-3 更優秀的是能一次看超過 25,000 個字,這比 GPT-3 大約只能看 2,048 個字好非常多,這也是為什麼長一點的文章,要 GPT-3 作摘要就無法做得那麼好。

蔡炎龍指出,GPT-4 的限制,最主要來自它其實只是「用前一個字預測下一個字」的模型,只是依過去訓練的經驗,覺得放哪個字合理,不是真的基於事實,但 GPT-4 的重點不是它還能更強,而是現在就可以怎麼使用它。

蔡炎龍引用 Microsoft 執行長納德拉(Satya Nadella)說明,要讓 GPT-4 產生有用、正確的東西是使用者的責任,而文字生成模型並不是有意識的提供不正確的資訊,所以刻意要造假消息的,用 GPT-4 不一定能更快速造出一個人要的假消息。

蔡炎龍強調,這說不定反而會讓大家更認為,堅持把關文字的媒體、出版社,或是知名人物才是值得信賴的。相反的,照片、影片和聲音,反而不會再被大家認為是「有圖有真相」,未來可能要即早思考如何因應。

GPT-4 錯誤仍高須辨識

師範大學圖書資訊學研究所特聘教授曾元顯說明,GPT-3.5、GPT-4 是進一步用人類導師的導引以及強化學習的方式加以訓練,抑制較差的輸出、獎勵較好的回應,所以誤導、偏見的資訊並沒有從 ChatGPT、GPT-4 中刪除,只是被抑制,但仍然可能由某種提示被引導出來。

曾元顯表示,GPT-4的限制跟前一代一樣,仍舊會有無中生有、推理錯誤、各種偏見(如性別、種族、職業等偏見)、不理解訓練資料之後發生的事物,因為訓練資料只到 2021 年 9 月的網路資料,因此使用仍須小心,必須盡力求證,但 GPT-4 回應出事實的能力仍比前一代高出 40%。

曾元顯補充,其實最近有些研究可降低 GPT-4 對社會的負面衝擊,某種程度上可以偵測 AI 生成的文句、協助偵測 GPT 生成的文字,以及協助辨別是否有錯用 AI 文字而有欺騙、造假、不公平的情事等。

(首圖來源:Unsplash

延伸閱讀: