微軟創辦人比爾蓋茲(Bill Gates)個人 Podcast 節目〈Unconfuse Me with Bill Gates〉,邀請 OpenAI 執行長阿特曼(Sam Altman)作客。他們如何預言 ChatGPT 與 Copilot 等生成式 AI 的未來?
比爾蓋茲展現人文主義關懷,分別從AI促進不平等、AI對工作者的影響,以及AI與人類目的(purpose)角度提出擔憂。身為近兩年生成式AI浪潮最受矚目的明星,阿特曼分享ChatGPT發展藍圖、個人對AI技術發展的信心,以及期盼通用人工智慧到來的願景。
GPT-5怎麼改進?影音互動、可靠性、客製化
OpenAI以GPT模型和面向消費者的ChatGPT打響名號,近期也開放GPT Store,外界最好奇的問題始終是,最新GPT-5何時推出,以及ChatGPT功能如何演化。
阿特曼對比爾蓋茲說,ChatGPT有幾項發展重點:持續耕耘多模態(multimodality)、加強推理能力(reasonability)、增進回答穩定性(reliability)及更多客製化。
ChatGPT剛推出時,使用者僅能用文字和系統互動,OpenAI陸續開放圖片輸入、語音輸入,接著是語音輸出和圖片輸出,下一步就是影音。阿特曼表示,圖像和語音互動迴響,比OpenAI預期更多,「人們真的很想要(影音)」。
除了增加互動媒介,ChatGPT推理能力和穩定性還有改善空間。比爾蓋茲指現在產生不同詞彙時,背後函數其實都是在做同樣的事,阿特曼認為應能利用更複雜的函數改進。其實Google和OpenAI,都曾遇上大語言模型難處理數學運算和常識推理的挑戰,也開發專注監督推理過程的思維鏈(chain-of-thoughts)等技術因應。
就穩定性來說,阿特曼解釋,如果問GPT-4萬次問題,可得到一次品質不錯的解答,但沒辦法次次滿意,這會是接下來的重要功課。至於客製化,他腦海情境有點像微軟Copilot,透過Microsoft Graph串接使用者電腦資料,ChatGPT若比照辦理,「擁有知道你的能力,有你的電子信箱、行事曆,再連上其他外部資料」,使用者就會得到完美的個人助理。
▲ 就穩定性來說,阿特曼解釋,如果問GPT-4萬次問題,可得到一次品質不錯的解答,但沒辦法次次滿意。(Source:Unsplash)
和AI協作增進效率,還能處理性質完全不同任務
視野從OpenAI和ChatGPT放大至整個社會格局,阿特曼認為,技術進步是一條漫長的連續曲線,現在人們擁有的AI系統能處理任務(do tasks),但無法做完整份工作(do jobs)。對人類來說,和機器合作不只工作更快更好,還可以省時間做更多性質完全不同的任務。
程式撰寫助理剛面世時,從自動調整程式風格、讓版面美觀和偵錯開始,逐漸進步到自動完成、推薦函數,再進化到產生程式碼。阿特曼預期,可預見的未來,會有一個個代理人(agency)直接接管完整任務,替人類經營公司、拓展物理學邊界,「至少接下來五到十年AI進步曲線會很陡峭,現在模型(以後看來)可能很蠢。」阿特曼很看好AI寫程式、醫療和教育等能做到的變革。
降低成本造福社會,阿特曼:我們做得比摩爾定律更好
致力解決人類社會問題的比爾蓋茲提出擔憂。若如阿特曼所言,AI將發展得如此強大,人們是否被迫提高適應能力?
阿特曼緩頰,強調以往技術革命,人類總能適應改變,他也同意AI會撼動勞力市場。現在人們擔憂GPT等模型將取代白領工作,但如果時間拉回十年前,當時AI警訊聚焦藍領工作不保,如機械手臂、仿生人等取代工廠人力。
阿特曼分享,OpenAI曾發展機器人計畫,但沒有太大進展,「隨著時間過去,我們意識到重點其實在智力和認知。」因此團隊才改變方向。不過OpenAI仍有意回歸機器人研究,也有投資相關企業,他認為頗有發展前景。阿特曼期許,隨著GPT模型多模態能力成長,對語言和影音理解都能達一定水準,再結合機器人,就能非常令人驚奇。
阿特曼也強調,過去三年OpenAI已將運算成本降低40倍,OpenAI還沒有投入資源節省GPT-4運算成本,但他相信有望持續壓低。「在所有我知道降低技術成本的曲線,我們做得比摩爾定律更好」。