微軟比爾蓋茲對談 OpenAI 阿特曼，預測 GPT-5 會更進步？

微軟創辦人比爾蓋茲（Bill Gates）個人 Podcast 節目〈Unconfuse Me with Bill Gates〉，邀請 OpenAI 執行長阿特曼（Sam Altman）作客。他們如何預言 ChatGPT 與 Copilot 等生成式 AI 的未來？

比爾蓋茲展現人文主義關懷，分別從AI促進不平等、AI對工作者的影響，以及AI與人類目的（purpose）角度提出擔憂。身為近兩年生成式AI浪潮最受矚目的明星，阿特曼分享ChatGPT發展藍圖、個人對AI技術發展的信心，以及期盼通用人工智慧到來的願景。

GPT-5怎麼改進？影音互動、可靠性、客製化

OpenAI以GPT模型和面向消費者的ChatGPT打響名號，近期也開放GPT Store，外界最好奇的問題始終是，最新GPT-5何時推出，以及ChatGPT功能如何演化。

阿特曼對比爾蓋茲說，ChatGPT有幾項發展重點：持續耕耘多模態（multimodality）、加強推理能力（reasonability）、增進回答穩定性（reliability）及更多客製化。

ChatGPT剛推出時，使用者僅能用文字和系統互動，OpenAI陸續開放圖片輸入、語音輸入，接著是語音輸出和圖片輸出，下一步就是影音。阿特曼表示，圖像和語音互動迴響，比OpenAI預期更多，「人們真的很想要（影音）」。

除了增加互動媒介，ChatGPT推理能力和穩定性還有改善空間。比爾蓋茲指現在產生不同詞彙時，背後函數其實都是在做同樣的事，阿特曼認為應能利用更複雜的函數改進。其實Google和OpenAI，都曾遇上大語言模型難處理數學運算和常識推理的挑戰，也開發專注監督推理過程的思維鏈（chain-of-thoughts）等技術因應。

就穩定性來說，阿特曼解釋，如果問GPT-4萬次問題，可得到一次品質不錯的解答，但沒辦法次次滿意，這會是接下來的重要功課。至於客製化，他腦海情境有點像微軟Copilot，透過Microsoft Graph串接使用者電腦資料，ChatGPT若比照辦理，「擁有知道你的能力，有你的電子信箱、行事曆，再連上其他外部資料」，使用者就會得到完美的個人助理。

▲ 就穩定性來說，阿特曼解釋，如果問GPT-4萬次問題，可得到一次品質不錯的解答，但沒辦法次次滿意。（Source：Unsplash）

和AI協作增進效率，還能處理性質完全不同任務

視野從OpenAI和ChatGPT放大至整個社會格局，阿特曼認為，技術進步是一條漫長的連續曲線，現在人們擁有的AI系統能處理任務（do tasks），但無法做完整份工作（do jobs）。對人類來說，和機器合作不只工作更快更好，還可以省時間做更多性質完全不同的任務。

程式撰寫助理剛面世時，從自動調整程式風格、讓版面美觀和偵錯開始，逐漸進步到自動完成、推薦函數，再進化到產生程式碼。阿特曼預期，可預見的未來，會有一個個代理人（agency）直接接管完整任務，替人類經營公司、拓展物理學邊界，「至少接下來五到十年AI進步曲線會很陡峭，現在模型（以後看來）可能很蠢。」阿特曼很看好AI寫程式、醫療和教育等能做到的變革。

降低成本造福社會，阿特曼：我們做得比摩爾定律更好

致力解決人類社會問題的比爾蓋茲提出擔憂。若如阿特曼所言，AI將發展得如此強大，人們是否被迫提高適應能力？

阿特曼緩頰，強調以往技術革命，人類總能適應改變，他也同意AI會撼動勞力市場。現在人們擔憂GPT等模型將取代白領工作，但如果時間拉回十年前，當時AI警訊聚焦藍領工作不保，如機械手臂、仿生人等取代工廠人力。

阿特曼分享，OpenAI曾發展機器人計畫，但沒有太大進展，「隨著時間過去，我們意識到重點其實在智力和認知。」因此團隊才改變方向。不過OpenAI仍有意回歸機器人研究，也有投資相關企業，他認為頗有發展前景。阿特曼期許，隨著GPT模型多模態能力成長，對語言和影音理解都能達一定水準，再結合機器人，就能非常令人驚奇。

阿特曼也強調，過去三年OpenAI已將運算成本降低40倍，OpenAI還沒有投入資源節省GPT-4運算成本，但他相信有望持續壓低。「在所有我知道降低技術成本的曲線，我們做得比摩爾定律更好」。

（本文由遠見雜誌授權轉載；首圖來源：pixabay）