GPT-4 如何輾壓現有人工智慧,讓 Google 眼前一黑?

作者 | 發布日期 2023 年 03 月 15 日 8:59 | 分類 AI 人工智慧 , Google , Microsoft line share follow us in feedly line share
GPT-4 如何輾壓現有人工智慧,讓 Google 眼前一黑?


Google 辛辛苦苦追趕 ChatGPT 好幾個月,還沒拿出什麼具體對策,OpenAI 今日又火上加油發表 GPT-4 模組,在這條人工智慧賽道別說車尾燈,Google 現在要擔心的是被 OpenAI 套圈了。但究竟 GPT-4 有什麼威能,和現在聊天好好玩的 ChatGPT 有什麼差別?

大家肯定都聽過 GPT,但它的意思其實是生成式預訓練變形器(Generative Pre-trained Transformer),第一代發表於 2018 年,2019 發表 GPT-2、2020 推出 GPT-3,直到 2022 年大幅最佳化後出現 GPT-3.5,OpenAI 再微調對話方式,就成了目前看到的 ChatGPT。

OpenAI 對發表 ChatGPT 其實有不同意見,工程師認為 GPT-3.5 的表現還不夠好,應要等到更優秀的 GPT-4 成熟後再發表。就在 GPT-3.5 驚豔全球快半年後,GPT-4 風光登場了。

相比前代,GPT-4 多語言模組同時增加訓練深度和廣度,可產生處理 32,768 個 token,約等於 25,000 個詞彙,為了證明這件事,GPT-4 參加多項人類考試,包括 Bar Exam、LSAT 和 GRE 等,並繳出驚人的成績單。

▲ GPT-4 考試成績單。

這些成績代表若 GPT-4 是人類學生,完全可以考上法學院,或通過美國大部分大學測驗,GPT-3.5 除 AP(美國大學先修課程測驗)外成績,幾乎全面被 GPT-4 輾壓。

如果用機器人考試程度看,機器學習跑分測試,GPT-4 幾乎都以 10% 以上差距擊敗市面所有大型語言模型。更特別的是,其他模型幾乎都是以英語為主,透過 Azure Translate 模組將 MMLU 測試轉譯成多種語言後,GPT-4 依然交出高水準成績,中文部分準確率也達 80%。

▲ GPT-4 多語言測試成績。

除此之外,GPT-4 導入圖像文字複合模組,你各位最期待的能力之一終於降臨。ChatGPT 現在看得懂哏圖,甚至解釋哏圖,且單張和多張都行。

微軟也同步表示,其實過去一個半月,如果用戶試用新 Bing 瀏覽器和 Bing Chat 功能,應可感覺不同之處,因已提前導入 GPT-4 暖身。

OpenAI 執行長 Sam Altman 也指出,終極目標是開發通用型 AI,解放人類知識型工作。「但 GPT-4 還是有很多問題,也受到許多限制,第一次使用會讓你驚豔,但用久了就會發現問題還在。」

(圖片來源:OpenAI