隨著人工智慧系統在傳統測試中表現出色,研究人員發現這些基準測試已經無法再挑戰這些系統。
HLE 測驗 GPT-4o 準確率僅 2.7%,擊碎 AI 專家神話 |
| 作者 TechNews 編輯台|發布日期 2026 年 03 月 16 日 7:20 | 分類 AI 人工智慧 , ChatGPT , Claude |
HLE 測驗 GPT-4o 準確率僅 2.7%,擊碎 AI 專家神話 |
| 作者 TechNews 編輯台|發布日期 2026 年 03 月 16 日 7:20 | 分類 AI 人工智慧 , ChatGPT , Claude | edit |
隨著人工智慧系統在傳統測試中表現出色,研究人員發現這些基準測試已經無法再挑戰這些系統。
