隨著人工智慧系統在傳統測試中表現出色,研究人員發現這些基準測試已經無法再挑戰這些系統。
HLE 測驗 GPT-4o 準確率僅 2.7%,擊碎 AI 專家神話 |
| 作者 TechNews 編輯台|發布日期 2026 年 03 月 16 日 7:20 | 分類 AI 人工智慧 , ChatGPT , Claude |
HLE 測驗 GPT-4o 準確率僅 2.7%,擊碎 AI 專家神話 |
| 作者 TechNews 編輯台|發布日期 2026 年 03 月 16 日 7:20 | 分類 AI 人工智慧 , ChatGPT , Claude | edit |
隨著人工智慧系統在傳統測試中表現出色,研究人員發現這些基準測試已經無法再挑戰這些系統。
OpenAI 再延後 ChatGPT「成人模式」上線,優先投入核心 AI 發展 |
| 作者 TechNews 編輯台|發布日期 2026 年 03 月 09 日 9:20 | 分類 AI 人工智慧 , ChatGPT , OpenAI | edit |
OpenAI 再次推遲其 ChatGPT 的「成人模式」推出,這是該功能第二次被延遲。根據 OpenAI 發言人的說法,這個決定是為了將重心放在更重要的工作上,以滿足更廣泛使用者的需求。發言人指出,當前的優先事項包括提升 AI 智慧、改善個性化、增強使用者體驗以及使互動更加主動。 繼續閱讀..
GPT-5.4 新模型具原生電腦操作能力,支援 ChatGPT for Excel 外掛 |
| 作者 陳 冠榮|發布日期 2026 年 03 月 06 日 16:14 | 分類 AI 人工智慧 , ChatGPT , OpenAI | edit |
本週,OpenAI 除為 ChatGPT 換上 GPT‑5.3 Instant 模型提供日常外,5 日進一步發表 GPT‑5.4,上下文脈絡增至 100 萬 Token,是 OpenAI 目前最強大、效率最高的專業模型,在推理、編碼以及處理微軟 Excel 等有所進步。這也是 OpenAI 首款具有原生電腦操作能力的模型,它能代替使用者操作電腦、跨多個代理程式完成任務。
