華盛頓州立大學副教授 Mesut Cicek 領導研究顯示,ChatGPT 判斷科學假設方面錯誤率仍高,儘管模型不斷更新,準確性仍然有限,且重複詢問 AI 同樣問題,答案還是常常不同。 繼續閱讀..
AI 只拿到 D!ChatGPT 分辨科學假設錯誤率仍比想像高 |
| 作者 TechNews 編輯台|發布日期 2026 年 03 月 18 日 14:50 | 分類 AI 人工智慧 , 科技教育 , 資訊安全 |
AI 只拿到 D!ChatGPT 分辨科學假設錯誤率仍比想像高 |
| 作者 TechNews 編輯台|發布日期 2026 年 03 月 18 日 14:50 | 分類 AI 人工智慧 , 科技教育 , 資訊安全 | edit |
華盛頓州立大學副教授 Mesut Cicek 領導研究顯示,ChatGPT 判斷科學假設方面錯誤率仍高,儘管模型不斷更新,準確性仍然有限,且重複詢問 AI 同樣問題,答案還是常常不同。 繼續閱讀..
AI 法律應用的里程碑官司:日本生命保險提告 OpenAI,或又使 AI 監管加嚴 |
| 作者 TechNews 編輯台|發布日期 2026 年 03 月 09 日 18:20 | 分類 AI 人工智慧 , OpenAI | edit |
日本生命保險 4 日在美提告 OpenAI,因 ChatGPT 提供法律相關事務不當建議,導致他們面臨法律糾紛。ChatGPT 協助某客戶撰寫法律文件,但內容不只錯誤百出,還使日本生命保險不得不耗費大量資源打官司,故要求 OpenAI 賠償 ChatGPT 造成的公司損失。 繼續閱讀..
GPT-5.4 新模型具原生電腦操作能力,支援 ChatGPT for Excel 外掛 |
| 作者 陳 冠榮|發布日期 2026 年 03 月 06 日 16:14 | 分類 AI 人工智慧 , ChatGPT , OpenAI | edit |
本週,OpenAI 除為 ChatGPT 換上 GPT‑5.3 Instant 模型提供日常外,5 日進一步發表 GPT‑5.4,上下文脈絡增至 100 萬 Token,是 OpenAI 目前最強大、效率最高的專業模型,在推理、編碼以及處理微軟 Excel 等有所進步。這也是 OpenAI 首款具有原生電腦操作能力的模型,它能代替使用者操作電腦、跨多個代理程式完成任務。
ChatGPT 認為密西西比州全美國最懶惰!研究發現 AI 偏見仍無法消除 |
| 作者 TechNews 編輯台|發布日期 2026 年 02 月 18 日 9:30 | 分類 AI 人工智慧 , 資訊安全 | edit |
最新研究,密西西比州被認為是美國最懶惰的州,這結論來自牛津大學和肯塔基大學,他們成功破解 ChatGPT,揭示藏在訓練資料裡的刻板印象。研究員提問超過 2 千萬題,讓 ChatGPT 在兩個選項中選一個,了解 AI 對各城市和州的看法。 繼續閱讀..
採 Cerebras 晶片,OpenAI 發表 GPT-5.3-Codex-Spark 編碼模型 |
| 作者 陳 冠榮|發布日期 2026 年 02 月 13 日 11:14 | 分類 AI 人工智慧 , ChatGPT , OpenAI | edit |
OpenAI 12 日推出 GPT-5.3-Codex 精簡版——GPT-5.3-Codex-Spark,目前這款研究預覽版是 OpenAI 首款專為即時程式設計所打造的模型,更是與 AI 晶片公司 Cerebras 合作的新里程碑。
