Tag Archives: 大型語言模型

AI 設計「外星科技」重力波探測器,靈敏度提升 10 倍

作者 |發布日期 2025 年 08 月 18 日 10:00 | 分類 AI 人工智慧 , 尖端科技

在物理學界,人工智慧(AI)正逐漸成為設計新實驗的強大工具,甚至能夠提出一些人類科學家未曾想過的創新方案。最近,加州理工學院的物理學家拉娜·阿迪卡里(Rana Adhikari)利用由德國馬克斯·普朗克光科學研究所開發的 AI 系統「Urania」,成功設計出多款具有突破性的重力波探測器結構。這些設計不僅提升探測器靈敏度,有些甚至可提高超過 10 倍以上,遠超過現有人類設計的 15% 增幅。 繼續閱讀..

為什麼台灣仍需要主權 AI?不單是「誰說了算」問題

作者 |發布日期 2025 年 08 月 01 日 7:50 | 分類 AI 人工智慧 , Big Data , 科技政策

全球人工智慧(AI)競逐,英語與簡體中文訓練的大型語言模型(LLM)主導市場。然對資料量相對有限的繁體中文環境,台灣是否有必要投入資源發展「主權 AI」?語料規模遠不如英語或簡體中文下,打造自主 AI 模型是否仍具價值?

繼續閱讀..

AI 是太過自信的朋友,卻不會從錯誤汲取教訓

作者 |發布日期 2025 年 07 月 25 日 13:30 | 分類 AI 人工智慧 , 資訊安全

卡內基美隆大學研究員將大型語言模型(LLM)聊天機器人比擬為「自信滿滿卻老是投籃不中的朋友」,因 AI 模型回答錯誤卻會更自信。主要作者特倫特·卡什(Trent Cash)說,當人預測自己能正確回答 18 個問題只答對 15 題時,信心通常稍微降低,調整為 16 題回答正確,但 LLM 卻傾向表現不佳時仍保持甚至增加自信。 繼續閱讀..

韓國新創 FuriosaAI 與 LG 合作,推出高效能 AI 晶片 RNGD

作者 |發布日期 2025 年 07 月 22 日 15:00 | 分類 AI 人工智慧 , 半導體 , 晶片

韓國 AI 晶片新創 FuriosaAI 22 日宣布與 LG AI 研究部門達成首項大合約,代表 FuriosaAI 與輝達(Nvidia)等大型晶片商競爭的重要進展。FuriosaAI 首席執行長 June Paik 透露,AI 晶片 RNGD(發音為 Renegade )經七個月嚴格評估,獲 LG 批准,用於驅動 LG 的 Exaone 大型語言模型。 繼續閱讀..

不只給人看,專家:AI 時代網站也要做給機器人看

作者 |發布日期 2025 年 07 月 22 日 13:56 | 分類 AI 人工智慧 , 人力資源 , 數位內容

做行銷的人,都要研讀 SEO,幫自家內容爭取到搜尋引擎的青睞,但現在隨著 AI 竄出,大型語言模型取代搜尋引擎成為每個人了解世界的主要通道。提高搜尋引擎上的能見度愈來愈不重要,取而代之的是如何提高被 AI 抓取的機會,背後的思考邏輯已經大不相同。 繼續閱讀..

AI 表現亮眼背後的幻象,什麼是「波坦金理解」?

作者 |發布日期 2025 年 07 月 04 日 12:00 | 分類 AI 人工智慧 , ChatGPT

在最新的研究中,麻省理工學院、哈佛大學和芝加哥大學的學者提出了「波坦金理解」(potemkin understanding)這一術語,來描述大型語言模型在概念基準測試中表現優異、但卻缺乏真正理解能力的現象。這一術語源自於俄羅斯軍事領導人格里戈里·波坦金為了取悅凱瑟琳二世而建造的虛假村莊的故事。

繼續閱讀..

每七個月能力就翻倍,2030 年 LLMs 數日就能做完人類一個月工作

作者 |發布日期 2025 年 07 月 03 日 10:00 | 分類 AI 人工智慧 , 軟體、系統

大型語言模型(LLMs)迅速進步,幾年內這些模型能以驚人速度完成複雜任務。根據加州柏克萊模型評估與威脅研究(METR)機構最新研究,關鍵 LLMs 能力每七個月就會翻倍,到 2030 年最先進 LLMs 能以 50% 可靠性完成人類需一個月(約 167 小時)才能完成的軟體工作,並可能幾天甚至幾小時就做完。 繼續閱讀..

DeepSeek 更新 R1 模型,官方表示性能媲美 OpenAI o3

作者 |發布日期 2025 年 06 月 13 日 7:20 | 分類 AI 人工智慧 , GPU , 中國觀察

DeepSeek 5 月底發表大型語言模型升級版 DeepSeek-R1-0528 ,此次為小更新,數學推理、寫程式能力與內容準確性明顯提升,AIME 測試準確率達 87.5%,並降低模型產生幻覺機率。除開源外,新版支援 JSON 輸出與 Function Calling ,讓使用者更快整合至應用程式。 繼續閱讀..