Tag Archives: 大語言模型

突破人類知識限制,DeepMind 預測 AI 邁向「經驗時代」

作者 |發布日期 2025 年 05 月 11 日 10:30 | 分類 AI 人工智慧 , 科技教育 , 科技生活

在打造人工智慧的漫長路上,人類的角色是時候改變了? Google DeepMind 科學家在新文章中預測,有限的人類資料不再是引導機器產生智慧的最佳素材。相反地,人類是時候讓機器自行探索世界、從經驗中學習。如此,AI 也才能創造出值得人類學習的知識。 繼續閱讀..

大語言模型應用全攻略,馬斯克最推崇的 AI 專家教你這樣用

作者 |發布日期 2025 年 03 月 08 日 9:30 | 分類 AI 人工智慧 , 科技教育

曾待過特斯拉,馬斯克至今仍歡迎他隨時回訪的程式大師卡帕西,首度教導 ChatGPT、 Claude 等 AI 工具怎麼用!從 OpenAI 轉投教育事業的電腦科學家卡帕西(Andrej Karpathy)在 YouTube 釋出新影片,以樸實無華但乾貨滿滿的方式完整盤點大語言模型現況。現正熱門的推理模型怎麼用?如何讓 AI 更懂你?無論是初學者或重度使用者,都能獲益良多。 繼續閱讀..

百度李彥宏:大模型推理成本每年降逾九成

作者 |發布日期 2025 年 02 月 12 日 11:00 | 分類 AI 人工智慧 , 軟體、系統

綜合港媒及中媒報導,百度創始人、董事長兼首席執行長李彥宏出席於杜拜舉行的「世界政府峰會活動」,被問及 DeepSeek 面世,引發市場思考未來是否需要大額投資人工智慧(AI),他認為,儘管 DeepSeek 挑戰了大型 AI 模型的成本效率,但仍需要對資料中心和雲基礎設施進行投資;並強調雲基礎設施的投資仍然非常必要,想開發出比別人更智慧的模型,就必須使用更多的算力。 繼續閱讀..

全球首個「專為半導體設計」的開源 LLM:SemiKong 發表

作者 |發布日期 2024 年 12 月 29 日 12:36 | 分類 AI 人工智慧 , IC 設計 , 半導體

SemiKong 是由 Aitomatic 及其「AI 聯盟」(AI Alliance)合作夥伴訓練而成的新型大型語言模型(LLM),為世界上第一個專為半導體業需求而設計的大型語言模型。該模型旨在成為半導體設計公司工作流程的一部分,充當數位專家,加速新晶片的研發和上市。 繼續閱讀..

騰訊混元:大語言模型和 3D 模型正式開源

作者 |發布日期 2024 年 11 月 06 日 10:15 | 分類 AI 人工智慧 , 軟體、系統

綜合中媒報導,騰訊旗下騰訊混元 5 日宣布,最新的 MoE(混合專家;Mixture of Experts)大語言模型「混元 Large」以及混元 3D 生成大模型「Hunyuan3D-1.0」正式開源,支持企業及開發者精調、部署等不同場景的使用需求,可在 HuggingFace、Github 等技術社群直接下載,免費可商用。 繼續閱讀..

李開復:大語言模型加速 AI 2.0,推理成本下降可期

作者 |發布日期 2024 年 07 月 23 日 11:40 | 分類 AI 人工智慧 , 軟體、系統

鴻海研究院諮詢委員、零一萬物執行長及創新工場董事長李開復今天表示,大語言模型能力增強加速 AI 2.0 成真,AI 2.0 改變使用者介面和商業模式,升級全球經濟規模,所有軟體和商業模式可能被人工智慧重寫,未來 AI 應用推理成本,每年將以近 10 倍速下降。 繼續閱讀..

蘋果推出開源生成式 AI 模型 OpenELM

作者 |發布日期 2024 年 04 月 25 日 11:06 | 分類 AI 人工智慧 , Apple

蘋果被外界詬病,其在生成式 AI 領域的腳步太慢,被微軟、OPenAI、Google 等科技公司甩在後方;蘋果執行長庫克早先還表示,該公司今年會在生成式 AI 領域開闢出新天地,但依然無法挽回部分投資人信心。為了加快在生成式 AI 領域發展腳步,現在蘋果推出了一個名為 OpenELM 的開源生成式人工智慧模型。

繼續閱讀..