極低功耗運行 GPT 2!韓國開發全球首款「類似人腦」超高效 AI 半導體

作者 | 發布日期 2024 年 03 月 08 日 12:20 | 分類 AI 人工智慧 line share follow us in feedly line share
極低功耗運行 GPT 2!韓國開發全球首款「類似人腦」超高效 AI 半導體


韓國研究人員根據模仿人腦結構和功能的原理,開發世界上首款人工智慧(AI)半導體,能以超高速、極低功耗運行,用於處理大型語言模型(LLM)。該半導體成功運行 GPT 2,功耗僅 Nvidia A100 的 1/625,大小僅 A100 的 1/41,韓媒認為這是全球 AI 半導體大戰升級的關鍵進展。

韓國科學技術情報通信部(MSIT)2 月 6 日宣布,由 Yu Hoi-jun 教授領導的研究團隊利用三星 28 奈米製程開發出超低功耗的「互補變壓器」半導體。該團隊包括韓國科學技術院(KAIST)PIM 半導體研究中心和 AI 半導體研究生院。

傳統上,運行 GPT 2 需要多個 GPU,消耗 250 瓦的功率。然而,研究團隊使用單個 AI 半導體(尺寸為 4.5×4.5 毫米),在短短 0.4 秒內成功處理 GPT 2,功率僅 400 毫瓦。這項研究成果在 2 月 19-23 日於舊金山舉行的國際固態電路會議(ISSCC)上進行介紹和演示。

互補變壓器是種可有選擇性地使用 「尖峰神經網路」(SNN,spiking neural networks)和「深度神經網路」(DNN,deep neural networks)的技術。前者模仿大腦神經元處理資訊方式,後者則辨識複雜模式並透過多層神經網络進行學習的 AI 模型。

互補變壓器類比人腦的運行原理,即能耗隨著認知負荷變化而變化。該技術透過對大輸入值使用 DNN,對小輸入值使用 SNN 來最大限度降低功耗。

韓國科學技術院教授 Yu Hoi-jun 表示,神經形態運算模仿大腦功能,是 IBM 和英特爾等大公司尚未真正實現的技術。很自豪能成為世界上第一個使用超高效神經形態加速器(互補變壓器)運行 LLM 的公司。

(首圖來源:pixabay

延伸閱讀: