全球最強開源語言模型誕生！瑞士用「水力發電」打造 AI 新霸主，精通千種語言

瑞士研究人員最近在阿爾卑斯超級電腦上成功訓練了一個「完全開放」的大型語言模型（LLM），這一成就標誌著 AI 研究的一個重要里程碑。

阿爾卑斯超級電腦是歐洲最強大的高性能計算系統之一，專為AI工作負載而設計，於2024年底啟用，配備超過10,000個NVIDIA GH200 Grace Hopper超級晶片，結合了優化的ARM CPU和GPU，能夠高效地進行大規模訓練。

這次訓練過程耗費了約300萬GPU小時，這一龐大的計算工作得益於阿爾卑斯超級電腦的尖端架構，提供了數個petaFLOPS的AI專用性能。研究人員計劃在2025年夏季將這個LLM公開發布，並將其以Apache 2.0許可證的形式提供，強調開放性和可及性，以促進研究和開發。

除了其AI能力外，阿爾卑斯超級電腦還以環保著稱，完全依賴水力發電，並採取措施減少二氧化碳排放，將冷卻水重新利用於附近城市盧加諾的供暖。這項約1億瑞士法郎的建設投資和每年3,700萬瑞士法郎的運營費用，彰顯了瑞士在推進AI技術方面的承諾，並以開放、可持續和公共利益為導向。

ETH蘇黎世大學和瑞士聯邦理工學院的研究人員在日內瓦舉行的國際開源LLM建設者峰會上首次透露了這一消息。研究人員表示，這些模型將提供80億和700億參數的版本，並在150兆個數據標記上進行訓練，預計能流利使用超過1,000種語言，其中約40%的訓練數據來自英語以外的語言。

ETH蘇黎世大學的教授馬丁·雅吉表示，這種完全開放的做法與商業模型的封閉開發形成鮮明對比，旨在推動瑞士及歐洲的創新，並促進跨國合作。研究人員強調，這種透明度對於建立高信任度的應用和推進AI風險及機會的研究至關重要。

（首圖來源：shutterstock）

從這裡可透過《Google 新聞》追蹤 TechNews

科技新知，時時更新

想請我們喝幾杯咖啡？