蘋果不忍了!推出專為 Apple Silicon 晶片設計的 MLX 機器學習框架

作者 | 發布日期 2023 年 12 月 07 日 22:40 | 分類 AI 人工智慧 , Apple , 晶片 line share follow us in feedly line share
蘋果不忍了!推出專為 Apple Silicon 晶片設計的 MLX 機器學習框架


儘管蘋果多年來一直從事 AI 工具的研發,Siri 剛推出的時候也曾經吸引眾人的目光好一陣子。但隨著 OpenAI 推出 ChatGPT 之後,Siri 頓時黯然失色,蘋果也被貼上 AI 方面做得還不夠,甚至有點落後的標籤。事實上,蘋果並沒有在這方面停滯不前,如今蘋果的機器學習研究中心(Machine Learning Research)已經發布一個專為 Apple Silicon 晶片設計的全新 MLX(ML Explore)免費開源框架。 

週三,蘋果機器學習研究中心成員 Awni Hannum 在 Twitter/X 上宣布,該公司發布了蘋果機器學習研究方面的一些新軟體,亦即 MLX 框架。他強調:「MLX 是專為 Apple Silicon 晶片(也就是你的筆電)設計的高效機器學習框架。」目前完整的原始程式碼已可在 GitHub 上免費取得。

蘋果推出 MLX 是為使用蘋果硬體的研究人員或開發人員簡化機器學習模型的訓練和部署。進一步而言,它不是一個面向消費者的工具,而是為開發人員提供一個強大的環境來構建機器學習模型。

MLX 的設計靈感來自於諸如 PyTorch、Jax 和 ArrayFire 等現有框架,但該工具新增了統一記憶體模型(unified memory model)的支援,這意味著陣列位於共用記憶體中,可以在任何支援的裝置類型上執行操作,而無需進行資料複製。

除了統一記憶體外,MLX 還支援許多功能,包括熟悉的 API(具備與 NumPy 極度相似的 Python API、可與 Python API 緊密對應且功能齊全的 C++ API)、可組合函數轉換、延遲計算、動態圖構建、多裝置運行等。

目前蘋果已提供一系列 MLX 的實際用例,包括 Transformer LM 深度模型架構語言模型的訓練;透過 LLaMA 通用大型語言模型進行大規模文字生成並透過 LoRA 低秩自適應模型進行微調;透過 Stable Diffusion 工具進行圖像生成;透過 OpenAI Whisper 自動語音辨識系統進行語音辨識。

蘋果在 Github 上的 MLX 讀我檔案中指出,MLX 是個使用者友好的框架,設計概念上力求簡單,進而有效訓練和部署模型。目標在於讓研究人員能更簡單容易地擴展和改進 MLX,以便快速探索新的想法。

(首圖來源:Twitter/X