蘋果新一代 Apple Intelligence 深度整合至作業系統,並由一套以隱私為基礎的全新架構所驅動。這套架構的核心在於第三代 Apple 基礎模型(Apple Foundation Models,AFM),由蘋果與 Google 合作量身打造的 5 款基礎模型,範圍從裝置端一路延伸至運行在私密雲端運算(Private Cloud Compute)上的伺服器端,有助於使用者解鎖各式各樣的 AI 體驗。
裝置端模型
首先,第三代 Apple 基礎模型包含 2 款裝置端模型:
- AFM 3 Core:新一代 30 億參數密集型模型,處理品質向上跨出一階。
- AFM 3 Core Advanced:是蘋果目前最強的裝置端模型,具備原生多模態能力,支援語音、更高準確度的口述輸入等實用功能。這款 200 億參數模型採用稀疏架構(Sparse Architecture),根據請求內容每次只啟動 10 億至 40 億參數。
進一步來看,AFM 3 Core Advanced 並未將整個模型強制塞入 DRAM 中,而是將完整模型儲存在快閃記憶體(NAND)。由於 NAND 與 DRAM 之間的傳輸頻寬太慢,無法像標準混合專家(Mixture of Experts,MoE)模型所要求以 token 為單位逐次交換權重資料,因此 AFM 3 Core Advanced 是以提示為單位的方式,也就是模型根據當下輸入的整段提示,一次決定要派出哪幾個「專家」來處理。

▲ AFM 3 Core Advanced 模型架構。
上下文長度限制了模型在單一對話可以處理的資料量,token 則是模型處理資料的基本單位,蘋果官方文件指出,Apple 基礎模型的架構最多支援 4,096 token。如此一來,不只使用者輸入的文字占用用量,系統指令、格式要求、工具說明、前文紀錄,以及模型最後產生的回覆,會一併算進這 4,096 token。
因此,裝置端模型適合「短、小、快」的任務,而非長篇上下文、高複雜度的 Agent 任務。裝置端模型優勢在於離線可用、低延遲、隱私性高,能與蘋果生態系統深度整合。那麼 Agent 任務可望由下面介紹如 AFM 3 Cloud Pro 等承接。
伺服器端模型
第三代 Apple 基礎模型另外 3 款是運行在私密雲端運算上的伺服器端模型,確保使用者的資料不被儲存、不與他人共享:
- AFM 3 Cloud:是伺服器端的主力模型,針對速度、效率及效能進行最佳化。
- ADM 3 Cloud:用於圖像生成和編輯,進而解鎖進階的照片編輯工具、全新 Image Playground 及更多功能。
- AFM 3 Cloud Pro:是蘋果目前最強的伺服器端模型,可用於 Agent 使用情境和複雜的推理。
AFM 3 Core、AFM 3 Core Advanced、AFM 3 Cloud 及 ADM 3 Cloud 由 Apple 晶片量身打造而成。至於伺服器端最強的 AFM 3 Cloud Pro,蘋果與 Google、NVIDIA 合作,將私密雲端運算擴展至 Google Cloud 上的 NVIDIA GPU,這麼做依然維持蘋果保護使用者隱私的承諾。
第三代 Apple 基礎模型目的在於支援與整合 Apple Intelligence 體驗,使蘋果的作業系統更聰明、更有幫助,蘋果也能從模型層面和特徵層面進行品質評估。
(圖片來源:蘋果)






