蘋果聯手 Google 打造第三代基礎模型，裝置端進階模型走新架構

蘋果新一代 Apple Intelligence 深度整合至作業系統，並由一套以隱私為基礎的全新架構所驅動。這套架構的核心在於第三代 Apple 基礎模型（Apple Foundation Models，AFM），由蘋果與 Google 合作量身打造的 5 款基礎模型，範圍從裝置端一路延伸至運行在私密雲端運算（Private Cloud Compute）上的伺服器端，有助於使用者解鎖各式各樣的 AI 體驗。

裝置端模型

首先，第三代 Apple 基礎模型包含 2 款裝置端模型：

AFM 3 Core：新一代 30 億參數密集型模型，處理品質向上跨出一階。
AFM 3 Core Advanced：是蘋果目前最強的裝置端模型，具備原生多模態能力，支援語音、更高準確度的口述輸入等實用功能。這款 200 億參數模型採用稀疏架構（Sparse Architecture），根據請求內容每次只啟動 10 億至 40 億參數。

進一步來看，AFM 3 Core Advanced 並未將整個模型強制塞入 DRAM 中，而是將完整模型儲存在快閃記憶體（NAND）。由於 NAND 與 DRAM 之間的傳輸頻寬太慢，無法像標準混合專家（Mixture of Experts，MoE）模型所要求以 token 為單位逐次交換權重資料，因此 AFM 3 Core Advanced 是以提示為單位的方式，也就是模型根據當下輸入的整段提示，一次決定要派出哪幾個「專家」來處理。

▲ AFM 3 Core Advanced 模型架構。

上下文長度限制了模型在單一對話可以處理的資料量，token 則是模型處理資料的基本單位，蘋果官方文件指出，Apple 基礎模型的架構最多支援 4,096 token。如此一來，不只使用者輸入的文字占用用量，系統指令、格式要求、工具說明、前文紀錄，以及模型最後產生的回覆，會一併算進這 4,096 token。

因此，裝置端模型適合「短、小、快」的任務，而非長篇上下文、高複雜度的 Agent 任務。裝置端模型優勢在於離線可用、低延遲、隱私性高，能與蘋果生態系統深度整合。那麼 Agent 任務可望由下面介紹如 AFM 3 Cloud Pro 等承接。

伺服器端模型

第三代 Apple 基礎模型另外 3 款是運行在私密雲端運算上的伺服器端模型，確保使用者的資料不被儲存、不與他人共享：

AFM 3 Cloud：是伺服器端的主力模型，針對速度、效率及效能進行最佳化。
ADM 3 Cloud：用於圖像生成和編輯，進而解鎖進階的照片編輯工具、全新 Image Playground 及更多功能。
AFM 3 Cloud Pro：是蘋果目前最強的伺服器端模型，可用於 Agent 使用情境和複雜的推理。

AFM 3 Core、AFM 3 Core Advanced、AFM 3 Cloud 及 ADM 3 Cloud 由 Apple 晶片量身打造而成。至於伺服器端最強的 AFM 3 Cloud Pro，蘋果與 Google、NVIDIA 合作，將私密雲端運算擴展至 Google Cloud 上的 NVIDIA GPU，這麼做依然維持蘋果保護使用者隱私的承諾。

第三代 Apple 基礎模型目的在於支援與整合 Apple Intelligence 體驗，使蘋果的作業系統更聰明、更有幫助，蘋果也能從模型層面和特徵層面進行品質評估。