從 M1 Pro 與 M1 Max 的暴力美學,回顧構成蘋果晶片研發團隊骨幹的 P.A. Semi 與 Intrinsity

作者 | 發布日期 2021 年 11 月 02 日 8:00 | 分類 Apple , IC 設計 , 晶片 Telegram share ! follow us in feedly


當 1919 年「總體經濟學之父」凱因斯(J. M. Keynes)回顧性檢討第一次世界大戰時,所著《和平的經濟後果》這樣說:「權力政治無可避免。關於這次戰爭和結束並沒有新教訓:英國還是像過去每世紀,毀滅了一個貿易勁敵。」

這也是筆者10月26日看完新MacBook Pro發表會後,回想構成蘋果晶片研發團隊骨幹P.A. Semi和Intrinsity後唯一感想。蘋果依舊在無拘無束的封閉花園內,把最簡單的事做到最完美的「暴力美學」,貫徹到兩顆巨無霸系統單晶片。當然,遊戲應用還是Mac罩門,再強的GPU恐怕都救不回來,但可大幅提高Mac用戶的「生產力」就足以灑花放煙火了。

M1完全體:驚人的橫向擴展

如果說一年前M1只有讓人印象深刻的驚人單執行緒效率,今年M1 Pro與M1 Max則告訴世人,蘋果如何「硬幹」出M1的巨型橫向擴張版(快取記憶體階層也維持現有結構),並靠看似用不完的大量記憶體理論頻寬,支撐超出兩倍現行x86筆電處理器的多執行緒浮點運算效能。論能耗比,大概也沒啥好比較的空間了。

從晶粒圖可清楚看出,M1 Pro和M1 Max的差別就在後者下方多「長出」額外16核GPU、兩組128位元寬LPDDR5記憶體控制器、兩塊16MB系統層級快取記憶體(SLC,Systel Level Cache)、最底部疑似「兩倍規格NPU」的部分。蘋果也並未在M1 Pro / Max修改處理器核心的微架構,八個大核區塊延續M1四核一組共用12MB快取記憶體,兩小核、16核類神經網路單元和SLC,也幾乎原封不動從M1搬到M1 Pro / Max。

這種看似高度模組化、彷彿把CPU當成GPU做的手段,乍看之下似乎很簡單(M1家族三款晶片應該是一起開發),但光想到M1 Max是巨無霸晶片,要考慮到維持低功耗並搞定內部匯流排的訊號走線和時脈區域,就很不得了了。

截至目前,論「堆積木」於泛用處理器世界,唯一可大膽說「叫我第一名」的恐怕只有IBM,從Power9開始,創造「一個大核拆成兩個小核」的世界奇觀,並延續到新一代Power10。但別忘了一件事:M1 Pro和M1 Max是「消費級產品」,IBM Power9 / 10卻是單價「1萬美元」為基本單位的伺服器怪物。

蘋果為何可在M1 Pro和M1 Max做到這些事,就不得不追溯蘋果自研晶片研發團隊的起源:P.A Semi與Intrinsity了。了解這兩間公司的背景和專長,就不難預期蘋果今日成就與未來想幹的大事。畢竟蘋果從來不公開技術細節,也從不參加處理器業界學術交流活動(哪天出現在ISSCC和HotChips演講台,太陽都要從西邊出來了),要推敲蘋果幹了啥好事的線索,也就只剩下被併購的公司了。

簡單結構的延展性:P.A. Semi

2008年4月,蘋果以2.78億美元收購某無晶圓廠晶片設計公司,聽說不小心得到150名天才工程師。

公司名叫P.A. Semi,創立於2003年,位於美國加州Santa Clara,由曾在2003年獲頒IEEE Solid State Circuits Award的晶片設計大師Daniel W. Dobberpuhl成立。

Daniel W. Dobberpuhl在1976年加盟DEC,參與過1980年代這間公司最成功的產品MicroVAX,也歷經過對後世影響深遠的DEC Alpha 21064與StrongARM。隨著StrongARM從DEC移轉給英特爾,Daniel W. Dobberpuhl創立SiBytes,專注MIPS指令集的高速網路處理器,2000年被博通併購。Daniel W. Dobberpuhl於2019年10月26日辭世,享年74歲。

今日蘋果A系列與M系列處理器之所以有今天表現與地位,除了封閉性生態系統帶來的先天「不對稱」優勢,P.A. Semi團隊絕對居功厥偉。

▲ Daniel W. Dobberpuhl。

值得一提的是,同樣待過DEC並參與Alpha 21164和21264的「處理器遊俠」Jim Keller於1999年入職SiBytes,接著在博通擔任首席架構師,又在2004年轉戰P.A. Semi任職工程副總裁。他在Daniel W. Dobberpuhl領導下,累積低功耗RISC處理器的豐富經驗,直到2008年P.A. Semi被蘋果併購,也仍留在蘋果服務不短時日,參與A4和A5研發。

▲ Jim Keller。(Source:影片截圖)

P.A. Semi當時研發名為PWRficient的產品線,顧名思義,就是追求極致能耗比的處理器。總計分成三部分:相容PowerPC指令集的PA6T核心、CONEXIUM晶片內連結架構、ENVOI I/O子系統。後來蘋果自研處理器的諸多特色,或多或少都可在PWRficient摸索到蹤跡,也可從遺產判斷蘋果自家晶片未來的可能方向。基本上,筆者只能說M1 Pro / Max問世,就是開花結果的時刻,即使相隔超過12年,實在有點漫長。

PA6T核心在時脈2GHz時,最高功耗不超過7W,1.5GHz時更低至4W,雙核心PA6T-1692M在時脈2GHz時,整顆標準功耗僅13W,最高也不超過25W。相較同時期衍生自伺服器應用的IBM PowerPC(如PowerPC 970家族),無論同時脈效能(SPEC CPU 2000)和能耗比,均享有壓倒性優勢,P.A. Semi也不搞大型化多層快取記憶體「金字塔」。

省電歸省電,PA6T仍是貨真價實的多指令派發、非循序執行的高效能微架構,浮點運算性能尤其出色,約為同時脈IBM PowerPC 970的「兩倍」(別忘了PowerPC 970源自Power4)。因此當時不乏蘋果將用P.A. Semi產品取代IBM和Motorola的傳言。

不過賈伯斯卻在2005年選擇了英特爾。假使蘋果當年直接用P.A. Semi晶片打造MacBook Air,而不是「連根拔起」轉進英特爾,那計算機工業界的歷史,恐怕就會重新改寫,最起碼IBM的Power Everywhere看來不會變成幻夢一場。

但這並不代表蘋果不重視P.A. Semi的價值(要不然也不會花錢併購了),P.A. Semi也並非如外界刻板印象,只想做低功耗的低階產品。反之,P.A. Semi PWRficient一開始就放眼各式各樣應用,並具備強大的多核心延展性。據已知資料,PWRficient將有16核版。

伺服器也是P.A. Semi鎖定的目標。換言之,P.A. Semi的目標可歸納為一條公式:StrongARM的低功耗+Alpha等級的高效能+PowerPC指令集相容性,都是當時最重要的指標。

不過蘋果收購P.A. Semi後也非一帆風順,雖然接收150名天才工程師,但Dan Dobberpuhl與數名重要的工程師,因對兩間公司的整合方式與股票獎勵制度不滿,2009年底先後離開蘋果,一起創立了Agnilux,不到一年就被Google買走。這次Daniel W. Dobberpuhl並沒有跟著進入Google,而成為機器視覺廠商Movidius的董事會主席,而Movidius則在2016年成為英特爾的一部分。

最佳化的電路設計:Intrinsity

蘋果吃掉P.A. Semi後,卻遲遲看不到自家晶片,甚至獨創核心微架構問世,他們該怎麼辦?

蘋果2010年4月發表首款自研處理器A4(APL0398,iPhone 4的心臟),衍生自三星S5PC110A01,最主要的差別在於GPU換成蘋果長期偏好的PowerVR SGX系列,但完全一模一樣的ARM Cortex-A8核心卻大有來頭,因得到Intrinsity公司的技術加持,延續和三星合作「Hummingbird」的成果,時脈從ARM公版的650MHz一舉推進到1GHz大關。

成立於1999年、設立在美國德州奧斯汀的Intrinsity,強項在最佳化Wave Pipeline(無鎖存管線)電路設計,命名為FastMATH。當蘋果認知到這間公司的重要性後,就馬上出手收入囊中,但過程卻極度低調,連確切時間和收購金額都無人知悉(據說是5千萬美元,但也有其他版本)。唯一可確定的是,蘋果目的非常明確,就是為了A4處理器。接著出自P.A. Semi團隊的獨特微架構Swift,就在2012年9月A6堂堂登場,開啟Apple Silicon之路。

Intrinsity人數就沒P.A. Semi那麼多了:22名業界老兵。

Intrinsity的FastMATH最有名成功案例,是超低功耗的MIPS32指令集處理器,時脈2GHz時只有4W,1GHz時更只有1.5W。蘋果得到Intrinsity後,更讓從P.A. Semi獲得的深厚功力提升更高。如何將特殊電路設計技術有效用到台積電最新製程,也是Intrinsity厲害的地方。

Apple Silicon的下一步?

看到這裡,想必各位一定會好奇,穩扎穩打、持續推陳出新的Ax與Mx之外,蘋果下一步會踏入哪些新領域呢?坦白講,目前看不出來。但我們有充分理由相信,在商言商,蘋果不太可能重回品牌伺服器與儲存設備市場(很久以前的Xserve和Xserve RAID),就算要打造伺服器等級處理器,也是關起門來自己用,頂多像Google和AWS出租雲端CPU,這不太像近期會成真的可能性。

話說回來,Apple Silicon效能表現看起來再好再威,影響範圍也只限蘋果生態圈和用戶,會不會真的讓微軟卯起來「有為者亦若是,將現有Wintel生態系統整個砍掉重練」,還得好好觀察。

唯一可確定的是,搞不好某些骨灰級果粉也許不太在乎M1 Pro和M1 Max究竟有多厲害,可能還比較關心「終於回歸」的HDMI連接埠、SD卡插槽、MagSafe充電線、改回實體功能鍵的Touch Bar、鍵盤手感,以及意外附贈的「瀏海」。說到底,決定使用者體驗的因素並非只有效能,冤有頭債有主,蘋果個人電腦市占率至今仍無法突破10%,終究還是有原因。

(首圖來源:蘋果)

延伸閱讀: