AI「iPhone 時刻」後，NVIDIA 打開生成式模型「魔盒」

人工智慧應用「淘金潮」火熱背後，總少不了 NVIDIA 的「默默付出」，最近爆紅的 ChatGPT 也一樣。如 CEO 黃仁勳於 GTC 2023 演講所說，數年前正是黃仁勳親手將有簽名與一句話的全球首台 DGX 交給 OpenAI。

正是這台整合8塊NVLink共享算力的H100組成的超級電腦，OpenAI才取得交出ChatGPT這張答案卷的機會。NVIDIA交貨給OpenAI首台DGX AI電腦後，《財富》100強企業一半都改用DGX AI。NVIDIA 算力基礎設備與人工智慧應用，儼然成為硬幣不可分割的正反面。

剛結束的GTC 2023，NVIDIA又展示向人工智慧未來邁出的下一步。

人工智慧的「iPhone時刻」

生成式AI和大型自然語言模型的殺手級應用風靡全球，讓人工智慧又站在新路口前，如黃仁勳GTC 2023演講所說，人工智慧正迎接自己的「iPhone時刻」，AI硬幣的另一面就是NVIDIA。

黃仁勳預測，就像iPhone使智慧手機和App普及，能產生自然文章和圖片的「生成式AI」也會很快普及。「算力即權力」口號正以人們未預料的速度變成現實，但對企業和開發者來說，想獲得「權力」沒那麼容易。

新創公司競相構建嶄新產品與商業模式，老公司也積極擁抱變化，以應付新環境。大型語言模型訓練需資料中心成千上萬GPU「齊心協力」，對企業來說就是場地和維護成本，要越過門檻並不容易。

不論新生血液還是老牌豪強，都在尋找更快捷的人工智慧開發流程。身為算力供應商的NVIDIA已發覺新需求，並推出雲端人工智慧DGX Cloud。DGX Cloud提供專用計算集群，每個DGX Cloud配備8個NVIDIA H100或A100 80GB Tensor Core GPU，共640GB GPU記憶體，用戶可按月租用計算資源，簡單Web瀏覽器即可存取，降低本地部署和管理基礎設施的成本，增加AI便捷性。

黃仁勳描述產品遠景時這樣說：「透過瀏覽器就能將DGX AI超級計算機立即接入公司。」

這並非空中樓閣，GTC 2023演講時黃仁勳宣布，NVIDIA將與雲端業者合作託管DGX雲端基礎設施，已與甲骨文達成合作，甲骨文OCI RDMA Supercluster提供可擴展超過32,000個GPU的超級集群。微軟Azure預定下季開始託管DGX Cloud，很快Google Cloud也會加入行列。

打開生成式AI「魔盒」

iPhone問世後沒有止步不前，一路引領智慧手機長達數十年發展，如今也到「iPhone時刻」的AI，面對的也與當年iPhone極其相似的世界。ChatGPT的成功，對AI革命而言僅是踏入門口一小步，門後是生成式AI更廣闊的世界。

基礎設施之外，想掌握AI「原力」的企業來說，如何搭上AI下一班車，建立生成式AI模型，並應用至生產也是重要命題。NVIDIA新雲端服務平台NVIDIA AI Foundations正是讓企業做到這點的「神兵利器」。NVIDIA AI Foundations分為客製語言文本Nemo、視覺語言製作Picasso和醫學專門模型Bionemo三部分。

Nemo客戶可引入自家模型，或使用Nemo從GPT-8、GPT-43到GPT-530等數十億參數的預訓練模型，並構建可掌控的語言模型。Picasso提供消費者大量有授權許可的專業圖片和影像素材，使用許可內容或根據自家內容訓練自定義模型，並將生成內容導入編輯工具，甚至能導入NVIDIA元宇宙平台Omniverse，參與「元宇宙」大基建。

提供語言、視覺和生物學等領域模型製作服務，適用需構建、改善和操作自定義LLM的客戶及專用資料庫訓練的生成AI，以及針對特定領域任務，Bionemo使用者既能即時存取藥物研發流程，也能用於蛋白質結構預測和蛋白質生成與分子生成、分子對接等新藥研究關鍵步驟的模型。

NVIDIA不僅將三者合一的NVIDIA AI Foundations視為雲端服務，更視為構建生成式AI模型的「代工廠」。

GPU反客為主，晶片關鍵步驟「搶班奪權」

要真的跨過AI下次進化的大門，最重要的「基建設備」GPU晶片製造當然非常重要。人工智慧大紅離不開GPU助力，提供大量執行重複簡單計算的GPU對需要大量算力的大模型和神經網路來說，是命定的伴侶。

前幾年人工智慧小小掀起工業浪潮，小至餐廳補貨，大到碼頭或光伏電站，人工智慧成為工業領域公認的「先進產能」。但兜兜轉轉，GPU領頭者NVIDIA終於把人工智慧觸手帶回「原點」：GPU晶片製造。

黃仁勳提到，隨著晶片製程進步，如今晶片要求約一個金原子或一條人類DNA鏈尺寸誤差，晶片製造核心步驟和起始階段的曝光更是重中之重。30年前電晶體尺寸就比曝光機波長更小，由於衍射效應，掩膜圖案與最終圖案特徵完全不同，使類比光透過光學元件和光阻劑互相作用結果的計算曝光成為晶片製造設備重要的一環。

▲ 掩膜圖案與最終特徵完全不同。

以前CPU承擔主要工作，黃仁勳估算，每年晶片商在這步驟消耗數百億CPU小時算力創建曝光系統掩範本，但先進製程發展到現在計算曝光更複雜，CPU負載舉步維艱。多次高呼「摩爾定律已死」的黃仁勳故宣布人工智慧與晶片製造結合的最新成果：基於晶片製造的NVIDIA cuLitho軟體庫，找到晶片製造的新「活路」。

NVIDIA表示，cuLitho加持下，短期就可提升晶片產業鏈效率，大幅降低功耗，新流程僅需500塊H100就能完成傳統流程4萬個CPU系統才能完成的工作，讓曝光性能躍升40倍。比起現有流程，cuLitho能僅用九分之一功耗達成每天3~5倍生產效率，也能一夜之間做完傳統兩星期才能完成的單個掩範本任務。

長遠看，NVIDIA有更遠大目標。不僅將與台積電、新思科技合作，將NVIDIA cuLitho軟體庫整合到系統，製造最新Hopper架構GPU，黃仁勳還宣佈與台積電、艾司摩爾與新思科技合作，使用cuLitho為2奈米以後更先進製程晶片打好基礎，為AI「iPhone時刻」後革命準備好足夠「糧草」。

（本文由雷鋒網授權轉載；首圖來源：NVIDIA）