NVIDIA 攜手 Google Cloud,合力加速 AI 開發

作者 | 發布日期 2024 年 04 月 10 日 15:00 | 分類 AI 人工智慧 , Google , 網路 line share follow us in feedly line share
NVIDIA 攜手 Google Cloud,合力加速 AI 開發


NVIDIA 和 Google Cloud 宣布開展新合作,幫助世界各地的新創公司加速建立生成式人工智慧(AI)應用程式和服務。

此合作於今日在美國拉斯維加斯舉行的Google Cloud Next 24大會上宣布,將結合針對新創公司的NVIDIA Inception計畫和Google for Startups Cloud計畫,以擴大獲得雲端積分(cloud credit)、市場推廣支援和技術專業知識,協助新創公司更快地為客戶提供價值。

AI投資高成本,新創公司將能解除限制

NVIDIA指出,NVIDIA Inception是一項支援超過18,000家新創公司的全球計畫,其合格會員將能夠加速使用Google Cloud基礎設施,並獲得Google Cloud積分,專注於AI的企業最高可獲得350,000美元的積分,並可用於NVIDIA DGX Cloud。

Google for Startups Cloud計畫成員可以加入NVIDIA Inception計畫,並獲得技術專業知識、NVIDIA深度學習機構課程學分、NVIDIA硬體和軟體等。Google for Startups Cloud計畫的合格成員還可以參與NVIDIA Inception Capital Connect,讓新創公司能夠接觸到對該領域感興趣的創投公司。

參與這兩個計畫的高成長新興軟體製造商也可以獲得加快入駐Google Cloud Marketplace、共同行銷和產品加速支援。

此次合作是兩家公司為幫助降低各種規模企業開發生成式AI應用相關成本和障礙而發布的一系列公告中的最新一項,新創公司尤其受到AI投資相關高成本的限制。

Google Cloud助使用者部署NVIDIA NeMo框架

此外,今年2月,Google DeepMind推出了Gemma,這是一系列最先進的開放式模型。 NVIDIA與Google合作,近期為Gemma在所有NVIDIA AI平台上進行了最佳化,有助於降低客戶成本,並加快針對特定領域用例的創新工作。

兩家公司的團隊緊密合作,利用NVIDIA TensorRT-LLM這個用於最佳化大型語言模型推論的開源庫來加速Gemma在NVIDIA GPU上運行時的效能,Gemma採用與建立Google DeepMind迄今為止功能最強大的模型Gemini相同的研究和技術。

NVIDIA NIM微服務是NVIDIA AI Enterprise軟體平台的一部分,它與Google Kubernetes Engine(GKE)一起為開發AI驅動應用程式以及將最佳化的AI模型部署到生產環境提供了簡化路徑。NIM基於NVIDIA Triton推論伺服器和TensorRT-LLM等推論引擎構建,支援各種領先的AI模型,並提供無縫、可擴展的AI推論,以加速企業中的生成式AI部署。

包括Gemma 7B、RecurrentGemma和CodeGemma在內的Gemma系列模型可從NVIDIA API 目錄中獲得使用者可以透過瀏覽器進行試用,使用API端點進行原型開發,並使用NIM進行自主託管。

透過GKE和Google Cloud HPC工具套件,Google Cloud讓使用者可以更輕鬆地在其平台上部署NVIDIA NeMo框架,這使得開發人員能夠自動化和擴展生成式AI模型的訓練和服務,使他們能夠透過可客製化的藍圖快速部署完整的環境,加速開發流程。

NVIDIA最新GPU,將於明年初導入Google Cloud

為了進一步擴大NVIDIA加速的生成式AI運算的可用性,Google Cloud也宣布A3 Mega將於下個月全面上市。這些執行個體是其A3虛擬機器系列的擴展,由 NVIDIA H100 Tensor核心GPU驅動,新執行個體將使A3虛擬機器的GPU到GPU之間網路頻寬增加一倍。

NVIDIA表示,以NVIDIA Blackwell平台為基礎的NVIDIA最新GPU將於明年初導入Google Cloud,共有NVIDIA HGX B200和NVIDIA GB200 NVL72兩種版本,前者專為最嚴苛的AI、資料分析和高效能運算工作負載而設計,後者是專為下一前沿、大規模、兆級參數的模型訓練和即時推論而設計,也是一款多節點機架規模系統,將與Google Cloud第四代先進液冷系統結合。

NVIDIA上個月宣布,提供企業開發人員使用、針對生成式AI需求進行最佳化的AI平台NVIDIA DGX Cloud目前已可在由H100 GPU驅動的A3虛擬機器上使用;另外,搭載GB200 NVL72的DGX Cloud也將於2025年在Google Cloud上提供。

(本文由 MoneyDJ新聞 授權轉載;首圖來源:NVIDIA

延伸閱讀: