2D 照片秒變 3D!蘋果 SHARP 模型開源,效能跑贏消費級硬體

作者 | 發布日期 2025 年 12 月 18 日 11:30 | 分類 Apple , 數位內容 , 軟體、系統 line share Linkedin share follow us in feedly line share
Loading...
2D 照片秒變 3D!蘋果 SHARP 模型開源,效能跑贏消費級硬體

蘋果公司近日推出一款名為 SHARP 的開源模型,該模型能夠在不到一秒的時間內,將單張 2D 照片轉換為逼真的 3D 場景,可說是蘋果在 3D 視覺技術領域的又一重大進展。

SHARP的全名為「單目視圖合成」,其核心功能是從單張2D圖像中重建出可導航的3D場景,這使其非常適合用於增強現實(AR)和虛擬現實(VR)等即時應用。根據蘋果的研究,該模型在標準GPU上運行時,能夠在不到一秒的時間內完成處理,效率在消費級硬體上也能輕鬆實現,無需專業設備。

蘋果的研究團隊在其發表的論文《在不到一秒的時間內進行單目視圖合成》中,詳細介紹了SHARP的訓練過程。該模型透過單次前向傳遞神經網路,回歸出3D高斯表示的參數,並能夠即時渲染出高解析度的3D圖像。SHARP的3D高斯表示是度量的,支援絕對比例,這使得相機的運動更加真實。

儘管SHARP在重建附近視角的能力上表現出色,但它並不支援合成完全未見的場景部分,這意味著用戶在使用時需要保持在拍攝照片的視角附近。該設計使得SHARP能夠在保持速度的同時,生成更為可信的結果。

蘋果還將SHARP模型上傳至GitHub,鼓勵開發者進行測試和貢獻,並分享他們的成果。許多用戶已經在社群媒體上展示了他們使用SHARP生成的3D圖像,顯示出該模型的強大潛力。

此技術推出後,不僅為創意和專業領域提供了即時3D建模的解決方案,還可能影響從行動應用到好萊塢預拍攝等多個領域,進一步鞏固蘋果在高效3D人工智慧技術中的領導地位。

(首圖來源:shutterstock)

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》