Figure 02 號稱「地表最強 AI 硬體」,能對話學習、無間斷工作 20 小時

作者 | 發布日期 2024 年 08 月 08 日 8:10 | 分類 機器人 , 科技趣聞 line share Linkedin share follow us in feedly line share
Loading...
Figure 02 號稱「地表最強 AI 硬體」,能對話學習、無間斷工作 20 小時

3 月 GPT-4 上身,像科幻片會看聽說的機器人 Figure 01 又出來占據矽谷話題榜了,五天前官方 X 帳號預告了下代人形機器人 Figure 02。

7日充滿未來感的demo如期而至:

Figure 02外觀煥然一新:從上版閃銀色鉻金屬皮膚換成炫酷啞光黑,曲線也更流暢,背景不再是實驗室,轉到南卡羅來納州斯帕坦堡的BMW產線。Figure 02有靈巧的手指和身體關節,在工廠裡走來走去,以神經網路學習拿取和裝配汽車零件。

Figure AI稱,此次工程和設計團隊從頭設計硬體和軟體,人工智慧、計算機視覺、電池、電子設備、感測器和執行器等關鍵技術都有重大突破。

主要特徵有:

  • 語音對話:機載麥克風和揚聲器連接到客製AI模型,能與人類對話。
  • 鏡頭:AI驅動視覺系統由六個機載RGB鏡頭支援。
  • 手部:第四代手部有16個自由度,與人類力量相當。
  • 機載視覺語言模型(VLM):使機器人鏡頭快速進行常識性視覺推理。
  • 機載電池:機器人身體裡有2.25千瓦時客製電池組,提供超過50%能量。
  • CPU / GPU:與上代相比,機載計算和AI推理能力提升三倍。

CEO兼創辦人Brett Adcock表示,Figure 02概念設計評審是年2月歷時18個月完成,自豪是「地球最先進AI硬體」。

並高調回應馬斯克2月底宣戰:

他也透露部分主要技術:

首先是語音對話推理。Figure 02延續上代,用麥克風和揚聲器與人類語音對話,基於OpenAI合作訓練的客製AI模型,能理解處理並回應人類語音輸入。機器人以語音為預設操作介面,代表使用者可像與人交談自然與Figure 02互動,無需傳統按鈕或螢幕介面。

得益於機載視覺語言模型(VLM),Figure 02能經鏡頭「看懂」周圍環境,快速語義理解和常識性視覺推理,並智慧判斷。如物體辨識、場景理解,甚至洞悉人類行為意圖,增強機器人複雜現實世界的適應和互動能力。

Figure 02機載CPU / GPU計算和AI推理能力是上代三倍,能完全自動執行現實世界AI任務,無需靠外部資源。

除軟體外,Figure 02底層硬體也有大升級。

Figure 02採自研2.25千瓦時電池組,比Figure 01多超過50%能量,大大提升續航力,可每天工作長達20小時,接近全天候運行。

創新整合佈線系統看似簡單,其實非常複雜,不僅減少線路故障風險,隱藏式更美觀安全,緊湊佈局也最佳化機器人內部空間。還開發客製線纜埠和連接器,提升Figure 02可靠性。

六個分佈頭部、前軀幹和後軀幹的RGB鏡頭,以及AI驅動的視覺系統,賦予Figure 02超越人類的視覺。全方位鏡頭達成360度環境感測、精確深度感測和細節辨識。結合先進AI演算法,使Figure 02快速理解眼前複雜視覺資訊,做出相應判斷。

為了提升剛性強度並防止撞擊負荷,Figure 02有類似飛機的外骨骼結構:即外殼不僅保護內部元件,還能支撐結構。與傳統框架相比,外骨骼更有效利用材料,不犧牲強度下減輕重量,提高能源效率和移動性能。

一大亮點是Figure 02的第四代機器手,完全仿照人手尺寸和功能,16個自由度和與人類相當的力量,Brett Adcock稱涵蓋機械、電氣、控制和感測器各方面,展現高度靈活性和強度,使手部執行夠廣泛人類任務。

Figure控制總監Michael Rose和硬體總監Vadim Chernyak介紹,Figure 02零件高達幾千個,為了方便製造,腿部和電池等都可更換。Figure 02預告還透露扭矩等級高達150牛頓米(Nm),使機器人能搬運重量級物體。Figure 02運動範圍(ROM)達195度,堪稱重大突破。

儘管外界一直傳言,Figure AI拿到OpenAI、微軟、輝達6.75億美元B輪融資後就進入難產期,但終究還是把第二代機器人做出來了。

輝達高階研究員Jim Fan說:「恭喜 Brett!製作高自由度靈巧手的決定絕對是正確的。」

網友Lorenz S說:「這竟然是最差的一次。想像Figure公司15年後的樣子。」

Brett Adcock回:「這確實是件神奇的事,每天都變得更好。我們沒有哪星期不進步,18個月內會看到更多激進改善,因越來越多轉向軟體。」

有人提問Figure 02重量和行走速度,Brett回答雖然外骨骼減輕重量,但另一端增加電池、鏡頭、CPU / GPU,因此淨重達70公斤。

速度則未回應,大概是因為看起來就很慢。

這也成了網友開玩笑的點。

一切都很酷,直到它開始走路。

是啊,就像拜登02。

眼尖網友還注意到機器人胯下有傷痕。

不買帳網友認為Figure 02影片抄襲消費電子產品風格,不是機器人實際工作樣貌,換句話說,有錢公司推出fancy demo這件事,很多人逐漸麻木。

我沒有看到你說的重大功能:它沒有顯示能聽到命令,沒有隨機與人交談,沒有展示推理能力,也沒有在工廠實際工作。你什麼時候展現真實的測試影片?

現在AI公司的常見現象,展示影片過度承諾以吸引投資者,實際情形非常差。這家公司有什麼不同嗎?

也有人認為工業製造業使用人形機器人不是最優解。

工廠啟用此技術是巨大浪費,這些工作都能用機械手臂完成,應將Figure 02放到商店上架、幫老年人做飯、打掃家裡等。

Figure AI幾個月前開始與BMW合作,汽車產線訓練和收集數據,每秒200次畫素採樣至動作神經網路學習,以證明工業級環境的應用潛力。加上整合OpenAI最先進大模型,超強語音對話和視覺推理能力成為大賣點。

Brett表示,目標是五年內將自動雙足機器人推向市場。

當然,Figure AI並非通用人形機器人賽道的唯一參賽者。去年底,亞馬遜和Playground Global投資Agility,用生成式AI改善人機通訊,雙足機器人Digit根據自然語言指令,成功執行「把達斯·維達光劍顏色的箱子移動到最高塔」。

馬斯克Grok AI和Optimus專案也快速發展,說Grok藉助X、特斯拉和Optimus機器人的數據,成為世界最領先AI系統。Optimus機器人也在特斯拉工廠工作,2026年對外銷售。馬斯克設想,將有百億台Optimus機器人與Grok AI互相訓練,提升整體實力。

此外1X、波士頓動力、輝達、Google都在開發智慧機器人專案。

科技巨頭和創業公司瘋狂湧入,頻繁更新投資紀錄。無論追逐生成式AI還是不想錯過下次大浪,抑或對解放生產力和探尋人機互動邊界的渴望,人形機器人無疑是科技重要方向。但各種影片看似高靈活和智慧背後,成本效益和複雜性、真實物理環境的實際表現、商業化產品週期都是未知數。

這讓Figure 02亮相,說是向消費者展示技術,更像做給同行看,特別是給投資人一個交代。又或像Brett Adcock所說,完成硬體創新後,18個月後有越來越多軟體升級,就有更多激進突破。我們拭目以待吧。

(本文由 品玩 授權轉載;首圖來源:Figure

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》