在雨夜試車後,矽谷自動駕駛公司 Drive.ai 將開始商業試營運

作者 | 發布日期 2017 年 03 月 29 日 15:10 | 分類 AI 人工智慧 , 汽車科技 , 自駕車 follow us in feedly

今年 2 月,長期隱身的自動駕駛汽車技術研發公司 Drive.ai 悄然上線,發表了一段長約 4 分鐘的影片。影片中,一輛測試汽車在雨夜中穿行美國加州山景城(Mountain View)的街道,全程駕駛員的雙手都沒有碰到方向盤,沒有任何干預動作。



我們找到 Drive.ai 的聯合創始人王弢,和他聊了聊 Drive.ai 背後的設計理念和核心技術。

Drive.ai 想為商業車隊提供包括感測器組合、控制系統和車內外互動介面在內的後裝套件,達到特定路線(如外賣、計程車等)的 L4 級別自動駕駛(即在任何情況下都不需要人工干預)。

感知方面,Drive.ai 後裝套件中的感應器包括多個鏡頭、雷達和雷射雷達,這樣的組合可以在某一感測器出現錯誤或故障的情況下提供支援,譬如鏡頭和雷達可以在雨雪霧等極端天氣中,為精準性下降的雷射雷達提供環境感知。值得一提的是,大部分自動駕駛技術提供商採用高精確度地圖來彌補感測器缺陷、為自動駕駛提供資料支援路線規畫,而 Drive.ai 則想避免使用維護和營運成本很高,且臨時變數不可控的高精確度地圖,目前使用的是自己收集資料生成、不包含 3D 空間內物體資訊的 2D 地圖,未來會和第三方地圖供應商合作。

決策方面,不同於一些起步較早、技術路線基於傳統機器人學習的自動駕駛技術提供商,Drive.ai 使用的是基於非規則學習的深度學習網路模型,這有 3 項優勢。其一,場景泛化。規則學習雖然可以快速建立起應對八、九成場景的決策系統,面對新的和罕見情況卻很難可靠應對;非規則學習的泛化能力,讓它更即時理解資料並解決此類長尾問題。其二,複雜決策。大量算例支援下的非規則學習,有複雜決策方面的優勢,這已在 AlphaGo 等深度學習程式中體現。未來會有很長一段時間,路上會有自動駕駛車輛和人工駕駛車輛共存,而自動駕駛所需的複雜決策(是否超車、變換車道等)與圍棋相似──觀察對方的動作,進行自己下一步動作,合理獲得路權。其三,硬體需求。自動駕駛過程中,感測器每小時會採集幾十 GB 的資料流,儲存和計算都是很大的挑戰。利用非規則學習而非現成的知識程式庫進行決策,對計算晶片的效能要求相對較低,在計算能力相當於個人電腦的車載裝置上,即可完成核心資料處理。

非規則學習的核心、也是進展困難,是大量標注的資料,以及大量的實驗試錯。Drive.ai 的資料源包括採集車收集的真實資料,和模擬器生成的各種場景(包含極端情況)的模擬資料。對這些場景中出現的物體(如車輛、行人、自行車等)進行標註,是個技術瓶頸──每小時車程收集的資料需要 800 個小時的人工標註,而王弢告訴 36Kr,Drive.ai 利用自己的標註系統進行半自動辨識和標註,比其他公司快 20 倍,能在短時間內擷取到更多有用的資料。在實驗方面,Drive.ai 的團隊同樣有較多積累。譬如在使用大規模顯卡(CPU+GPU)集群進行大規模神經網路訓練方面,Drive.ai 就擁有市面上最快的大規模並列計算軟硬體基礎架搆。之前 Google 曾使用千餘台機器完成當時世界最大的深度學習神經網路,Drive.ai 彼時在史丹佛的團隊用 16 台機器、十分之一的成本就可重建。

非規則學習的問題在於演算法不可解釋:「端到端」的訓練中,策略規畫有不透通的區域,原理和機制並不明確。針對這個問題,Drive.ai 採用當下學界主流的生成式對抗網路(GANs),將完整的端到端系統拆分開來,在涵蓋大多數場景的標準化測試機上,對決策機制的不同部分進行驗證和測試。

在達到自動駕駛功能之外,Drive.ai 認為自動駕駛車輛與其他通勤者的溝通同樣重要,因此設計了包括 LED 顯示螢幕和音響系統,向行人和自行車示意自己的行為。這些人車互動(human-robot interaction,HRI)部分的設計還在持續開發中。

▲ Drive.ai 在車頂裝載了一個 LED 察看螢幕,用於向行人和其他駕駛者傳遞文字資訊和 emoji 表情。

已經獲得美國加州無人駕駛路測執照的 Drive.ai,現處於路測階段。雖然 demo 中表現很好,但從樣車測試到產品落地還有一段路要走。落地中常見的成本過高和場景拓展性低等問題,Drive.ai 應該能較好應對──Drive.ai 的套件在成本上控制嚴格,感測器以低價鏡頭和雷達為主,高價的雷射雷達使用較少,並規避了運維成本高的高精確地圖;此外,非規則學習演算法也提升了 L4 技術可運用場景的可拓展性。

公司還未正式進入商業化營運,但今年會進行和一些第三方運輸服務提供商的試營運(約數十至百輛車),在固定路線上進行 L4 級別的自動駕駛,期間會進行人為監督。這些預設行駛路線上的乘客和貨物的運輸,將初步證明其技術的可靠性。同時,Drive.ai 也向一些車廠提供 L2~L3 級別的技術,達到初步商業化。目前暫時不方便透露更多合作對象的資訊。

▲ Drive.ai 團隊。

麥肯錫和彭博新能源經濟資訊聯合發布報告稱,2030 年進階別自動駕駛汽車(L3 和 L4)將達到整體銷量的 50%,其中 L4 級別的市場規模達到 5,500 萬輛至 6,000 萬輛。鑑於自動駕駛的發展方向將是 toB 主導──營運商統一管理自動駕駛汽車,提供去人力化的端到端運輸解決方案──這五千多萬輛車,就是面向商用車隊的 Drive.ai 的下游市場。

這個市場上選手雲集,想要向商用車和乘用車提供 L4 級別自動駕駛技術 Drive.ai 的競爭對手,既有擁有造車經驗的傳統整車廠,又有財力人力和技術皆儲備雄厚的科技巨頭,還有其他初創公司。這 5,500 至 6,000 萬輛車中,去掉 Google、特斯拉、百度、沃爾沃、BMW 等自主研發的車,剩餘的有多少會搭載 Drive.ai 的解決方案,取決於 Drive.ai 能否比通用收購的 Cruise Automation、福特收購的 Argo AI、專注出租車的 nuTonomy、專注物流商用車的 Otto 和圖森等自動駕駛技術提供商,更早推出低成本且安全可靠的整體解決方案。

公司共有大約 50 名員工,其中以技術人員為主。Drive.ai 的核心團隊來自史丹佛大學人工智慧實驗室,對自然語言處理、電腦視覺和自動駕駛等領域的深度學習有豐富經驗。董事會還包括通用汽車前高層 Steve Girsky。

Drive.ai 近期計劃開始新一輪融資,暫不方便透露融資額,預計在數億人民幣,主要用於技術開發和車隊拓展。去年 5 月,公司獲得來自 Northern Light Venture Capital、Oriza Ventures 和 InnoSpring Seed Fund 的 1,200 萬美元投資。

(本文由 36Kr 授權轉載;首圖來源:Drive.ai

延伸閱讀: