沒人懷疑 Google 在 AI 技術上領先,但它還需要學習蘋果做產品的本領

作者 | 發布日期 2016 年 10 月 09 日 12:00 | 分類 Google , 人工智慧 , 社群 follow us in feedly

在幾天前舉行的發表會上,Google 一改以前的技術公司風格發表了 Pixel 手機、DayDream View VR 裝置、Google Home 等多款硬體設備。但發表會上,Google CEO Sundar Pichai 反覆提到的一個概念是 Google Assistant 智慧語音助手。和蘋果的 Siri  一樣,Google Assistant 已經嵌入了 Google 的幾乎每一款新發表硬體和軟體產品。




這種轉變的背景是 Google 面臨的競爭環境改變。Google,或者說它的母公司 Alphabet 目前是世界上市值第二高的公司,同時它也是搜尋、線上廣告、行動裝置等諸多領域的領頭羊。但 2015 年剛上任 Google CEO 的 Sundar Pichai 面臨的問題卻是,這家公司雖然在技術上遙遙領先於其他大公司,但當需要把技術應用到產品中時,Google 卻拿不出類似於蘋果和亞馬遜那樣的成績。

在桌面時代靠搜尋引擎起家的 Google 在行動網路成為主流之前,靠 Android 系統成功地完成了一次轉型,這讓 Google 成為了一家「行動優先」的公司。但現在的情況卻是,網路不僅是從桌面轉移到行動裝置上,而是轉移到多種螢幕上,甚至是沒有螢幕的裝置都開始接入網路。對這個趨勢反應最靈敏的是亞馬遜,這家公司在 2014 年推出了沒有螢幕的智慧語音音箱 Echo。當時很多人都認為 Amazon Echo 只是一個「雞肋」產品,因為看起來它的應用範圍實在是太小了。但現在,Echo 和它背後的智慧語音系統 Alexa 已經成了大公司們爭相模仿的對象,因為 Alexa 成為了很多家庭的智慧家居的控制者。

於亞馬遜相比,Google 早就在語音辨識、自然語言處理和機器學習等技術領域取得領先地位。但 Google 唯一沒有做的就是像亞馬遜那樣早早地就把這些技術做成產品,讓它們去佔領消費者的家庭。

或許是已經準備充分,或許是看到了對手們咄咄逼人的攻勢,Google 現在決定利用自己的優勢,並將其利用在產品上,包括軟體和硬體。而這個優勢就是人工智慧。

在今年 4 月發表的 Google 公司內部信裡,Pichai 說 Google 將由一家「行動優先」(mobile-first)的公司轉變為一家「人工智慧優先」(AI-first)的公司。「我們正在有意地把它應用於我們所有的產品,無論是搜尋、廣告、YouTube 還是 Google Play。我們還處於早期階段,但你將會看到我們在所有這些領域以系統性的方式運用機器學習。」Pichai 在 2015 年的一次電話會議上這樣說。

pingwest配圖
▲ Sundar Pichai。

和 10 年前的 mobile-first 一樣,Google 在人工智慧領域的殺手鐧也是開源,這一次 Google 開源的同樣是和 Android 地位相當的機器學習平台 TensorFlow。TensorFlow 的魅力在於,它不僅在建立和訓練神經網路的速度上比以前快了 5 倍,還可以支持行動裝置、桌面、CPU、GPU 和服務器等多種平台。

開源的 TensorFlow 提供為開發者提供了完整的開發指南和文字檔案,以及豐富的 API 接口,目前已經有五十多款 Google 產品正在使用這個系統。

最先受惠於機器學習系統的 Google 產品是 Gmail,該系統已經讓 Gmail 的垃圾郵件辨識準確率達到 99%。因為辨識垃圾郵件本身就是一個典型的機器學習應用場景──分析越多垃圾郵件時,這些數據就會越來越增加機器學習系統的辨識準確率,這是一個循環漸進的過程。

但現在 TensorFlow 在電子郵箱裡能做的已經遠不只辨識垃圾郵件了。在 Google 推出的面向企業用戶的 Inbox 郵箱裡,郵件會被自動歸類為重要、行程、財務、社交等標籤,而完成這一歸類的就是 TensorFlow 的機器學習系統。這和辨識垃圾郵件的原理一樣,正確歸類越多郵件,系統的歸類準確率就越高,而 Gmail 和 Inbox 的用戶已經超過了 10 億,這給系統帶來了海量的數據。

Inbox 還有一個「智慧回覆」的功能,它能讓系統閱讀你的郵件,並為你自動判斷可能會回覆的內容,你可以選擇回覆直接發送給對方。這個系統本質上是一個遞歸神經網絡,它能將你做出的選擇傳遞回服務器,當然沒有人能夠閱讀到這些內容。利用這些數據,系統就會慢慢「學會」如何更加智能地回覆郵件。

pingwest配圖

這一切都發生在 Google 總部園區的一座不起眼的兩層小樓裡,在這裡一個名為「Google Brain」(Google 大腦)的團隊,正在竭盡全力將 Google 在人工智慧技術上的積累轉化為可用的產品。

這個團隊成立於 2012 年,當時它的主要目標是進行一個深度學習和神經網路的研究實驗。現在這個實驗已經完成,但這個團隊保留了下來,並在 TensorFlow 創始人 Jeff Dean 的領導下在多個領域改善了 Google 產品的用戶體驗。

Jeff Dean 曾透露,Google 目前已經有 100 個產品團隊正在使用機器學習技術,其中包括搜尋、Google Photos、Google Adwords 等。當然,其中最重要的就是這一次 Google 發表會的主角 Google Assistant 智慧語音助手。Dean 說它旨在「開啟一個更自然、更智慧的人機交互模式,基於日常語言的使用。」

現在 Google Assistant 已經出現在了 Google 的多款硬體設備和軟體產品中,並且很有可能被開放給第三方開發者,這讓 Google 在語音助手領域可以與亞馬遜的 Alexa、蘋果的 Siri 和微軟的 Cortana 展開正面競爭了。

我們從 Google 發表的新產品中就可以看到 Google 的這個野心。例如 Google Pixel 手機的最大賣點就是搭載了 Google Assistant,它不僅讓 Pixel 手機能像 Siri 一樣的智慧語音回覆和任務處理,還在翻譯、圖像辨識上較以前的版本有極大的提升。而智慧音箱 Google Home 則幾乎是將 Google Assistant 變成了一個實體設備,你可以讓它播放音樂、查詢天氣和安排日程。

pingwest配圖

在軟體上,Google 著重推出的聊天應用程式 Allo 同樣內建了 Google Assistant,這讓 Allo 具備智慧回覆、圖像辨識等功能。雖然 Google 的 Gmail 和 Inbox 擁有 10 億用戶,但電子郵箱對於年輕人來說實在是太古老了,因此 Allo 也成為了 Google 實現社群夢想的新一次嘗試。

但 Allo 的智慧回覆功能使用的機器學習技術,需要將用戶發送的訊息發送回 Google 的服務器上進行演算法分析,並且 Google 會將這些訊息儲存一段時間。這一點遭到了愛德華·史諾登的猛烈批評,他認為 Google 儲存這些訊息會導致用戶隱私洩露。

在做社交產品時,蘋果也遇到了類似的隱私問題,但蘋果的做法更加尊重用戶隱私,那就是採取端對端的信息傳輸和差分隱私技術(Differential Privacy)。這項技術會將用戶的數據切割成數個片段,並加入數學噪音隱藏用戶的個人訊息,然後這些加密的數據就會被上傳到蘋果的服務器上,用來訓練神經網路。這也能在用戶在使用一些本地知識庫中不存在的新詞彙時,讓系統更快地理解其意思,從而很好地提升了人機交互的體驗。

能夠如此完美地兼顧機器學習對數據的需求和用戶隱私,是因為蘋果多年來在實際產品中得到的經驗。雖然不能說 Google 有多麼不尊重用戶隱私,但史諾登的批評也不是沒有道理的。或許是 Google 內部的工程師佔據了主導地位,而忽視了用戶對隱私的擔憂,但在急於將人工智慧推向用戶的過程中,Google 還需要向它的同行們學習很多。

(本文由 PingWest 授權轉載;首圖來源:shutterstock) 

關鍵字: , , , , ,

發表迴響