幫大腦省力!隱身在 Google 郵件、翻譯、照片背後的「機器學習」

作者 | 發布日期 2015 年 11 月 16 日 5:28 | 分類 Google , 尖端科技 follow us in feedly

電腦的視覺辨識如果比人好,那為什麼要由人開車,不是機器開車呢?電腦的視覺辨識如果比人好,看 X 光片診斷會不會比醫生更加準確?




上面兩個問題是 Alphabet 集團(前身為 Google)與董事會執行董事長 Eric Schmidt 大膽的提問。2015 Google 亞太區媒體活動以「The Magic in the Machine」(機器中的魔法)為主題,揭示 Google 在機器學習(Machine Learning)與深度學習(Deep Learning)領域近年來的成果。而就在這場活動的前一晚,Google 將其機器學習系統 TensorFlow 開源放上網路,供所有人在 Google 長年累積下來的基礎上發揮,Google 以此證明自己在機器學習領域的領先地位。

 

解析那些在 Google 翻譯、郵件、照片都會看到的「機器學習」

Google 機器學習技術近年來已愈趨成熟,很多產品都可以看到機器學習的技術在裡頭,像是在本月 5 日剛發表的 E-mail 智慧回覆(Smart Reply)功能,就是機器透過爬梳信件字句,判斷是邀請信/問候信等類別,然後做出適當的回應;垃圾信件阻擋功能也是透過機器學習,才能有現在近 99% 的高辨識率;今年 5 月發表的 Google Photo 產品則是會透過電腦視覺(Computer Vison)辨別圖片中的人臉、地標、動物、照相情境,自動為照片下標籤與分類,方便使用者日後隨時搜到想看的照片。

聽起來機器學習就像個魔法?Google 人工智能、計算神經科學及可量化機器學習研究員 Greg Corrado 講解何謂機器學習,他坦言機器沒辦法像人類般聰明,瞄一眼就能辨認,靈光一閃就能學習,機器要透過一次次統計學的假設與驗證,學習世界的運行模式,如果今天得到了資料 A(input),那依照這個模式,機器就會產出 B(output)。而一個模式,又稱為「Model」,要靠數學和程式組成的演算法呈現。

1106-google ML02

通常機器學習在應用時,不可能單單只靠一個模式就能得到正確結果,而是需要經過一層層模式逐步判定,這又屬機器學習之中的「深度學習」。Google Photo 搜尋和分析負責人 Chris Perry 即舉上述的 Google Photo 為例,深度學習為了辨識出一張照片裡的人物、地點、活動類型、照片類型,要經過 22 層的模式一層層判讀照片裡的訊息,包含顏色、線條、輪廓、形狀等。

1116-google ML

經過這樣複雜的步驟,Eric Schmidt 表示,Google Photo 是目前影響他最深的機器學習產品,Eric Schmidt 說,他上傳了 2 萬 5000 張照片,而 Google Photo 能幫他辨識所有的人,或是溜冰時拍的照片,動物的照片,甚至是自拍,他相信這項功能對每個人來說都是非常棒的。

 

延續「行動第一」主題,機器學習就是為了讓行動更方便

在電腦運算能力大幅提升的現代,機器處理 Big Data、快速運算已經不成問題,這也造就機器學習在今日能夠做出成果,甚至大幅被應用。上面提到的幾個機器學習應用只是冰山一角,Greg Corrado 提到,Google 在 2015 年第 3 季時,已經有超過 1200 個計畫是以機器學習為方向,在一年前,不到 500 個,在 2012 年初時甚至還沒開始呢。

Google 亞太區媒體活動過去多是彙整當年度的產品,系統性的與媒體分享,但過去兩年以應用產品為主題,如「雲端生活夢」、「行動第一」,今年卻反常以技術為主題。Greg Corrado 解釋,其實機器學習技術發展的關鍵因素,是為了讓行動端更好。

因為行動端需要更簡便的輸入功能、更貼心的輔助功能,才會需要機器學習技術協助行動裝置使用者,不然能夠坐在電腦前面打字,誰需要語音輸入,誰需要智慧信件回覆?因此機器學習其實是延續過去雲端、行動的主題發展而來的。目前網路科技發展成熟,Google 在機器學習領域也已經到成熟且能預見未來方向的領先階段,因此選在這時與全世界分享。

 

開源 TensorFlow 系統,加速機器學習發展

而就在 2015 Google 亞太區媒體活動開始的前一天,9 日 Google 宣布自家機器學習系統 TensorFlow 開源放上網路,供所有人在 Google 累積的基礎上使用。

開源後的 TensorFlow 就像是一個軟體圖書館,有許多 Google 以他們過去蒐集到的資料做出來的機器學習模式,未來不管是學生、工程師、業餘玩家,都可以依據 Google 已經訓練好的模式做出新的應用,過去這些人因為沒有足夠的數據以及資源,因此在驗證出一個正確的模型上可能會花很多時間甚至是失敗。

Greg Corrado 表示 Google 將 TensorFlow 開源的原因是希望建立一個更多人可以參與開發機器學習,或是聊關於它的應用,加速機器學習的發展。

 

機器學習像魔法般的技術不比大腦,也無法取代大腦,但它的確幫大腦省了許多麻煩與時間。而且大腦會累,機器不會累,大腦一時接收到資訊量很可能也不比機器多,有些事情如果機器做得更好更輕鬆,交給機器去做不也很好嗎?

 

(圖片來源:科技新報攝,首圖為Google 人工智能、計算神經科學及可量化機器學習研究員 Greg Corrado) 

發表迴響