Google 最新成果:利用神經網路讓糖尿病患者擺脫失明

作者 | 發布日期 2017 年 05 月 19 日 8:00 | 分類 AI 人工智慧 , 醫療科技 follow us in feedly

根據維基百科,截至 2014 年,全球共有超過 4.2 億人患有糖尿病,這個數字在近年來有所減少,但形勢仍不容樂觀。而糖尿病的併發症之一,糖尿病性視網膜病變(Diabetic Retinopathy)正在侵蝕慢性糖尿病患者。醫學人士發現,對於一般患者,患病 10 年以上會開始出現病變,導致失明。10 年後聽起來還很遠,但情況其實比想像的更緊急,因為對那些血糖控制差,或是胰島素依賴型糖尿病患者來說,他們有可能更早出現眼睛病變,失明的風險比其他人甚至是其他糖尿病患者都更高。



問題在南亞國家尤為嚴重。截至 2015 年,印度有超過 7,000 萬名糖尿病患者,由於生活習慣、遺傳因素、缺少醫生和足夠的醫療資源等社會原因,接下來 20 年的情況很讓人擔憂,到 2040 年南亞國家糖尿病患數字將會增長到 1.4 億。但擺在印度公共衛生部門面前的直接問題更棘手:根據官方統計,由於全國大約有 12 萬名眼科醫師缺口,糖尿病和糖尿病性視網膜病變患者無醫可找,大約 45% 的患者在確診前已失去部分或全部視力。

莉莉·彭(Lily Peng)是 Google 旗下科研機構 Google Research 的一名研究員。在 Google 年度開發者大會 I/O 2017 召開前夜,向我們介紹了一個科研計畫:用機器學習技術來提早發現糖尿病性視網膜病變,進行及時甚至是預防性治療,進而讓那些可能將在 3 年、5 年甚至 10 年後失去視力的人,獲得寶貴的提前治療機會。

「我們的任務:使用深度學習技術訓練一個演算法,能夠從病人的視網膜眼底照片中自動診斷出潛在的病變情況。」她介紹道。任務邏輯聽起來很簡單,但實際上並非如此,因為訓練這個演算法的過程才是關鍵。為了提供高品質的訓練素材,科研人員找來了 54 名美國食品藥品監督管理局(FDA)資質認證的眼科醫師和專業人士,從 2015 年 5 月到 12 月期間對總共 128,175 張視網膜眼底照片素材進行標記和評級,最終標記出超過 88 萬個確診症狀。

接下來,神經網路技術就該派上用場了。莉莉‧彭的團隊搭建了一個 26 層的深度卷積神經網路(Convolutional Neural Network),然後用標記好的素材進行訓練。

這種神經網路結構較為特殊,它的特性是對於二維結構的數據──也就是圖片──有較好性能,因此經常用於機器學習大量圖片。

2016 年 1 月和 2 月,Google Research 分別找來兩個不同眼科專業的視網膜眼底照片庫,讓演算法和眼科醫師一較高下。這次嘗試的結果是顯著的:演算法在發現症狀的敏感度(98.8)和判斷症狀的準確性(99.3)上,都比人的得分要高(在統計學上這個得分叫做 F-score,眼科醫生的分數是 0.91,而演算法拿到 0.95)。

同年,這份研究報告發表在美國醫學會的專業期刊《JAMA》上,獲得醫學界大量好評。哈佛醫學院的安德魯‧比姆和艾薩克‧柯漢表示,「這一研究展示了醫學新世界的樣子」。

將電腦科學和醫學進行結合,竟然達成意想不到的效果。

當然,這已經不是電腦科學第一次跟醫學產生有價值的交集,甚至醫學界已經對「機器學習」這一術語不陌生。事實上在過去幾十年間,醫學科研人員一直採用機器學習這種更為先進的技術,嘗試攻克只有大計算量才可以解決的醫學難題。但隨著近幾年來計算性能的飛躍式突破,機器學習的子集「深度學習」技術開始流行──毫無疑問,後者將成為醫學科研工作者手中的最新利器。

身兼生物醫學、醫學雙料博士的莉莉‧彭,還對深度學習頗有了解,這種跨學科的才能讓她格外受矚目,但她又怎樣看待醫學和電腦之間的關係?「其實不是所有的醫學難題都要機器學習來解決,比如洗手這件事……更重要的任務是幫助我的團隊找到那些機器學習可解的難題,幫助他們理解我們的訓練數據。」

▲ 莉莉‧彭講解她的計畫。

她認為,機器學習是醫學一個很好的輔助工具──用來輔助醫生診斷,而不是決定診斷。也正因此,Google Research 團隊對該技術的推進比較謹慎,莉莉‧彭一再強調,這項研究只是為了證明透過機器學習的路徑來解決問題,成效顯著且可預期。然而這個電腦診斷的過程,還沒有達到絕對科學可靠的程度。說到底,他們只是知道電腦能做出準確的診斷,並不完全明白它為什麼能做出準確的診斷。

其實問題又回到了深度學習技術的一個核心辯題:無論辨識圖像、聽懂語音,神經網路技術總能輸出一些很不錯的結果,但還是沒人解釋得清,它到底是怎樣做到的。一些深度學習專家曾對我說,神經網路的節點和層級,模擬的是人腦神經元(neuron)之間互相連接以及層級式(hierarchy)的思考模式,但另一些腦科學家卻指出,就連他們都沒完全搞清楚人腦到底怎樣思考。因此你可以說,現在的電腦神經網路結構與其說模擬人腦,其實更像依樣畫葫蘆。

似乎這個問題可以爭論下去無休無止,但爭論可能更多發生在學界內部。好在,Google 已經可以確認用這種技術來診斷糖尿病性視網膜病變是有效的。接下來,Google Research 要和 Nikon 等眼科儀器、醫療服務機構合作推廣這項技術。更進一步,他們希望能為這項技術取得 FDA 及印度方面權威機構的認證,讓全世界視力被糖尿病威脅的人能夠盡早診斷、盡早治療。

她們發現,其實診斷晚的這個情況,不僅在印度,在美國甚至全世界都是個問題,儘管原因不盡相同。

「在美國,很多情況是人們提供自己的資料(註:眼底掃描)給醫療機構等待檢查。但時間長了,人們搬家了、換電話了,當醫療機構診斷出病症時,病人卻失聯了。」莉莉‧彭說,而機器學習檢查的最大優勢在於可以當場得知結果。研究團隊也在進行嘗試,設立網站讓用戶提交自己的眼睛掃描照片進行分析──儘管這不是專業診斷,但仍足以提前 5 年甚至 10 年,拯救現在的普通人,未來的失明者。

前面提到,莉莉‧彭的分享會發生在 I/O 2017 的前一天。在一整天的圓桌討論議程中,我不只一次聽到 Google 科研人員做出「我們的重心不是那些未來 50 甚至 100 年的新技術,但 10 年是一個很值得抓住的節點」或類似的表述。

的確,我們暫時無法解釋神經網路到底是為什麼這麼厲害,但我們還是可以、應該用它來做一些很好的、10 年內可以幫到我們的事情。尖端科技其實都是如此,核心原理搞沒搞清楚,並不妨礙我們利用它改善生活。就好比我們的祖先不知道哪天突然發現鑽木或撞擊石頭可以取火,當時他們沒能研究明白火到底是什麼,但人類還是從茹毛飲血的時代向農耕文明邁出了重要一步。

(本文由 PingWest 授權轉載;首圖來源:pixabay)