深度學習如何應用在醫學影像？

近來人工智慧、機器學習與深度學習等技術，在影像處理與語音處理上，已經展現出遠比傳統方法優秀的效能。而在各種公開教育訓練資源中，日常生活的影像辨識（例如辨識手寫數字、門牌號碼等），也已經成為學習這項領域技術的常見材料。

但是如何將深度學習技術使用到目前科技難以解決的問題，尤其是醫療上，幫助我們改善醫療品質與效果？在這個大方向上，世界各國的科學家與工程師持續積極地與臨床醫學從業人員合作中。

就在最近，位於美國麻省總醫院的科學家發表了一份使用深度學習來進行醫學影像重建的研究。這項研究的特色在於，在沒有給予明確物理模型的情況之下，電腦也可以經由大量的學習，將各種偵測器所收到的資料重建出影像來。

以電腦斷層為例，傳統方法是如何重建出橫斷人體的影像呢？在收到 X 光的資料後，我們必須有一個明確的物理模型，來描述偵測器收到的資料與影像之間的關係：我們所收到的 X 光訊號，會被任何位於從 X 光發射器到接受器的直線路徑上的物質阻礙而衰減。而各種物質的密度、大小與位置，都會改變信號的衰減程度。基於這個物理模型，加上電腦斷層系統的描述（例如 X 光發射器與接收器的位置），我們就可以利用數學工具「解出」人體的斷層影像。

上述的例子也可推廣到其他的種類的醫學影像上，像是核磁共振影像（magnetic resonance imaging，MRI）的影像重建，也需要知道人體各個部分是如何產生不同的核磁共振信號（信號的大小與隨時間衰減的快慢）。在結合 MRI 系統的成像參數後，我們才能建立一套明確的物理模型，將影像重建出來。

▲ 要先得知人體各個部分是如何產生不同的核磁共振信號，結合 MRI 系統的成像參數後，我們才能建立一套明確的物理模型並將影像重建。（Source：Flickr/Gerwin Sturm CC BY 2.0）

如此看來，要重建出各種不同的醫學影像，需要有各類醫學影像相關的物理模型描述，而更重要的是，各個物理模型在描述真實世界收到的資料會有所偏差。例如，完美的物理模型知識並沒有考慮到在收集資料時不可避免的雜訊影像。更甚者，我們對於醫學影像系統的描述常常都會有各種因為工程技術限制所產生誤差。而這些誤差在多半的情況下我們並不清楚他們的大小為何，所以也沒有辦法提供一個完美的物理模型來描述資料。

但這個限制可以藉由此研究所提出的方法加以克服。這群科學家利用深度學習的架構：包含前三層完全連結的神經網路,，以及後面三層比較小範圍的卷積神經網路，就可以重建出影像出來。這項技術其中一個有趣的地方在於，由信號偵測器資料到成像的過程當中，完全不需告知資料該如何轉變成影像，電腦就可以經由大量資料的學習自動找到這個轉變過程。例如在本研究的例子中，科學家嘗試重建核磁共振影像，但以往我們必須明確告知 MRI 的感測器資料與影像間存在傅立葉變換（Fourier transform）關係，才能完成影像重建。如今在新的架構下，傅立葉變換關係可以自動由資料學習而來。

採用這項技術進行影像重建的另一個好處在於：重建出的影像對於箇中誤差與雜訊的容忍度比過往的技術都來得高。此外，當我們觀察訓練好的神經網路，能發現神經網路在進行影像重建時，較後端神經網路的活化現象會以比較稀疏的方式來作用。這項稀疏特性也是由資料學習的過程自動習得，而不是外加強制發生的（例如使用壓縮感知技術 compressed sensing 就會強調稀疏性的重要，使得感測器到成像的轉換過程必然有稀疏性的存在）。稀疏性的神經網路活動在科學家的觀點中，也代表學習的成果能比較有效率地以少量資料來完成工作。

這項論文展示了由各種不同的核磁共振成像法取得的資料，都可以被同一個訓練好的神經網路重建出來。重建的影像也比傳統的方式來的精確（誤差更小）。即使核磁共振影像系統有所誤差，還是可以獲得比傳統方式更高品質的影像。

除了核磁共振影像之外，論文也展示了這個深度學習架構可以重建正子斷層掃描影像。再度說明在不需要明確描述物理模型的情況下，也可順利完成影像重建。在可預期的未來，此項技術將可望進一步應用在其他的醫學影像（例如低強度電腦斷層、光學同調影像等），幫助我們在高雜訊的狀況下獲得好的醫學影像，提供醫療人員進行更有效精準的診斷與治療。

（作者：林發暄博士，台灣大學醫學工程學研究所教授；首圖來源：shutterstock）