運用新電腦技術「深度學習」 科學家發現癌症、自閉症等疾病遺傳因子

作者 | 發布日期 2015 年 10 月 02 日 15:11 | 分類 尖端科技 , 醫療科技 follow us in feedly
cell

西元 2003 年,人類的 DNA 序列第一次完整的被研究學者排序且繪製成圖,造成當時一陣轟動。近十二年來,科學家以及醫生無不用盡心思,希望能夠從這些 DNA 序列中解答一個他們百思不得其解的問題──到底是什麼樣的基因突變會造成疾病的產生?而現在,來自加拿大的研究團隊運用了多倫多大學新研發的計算技術後,科學家對於這項問題的解答彷彿見到了一道曙光,從中發現了先前無法預測的疾病決定因素,例如自閉症、遺傳性疾病等。




若將 DNA 視為一個新的語言,那麼它就是一個極艱澀的語言,擁有 30 億個字母,不同的排列組合都會有不同的意思需要人類去解讀。而 Brendan Frey 教授領軍的團隊在探索人類活細胞是怎麼「讀取」DNA 後,排列了所有的基因突變可能性,藉此一解在基因上的各種變動可能會造成某些疾病產生。他並指出,先前的科學家急於想找出各種造成疾病的基因突變,卻沒有真正理性的想去了解「為什麼」基因突變會導致疾病的產生,這也是為什麼他們總是卡在特定階段無法再往前邁進的原因。

各個研究團隊已知將 DNA 轉換成蛋白質的「RNA 剪接(RNA splicing)」過程中,若有任何的混亂或是中斷就會造成疾病的產生,而 Frey 與其他科學家的差別就在於研究的採取對象不一樣。通常,其他科學家們只研究在最後轉譯為蛋白質的外顯子(exon)突變,卻沒有去注意到雖未被轉譯,但也決定蛋白質生成過程的內含子(intron)。Frey 的團隊採取與他人不同的方式,檢視並研究由內含子主導的剪接過程。

在這個研究過程中,Frey 使用了新的電腦技術「深度學習(deep learning)」,教導電腦在掃描 DNA 的一部份後,讀取它的基因指令,了解蛋白質是怎麼被拼貼而成,以及那些特定的蛋白質會被生產出來。「深度學習」能學會解讀極度複雜的生物和藥理關係,被視為這個世代以來最重要的發展。也正因為有了這項新技術的幫助,由來自不同領域的的高手所組成的 Frey 研究團隊才能夠順利的完成這項艱難的研究。

在教導了電腦「深度學習」後,研究團隊利用它去尋找在剪貼過程中出錯所產生的突變,他們發現,這樣的方法竟然準確預測高達 94% 的準確度,包括脊髓性肌肉萎縮症以及直腸癌等已經被研究透徹的疾病,更重要的是,深度學習還能夠準確預測從未被看過且了解過的突變,是在醫療層面上的一大突破。

小有所成,持續尋找相關基因資料

有了這樣的結果,Frey 的團隊還不肯罷休,他們決定著手調查棘手的「自閉症光譜(autism spectrum)」。在還未有調查結果前,已知的自閉症光譜基因突變只有少數的十幾個而已,在運用深度學習後,Frey 團隊發現了 39 個新的自閉症光譜的基因突變可能性。而這樣的案例只是其中一個而已,深度學習還能夠被運用在調查不同的疾病以及在個體之間非疾病的特徵等,爆炸性的調查結果也是指日可待的。

西班牙基因調控中心的 Juan Valcárcel Juárez 博士在得知這樣的研究結果後便欣然若接的表示,就算他們能全然操控這項基因語言,但一樣要了解隱含在內的語言文法,運用深度學習的電腦調查就像擁有了全新的語言翻譯機,提供了個人化藥物的重要訊息,成為未來病人在療程中不可或缺的幫助。

(首圖來源:Medical Press) 

發表迴響