德國團隊運用神經網路,讓電腦能以 30 倍人工速度進行逆合成分析

作者 | 發布日期 2018 年 04 月 20 日 7:00 | 分類 AI 人工智慧 , 材料 follow us in feedly

德國明斯特大學(University of Münster)研究團隊近期透過研究證實,結合 AI 神經網路與蒙地卡羅樹搜尋(MCTS)的搜索方式非常適用於化學合成的規劃,尤其是逆合成分析(retrosyntheses),更能以前所未見的效率進行。



對於非化工領域的人來說,逆合成分析可能聽來有些陌生,但這其實是有機合成中設計化合物生產的標準方法,透過對目標分子結構的分析與拆解、推導出基本的組成成分,進而完成化合物合成路線設計。

儘管這是有機合成路線設計的標準方法,但主要作者 Marwin Segler 表示,逆合成分析其實是有機化學的終極挑戰,化學家往往需要數年時間才有辦法掌握運用得很好。「這就像下棋,除了直觀的專業知識,你還需要很好的直覺與創造力去發揮。」

如果以烹飪來形容,就像從一道完成的菜推敲出材料與做法,然後在實驗室中實際從基本成分試著「煮」出相同的目標分子;雖然理論上很簡單,但在實踐的過程中總是會遇到許多困難,每一步都有許多選擇必須進行,而化學問題又比烹飪或下棋還複雜許多。

苯乙酸的逆合成分析
▲苯乙酸的逆合成分析範例。(Source:Wikimedia/Roland Mattern

運用電腦來計算合成的想法其實已經非常久遠,過去幾乎所有人都認為除非專家手工編程成千上萬條規則,否則電腦就無法進行計算合成──但過去的實際案例顯示,即使有規則協助的電腦也無法做到這些事。

這是因為化學合成過程非常複雜,無法單純用簡單的規則來理解,更別提合成反應的相關出版物數量每十年就增加一倍,無論化學家或是編寫程式者,都無法讓單純的電腦跟上腳步。

然而隨著深度學習與神經網路的出現,用電腦協助進行逆合成分析不再是空想,Segler 已證明即使只靠從現有資料和應用學習,機器仍可以學會進行分析,而不需人類編程規則的協助。

為了做到這一點,團隊先是運用過去發表的所有化學文獻(其中約有近 1,200 萬種化學反應)對機器進行深度學習訓練,然後將 DNN 神經網路與蒙地卡羅樹搜尋連結,以類似在棋類遊戲評估變體的方式,逆向分析尋找有機化學合成的最佳解。

與傳統的人工推導方式相比,這個全新方式的速度大約快了 30 倍,並且找到 2 倍以上的潛在合成途徑,在一項雙盲測試中,團隊發現化學家普遍認為這些電腦找出的合成路線,與現有經過實驗和測試的路線一樣好。

這項研究已發表在最新一期的《自然》(Nature)期刊。Segler 指出,團隊希望藉由這個全新的方式,節省去化學家在實驗室嘗試的時間,「如此一來,化學家能使用更少的資源,製造出協助提高人們生活水準的化合物。」

(首圖來源:shutterstock)