當 AI 學會聞氣味,人類就可以少工作 70 年

作者 | 發布日期 2023 年 09 月 24 日 13:14 | 分類 AI 人工智慧 , 科技趣聞 line share follow us in feedly line share
當 AI 學會聞氣味,人類就可以少工作 70 年


不知道有多少人還記得 Google Nose

這個Google在2013年愚人節上線的搞怪計畫,聲稱有一個包含1,500萬種味道的氣味資料庫,用戶只需要在Google搜尋框輸入關鍵詞,點擊「聞一聞」,就能直接在電腦旁聞到該物體的味道,例如新車的味道、篝火的味道以及埃及古墓的味道(?)等。

(Source:Google

就是這個十年前離譜但腦洞大開的玩笑,正被它的發明者部分變成現實。

今年9月初的《科學》雜誌刊登了一篇由新創公司Osmo(從Google分拆)和莫奈爾化學感官中心(Monell Chemical Senses Center)等多個研究團隊共同發布的論文,其中稱, AI模型可以讓機器擁有比人類更好的「嗅覺」

乍聽之下這簡直太不可思議了,畢竟對大眾來說,嗅覺是比視覺和聽覺抽象得多的存在。RGB顏色圖譜可以描述人眼看到的色彩,人耳聽到的聲音也可以轉化為不同頻率的波長,甚至讓人感受到震動,但唯獨嗅覺,看不見摸不著,更難以用量化的指標描述。

換句話說,把氣味數位化聽起來就是件不可能的事。

而這篇論文的研究人員核心要做的,正是去試圖創造一個能夠如實反映氣味特徵的人類嗅覺高維圖譜,即POM(Principle Odor Map)。

具體是怎麼做的呢?

氣味是人類嗅覺系統對散布於空氣中的某些特定分子的感應。氣味分子進入鼻孔後,會與鼻腔上方的嗅覺細胞產生(受體)反應,產生的生物電波再經由神經傳到大腦,進而辨識味道。

而氣味的構成實際上要比色彩、聲音複雜得多,有數以百萬計的不同種類,每種氣味又都由數百個化學分子組成,其性質各不相同。與之相應地,人類的功能性嗅覺受體大約有400個,遠遠超過我們用於視覺的4個,以及用於味覺的約40個。

所以面對如此複雜的嗅覺機制,研究人員首先做的事情就是創建了一個機器學習模型──訊息傳遞神經網路(MPNN)。

▲ 模型示意圖。

這是一種特定的圖神經網路(GNN),因為圖神經網路是一種基於圖結構的深度學習方法,將傳統的圖分析引入,提供了對非規則資料提取特徵的方法,因而也非常適合用來學習複雜的氣味特徵。

模型搭好之後,接下來就要餵它學習材料。

研究人員結合Good Scents and Leffingwell & Associates(GS-LF)香精香料資料庫,建立了一個包含約5,000個分子的參考資料集做為訓練基礎素材,每個分子可以有多個氣味標籤,例如果味、花香、起司味和薄荷味等。

▲ GS-LF資料庫中的部分分子。

透過將分子的形狀結構做為數據輸入,模型得以輸出最能描述某種氣味的對應氣味詞。

為了讓訓練結果更準確,研究者也同樣使用各種方法來優化模型參數。例如將GS-LF香精香料資料庫依照8:2的比例分成訓練集和測試集,訓練集被進一步劃分為五個交叉驗證的子集;以及使用貝葉斯優化演算法對資料進行交叉驗證,並對GNN模型的超參數進行最佳化等。

實驗最終將形成如下的嗅覺高維圖譜POM(局部):

這張圖直觀表示了每種氣味的感知距離,例如花香(floral)、肉味(meaty)和酒香(ethereal)幾個大類彼此間是存在較大感知距離的;但每個大類下包括更具體的氣味,例如花香下的百合花香(muguet)、薰衣草香(lavender)和茉莉花香(jasmine),感知距離則較為接近。

論文將POM和先前有研究先例的基於摩根指紋的氣味空間圖(Morgan fingerprint-based maps)進行了對比,發現後者尚無法體現上述感知距離:

為了進一步驗證模型訓練效果,研究者接著找來15位氣味專家,來和模型比拚誰辨識氣味更準確。

15位專家每人需要聞400種氣味,研究者會給出55個氣味形容詞,讓他們就每種氣味對這55個選項用1-5分來評分,評定每個氣味形容詞在多大程度上適合於這個氣味。

結果發現,對於其中53%的測試分子,模型的表現都優於小組成員的平均值。

研究者也將模型的預測結果按氣味描述詞進行了分類,發現除麝香外,模型對分子氣味的預測結果均在人類組的誤差分布中,且在30個氣味描述詞的預測結果中優於人類組中位數:

後續,研究者也對模型的性能進行了反覆驗證,獲得了較穩定的分子結構─氣味關係。

下面就進入到最激動人心的氣味圖譜大規模繪製環節,並最終得到下面這張圖:

你可以把上文那個表示氣味感知距離的座標圖理解成是這張圖的無限放大版。論文提到,這張圖中包含了約50萬種氣味分子,當中甚至有許多還沒有被發現或合成出來(但確實能計算出來)。

做個更直觀的比較,如果讓訓練有素的人類評價員尋找這些氣味,大概需要連續工作70年才可以全部收集到。

看起來,這篇論文著實完成了一件大事。

這時就有網友發問了,機器為什麼要聞味道?

其他人紛紛提出自己的見解,例如認為可以用於工廠污水處理的品質控制,進行爆炸物、毒品或是屍體的嗅聞等;有人希望可以據此研發出一款好的除臭劑,因為人們在進行大量有氧運動例如跑步或舉重後會散發出不好的氣味;也有人對這項研究成果在醫療方面的應用很感興趣,例如可以用來開發嗅覺喪失症的新療法,或是透過氣味檢測疾病等;還有香水產業的從業人員覺得這幫了自己大忙,「讓它告訴我的同事什麼時候他們噴了太多古龍水」。

這些預測事實上都無道理。首先機器確實可以幫助人類解決有時對氣味辨別不準確的問題──研究表明,每個人對氣味的感知程度都各不相同,會根據感覺和生理信號引發不同反應,其中也受到經驗、期望、個性或情境因素的影響。

而氣味某些時候對人來說又十分重要。

不好的氣味就不用說了,某些有害氣體還可能會危害健康,這時如果可以有機器代替某些特定職業幫助人類或動物作業就再好不過。

而對另一些氣味可以為之帶來好處的職業,例如調香師、廚師、設計師、藝術家和建築師等,也有調配出更具功能性的氣味的需要。有些場合會將氣味應用在環境中,例如紐約Sloan-Kettering癌症中心會在空氣中散布香草油,以降低患者對於磁振造影(MRI)測試的幽閉恐懼症;芝加哥期貨交易所也會散布特定的香味以降低交易大廳的噪音分貝。

也有研究表明,人類大多數與氣味有關的記憶都來自嬰兒及幼兒時期的最初十年,而語言和視覺所產生的記憶通常在10-30歲之間產生。這部分解釋了氣味可以喚起人類遙遠的回憶,而且透過氣味所引起的回憶,經常比視覺或聽覺所引起的回憶,更有情緒傾向。

所以氣味和人類的連結還是非常緊密的,只是我們很多時候都不容易察覺。

網友們的猜想也在論文的作者之一、來自Osmo公司的Alex Wiltschko那裡得到了驗證。他在發布在Osmo官網的一篇文章中寫道,

「氣味圖譜是我們實現更遠大目標的基礎。如果可以開發出能夠複製我們鼻子或狗鼻子的功能系統,我們就可以盡早發現疾病;人工智慧也將幫助醫生找到更有可能在臨床上取得成功的藥物,更好地幫助合成化學家和調香師進行工作……我們未來的工作目標是,為改善人類健康和幸福奠定堅實的科學和商業基礎。」

不過他也表示,論文依然存在許多不足。

例如,無法體現分子氣味的濃淡,只能預測它聞起來是什麼樣子;只對單一分子氣味進行預測,現實生活中更多卻是混合氣味;而即便是所有的能力都達到了,對氣味的複製和還原也將是很大的挑戰等。

最後,說了這麼多,有一個網友的評論倒是很樸實,「我覺得這會讓品酒失去樂趣」。

(本文由 品玩 授權轉載;首圖來源:shutterstock)