為了體驗如今人工智慧的自然語言處理有多強大,Google 近日發表了語義體驗網站「Semantic Experience」,其中有一個全新的書籍搜尋引擎「Talk to Books」,以及兩個基於機器學習的單詞關聯遊戲。
相比平常我們搜尋一本書,主要是透過書名、作者等關鍵詞檢索,Talk to Books 裡,我們可以像平常講話輸入一句話,隨後搜尋引擎就會解讀和預判這句話,給予搜尋結果。
也就是說,你可以用「聊天」方式找到你想看的書。
試著在搜尋框輸入一個問題:
What is the best programming language?(什麼是最好的程式語言?)
排在第一位的搜尋結果,是一本用 C 語言寫程式的書《C Programming for Arduino 》,作者是 Julien Bayle。這本書有一句話,搜尋結果裡有加粗:
There is no scientific or universal way to define what is the absolute best style of programming. (目前沒有一個科學或廣義方式定義什麼是絕對完美的程式。)
在搜尋結果中,能回答這個問題的句子或段落加粗顯示,下方還有作者及書籍訊息。我們用聊天方式向 Talk to Books 提問,然後它用搜尋結果告訴你,這本書裡這段話,可以回答你的問題,這些或許就是你想找的書。
另一個名為「SEMANTRIS」的頁面,有兩個基於機器學習的單詞遊戲 Arcade 和 Blocks。
▲ Arcade。
玩 Arcade 時,需要在一定時間內輸入與某個目標詞語最相關的單詞、短語或句子,越相關得分越高,同時目標詞語會下移。
▲ Blocks。
Blocks 則像無時間限制的消去遊戲。輸入某個單詞、短語或句子後,遊戲會自動判斷頁面哪個單詞與之最相關,然後這個單詞所在的方塊,以及相鄰同色的方塊就會消除。每次消除都會有新方塊掉下來,方塊堆積到達頂部,遊戲結束。
「Semantic Experience」這個項目呈現的是機器學習「詞向量」技術,這項技術能讓機器更快、更準確理解人類的語言。目前 Google 已在自家人工智慧開源軟體庫 TensorFlow 開源了一個預訓練語義的模組,開發者可使用自己的詞彙或語句實驗,訓練自己的模型。