自動化取代人力,Google 建全球最大知識庫

作者 | 發布日期 2014 年 08 月 26 日 13:46 | 分類 Google , 網路
14082601-01

搜尋引擎巨人 Google 正建立一個自動化的知識庫(Knowledge Vault),透過演算法自動爬梳網路上的資訊,並利用機器學習將資訊整合成知識,兼具廣度與精度,讓電腦與智慧型手機了解人類的提問,未來有望改進 Google 回答問題的方式,從原本列出一連串的搜尋結果,進化到一目了然的答案。



Knowledge Vault 的前身是 2012 年 Google 所發表的「知識圖表」(Knowledge Graph),一個將資訊結構化的資料庫,透過群眾外包的力量擴大訊息量,內容取自維基百科、CIA 的世界概觀(World Factboo)與協作知識庫 Freebase,內容包羅萬象,有名人、事件等,總共彙整了 5 億個條目及 35 億種事實描述。但最終 Google 發現人的力量還是有限,知識量的擴增出現停滯,於是 Google 改弦易轍,決定以自動搜集的過程取代人力。

到目前為止,Knowledge Vault 已建置了 16 億種事實描述,其中 2.71 億被評比為可信賴的事實,Google 將新事實與已掌握的知識進行交叉比對,發現準確性達 90%。雖然目前 Knowledge Vault 的知識量還未達到知識圖表的水準,但它能自動擴充增加知識,超越的時間指日可待,很快的將成為全球最豐富的知識資料庫。

Google 除了能從網頁上分析文本找尋事實,來餵養它的資料庫,也能抓到一般檯面上看不到的資料,例如 Amazon 的產品銷售數據,或瀏覽某項產品的人數等。Garntner 的技術分析師奧斯丁(Tom Austin)表示,幾家世界上最大的科技公司如 Google、微軟、Facebook、Amazon 和 IBM 等,都在打造類似的知識庫,並處理極為龐大複雜的問題。他表示:當機器能掌握全人類的知識,它的智力將遠遠超過現有的語音助理軟體,在不久的將來,我們會看到能判斷優先順序的電子信箱問世,它能夠找到最重要的 10 封郵件,然後在不用人類的幫忙下,自動處理完剩下的郵件。

(首圖來源:Robert Scoble CC BY 2.0)

發表迴響