在博物館龐大數據海大展身手的 AI

作者 | 發布日期 2019 年 05 月 11 日 0:00 | 分類 AI 人工智慧 , 數位內容 , 軟體、系統 follow us in feedly


如果一個資訊量爆炸的博物館與先進人工智慧結合,會碰撞出什麼樣的火花?NVIDIA Blog 文章《以色列大屠殺博物館擁抱人工智慧,幫助遊客從龐大檔案獲得啟發》或許可以告訴你,全文編譯如下。

上週,世界各地人們紀念大屠殺紀念日。除了緬懷受害者,還向冒著生命危險試圖拯救他們的非猶太人致敬。

數據是國會圖書館的 2 倍

世上最著名的大屠殺紀念中心 Yad Vashem 每年吸引 100 萬遊客,有 6 位美國總統訪問過,致力於為後代保存 600 萬名死於德國納粹及合作者之手的猶太人記憶。Yad Vashem 的檔案包括獨特強烈的影片證詞、短片、照片、個人書面紀錄、納粹文件和語音文件。這 8 億的數位資產,包含 4pb 的數據,是美國國會圖書館數據的 2 倍。

世界大屠殺紀念中心是供全世界學者使用文獻的地方,儲存大量關於受害者和倖存者的數位媒體檔,確實難以訪問和查找。研究人員跟上編制歷史的步伐都是艱鉅的挑戰,更不用說更年輕的一輩接觸到它。由於這些文獻是幾十年來陸續發現的,經過完全數位化後將會成為全球大屠殺學者的資料來源。這家總部位於耶路撒冷的組織正在尋求人工智慧的幫助,讓其從大量數據中幫助辨識、組織和連結照片和其他歷史文件。

Yad Vashem 團隊利用深度神經網路,讓圖像辨識演算法幫助索引和分類數位歷史。Yad Vashem 首席資訊長 Michael Lieber 表示,這可能有助於找到大屠殺受害者的新關係和故事。Lieber 說:「我們是世界上第一家處理文化遺產的機構,我們決定把所有東西數位復刻,因為這是在全球獲得更廣泛受眾的途徑。」他樂觀地認為,人工智慧將有助於辨識資源,在社群媒體帳號講述大屠殺受害者和倖存者的故事。他說,這可能有助於與更年輕的觀眾保持聯繫。另外,他還希望研究人員利用深度學習揭示一些無法輕易發現的新歷史資訊。

改進家族史搜尋法

許多人訪問 Yad Vashem 是為了研究祖父母和曾祖父母的遭遇,並拼湊出中斷的家族史。現在的問題是,數位化數據的收集未來幾年可能會翻倍,這將更難搜尋。

Yad Vashem 技術團隊旨在透過利用高性能計算驅動的深度學習來改變現狀。利用 NVIDIA DGX-1 人工智慧系統的超級計算能力,透過深度學習幫助組織和擴充歷史,DGX-1 在系統中提供數百台基於 CPU 伺服器的能力,人工智慧計算能力可超過每秒千兆次。

NVIDIA 高級解決方案架構師 Yuval Mazor 表示,DGX-1 把 Yad Vashem 和全球最具創新性的組織放在一起,部署人工智慧以應付挑戰。他說:「他們從人工智慧的應用獲得實在的好處。例如,Yad Vashem 使用影片分析來理解和預測博物館的客流量和單件展品的影響,並從豐富的歷史數據提取深刻的見解。這些可幫助 Yad Vashem 完成首要任務,即接觸和教育盡可能多的人。」

Lieber 說,無監督學習為訓練有素的神經網路帶來為數位產品創建標籤的希望,允許深度學習將各種資訊的點連接起來。「如果你設法在 Mauthausen 集中營找到一張監獄卡,系統就會知道這是一張囚犯卡。它會引導你找到相關的數據資料和文件,你將能夠定位和辨識文件的類型,並在不需要人為干預的情況下提供額外資訊。」 他說。

另一種選擇是讓大批人幫數億數位媒體資產貼標籤,並繼續追蹤和更新資料庫。NVIDIA 的以色列研發人員正與 Yad Vashem 合作開展這項工作。

(本文由 雷鋒網 授權轉載;首圖來源:NVIDIA