小型圖靈測試:什麼單字能夠證明你是人類?

作者 | 發布日期 2018 年 09 月 27 日 19:31 | 分類 AI 人工智慧 , 科技趣聞 follow us in feedly

隨著人工智慧技術(AI)研究持續進步,未來十幾年後的某一天,我們可能必須做出一個判斷:隔著螢幕談話對象究竟是機器人還是人類?最近有兩個科學家基於這項概念,透過一項簡單測試提出了圖靈測試的新觀點。



與傳統圖靈測試相比,賓州大學(UPenn)John McCoy 和麻省理工 Tomer Ullman 近日提出的「最小的圖靈測試」(Minimal Turing Test)目的有些不同;比起測試機器能否騙過人類,團隊更想知道的是,人類會如何判斷人與機器的區別?

測試內容是這樣子的:首先,試著想像一下你和一個聰明的機器人就坐在法官面前,法官無法看見你們雙方,最終法官會判定你們誰是人類,而無論對象是誰,判定為非人的那方就會死亡,但你與機器人都希望活下去。

這項測試的假設中,法官非常公平且聰明。但為了做出判斷,你仍然必須給法官一個提示:一個英文字典中的單字,法官將根據這個單字判斷何者為人,何者又是機器人。

這項測試非常有趣,公布團隊最終調查情況以前,讀者不妨可以試著思考究竟應選擇什麼樣的單字。

這項測試中,科學家向 1,000 多位受試者提出這個小型的圖靈測試,最終有 936 位受試者回答,團隊最終得到 428 個單字(單字之所以少於受試者,是因為許多人答案相同,這也是這項測試有趣的點)。

如果你做好選擇,不妨從下方圖片看看你選擇的單字是否也與多數人相同。

▲ love(愛)、please(請)、human(人類)和 compassion(同情心)是最多人選擇的單字。

隨後團隊再找來一些獨立志願者,使其隨機查看兩兩單字配對(由團隊從其中選擇的 10 個不同屬性單字隨機搭配而成),並要求他們判斷哪些單字來自人、哪些來自機器人;當然這些「法官」並不知道,所有的單字都出自人類之口。

而結果也非常有趣,事實證明,比起 mercy(慈悲)、love(愛)、please(請)、human(人類)、robot(機器人)這些單字,讓我們能與機器劃分的其實是更人性化的單字:poop(大便)。

超過 2,000 次與其他 9 個單字的一對一較量中,法官選擇 poop 為人類所說單字的比例遠高於其他單字,從下面圖表可看出單字兩兩較量下,何者更容易判斷為人類。

▲ poop 與其他單字的比較都占上風。

或許有人會問,這樣的測試有何意義?

自圖靈測試(Turing test)問世以來,數十年已過去,但人們仍對機器的學習方式不甚清楚,研究者認為,隨著科技持續進步,了解人類如何看待機器是必須的,而這次的實驗正好能為過去相關研究提供額外資訊,即量化人們看待不同屬性單字的重視程度。

無論如何,至少現在我們知道,如果未來被迫回答「以單字證明自己是人類」這種問題時,更口語化的單字或許是更好的選擇。

(首圖來源:shutterstock,內文圖片來源:Tomer Ullman, John McCoy CC BY 4.0)