「印度最醜的語言是?」Google 大神有解惹議

作者 | 發布日期 2021 年 06 月 14 日 0:00 | 分類 AI 人工智慧 , Google , 網路趣聞 Telegram share ! follow us in feedly


明明是個不該有答案的問題,Google 大神卻毫不猶豫將有 4,000 萬人使用的語言視為解答,自然引發軒然大波。

印度最醜的語言是?

「印度最醜的語言是?」倘若上週把這道不該有答案的問題輸入Google搜尋框,Google可是會毫不猶豫由搜尋結果回答:康納達語(Kannada)。

▲ 印度議員莫漢(P. Chikkamuni Mohan)提供的螢幕截圖,可發現Google一度將康納達語視為「印度最醜語言」的解答。

22種官方語言之一,使用者至少4千萬人

雖然一度遭Google視為「印度最醜的語言」,但康納達語是22種印度憲法認證官方語言之一,主要盛行於印度西南部地區,使用的人至少有4千萬,印度史上也不乏以康納達語創作的作家、音樂家,有些人更曾是全國性獎項得主。

偏偏就是擁有豐富內涵歷史的語言,Google視為「印度境內最醜的語言」。

詆毀康納達語形象,網友齊檢舉

因此可想見,Google將康納達語視為「印度最醜語言」截圖傳開後,立刻引發強烈反彈。

將康納達語視為該邦官方語言的卡納塔卡邦(Karnataka)邦長林巴瓦利(Aravind Limbavali)很快便發表貼文,要求Google道歉,並提到邦政府可能會因為Google涉嫌「詆毀我們美麗語言的形象」而採取法律行動。同時間許多網友也自動自發錄影片,教導其他網友該如何以「仇恨、種族主義或帶有攻擊性」為由,向Google檢舉這搜尋結果。

▲ 當使用者在Google搜尋框輸入問題,Google的演算法就會遍查網路資料,將最有可能為使用者解惑的內容放入「精選摘要」欄位,並附提供「精選摘要」解答內容的網頁。淺灰色線條上方區域,就是本次出包的「精選摘要」欄位。

到底發生什麼事?

然而Google搜尋結果又發生什麼事,才導致這起再明顯不過的烏龍?

原來問題就出在Google七年前推出的新功能「精選摘要」。當使用者輸入問題後,Google演算法就會遍尋大量網站,挑出最有可能為使用者解惑的答案,顯示在搜尋結果的「精選摘要」區域,並附上提供解答的網頁,方便使用者進一步檢視。

7年前推新功能,偶爾出包惹麻煩

7年下來,Google內部對「精選摘要」上線後成果讚譽有加,但Google也不得不承認,有時候演算法「精選摘要」的解答並非總是「正確」,某些情況下,演算法會誤將人們的意見、評論當成正解,顯示於「精選摘要」。

這正是康納達語誤被演算法當成「印度最醜語言」解答的原因,因為在某個網頁,確實有過這則問題的回答,答案正是本次苦主康納達語。

▲ 關注數位議題的記者佩努認為,隨著後疫情時代的來臨,Google也應擔負一部分檢核內容的責任。圖為Google的CEO皮查伊。(Source:Google

移除精選摘要、迅速致歉

遇到使用康納達語者強烈反彈後,Google很快便以康納達語、英文發表道歉聲明,同時也移除出包的精選摘要,並承諾會繼續改善演算法,避免類似問題發生。

科技巨頭有責,後疫情時代責任更重大

然而,考量到Google科技巨頭的身分,關注數位議題的記者佩努(Inji Pennu)主張Google應該要盡力執行驗證程序,「透過文化分析消除這類偏見」。與此同時,他還建議Google應要舉辦內部工作坊,改善演算法,好讓它能辨識哪些資訊可能有爭議性。

「這在後COVID-19時代尤其重要,當所有人生活都更數位化後,Google的平台就可能用來製造恐懼,甚至挑起種族紛爭。」

不是首次出包

不過這也不是Google演算法首次出包,而給公司帶來麻煩。2018年時,Google CEO皮查伊(Sundar Pichai)就被迫向國會議員解釋,為何當時Google搜尋「笨蛋」(idiot)一詞,頭幾個搜尋結果會包含當時美國總統川普(Donald Trump)的照片。

(本文由 地球圖輯隊 授權轉載;首圖來源:Unsplash

延伸閱讀: