打擊網路小惡霸!Yahoo 打造能自動偵測九成霸凌語言的演算法

作者 | 發布日期 2016 年 07 月 31 日 0:00 | 分類 人工智慧 , 網路 follow us in feedly

霸凌是社會環境中不容忽視的重要問題,這樣的歪風不僅僅可能出現在檯面上看的見的地方,檯面下的惡鬥更是波濤洶湧,網路霸凌就是其中之一。而此風不可長,Yahoo 實驗室的研究團隊近期也正著手研究能偵測出「話中有話」的網路霸凌語言,經研究測試後更發現準確率高達九成!




近來,許多社群網站積極對付網路霸凌,像是日前,演出電影《魔鬼剋星》的女星 Leslie Jones 就因在 Twitter 上遭受網路霸凌,最後黯然宣布關閉個人推特,這件事也引起了 Twitter 的注意,更讓 Twitter 大動作的主動關閉帶起這波歪風的 Milo Yiannopoulos 推特,也讓人真正意識到網路霸凌的可怕。

而 Yahoo 也不落人後,在近期成功開發出能自動偵測出網路霸凌語言的演算法。然而,一般的自動偵測僅能依照使用者所設定的「黑名單」,像是某些三字經等特定字詞或詞組才會讓社群網站偵測到有所謂的網路霸凌。但,罵人的方式有很多種,更有許多人能罵人不帶髒字,跟其他社群不同的是,Yahoo 研究團隊要做的就是突破特定語詞的限制,找到那些話中有話的網路霸凌。

在研發過程中,Yahoo 利用機器學習中一種叫做「詞向量(word embedding)」的方式,讓電腦能夠在即便每個字分開來看本身都不帶有侵略性的時候,卻也能在看出這一連串的語句是否有霸凌的成分。經測試後,Yahoo 研究團隊的演算法竟能成功偵測其數據組中的九成是否是在霸凌他人。

九成的數據聽起來雖不是相當的完美,但來自英國社群分析中心的網路霸凌研究學者 Alex Krasodomski-Jones 也表示,當人類也沒有辦法完完全全分辨出哪一句話是帶有歧視性,或者是霸凌的成分在時,你就知道要成功讓一個電腦偵測出九成的網路霸凌語言是有多困難的一件事了。

 

相關連結

(首圖來源:Engadget) 

發表迴響