《我們與惡》為何有酸民、媒體角色?幕後資策會大數據團隊的工作揭密!

作者 | 發布日期 2019 年 06 月 24 日 14:00 | 分類 Big Data , 社群 , 科技生活 follow us in feedly


由公視製播、探討無差別殺人事件的影集《我們與惡的距離》,自上映後成為網路熱門話題,收視率隨著劇情的開展節節攀升,完結篇創下 3.4 的高收視率。這部戲能成功,金鐘編劇呂蒔媛功不可沒,無論是不同故事主線穿插交織、劇中人物對社會事件的辯證論述,還是一波未平一波又起的衝突場面,在在都牽動著觀眾的情緒,也喚起台灣社會對五年前鄭捷事件的集體焦慮與傷痛回憶。

《我們與惡》是一部治癒人心的戲劇,但鮮少人知道這部神劇還有一位幕後功臣——資策會數位服務創新研究所(簡稱服創所)。服創所由副主任徐毓良與其團隊,以大數據分析為《我們與惡》的前期劇本開發奠定良好基礎,拓展整部戲的深度與廣度。而擅長數據溝通的分析師又如何跟金鐘編劇合作,才能碰撞出台灣史上首部擁有「數據力劇情」的佳作?

「目前我們所熟知的機器學習與演算法有其僵固性,以致未必能夠貼近人們的真實情感,因為人的決策很複雜」資策會執行長卓政宏對大數據能在藝文領域發光發熱頗有感觸:「但即便如此,在科技急速發展下,未來的一切都有可能發生,關鍵是要先能明確定義需求,才能產出真正有用的資訊!」

回到劇本上,一部劇要成功需具備三元素,衝突、觀點、立場,三者缺一不可。好的編劇就是能將這三個元素巧妙安排在各橋段中。戲裡面有一幕是法扶律師王赦拜訪網路先驅報創辦人劉昭國,王赦希望借助媒體的力量,一起找出李曉明會犯下如此重刑的原因。僅就這一幕,雙方一來一回的對話中,就點出了戲裡錯綜複雜的人物關係,也呈現出各個角色因立場分歧,對同件事情所持有的不同觀點與引發的衝突。

找出衝突、觀點、立場,幫助編劇在「無差別殺人事件」這個主題上進行框架設計與資料探索,就是 2016 年服創所與公視開始為期五個月的大數據劇本實驗時,編劇與製作人所出的第一道功課。

(Source:公共電視)

資料探索,挖出事件、人物、議題

徐毓良在接到這項任務時,先利用編劇所提供的 5~10 個關鍵字,從社群網路爬梳大量文章,並藉由自然語言處理(語意分析)清洗資料,篩選出新的關鍵字,再重複以上爬梳、清洗、刪選等步驟,直到留下真正相關的資料為止。「使用的演算法不難,但整個過程非常繁瑣,因為抓下來的文章並沒有統一的規範格式與標籤,需要經由人工與程式反覆地處理」,徐毓良坦言。

篩選後的資料再給定標籤,分別歸屬於事件、人物、議題。事件的選定較簡單,只選擇與無差別殺人有關的事件,而人物與議題的標定則較為困難,必須參考相關的研究資料與主觀經驗判斷,且因為無法用程式精準地判別,還需加上人力輔助。

最終徐毓良從一年份的資料中找出 16 個事件,篩選出 40 個分屬四大類的關鍵人物,這四大類分別是加害人、被害人、專業人士、其他人物,其中加害人的描述是毒品前科犯、精障患者、預謀隨機殺人犯,後兩者也是編劇選用的角色。

在議題上則濃縮到 10 個,並從中整理出 200 個關鍵字。以「審判過程」這個議題為例,在建立標籤架構後,除了從文字雲、Facebook、PTT 等熱門文章進行分析外,也從不同人物立場觀點,針對有被留言與分享的文章進行分析,如此一來才能反應真實的討論聲音。透過文章分析,就能找到審判過程中會出現的角色與觀點,像是加害者想要逃避死刑、檢察官認為犯人沒有悔意、法官說精障不能判死等。

這樣的過程能幫助編劇找出隱藏訊息與專業術語。例如徐毓良從資料探勘中挖掘出以下文字,

如果判死刑就是順應民意,民意只聽它想聽的、看它想看的,但民意真的是對的嗎?

這段話出自小燈泡事件發生後嫌犯的辯護律師引用的日劇經典台詞;而在《我們與惡》中,法扶律師王赦也曾用類似的話為死刑進行辯證。

(Source:公共電視)

從關鍵字孵出劇情對話

有看過《我們與惡》這部戲的人,一定會對劇出現許多有意思的關鍵字印象深刻。徐毓良表示這些關鍵字能幫助編劇從中孵出劇情對話,更能支撐每個角色所需的觀點,因此當他給出 200 個關鍵字時,編劇馬上眼睛為之一亮,非常興奮。

這些關鍵字包含:社會安全網、思覺失調症、教化可能、挪威、矯正署、聯合國兩公約等。「當分析結果出來時,尚未進入劇本編寫過程,人物設定都還在初期階段」,但兩年後當《我們與惡》開播時,徐毓良驚喜地發現這些關鍵字出現在許多對話中。

例如劇中身為受害者家屬也是媒體高層的宋喬安,就以

挪威的社會福利這麼好,還不是出了隨機殺人犯。我們的社會安全網,我們的教育體制,永遠控制不了那些加害者

這段話,控訴對兒子遇害的無力感。

(Source:公共電視)

從資料找出衝突角色

 《我們與惡》這部戲的張力十足,媒體在劇中所扮演的角色可說至為關鍵。徐毓良在分析數據時,發現許多衝突點都來自媒體,因此在他與編劇的會議時,湯昇榮製作人就建議納入媒體觀點立場進行分析,後續也加大了分析的程度。

「可能編劇那時候就有這樣的想法,但或許我們的建議讓他們加重了戲份」,對於這部分的貢獻,徐毓良並不邀功,然而從許多觀眾的迴響來看,媒體這條支線的表現非常真實且細膩,確實突破了台劇過去的套路。

除此之外,編劇也希望對一些議題能更深入了解,像是酸民現象。因此徐毓良利用爬蟲將社群上的討論聲音抓下來分,並與新聞風向交叉比對分析,篩出一些討論的文字,酸民也意外成為這部戲的亮點。

(Source:公共電視)

大數據在影劇產業的應用

「台灣劇本能成功多是因為天才編劇,但天才畢竟少見,美國近年也鬧劇本荒,好的劇本不多見,但為什麼還能屢有不錯的戲?這是因為美國對編劇的訓練已經有一套完整系統與脈絡」。徐毓良表示台灣在編劇的訓練上較欠缺這一塊,未來若能有好的劇本引導開發工具也許能幫助編劇建立基礎脈絡,再輔以這次以大數據分析的方式,建立知識圖譜、帶出觀點、建立相關人物脈絡、發現潛在劇情、探索專業議題,「也就是讓新手編劇能快速找到多元與衝突觀點。」

資策會執行長卓政宏強調,「雖然大數據、人工智慧看似無所不能,但人的需求才是推動整個社會前進的動力」。《我們與惡》這部戲為影視產業帶來新氣象,但如果當初合作時編劇沒有說出需求、雙方沒有那麼密切的互動,服創所空有資料也無法生出這些內容,而編劇也將錯失可以發展的好點子。服創所提供的數據分析結果,不僅為編劇帶出新的思考角度,也讓劇情更具厚實度,達成製作人對這齣戲的期望「做一齣能夠讓大家討論的戲」

(首圖來源:公共電視)