讓網路科學工具助你成為劇透魔人,資料科學家建立《獵魔士》人際網路圖

作者 | 發布日期 2022 年 03 月 03 日 8:30 | 分類 AI 人工智慧 , Big Data , 網路 Telegram share ! follow us in feedly


《獵魔士》(The Witcher)是 Netflix 改編自 Andrzej Sapkowski 所創作同名奇幻小說的熱門影集,在此之前,並有許多遊戲的推出。去年 12 月 17 日開播第二季,光開播首週,全球用戶就觀看了 22 億分鐘。中歐大學(Central European University)網路科學博士暨 Datopolis 首席資料科學家 Milán Janosov 最近嘗試透過網路科學(Network Science)來歸納《獵魔士》的劇情與人物關係,並在 Nightingale、arXiv 及 ResearchGate 等學術平台及社群上發表論文,文中他製作出第一張將這部奇幻巨著故事劇情與角色關係詳細勾勒的視覺網路圖。

在這項研究中,Janosov 第一步是蒐集資料,以便之後用來建立網路圖。他一開始查看 Netflix 影集的字幕,但很快意識到他需要更多的資料,於是決定另外進行整個系列小說內文的分析。Janosov 著透過自己撰寫的電腦程式來篩選、推導並製作出內文句子中每個被提到人物角色的關係度列表,它成了兩個角色是否真的相遇或出現在同個劇情中的最佳指標。

在檢查被提到角色之間的關係度之後,Janosov 手定義這個網路中的元素。他隨後決定以單一節點來代表每個角色,並在角色於相同情境或部分內文中被提及時,將有關係的節點相連起來。

Janosov 論文為網路科學帶來新的應用價值,亦即如何運用網路科學來揭露諸如文章、小說、電影劇本等大量非結構性資料的隱藏模式。人們在閱讀完長篇大論的書籍或文章後,雖然能大致掌握整個故事的結構,但卻無法記得所有人物角色與所有劇情細節。對此,網路科學可以協助人們以定量與客觀的方式來歸納長篇小說或叢書。

Janosov 的研究算是當前網路科學如何運用在真實世界裡的範例之一,事實上,當前一些類似的資料分析工具也能用來歸納分析真實世界的其他網路。當前已有許多人資專家使用網路科學工具來設計更好的工作環境或加強同事之間的協作,也有科學組織利用這些工具來分析改善國際貿易與電信。

(首圖來源:Nightingale