維基百科最高產量的作者，憑一己之力把小語種推上第二多條目

正如網路最常用的語言是英語，英語版維基百科同樣也是全球 309 種語言中內容最豐富的。今年 1 月，英語版維基百科條目正式突破 600 萬條。

奇妙的是，全球第二多條目的語言，並不是西班牙、法語等「大語種」維基，而是宿霧語（Cebuano）版維基，共有 538 萬條目。

如果你沒聽過這種語言，也很正常。

宿霧語是菲律賓使用的小語種，懂得講宿霧語的人合計不超過 2 千萬。且宿霧語版維基雖然有 500 多萬條，但管理員只有 6 人，活躍用戶也只有 14 人；相比之下，英語版單管理員就有 1,143 人，活躍用戶更超過 10 萬人。

原來宿霧語版維基 500 多萬個條目，99% 內容是名為「Lsjbot」的機器人完成的。同時它也是維基百科最高產的作者。

狀態好，一天能創立 10 萬個條目

Lsjbot 的「爸爸」Sverker Johansson 是瑞典物理學家，擁有語言學、經濟學和土木工程學位。他的妻子是菲律賓人，通曉宿霧語，因此 Lsjbot 在瑞典語和宿霧語維基百科都有創作內容。

Johansson 表示，自己一直以來都對「一切事物的起源」充滿興趣，並認為維基百科未來應可「讓所有人了解所有事」。於是，他花了幾個月編寫出 Lsjbot，想用更快捷的方式將維基百科推向「囊括一切」的美好願景。

▲ Sverker Johansson。（Source：Lsj / CC BY）

Lsjbot 做的事情有點像「拓荒」，將 0 變成 0.5。

它不會撰寫系統豐盈的條目，只會簡單創立一個條目，放上最基本的資訊，這種條目稱為「小條目」（stub），有待用戶進一步補充和豐富內容。Lsjbot 專注的領域也比較窄，主要都是生物物種和地理相關內容。

▲ Lsjbot 一般生成的小條目。（Source：網頁截圖）

Lsjbot 生成內容的過程也非常程式化。首先，Johansson 會先就特定領域編寫模板，然後尋找可信、機器可讀的資料庫為資訊來源，再讓 Lsjbot 根據模板「填空」，並完成後期發表工作。效率高時，Lsjbot 一天能完成 10 萬條小條目。

聽這個工作描述，大家也能感覺到，Lsjbot 雖冠名幾百萬條條目，但內容其實都只是乾巴巴的「骨頭」，缺乏人類的創造力和思考，自然惹來部分活躍作者的不滿。

整體來說，我反對機器人生成的小條目。（它們）只包含或多或少正確的分類資訊，但卻缺乏動物外觀等重要資訊。

41 歲的 Achim Raschka 說，他是德語版維基百科的積極貢獻者，常常會花好幾天完成一篇關於某種植物的深度條目。

Johansson 也承認，Lsjbot 創造的內容的確很無趣，但也堅持這些內容有自己的價值。在他看來，Lsjbot 的條目能補充一些維基社群缺乏的領域。

維基百科作者的多樣性被詬病許久，有研究發現在維基百科撰寫內容的人大部分都是住在北半球發達國家的男性白領，擅長科技產品。Johansson 指出，瑞典語版的維基百科，關於《魔戒》角色的條目就超過 150 條，但關於越南戰爭的內容卻少於 10 條：

我對托爾金沒意見，且相對（越戰的）「春節攻勢」，我也更熟悉（《魔戒》）索倫發起的戰爭，但這樣真的是均衡的百科全書嗎？

雖然 Lsjbot 的內容「乾巴巴」，但 Johansson 希望這些知識骨幹能拋磚引玉，啟發未來維基作者探討原有社群「舒適圈」以外的內容。

這也是為什麼我認為 Lsjbot 這個「拓荒牛」只將 0 做成了 0.5，因為得有人類創造性參與，0.5 才能走向 1。

維基百科除 Lsjbot 外，還有大量不同功能的機器人，已成為社群不可或缺的成員。

維基百科的「機器人軍團」

我們常開玩笑說，機器人得來一次大罷工，所有人才會懂得感恩它們對社群的奉獻。

（如果沒有機器人）這個網站將需要我們做更多工作，編輯工作過載率也會大大提升。

生活在澳洲的 Chris Grant 說，他是維基百科社群專門負責管理機器人的組織「機器人審批組」（Bot Approvals Group，BAG）成員。

是的，機器人在維基百科應用歷史悠久，廣泛到 2006 年就設立專門審核和管理機器人的 BAG。

從流程來看，如果有維基作者想在社群應用機器人，必須先向 BAG 提交申請，闡述機器人的功能、程式語言及預計涉及的頁面數等資訊。隨後，BAG 的成員會綜合多方面預估可能的影響，並決定是否通過。即便是通過審核的機器人，開發者每增加一個功能，機器人都必須重新提交審批。

截至 2018 年，維基百科應用的機器人數早已破千，且不斷發展。2019 年的論文《The Roles Bots Play in Wikipedia》研究分析維基百科的機器人，並以職能分為 9 大類：像 Lsjbot 用其他數據來源生成頁面的「生成者」（Generator ）、負責修復超連結、文檔之類的「維修者」（Fixer）、更新數據，記錄用戶狀態的「文字員」（Clerk）、提供維基作者建議的「顧問」（Advisor）等。

▲ 維基百科機器人 9 大類。

這些機器人大部分都幫人類編輯完成社群非常繁雜的批量工作，同時也提供新加入的成員編寫內容時的幫助建議，清除各類惡性內容。當然，機器人也有犯錯的時候，基於維基編輯系統修改紀錄的透明化，管理者也能及時更正錯誤和優化機器人。

沒有機器人，維基百科將是一片混亂。

自稱 Hersfold 的維基百科管理員接受《BBC》採訪時說。

當人們反對 Lsjbot 時，是在反對什麼？

既然機器人在維基百科的歷史悠久，像 Lsjbot 這種內容生成型的也不少，為什麼人們仍一直爭辯 Lsjbot 的使用合理性？

維基百科誕生次年，首個應用的機器人「rambot」就已誕生，且還是和 Lsjbot 類似的內容生成型機器人。

當時，rambot 從美國人口普查公開資料裡提取地理資訊，在英文版維基創建了 3 萬條美國城鎮的小條目，同時也是維基百科第一個機器人。後來，這些條目逐漸由人類作者完善豐富，增添各種歷史事件和旅遊資訊。

截至 2009 年，英文版維基百科由機器人和輔助程式參與的編輯占總數 28.49%。

為什麼做類似事情的 Lsjbot 卻一直被攻擊？

主要還是比例問題。

正如開頭提及，宿霧語版維基的活躍用戶只有十多人，而 Lsjbot 生成的條目有 500 多萬條，部分人認為這個小社群不可能完成如此大量的完善工作。

因此，當新用戶來到宿霧語版維基百科時，看到的就只有品質低下的條目，並會因此離開，或失去動力編輯貢獻。

2017 年，因宿霧語版維基大部分都是機器生成內容，用戶 KATMAKROFAN 提出關閉該版維基。

最終，委員會就此議題討論的公開頁面宣布駁回提議，表示「理解專案機器人生成內容的問題的確需要關注」，建議「收緊內容品管」。

所以說，人們爭辯的其實是社群營運問題，同時，也在討論機器人產生的內容如何影響人類創作的積極性，並不涉及機器人創作品質本身。

Johansson 今年接受 Vice 採訪時表示，出於對社群「態度改變」的考慮，現在 Lsjbot 已不再在宿霧語版維基創建新條目，只負責維護類工作。

雖然 Lsjbot 不再創建新條目，這類機器人的作品也稱不上「創作」，但人類對寫作機器人的探索一直沒停過。

有的演算法在寫作，有的演算法在默默影響人類寫作

2019 年，華盛頓大學的團隊突然想到一個曲線打擊假新聞的方法──想要創造最好的檢測假新聞的演算法？也許我們得先寫一個擅長寫假新聞的演算法。

於是，Grover 誕生了。

只需要輸入標題，Grover 就能生成一段假新聞。《Fastcompany》編輯曾以《為什麼川普一天要做 100 個伏地挺身？》為題，讓 Grover 發揮：

當你想到伏地挺身時，第一個想到的形象絕對並不是美國總統。

做為三軍統帥，川普的健康狀況並不怎樣。他承諾一旦當選總統就會鍛鍊身體，而且在《飛黃騰達》中，他曾對阿諾‧史瓦辛格的技術大加嘲諷，如果沒有什麼能阻止川普不做「川普式的伏地挺身」。

不過就連川普自己也承認，不管你的工作多麼適合你，要想駕馭自己的身體都是極其困難的。那麼，是什麼讓三軍統帥走上正軌呢？答案是 100 個伏地挺身。

雖然這段話看著看著讓人覺得不妥，但仍無法否認它對川普言論風格的掌握不錯，還挺「創造性」的。看到這裡，你也許也會想起小米的小愛同學寫的詩句。Grover 論文的第一作者 Zellers 很好地總結出演算法寫作存在的普遍問題：