義大利著名的聖母百花大教堂對面,矗立一座歷史悠久的教堂「佛羅倫斯聖若翰洗者洗禮堂」(見首圖)。這座洗禮堂不僅是宗教生活的中心,也是許多佛羅倫斯人受洗的地方。八面體外觀由綠白相間的大理石構成,建築風格為古典羅馬,讓人難以想像佛羅倫斯日後會誕生出改變歐洲面貌的文藝復興風格。然而,這座洗禮堂的建造者、建造時間與建造原因,始終未有定論。
獨立藝術史學家伊隆‧丹齊格(Elon Danziger)多年研究後發現,這座洗禮堂並非佛羅倫斯人建造,而是教皇額我略七世 1073 年後主導的合作計畫興建,專為佛羅倫斯人設計。這項發現恰逢人工智慧(AI)迅速發展,丹齊格那時開始思考,如 ChatGPT 這種大型語言模型,能否比他更快破解歷史謎團。
丹齊格實驗詢問三個 AI 聊天機器人 ChatGPT、Claude 與 Gemini 不同研究方向的問題。他期待 AI 能找出他已發現的線索,理解重要性,並有相同結論。當然結果不如預期。三家聊天機器人雖然能分析洗禮堂起源相關文本,卻始終無法拼出全新觀點,顯示仍欠缺發現事物的關鍵能力。
丹齊格認為,原因在大型語言模型即使閱讀大量文本,本質上仍只是辨識模式。獨特細節、異常資料與非主流觀點,往往容易忽略。他說正是不尋常的觀點,讓人取得突破。舉例,佛羅倫斯大學教授圭多‧提格勒(Guido Tigler)2006 年著作提出,洗禮堂建造時間可能比學界普遍認為還晚,雖未被廣泛接受,卻促使丹齊格重新檢視學界認為的洗禮堂建造年代。
許多人認為教皇尼古拉斯二世 1059 年為洗禮堂舉行祝聖儀式,但其實沒有史料可佐證,這說法只是根據他當年與其他佛羅倫斯教堂的關係所做的推測。丹齊格有引導聊天機器人注意到這矛盾,但 ChatGPT 與 Claude 只指出紀錄缺失,卻未再質疑合理性,Gemini 則虛構證據填補落差。丹齊格說若要對知識體系有貢獻,必須準確掌握研究現狀、察覺可疑之處,並能解釋成因,而大型語言模型三層面都明顯受限。
更深層問題在於,無論人類還是機器,辨識模式本來就會出錯。儘管缺乏確鑿證據,多數學者仍假設洗禮堂的贊助者是佛羅倫斯人,因中世紀教堂多由當地社群推動興建。但丹齊格研究逐漸讓他傾向另一種較冷門的看法,即 11 世紀的佛羅倫斯居民可能還是很貧困,很難支撐如此精緻且耗資龐大的建築工程。
(首圖來源:sailko, CC BY-SA 3.0, via Wikimedia Commons)






