「Strawberry」有幾個「r」？AI 答：兩個！

近年來，大型語言模型（LLM）如 OpenAI GPT-4o 和 Anthropic Claude 等，在自然語言處理領域取得了令人矚目的成就。它們不僅能撰寫文章、翻譯語言，甚至還能生成各種創意文本。然而，這些看似無所不能的 AI 模型，卻敗在一個簡單的問題：無法準確計算「Strawberry」（草莓）字母「r」出現幾個。

oh pic.twitter.com/K2Lr9iVkjQ

— Rob DenBleyker (@RobDenBleyker) August 26, 2024

為什麼 AI 會犯這種錯誤？

這看似荒謬的現象，其實源於 LLM 的工作原理。LLM 並非像人類一樣理解語言，而是透過統計學習大量的文本資料，預測下一個詞或字元。它們將文字分解成更小的單位，如單字、音節或字母，然後將這些單位轉換成數位表示。雖然 LLM 能夠根據上下文關聯，生成符合語法的句子，但它們並不真正理解這些單字或字母所代表的意義。

大多數 LLM 都採 Transformer 架構，雖然處理序列資料表現出色，但卻有些固有限制。如 Transformer 處理不同語言時，會遇到標記化（tokenization）問題。不同語言在詞彙分割有差異，使 LLM 難以統一處理各種語言。