AI 以 11 歲作文預測 33 歲學歷,準確率比 DNA 預測還高

作者 | 發布日期 2025 年 07 月 26 日 0:00 | 分類 AI 人工智慧 , 科技趣聞 line share Linkedin share follow us in feedly line share
Loading...
AI 以 11 歲作文預測 33 歲學歷,準確率比 DNA 預測還高

日本最新研究顯示,AI 分析 11 歲兒童短篇作文,能精準預測 22 年後學歷及認知力。團隊用 1958 年出生的約萬名英國兒童 11 歲作文,主題為「想像 25 歲的自己」,發現 AI 預估準確度與教師評量差不多,並明顯優於基因預測。

研究分析平均約 250 字的短篇作文,用 OpenAI GPT 模型等大型語言模型提取 1,536 維特徵量,並測量 534 項語言指標、可讀性及文法拼字錯誤等。結果顯示,AI 預測 11 歲孩童理解力準確度達 59%,教師評估為 57%,基因預測只 14%。

同時發現,以作文分析能預測語言能力、數學能力等認知技能,準確度均達 55% 以上。對非認知特質如職業抱負、學習動機等準度較低,但仍優於基因預測。結合作文、教師評估及基因三方法,精準度可提升至近標準智力測驗的重測可信度。更令人驚訝的是,11 歲作文還能精準預測 33 歲學歷等。純粹基於作文的準確度達 26%,教師評估為 29%,基因為 19%。三方法結合後,教育成就準確度可達 38%。

傳統社會學預測因子如父母教育程度僅達 12%,出生體重及身高等生物學指標準確度更只有 1%~3%。團隊重建類似「脆弱家庭挑戰」研究的社會學模型,含性別、父母教育水準、社會階層等變數,準確度為 18%,仍遠低於 AI 文本分析。

細究各文本分析模型,發現深度學習是關鍵。傳統可讀性指標、拼字文法錯誤率、計算語言學測量等雖有一定效果,但深度學習幾乎含所有重要資訊,成為預測準確度的驅動因素。研究採 SuperLearner 框架,結合極端梯度提升、隨機森林、支援向量等多種機器學習演算法,交叉驗證避免過度擬合。結果顯示線性模型及隨機森林大部分預測獲最高權重。

新研究挑戰了「人生本質不可預測」觀點。標準社會調查數據僅能解釋約 20% 個體差異,此研究卻以非標準數據大幅提升精確度。近年自然語言革命性發展,成為行為科學家預測心理社會特徵的強大工具。

國際大學校長橘川武郎等專家認為,雖然顯示文本預測潛力,但仍需考慮倫理問題。準確度持續提升並整合至社會各層面後,如何規範應用系統將成為重要課題。研究也強調需要更多不同類型非標準數據的縱向資料庫,以驗證結果普遍性。

不過研究仍有限制,包括樣本僅為 1958 年出生的英國兒童,是否適用當代學生有待驗證。研究也未充分探索三種資訊來源,之後可用更先進 GPT 模型及貝氏定理提升準確度。

(本文由 Unwire HK 授權轉載;首圖來源:shutterstock)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》