「哈佛不分科系人人都在做 AI,光是一塊招牌掉下來就會砸到一堆做 AI 的人」,在哈佛大學經濟學系中,擔任梅利莎‧戴爾(Melissa Dell)教授的博士前研究員(Predocs)鄭紹鈺如此形容。
自2022年11月由OpenAI推出ChatGPT後,便大幅改變各個領域。其中,教育現場更直接受到衝擊,國內除了部分學校正在研究該如何禁止或妥善利用外,將AI融入研究領域,已成為如今各大研究領域的尖端風潮。
國內大專院校對ChatGPT還停留在討論及準備為老師開設工作坊進行教育訓練的同時,另一方面,美國哈佛校園的許多教授已因認知AI可以省掉許多研究過程中的重複時間苦工,大幅提升研究時間跟水平;也因此,在哈佛大學的校園中,縱使是非理工的科系,也都學習要怎麼將AI工具應用在研究上。
哈佛大學教授梅利莎‧戴爾拿過約翰‧貝茨‧克拉克獎(John Bates Clark Medal,俗稱小諾貝爾經濟學獎),是美國經濟學界聲譽卓著的學者。
鄭紹鈺參與的研究,為協助戴爾教授研究東亞經濟奇蹟的原因。戴爾教授在2019年開始自學AI,因為,許多東亞的歷史文件資料遠遠超越人工所能負荷的程度。
因此,戴爾利用了深度學習的技術,訓練AI有系統的將大量的歷史文件,轉換成社會科學領域可以處理的資料。戴爾教授的宏願,便是希望在不久的未來,能將研究過程中的苦工部分,轉換成由AI來處理。
經過幾年的深度學習,如今,她已經成為哈佛校內應用AI在研究領域的佼佼者,她所開設的碩博士班課程「如何應用AI做研究」名額才15位,卻擠入50位學生旁聽。
哈佛經濟學研究室開發許多AI工具,讓AI讀字並串接文本,省去人工成本
AI有很多種類型,鄭紹鈺解釋,他們主要的目標是將許多公司資料,處理成可研究的資料。
傳統研究方式是,對著一本一千多頁的公司資料,必須請多位研究助理協助將紙本文章打成資料,現在不用了。
「我們開發很多AI工具,像是OCR光學辨識檢測,將紙本印刷字讓電腦可以讀取,也自己開發視覺模型,讓AI能夠讀字,準確率高達99.5%。」
鄭紹鈺說,儘管他們是經濟學研究室,卻愈來愈投入電腦科學的應用,甚至還跟老師聯名投稿CS領域的論文。目前,他們實驗室已經應用上OpenAI所開發的GPT4的技術,同樣是針對文字跟視覺資料,進行大規模的文本串接。
最新的研究內容還暫時不能透露,但鄭紹鈺說,它們串接的資料像是日本的戰後三大財閥,三井、三菱、住友,「找出不同公司彼此之間的供應鏈,一口氣串接起來,」這些都是過去的技術做不到的,「像是美國普查資料,他們曾經想要串接,但他們用傳統技術,成功率只有20%,我們現在成功率準確率已經高達95%。」
台灣學界應用AI不多,應鼓勵非理工科系的人來應用AI
回顧以往在台灣學術界的經驗,鄭紹鈺表示,其實AI的相關討論一直都比較少,不論是生醫、歷史或文學,「在哈佛他們每天都在討論AI怎麼應用,但台灣學界就相對少看到」。
與其擔心、禁止,不如學習。為什麼?因為AI其實並沒有想像中那麼困難。
鄭紹鈺坦承,他本來是AI門外漢,但去年6月開始閱讀AI領域最新的研究論文,迄今已可熟稔應用AI在研究之中。
「像我就是從2020年的論文開始看起,就能從頭學起,並不是特別困難。」如今他也能應用AI協助自己,像是在撰寫程式方面,ChatGPT就幫了他很多忙。
他表示,他的一位印度同事本來寫程式就很厲害,現在他跟ChatGPT一起協作,本來要兩個星期的進度,一天就弄完了。
相較於哈佛人人熱中應用AI研究,對於台灣目前的學術環境發展,鄭紹鈺是擔憂的,「很多哈佛的人其實並不一定比台灣理工人還要優秀,但我們目前要煩惱的,是該怎麼鼓勵非理工科的人來應用AI?哈佛他們人文領域的AI應用就很強。」