OpenAI 推出全新 NLP 模型 GPT-3,可能有與區塊鏈技術相提並論的潛力

作者 | 發布日期 2020 年 07 月 21 日 8:00 | 分類 AI 人工智慧 Telegram share ! follow us in feedly


OpenAI 全新新通用自然語言處理(Natural Language Processing,NLP)模型公開發表 Private Beta 版,並得到早期測試人員的大力讚揚。模型稱為 Generative Pretrained Transformer,簡稱 GPT-3,是可用於分析一連串單字、文章或其他資料的工具,並在此基礎上擴展以產生全新文章或影像輸出。 

Zeppelin Solutions 技術長 Manuel Araoz 最近展示證明了這項技術的潛力,他在頗受歡迎的 Bitcointalk 論壇透過基本提示字元符號處輸入一段描述當作指導原則,系統接著撰寫了一篇關於某模擬實驗的完整文章。

以「OpenAI GPT-3 可能是繼比特幣以來最大突破」為題的文章,GPT-3 生成一篇 746 字的部落格文章,描述 GPT-3 如何騙過 Bitcointalk 論壇成員,讓他們相信生成的評論是真人撰寫。文中幾處 GPT-3 還描述語言預測模型的幾種可行使用案例,並指出可用於「模擬新聞、『研究類新聞』、廣告、政治觀點和宣傳」。

除了一些小問題(包括遺漏一個表格和文章的引用截圖),文章實際上與真人所寫幾乎沒太大差別。文章運用一個標題、少量標籤,以及以下所示的簡短結論加以組合生成:「我分享了對 Open AI 全新 Beta 版語言預測模型(GPT-3)的初步實驗。我解釋了為什麼我認為 GPT-3 有可與區塊鏈技術相提並論的顛覆性潛力。」

這位阿根廷電腦科學家另外也透過 GPT-3 使複雜文章更容易理解,同時以阿根廷大文豪博爾赫斯(Borges)的風格寫詩(仍以西班牙文撰寫),並以 ABC 記譜法來譜曲等等。Debuild.co 創辦人 Sharif Shameem 也導出類似結果,他設法讓 GPT-3 根據網站版面配置的基本內容描述來編寫 JSX 碼。

最新版 GPT-3 似乎完全將前一版 GPT 抛諸腦後,包括令人難以置信的 1,750 億個能讓 AI 被任何任務指定的學習參數。這使 GPT-3 成為目前最大的語言處理模型,比微軟(Microsoft)擁有 170 億個參數的 Turing-NLG 語言處理模型要高一個等級。目前只有受邀請的使用者才能存取 GPT-3 API,但已有完整版候補清單。至於價格目前也尚未決定。

(首圖來源:Sharif Shameem