馬斯克 xAI 首款聊天機器人「Grok」有幽默感,願意回答尖銳問題

作者 | 發布日期 2023 年 11 月 05 日 16:34 | 分類 AI 人工智慧 line share follow us in feedly line share
馬斯克 xAI 首款聊天機器人「Grok」有幽默感,願意回答尖銳問題


馬斯克(Elon Musk)成立 AI 新創 xAI 後,希望建立 AI 工具幫助人類尋求理解和知識,5 日推出如 xAI 版 ChatGPT,稱為「Grok」,先提供美國少數用戶測試。

Grok 是以知名科幻小說《銀河便車指南》為藍本設計的人工智慧,用對話讓用戶與 AI 一問一答,幾乎可回答任何問題,更難得的是,甚至建議你該問什麼問題。Grok 擁有獨特且重要的優勢,能透過 X 平台即時了解世界,也就是說與 ChatGPT 一樣有網路瀏覽功能,能在網路搜尋特定主題資訊,更會回答其他 AI 系統拒絕回答的尖銳問題。

「Grok 設計成能以一點機智回答問題,並有點叛逆精神,所以如果你討厭幽默,請不要用它!」xAI 團隊強調。

▲ 馬斯克談 Grok 設計有幽默感。

xAI 成立後,團隊訓練了有 330 億參數的大型語言模型(Large Language Model,LLM)「Grok-0」,標準語言模型基準上接近 700 億參數版的 LlaMA 2,但只耗費 LlaMA 2 一半訓練資源。Grok 背後支援 LLM 為「Grok-1」,較 Grok-0 推理和編碼能力都有顯著進步。

為了突顯 Grok-1 的能力,xAI 以衡量數學和推理能力的標準機器學習基準,包括 GSM8k、MMLU、HumanEval、MATH,與競爭對手 OpenAI、Google、Meta、Anthropic、Inflection AI 開發的 LLM 比較:

▲ Grok-1 與其他大型語言模型進行數學和推理能力測試比較。(Source:xAI 截圖)

基準測試顯示,Grok-1 可超越 GPT-3.5、Inflection-1、LlaMa 2(70B),然而使用大量訓練資料和運算資源如 GPT-4、Claude 2、PaLM 2 仍領先 Grok-1。

現在除了 ChatGPT、Bard、Claude 等聊天機器人,又有 Grok 加入市場競爭。xAI 團隊指出,Grok 仍屬於一個非常早期的測試版產品,期望在用戶幫助下每週快速改進。馬斯克則預告,一旦結束早期測試,Grok 將向所有 X Premium+ 訂閱者開放使用,也藉此拉抬 X 平台的付費訂閱服務。

(首圖來源:達志影像)

延伸閱讀: