
Anthropic AI 模型推出 Claude 3.7 Sonnet 版,號稱迄今最聰明版本。同時 xAI Grok-3 也引發關注,部分用戶認為更有吸引力。Claude 3.7 Sonnet 有哪些升級?對普通用戶又有何幫助?
Claude 3.7 Sonnet 三大升級
Claude 是由 Anthropic 開發的 AI 模型,功能類似 ChatGPT。3.7 Sonnet 為最新版本,2 月 24 日公布,稱為「混合推理」AI,能根據需求快速回應或深入思考,結合速度與深度優勢,用戶可從 Anthropic 官網免費試用,操作簡便。
快慢自如,靈活應對
Claude 3.7 Sonnet「混合推理」功能能像人類靈活切換模式:
- 快速模式:適用簡單問題,如「晚餐吃什麼?」,可即時建議,節省時間。
- 進階思考模式:複雜問題如「如何安排餐廳人力」,AI 會逐步分析後給予更精確答案。
用戶還可調整 AI 思考時間,簡單問題快速解決,複雜問題深入思考,體驗更貼心。
寫程式力大幅提升
對程式設計愛好者而言,Claude 3.7 Sonnet 可能成為得力助手。專業測試(SWE-bench Verified)得分高達 70.3%,Anthropic 稱這是全球最高,相較上代 3.5 Sonnet 顯著提升。無論寫程式還是修復錯誤,都能大幅提升效率。
回答更詳細,容量升級
Claude 3.7 Sonnet 輸出量大幅提升,一次可處理高達 12 萬字(128K token),較上代增加 15 倍,無論旅遊規劃、多案例解析還是長篇解釋,都能提供詳盡內容,「無理拒答」較上代減少 45%,體驗更佳。
價格與性價比
Claude 3.7 Sonnet 定價與上代相同:
- 輸入(用戶提問):百萬字 3 美元。
- 輸出(AI 回答):百萬字 15 美元。
相較 OpenAI o1 模型(輸入 15 美元,輸出 60 美元,都為百萬字),Claude 更具價格優勢。用戶還可據需求控制 token 消耗,簡單問題省錢,複雜問題多花費,性價比高。
Claude 3.7 Sonnet vs. Grok-3 用戶意見
為了更清楚比較 Claude 3.7 Sonnet 和 Grok-3 的差別,本文整理截至 2 月 24 日網路和 X 最新意見,幫助讀者快速了解兩者優缺點。
速度與反應
poiskx 認為:「Grok-3 日常事務處理比 Claude 3.7 Sonnet 更聰明,能完全理解我的意圖,反應速度更快。」他分享例子,Grok-3 的確能迅速回答實用,無需思考太久。但 Decrypt 2 月 19 日指出,雖然 Grok-3 創意任務表現出色,但 Claude 3.7 Sonnet「進階思考模式」更適合需深度分析的問題,如複雜推理或商業應用。
寫程式
Suzacque 表示:「Claude 3.7 Sonnet 寫程式顯著提升,單一提示即可產生大量程式碼,數量遠超過 Grok-3,視覺表現尤其細膩。」他以設計圖程式碼為例,Claude 表現更出色。Reddit r/ClaudeAI 討論區 2 月 21 日有用戶指出,Grok-3 實戰表現過度誇大了,Claude 3.7 Sonnet 複雜專案表現更穩定。
創意與實用性
Decrypt 提到,Grok-3 創意寫作和 HTML5 遊戲設計比 Claude(包括 3.5 版)好,因內容更具吸引力且介面更美觀,但 Claude 3.7 Sonnet 被譽為「實務導向」,企業級 AI 代理和長篇內容產生表現更出色,品質穩定可靠。
價格與限制
網路資料,Claude 3.7 Sonnet 定價(見上文)比 Grok-3 需訂閱 X Premium+,約每月 30 美元,更有優勢且更靈活。Reddit 用戶指出,Grok-3 無法直接讀取文件是大缺點,Claude 3.7 Sonnet 支援更多工具,均認為「物有所值」。
該選哪個模型?
- Grok-3:速度快、創意及推理強,適合日常或輕量任務。
- Claude 3.7 Sonnet:寫程式深度、穩定性和實用性更具優勢,尤其適合專業人士或需長時間思考任務。
最終選擇哪款 AI 模型還是取決於需求,一般日常工作,Grok-3 很合適。如果是工程師,可考慮主要用 Claude 3.7 Sonet,設計初期若遇到邏輯問題,可用 Grok-3 先推理並寫出框架,再讓 Claude 3.7 Sonnet 後期 debug 及最佳化。
(本文由 Unwire HK 授權轉載;首圖來源:shutterstock)