Mistral AI 發表 Mistral Large 2 模型,程式碼和數學能力勝 Llama 3.1

作者 | 發布日期 2024 年 07 月 25 日 18:44 | 分類 AI 人工智慧 line share Linkedin share follow us in feedly line share
Mistral AI 發表 Mistral Large 2 模型,程式碼和數學能力勝 Llama 3.1


繼上週攜手 NVIDIA 18 日推出新模型 Mistral NeMo,Mistral AI 24 日發表全新旗艦模型 Mistral Large 2,宣稱在程式碼編寫、數學及推理方面與 OpenAI、Meta 的最新模型不相上下。

Mistral Large 2 是一款先進的大型語言模型,支援 128K token 上下文長度,以及數十種語言,包括英語、法語、德語、西班牙語、義大利語、中文、日語、韓語、葡萄牙語、荷蘭語、波蘭語、阿拉伯語及印地語等。

Mistral Large 2 精通程式碼編寫,經過超過 80 種程式設計語言的訓練,如 Python、Java、C、C++、JavaScript、Bash、Swift 及 Fortran。它擁有一流的代理能力,可以原生呼叫函數和輸出 JSON,進而實現與外部系統、API 及工具之間無縫交流。此外,Mistral Large 2 擁有先進的推理和數學能力,可成為解決複雜邏輯和計算難題的強大工具。

Mistral AI 投入大量努力來強化模型推理能力,訓練關鍵在於讓模型盡量減少產生「幻覺」,或看上去可信但實際上不正確或不相關的資訊,這是透過微調模型來達成,使模型在回應更加謹慎和明智,確保其提供可靠和準確的輸出。此外,Mistral Large 2 會在找不到解答或沒有足夠的資訊來提供自信答案時承認這一點。

值得一提的是,Mistral Large 2 的發表比起 Meta 新款模型 Llama 3.1 405B 晚了一天。不僅沒讓 Meta 搶走鋒頭,Mistral Large 2 在程式碼編寫和數學性能方面似乎超越 Llama 3.1 405B,而且其 1,230 億參數量不到 Llama 3.1 405B 的三分之一。

Mistral Large 2 已能在 Google Vertex AI、Amazon Bedrock、Microsoft Azure AI Studio 及 IBM watsonx.ai 上取用,開發者也可在 Mistral AI 的 le Plateforme 上使用名為「mistral-large-2407」新模型。

(首圖來源:Mistral AI

延伸閱讀:

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》