Mistral AI 發表 Mistral Large 2 模型，程式碼和數學能力勝 Llama 3.1

繼上週攜手 NVIDIA 18 日推出新模型 Mistral NeMo，Mistral AI 24 日發表全新旗艦模型 Mistral Large 2，宣稱在程式碼編寫、數學及推理方面與 OpenAI、Meta 的最新模型不相上下。

Mistral Large 2 是一款先進的大型語言模型，支援 128K token 上下文長度，以及數十種語言，包括英語、法語、德語、西班牙語、義大利語、中文、日語、韓語、葡萄牙語、荷蘭語、波蘭語、阿拉伯語及印地語等。

Mistral Large 2 精通程式碼編寫，經過超過 80 種程式設計語言的訓練，如 Python、Java、C、C++、JavaScript、Bash、Swift 及 Fortran。它擁有一流的代理能力，可以原生呼叫函數和輸出 JSON，進而實現與外部系統、API 及工具之間無縫交流。此外，Mistral Large 2 擁有先進的推理和數學能力，可成為解決複雜邏輯和計算難題的強大工具。

Mistral AI 投入大量努力來強化模型推理能力，訓練關鍵在於讓模型盡量減少產生「幻覺」，或看上去可信但實際上不正確或不相關的資訊，這是透過微調模型來達成，使模型在回應更加謹慎和明智，確保其提供可靠和準確的輸出。此外，Mistral Large 2 會在找不到解答或沒有足夠的資訊來提供自信答案時承認這一點。

值得一提的是，Mistral Large 2 的發表比起 Meta 新款模型 Llama 3.1 405B 晚了一天。不僅沒讓 Meta 搶走鋒頭，Mistral Large 2 在程式碼編寫和數學性能方面似乎超越 Llama 3.1 405B，而且其 1,230 億參數量不到 Llama 3.1 405B 的三分之一。

Mistral Large 2 已能在 Google Vertex AI、Amazon Bedrock、Microsoft Azure AI Studio 及 IBM watsonx.ai 上取用，開發者也可在 Mistral AI 的 le Plateforme 上使用名為「mistral-large-2407」新模型。