相較 OpenAI 日前發表更強大的推理模型 o3 系列,微軟持續開發更強大的小型語言模型(small language model,SLM)Phi 系列,推出可從事複雜推理的 Phi-4。
微軟將 Phi-4 做為一項開源專案,已在開源機器學習社群平台 Hugging Face 提供下載權重,研究人員和開發者能夠完全存取這 140 億參數(14B)模型和權重,用於實驗和部署應用。
權重是指模型如何理解並輸出資料的數值,透過模型訓練過程才能確定,通常是透過無監督的深度學習,在此過程中,模型根據收到的輸入確定應提供哪些輸出。研究人員和模型開發者可在訓練期間向模型添加自己的設定(稱為偏差),進一步調整模型的權重。除非權重公開,否則模型通常不被視為完全開源。
2024 年 12 月,Phi-4 在微軟 Azure AI Foundry 平台推出,很快受到研究人員和開發者關注,它在數學推理和多任務語言理解等領域優於許多大型語言模型,而且運算資源相對少很多。
Phi-4 在測試高階推理和特定領域能力的基準測試有所表現,例如具挑戰性的 MATH 和 MGSM 等得分超過 80%,勝過 Google Gemini Pro 和 OpenAI GPT-4o-mini 等較大的模型。在數學推理任務表現出色,這是金融、工程及科學研究等領域的關鍵能力,而評估程式碼生成的 HumanEval 也取得令人印象深刻的結果。
▲ Phi-4 14B 比起其他參數量接近的 SLM 表現更優異。(Source:微軟)
透過在 Hugging Face 提供 Phi-4 的權重和 MIT 授權條款,微軟向企業開放,可將 Phi-4 用於商業領域。開發者可將這款模型併入自己的專案,或針對特定應用程式進行微調,無需大量運算資源或事先取得微軟許可。
(首圖來源:微軟)