
中國人工智慧(AI)新創公司深度求索(DeepSeek)今年初推出大型語言模型,標榜低成本也能訓練出強大 AI 模型,震撼全球。中國媒體報導,DeepSeek 使用率從今年初 50% 暴跌至目前 3%,原本預定 5 月推新 R2 模型,目前未見蹤影。
中國媒體快科技9日報導,很多人都已淡忘DeepSeek今年初問世時的輝煌景象,使用率從年初50%暴跌至3%,下滑態勢明顯。
原定5月推DeepSeek-R2,時間卻一拖再拖,引起外界揣測。有業界人士表示,DeepSeek-R2迄今未能推出,是由於DeepSeek-R1是基於OpenAI已有、來自全球且經過認證的訓練數據產生,R2對訓練數據的需求量更大。
但中國可供R2訓練的資料品質不高,導致R2使用時「幻覺」問題十分嚴重。所謂「幻覺」問題,是指大型語言模型沒有準確答案時,有時會創造虛假資訊。
另一個原因導致DeepSeek-R2延遲推出,是高端繪圖處理器(GPU)嚴重不足,令DeepSeek的訓練效率大幅降低,拖累R2的更新進度。
金融投資報近日報導,DeepSeek發展受阻的同時,競爭對手卻不斷推陳出新。DeepSeek兩大海外競爭對手ChatGPT和Google Gemini,官網流量分別增長40.6%和85.8%。激烈競爭下,DeepSeek還依賴半年前技術,難滿足用戶需求,導致大量用戶流失,使用率急劇下降。
(作者:江明晏;首圖來源:shutterstock)