Google 近日低調在 iOS 平台推出一款 AI 語音聽寫 App「Google AI Edge Eloquent」,主打可在裝置端離線運作,鎖定 Wispr Flow、SuperWhisper、Willow 等同類工具。使用者下載後,只要先安裝基於 Gemma 的語音辨識模型,就能直接在 iPhone 上進行語音輸入。
據 Google 官方介紹,Eloquent 主要訴求是把自然口語整理成較適合直接使用的文字內容。App 可即時顯示逐字轉錄結果,當使用者暫停輸入時,系統會自動去除像是「um」、「uh」這類語助詞,以及句中自我修正的內容,讓輸出文字更乾淨。轉錄結果下方也提供「Key points」、「Formal」、「Short」、「Long」等整理選項,可進一步調整文字風格與長度。
這款 App 的一大特點,是可切換為純本機處理模式。Google 表示,若關閉雲端模式,轉錄與整理都能在裝置端完成;若開啟雲端模式,則會透過雲端 Gemini 模型進一步協助文字清理。除此之外,Eloquent 也支援從 Gmail 匯入特定關鍵字、姓名與專有名詞,使用者也能自行新增自訂詞彙,減少專有名詞辨識錯誤。
為了方便用戶查看,Eloquent 也會保留歷次轉錄紀錄,並支援搜尋過去內容。App 內還可查看上一次輸入的字詞、每分鐘語速,以及整體輸入字數等資訊。從產品定位來看,Eloquent 不只是單純把聲音轉成文字,也進一步加入文字整理與個人化詞彙管理,強化其作為行動聽寫工具的實用性。
不過對中文使用者來說,現階段恐怕還得再等等。Google 在官方 AI Edge Eloquent 頁面明確表示,目前裝置端模型「僅正式支援英文」;App Store 頁面顯示的語言也只有「English」。這意味著,想體驗中文語音輸入,或希望使用其他語言進行穩定轉錄的用戶,暫時還無法把這款 App 當成成熟方案使用。
目前 Google AI Edge Eloquent 先在 iOS 上架,但從 App Store 說明可看出,Google 也已規畫 Android 版本。據描述,未來 Android 版將可與系統更深度整合,包括設為預設鍵盤,讓使用者在各類輸入欄位中直接使用,也會支援類似懸浮按鈕的快速啟動方式。
(首圖來源:科技新報)






