Google 發表「語音轉語音」Gemini 3.5 Live Translate 模型,日後不再需要擔心語言隔閡,透過模型強大的語音翻譯能力將能無縫對話。
Gemini 3.5 Live Translate 能夠自動偵測超過 70 種語言,產生自然流暢的翻譯內容,同時維持說話者原有的語調和高低、語速。此外,不同於那些必須等到說話者講完才能進行作答的系統,這款模型可持續產出翻譯後的語音內容。
Google 透過 2 段示範展示 Gemini 3.5 Live Translate 的實際表現。第一段示範呈現出一項即時配音的使用體驗,是將一段影片內容即時翻譯成另一種語言。第二段示範則聚焦在演講和簡報內容的多語言翻譯,呈現出來的成果相當令人印象深刻。
Google 指出,Gemini 3.5 Live Translate 陸續在視訊服務 Google Meet 當中推出。一旦這項功能推出,將會支援超過 70 種語言,相較於目前 Google Meet 僅支援 5 種語言的限制有顯著提升。另一項重點是,Gemini 3.5 Live Translate 能在一場視訊會議支援超過 2,000 種語言組合。先前 Google Meet 的語音翻譯僅支援與英文之間的相互翻譯。Google 還計劃換新 Google Meet 的使用者介面,讓你能夠更快取用語音翻譯功能。
Google Meet 升級版的語音翻譯功能將以私人預覽的形式,向部分企業端的 Google Workspace 客戶推出,Google 也計劃在今年稍晚將這項功能擴展至更多使用者。
(首圖來源:Google Blog)






