
在最新的微軟 Edge 瀏覽器測試版(版本 141.0.3537.13)中,推出了一項引人注目的 AI 驅動功能,能夠即時翻譯影片片段。這項翻譯功能不僅能生成字幕,還能提供音檔翻譯。
根據Windows Latest的報導,這項翻譯功能幾乎是即時進行的。使用者需要擁有相對強大的電腦配置,至少需要12GB的RAM和四核CPU,因為這項技術依賴於本地AI模型運算。雖然現代高階PC普遍具備16GB以上的RAM,但低階舊機則無法支援,這可能會影響使用者體驗。
目前,這項即時音檔翻譯功能的語言支持包括:西班牙語與英語之間的雙向翻譯,以及英語可翻譯成印地語和俄語。韓語目前僅支援語音翻譯方向,尚待整合。
這項功能不僅支援YouTube,還擴展到LinkedIn、Reuters、CNBC、彭博、Coursera等教學或新聞網站,適合企業與遠距團隊提升協作效能。所有翻譯處理均在用戶本機完成,無需將影片或音檔資料上傳到雲端,保障使用者隱私。
不過,這項技術仍面臨一些挑戰,例如AI生成的音檔在語調變化時,可能會突然在男性和女性聲音之間切換,這是由於生成的語音模型與語調調度尚未成熟。此外,部分用戶反映語言包安裝卡住、特定平台翻譯選項不出現等技術問題,微軟正在積極改進中。
目前企業用戶尚未開放此功能,微軟計畫在未來增加更多語言的支持,並期待提升AI翻譯的自然度與穩定性。
- Microsoft tests on-the-fly AI audio translations for videos in Edge
- What Real-Time Video Translation in Microsoft Edge Will Bring to the Digital Workplace
- Unlocking Real-Time Translation: Microsoft Edge’s AI Breakthrough
- Edge Real-Time Video Translation Preview on Windows 11: On-Device Subtitles & Dubbing (12GB RAM)
- Real-time video translation
- Issues with Real-time video translation
- Microsoft Edge now has AI audio translation for videos on Windows 11, but it needs 12GB RAM
- Microsoft Edge’s handy new feature will devour 12GB of RAM
(首圖來源:微軟)