致力開發 AI 翻譯的德國新創 DeepL,宣稱翻譯品質優於 GPT-4、Google 翻譯,讓這家公司擁有超過 10 萬付費客戶,估值達到 20 億美元。新推出的 DeepL Voice 解決方案,象徵公司正式進軍語音翻譯市場。
DeepL Voice 是 DeepL 首款支援即時語音互動的語音翻譯解決方案,同步提供 2 項產品──Voice for Meetings(會議語音)、Voice for Conversations(對話語音),讓跨語言的視訊會議和面對面即時翻譯成為可能,並以文字呈現、而非語音。
Voice for Meetings 可消除視訊會議的語言障礙,每位與會者可使用自己偏好的語言溝通,提升參與度,其他人則在螢幕上看到即時翻譯字幕。不過,目前唯一支援 Voice for Meetings 產生即時翻譯字幕的視訊會議服務為 Microsoft Teams,是否整合 Zoom 或 Google Meet 還沒有進一步消息。
Voice for Conversations 支援行動裝置,場景適用於面對面對話,透過即時翻譯字幕協助不同語言進行溝通,並提供 2 種字幕顯示模式,方便雙方在同一裝置查看翻譯內容。
DeepL Voice 進一步擴展 DeepL 平台上的語言與通訊工具套件,為了確保達到 DeepL 翻譯的高品質和準確度,全新語音翻譯技術採用多元資料訓練而成的 AI 模型,能夠處理不同的口音和環境,滿足商業應用所需。
DeepL Voice 全面推出下,企業客戶都能使用,初期支援英語、德語、日語、韓語、瑞典語、荷蘭語、法語、土耳其語、波蘭語、葡萄牙語、俄語、西班牙語及義大利語,未來將會陸續新增更多語言。此外,DeepL 翻譯器支援的 33 種語言均能提供字幕翻譯。
「DeepL 在書面翻譯領域處於領導地位,但即時語音翻譯是完全不同的挑戰」,DeepL 執行長暨創辦人 Jarek Kutylowski 指出,即時翻譯必須處理不完整的語音輸入、發音問題及延遲等因素,這些可能導致誤譯,影響翻譯體驗。這些挑戰在日常人際對話經常出現,容易導致誤解,因此 DeepL 一開始就有對此考量,設計出幫助企業跨語言溝通的解決方案。
「語音是明年翻譯的重點」,Jarek Kutylowski 接受外媒 TechCrunch 採訪表示。事實上,Google 逐步將即時翻譯字幕納入 Google Meet,還有許多 AI 新創公司也在建立語音翻譯相關服務,如 ElevenLabs 和 Panjaya 等。
DeepL Voice 的推出是 DeepL 首次進軍語音翻譯領域,將領先業界的翻譯品質和安全性導入對話交流。光是 2024 年,DeepL 推出 DeepL Write Pro 並更新詞彙表功能,也發表新一代大型語言模型,宣稱翻譯品質超越 GPT-4、Google 翻譯。此外,今年 5 月 DeepL 獲得 Index Ventures 領投的 3 億美元融資,公司估值達到 20 億美元,並入選富比士 2024 年雲端運算 100 強榜單。
(首圖來源:DeepL)