自動翻譯 60 多國語言!聲調、口音、嘴型一步到位,Rask AI 的魔法從 Deepfake 開始

作者 | 發布日期 2023 年 06 月 04 日 11:00 | 分類 AI 人工智慧 , 軟體、系統 line share follow us in feedly line share
自動翻譯 60 多國語言!聲調、口音、嘴型一步到位,Rask AI 的魔法從 Deepfake 開始


「2018 年,世界開始談論 Deepfake,我就覺得好像有商業化的潛力。」Rask AI 創辦人 Maria Chmir 回顧 Deepfake 引起自身好奇心的原因。

Rask AI是一款AI影片語音翻譯服務,可以直接將一部影片翻譯為六十多種語言,還能讓影片中的人物變換嘴型、調整口音。舉例來說,任何講中文的影片創作者,都可以輕鬆地用Rask AI,讓影片中的人看起來就像是真的在講英文,而非僅是翻譯。Rask AI的客戶包含環球音樂等。

透過Rask AI的Deepfake技術,基本上演講、線上課程、企業培訓都不必再請翻譯,可以直接發布於全球市場。但事實上,Maria Chmir最初踏入這一行的原因,是為了拯救公司財務危機。

為了拯救圖片搜尋引擎Everypixel資金危機
Maria Chmir發揮人脈行銷Deepfake技術

Maria Chmir(見下圖)碩士原就讀廣告系,畢業後便理所當然地進入廣告公司工作,負責為公司開拓客源、經營與合作廠商的關係,2年後被挖角至圖片搜尋引擎Everypixel擔任產品經理,也無意間開啟認識Deepfake技術的大門。創業小聚配圖

(Source:Linkedin)

2017年,Everypixel開發AI技術,幫助使用者在各個圖庫平台上搜尋,而且能自動篩掉畫質差、構圖不佳的圖片,即便產品對於消費者來說十分方便,也被各大媒體報導,卻遇到一個棘手問題:無法賺錢。

公司想到了兩個解決方案:增加廣告服務、向投資人募資。前者需要增加大量平台流量,才能吸引企業購買廣告版位;後者則是因Everypixel從來沒有與投資人打交道的經驗,成功機率較微小。最後,Everypixel並沒有選擇其中任何一個方案,而是將希望放在第三個選擇:AI影像辨識服務。

Everypixel內部當時正發展一套功能,幫助使用者在上傳完照片後,為照片貼上標籤、自動新增文字描述,希望能夠藉此獲利,最終還是失敗收場。

當時剛上任行銷長的Maria Chmir就在思考究竟是哪個環節出了問題?

她發現Everypixel無法盈利的原因,是因為沒有用消費者的角度來看待產品,缺乏和消費者近距離互動、溝通,因此無法察覺消費者的根本需求,「這是一個矇眼的行業:你不會知道今天要製作哪些內容,也不會知道產品會被哪些消費者購買。」

正好在2018年,也是Deepfake技術越趨發達期間,Maria Chmir看到了比利時社會民主黨透過Deepfake技術製作的一段假川普影片,第一時間便想到這技術是否能為公司賺錢、商業化應用,於是針對Everypixel的另一項AI換臉工具Reflect尋找客戶,聯繫過往在廣告業培養的人脈,而這次總算成功,為公司增加許多收入。

眼見Everypixel終於開始賺錢了,公司高層決定重點發展Deepfake技術,為此成立一間新公司Dowell,並讓Maria Chmir兼任創辦人暨執行長的角色,專門為影視產業提供服務。

過了一年多的時間,Dowell走上正軌的同時,Maria Chmir的野心也越來越大,認為Deepfake具有更多可能性,促使她決定跳出來成立了Rask AI。

將Rask AI定位為教育科技!
Maria Chmir指出Deepfake技術3大發展挑戰

Rask AI是一個影片語音翻譯SaaS服務,如同Maria Chmir的願景,該服務全自動化,使用者只要把影片上傳、選擇指定語言,就能把影片自動翻譯為六十多國語言,而人物的嘴型、口音也會隨之而變。

目前分為2種費用方案,分別是基本版(每月49美元)和進階版(每月119美元),前者可翻譯25分鐘、後者有100分鐘的時間,如果影片時間較長,則每多1分鐘增加1美元。

有趣的是,Maria Chmir將公司定位為「教育科技」,期望透過Deepfake技術的力量擴大世界上所有內容的影響力,「我們正在打破語言障礙,使人們能夠學習新事物,或以母語觀看他們最喜歡的YouTuber。」

Rask AI的應用場景也不局限於影視產業裡,而是更加廣泛,例如幫助YouTuber、線上課程和國際企業的員工培訓課程翻譯,也正呼應了Maria Chmir多年前學到的教訓:「始終以消費者的角度打造產品」。

即便Deepfake技術得以讓歷史人物「復活」,她也補充Deepfake技術3大發展挑戰,第一,無法得知該人物過去的習慣行為、動作、情緒,「我們明白我們的觀眾往往不想創造某個英雄的外表,而是想要現人物的性格、本質、思維、言談舉止、情感。」

第二,光線容易影響Deepfake換臉技術的完整度,例如在很暗的環境下,就難以實現換臉技術;最後,則是容易吃官司,因此需要特別注意圖庫使用權限。

(本文由 創業小聚 授權轉載;首圖來源:網頁截圖)