語音輸入新時代,Wispr 憑「理解語意」技術挑戰 Siri 與 Alexa 霸權

作者 | 發布日期 2025 年 11 月 30 日 11:00 | 分類 AI 人工智慧 , 新創 , 軟體、系統 line share Linkedin share follow us in feedly line share
Loading...
語音輸入新時代,Wispr 憑「理解語意」技術挑戰 Siri 與 Alexa 霸權

鍵盤其實是恐龍級古董,Wispr 共同創辦人暨執行長 Tanay Kothari 認為,是時候讓 AI 取代這 150 多年前設計的工具。

Wispr是總部位於舊金山的AI語音輸入新創,簡單來說,Wispr希望人們不要再盯著螢幕、用手指打字了,而是用自家語音轉文字AI應用程式Flow,靠說話輸入文字。

繼6月完成Menlo Ventures領投的3,000萬美元A輪募資後,Wispr本月又迅速追加一輪Notable Capital領投的2,500萬美元募資,估值到7億美元。

但語音輸入並不是新題目,甚至是超級擁擠的賽道,Wispr憑什麼獲得青睞?

語音輸入,是「不是辦法」中的「最好辦法」?

先釐清Wispr要解決的問題是什麼。

雖然我們習以為常,鍵盤其實不是最佳輸入工具。大腦誕生一段想法、準備手打鍵盤轉化成文字時,其實會遇到一些摩擦,包含要把口語變成有架構的句子、找到鍵盤按鍵、調整與修正等,都限制我們傳達思緒、意圖和指令給數位系統的速度。

Typing.com研究顯示,員工每天花費約五小時打字。如果這些時間可省下來?

最理想的方式是什麼?對Tanay Kothari來說,其實不是語音,而是有點科幻的解法:鋼鐵人。「我最一開始其實是想打造電影〈鋼鐵人〉的AI助理賈維斯」,Tanay Kothari笑說,理想是最好不用說話,直接將腦神經訊號轉換成文字,因此創業頭三年和共同創辦人暨技術長Sahaj Garg研發穿戴硬體裝置,不過硬體投入資源跟時長,讓Wispr最終還是放棄。

▲ Wispr共同創辦人暨執行長Tanay Kothari(左)和共同創辦人暨技術長Sahaj Garg(右)。

團隊決定轉向軟體試試,「但是轉成軟體平台,是高風險的賭注」,Tanay Kothari說,幾十年來,語音技術充滿炒作,真的有實際效果的產品卻是寥寥無幾,且競爭激烈程度相當高。

沒想到的是,Wispr產品Flow發表後,約20%使用者轉成付費用戶,遠高於一般軟體3%~4%轉換率,證明Wispr初步的產品市場契合度(Product-Market Fit,PMF)。

講話是講話,文字是文字

Wispr能在語音AI紅海成功的關鍵,跟產品設計哲學有關。和蘋果Siri、亞馬遜Alexa不同的是,Wispr不是單純語音轉錄為文字,還會理解語意,差異就是使用者不用再花時間去除贅詞、修文,或重新組織雜亂的思緒。

可回想過往使用語音輸入。說話時,我們總是有很多語助詞、停頓、重複贅字,或中途改變表達順序,以前語音輸入AI會忠實記錄一切,變成一段看不懂的句子,可是Flow能處理人類說話的「混亂」,產生乾淨、結構化的句子,如訊息試圖更改會議時間,傳統工具可能會轉錄成一串混亂的重複:「嘿Aaron,我們五點見,等等,不是,六點。」新語音工具能捕捉意圖並整理成:「嘿Aaron,我們六點見。」

▲ Wispr不只是單純語音轉錄為文字,還會理解說話的語意,使用者就不用再手動去除贅詞、修改。

所以Wispr團隊在意的指標,是「零編輯率」(zero-edit-rate)。

傳統聽寫工具或許會聲稱平均詞彙準確度達98%,但Kraning指出,即使有98%準確度,一則約80個詞(五或六句話)的長訊息,仍然有超過80%機率會出錯。相比之下,Wispr Flow已達成超過80%的零編輯率。數字仍持續改進,並遠優於競爭對手:Flow宣稱錯誤率約10%,明顯低於OpenAI Whisper的27%和蘋果原生聽寫功能的47%。

日常能用,比酷炫AI代理更重要

不過目前看下來,Flow只是技術,要變成收費產品,還需要更多設計,也就是成為能硬實際用到各個應用程式、後台運作的系統。

Wispr已發表Flow的Mac應用程式(2024年10月)、Windows應用程式(2025年3月)和iOS應用程式(2025年6月),且只專注人們每天重複許多次的任務,如寫信、回訊息、設置提醒、寫筆記等等。

▲ Wispr Flow只專注人們每天重複許多次的任務。

「用語音預訂Uber或航班,這類應用場景沒什麼用,因為是一次性頻率低的事件,資料量少、產品價值低。」Wispr共同創辦人Sahaj Garg說,Flow是日常使用工具,價值遠遠高於其他AI語音代理,數據顯示,使用者經Flow每天平均進行100次聽寫、輸入72%字元,且跨越近70個應用程式和網站。

目前Wispr營收以每月50%速度增長,且開始進軍企業,已與125家企業客戶簽付費合約,不過並未透露收費模式細節。

最新2,500萬美元募資,也是為了擴大市場佈局,包含推出Android應用程式的測試版、語音模型個人化、企業服務等等,不過Wispr技術也還有些挑戰有待克服,如Flow對背景噪音和口音的敏感度極高,還有忘記上下文問題,如用戶說話中途停頓,應用程式就會忘記前文。

AI時代,模型進步相當快,Flow能否成為這個領域的霸主,就要看Wispr接下來的速度了。

(本文由 創業小聚 授權轉載;圖片來源:Wispr)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》