Build 大會微軟展示多項語音智慧成果

作者 | 發布日期 2019 年 05 月 07 日 19:04 | 分類 AI 人工智慧 , Microsoft Telegram share ! follow us in feedly


微軟在 Build 大會,揭露智慧助理如何帶給人更好的生活。透過 Cortana 加 Bot Framework 實現的個人語音秘書,以及直接在 Build 大會會場的即時會議逐字稿系統,看到微軟在語音資料處理和轉換的能耐,將要逐步商品化進入大眾的生活。

Cortana 加 Bot Framework 製作的個人語音秘書功能願景,透過事前錄製的情境影片,人人都有的行事曆程式加上語音指令功能,而且不只是簡單辨識你說的話語,還能做出對應的後續行動。像是更改行程,原先的餐會確認誰會不會與會,並且確認後,自動完成邀請原先沒有在名單上的人,全部靠說話方式下完指令,就像董事長、總經理身邊的秘書,全部改由 Bot 處理。

儘管微軟影片中的語音秘書還是未來願景,Build 大會上隨著舞台上演講、展示人員的說話話語,Conversation Transcription 即時對話轉文字系統默默的運作,在螢幕上稍微延遲的時間差,即時出現台上人的話語語音辨識,以及轉換為文字。儘管仍有大約 5 秒鐘的差距,對於事後弄逐字稿,可說相當方便。

 ▲ 微軟的影片展示微軟 Cortana 和 Bot Framework 技術,能夠做到未來個人語音秘書,用語音排定和調整行事曆行程。

微軟為了取信大家,特地安排微軟人員現場示範唸一段含有專有名詞的話語。示範人員用一般電腦上的麥克風取音,一位唸了一段包括大量資訊技術術語的片段,一位唸包含一堆醫學相關術語的片段。結果均成功抓到對的字詞。

▲ Conversation Transcription 即時對話轉文字系統成功辨識專有名詞,如資訊與醫學相關的專有名詞。

微軟在語音辨識和智慧應用上有相當深厚的基礎研究,開發應用也相當注重人們的需求。微軟在 Build 大會火力展示,有未來技術願景,還有現在技術能做到的程度。目前 Conversation Transcription 處於 preview 狀態。

(圖片來源:微軟)