Mozilla 同聲計畫打開多語大門,壯大開源語音資料

作者 | 發布日期 2018 年 06 月 08 日 11:30 | 分類 市場動態 , 網路 , 軟體、系統 Telegram share ! follow us in feedly


致力推動網路平等、開放與自由的美商謀智(Mozilla),宣布其最大開源語音募集專案──同聲計畫(CommonVoice),將正式打開多語大門!從 8 日起,同聲計畫已開始收集德語、法語和威爾斯語的音檔,並緊鑼密鼓計劃在後續募集其他包含正體中文在內的 40 多種語系的語音資料

同聲計畫是 Mozilla 發起的史上最大開源語音募集專案,希望透過此一專案收集用於訓練語音辨識技術的聲音數據。自去年 7 月啟動計畫以來,Mozilla 已透過網站iOS 應用募集到數十萬筆的英語語音樣本。Mozilla 也在去年 11 月發表同聲計畫第一版資料集。這批語音資料的下載量至今已達數千次,並已用於開發商用語音產品、包括 Kaldi 在內的開源軟體,以及 Mozilla 自己的語音辨識引擎「深入語音辨識」(DeepSpeech)上。

目前,同聲計畫只接受英語音檔,但其目標是支援多種語言,以實現 Mozilla 促成語音技術更開放、便於使用和更具包容性的願景。因此,Mozilla 在過去幾個月間積極與在地語言社群合作,希望於當地推廣同聲計畫,以收集更多種語系和方言的語音資料。

在努力將專案網站在地化之際,這些社群還設計許多建立高品質語音資料集所須特點的語句,以供有意捐聲音的人誦讀和錄音。此外,他們還在各自的國家中推廣這個網站,建立起語音貢獻者的社群,藉此達成各語言音檔總收集時數的目標。

除了英文以外,同聲計畫現在也開始收集法、德、威爾斯語的語音錄音檔,並規劃另增 40 多種語言,包括正體中文、西班牙文、印尼文和俄文等大眾語言,以及使用者較少的菲士蘭語(Frysian)、挪威語和楚瓦什語(Chuvash)。弱勢語言往往不受現有商用數位及語音辨識服務重視,所以,Mozilla 認為有必要收集這些小語言的語音資料。有了資料以後,創業者和社群便有能量來縮短強勢與弱勢語言之間的落差。

同聲計畫開始收集多國語言的音檔,是極為重要的一大步。Mozilla 希望,這對語音辨識技術的整體發展是別具意義的重大進展。語音技術的民主化不僅能降低全球創新的門檻,也將降低取得資訊的門檻。對於傳統的資訊弱勢族群來說,如:視障者、未受教育者、兒童、年長者等,此一重要性不容小覷。

Mozilla 在打造全球最大的開源多語語音資料庫之際,很榮幸能獲得越來越多社群的支持。如果您想助我們一臂之力,歡迎您一起捐出聲音。您也可透過 iOS 應用來捐獻語音錄音檔。如果您想將您的語言納入同聲計畫和語音辨識科技,請造訪專案計畫的語言頁。若您所隸屬的組織也想參與此計畫,請與 Mozilla 聯繫。

您也可在論壇找到更多有關參與同聲計畫的資訊,也可在上面提問和與社群互動。

(首圖來源:Common Voice