音訊技術規格進步，為聆聽帶來更真實的感受

最近一陣子，聲學相關的產品在群眾募資（Crowd funding）平台驚豔市場，例如今年在群募平台 Kickstarter 上面，一下子就創下破 270 萬美元募資紀錄，主打提供虛擬實境音效的 OSSIC 耳機，這讓過去 10 年間進步緩慢、沉寂已久的聲音技術領域，突然變得熱鬧非凡。

以遊戲產業來說，現在最熱烈討論的則是「虛擬實境」（virtual reality）及「擴增實境」（augmented reality），尤其一款 Pokémon Go 的實境遊戲，在零星幾個國家上線第一周就突破千萬下載，玩家們搶著在實體世界裡跟兒時記憶中的口袋怪獸虛實互動…….。從 NEWZOO 的全球遊戲市場報告看來，所謂實境遊戲，雖然現在營收佔比仍非常小，但「虛擬實境」或「擴增實境」的體驗，未來將取代消費者與遊戲的互動方式。這個遊戲業轉變的時刻，正需要更真實、更包覆式、虛實整合的全景式聲音體驗。

另外，根據國際唱片協會（IFPI）的最新報告，串流音樂的成長驚人，2015 年比起 2014 年同比成長超過 45%，2015 年數位音樂的營收，更已經遠遠超越了實體唱片的營收，這象徵人們聽音樂的方式轉變，已經從過去下載音頻、或是實體唱片的形式，開始習慣只要在網上或是 App 按幾個鍵，就能夠享受音樂，但與此同時，使用者也開始希望，能用最簡單的方式就能享受過去需要複雜音響設備才能達成的聲音饗宴。

然而，在很多情況之下，產品因為造型的限制、使用的方式、以及造價，人們要擁有「環繞音響」百般困難，有的中低階手機甚至連錄音、放音功能都做不好，更遑論有好的聆聽感受。

這箇中最重要的原因就是，原來的音效巨擘杜比跟 DTS 想盡辦法，把設置成本跟進入障礙弄到難以跨越，加上大部分使用者覺得「有聲音就好」，並沒有去比較過聲音效能，都讓聲學工程師，在過去 10 年如同印象派畫家在工筆畫盛行的時代，處處掣肘施展不開。

舉個實例，想達到電影院的音響效果，體驗杜比或是 DTS 的編碼的環繞音效，需要安裝多達 64 個喇叭，還要有擴大機、多聲道解碼器，以及支援特殊編碼的影音內容，萬事俱備才能達成。所以除非家住在比佛利山莊或百坪以上豪宅，否則不太可能把電影院搬回家。就連要達到較普通的 5.1 聲道的家庭劇院效果，也等於要裝設 6 個喇叭，解碼器跟擴大機才可能達成。環顧一下家中客廳，能達成的人恐怕也不多。更何況現在大多數的串流影音網站上的內容，大多數沒經過多聲道編碼，這就意味著，就算費力裝好 6 顆喇叭，聽到的還是一般的聲音。

虛擬多聲道環繞音響技術

這讓許多研究「虛擬多聲道環繞技術」的公司應運而生，主要的目的是可以讓使用者透過兩個簡單的喇叭，便可以模擬享受沉浸式的劇院體驗。

先試想為何大家聽一般的喇叭不過癮、覺得普通？因為左耳會同時收到來自左邊，加上右邊喇叭所發出的聲音，另外一邊右耳也是同樣的情況，產生所謂的「空間串音干擾」（acoustic crosstalk）。

▲ 空間串音干擾示意圖。

如果能有效消除上圖藍色曲線的「空間串音干擾」就可以大大的提升音場細節，使得從前原本不明顯的聲音層次，能夠原音重現、甚至超越錄音室後製原本想提供的聲音定位感與豐富度。然而，要達成這個目標，需要在聲音被播放出來之前做出預處理，根據聲音在空氣中的傳播速度做精準計算，才能有效的形成一個聆聽的甜蜜區，這就是「虛擬多聲道環繞音響技術」。

▲ 聆聽甜蜜區示意圖。

位於台灣的 Embrace Audio Lab，正獨家開發出了 XROUND 音訊演算法，透過專利演算法，在僅有兩個喇叭的情境下，也能提供如同家庭劇院的環繞音響體驗，他們的訴求是不必安裝其他的應用程式，不必添購多餘的喇叭及耳機，不需繁瑣的安裝，只要連上他們開發的音效引擎 XPUMP 可以隨插隨用，相容性極強。

不管使用者習慣聽音樂的平台是 Spotify 或 Apple Music，看的影片來自於 Netflix、YouTube 或是樂視，或是任何遊戲應用軟體。XPUMP 音效引擎內建的 XROUND 的演算法，會持續不間斷的偵測並分析聲音中的每個微小元素，以十萬分之一秒的更新運算速度，時時偵測聲音細節，並即時分析、重組、提供動態音場最佳化設定，並實時與人耳的實際聽覺連結，即時重組成更豐富、更實境的聲音體驗，或達成劇院音場效果。

▲ 即時細節增強示意圖。

有別於以往的聲音增強技術，僅止於平面 2D 增強，XPUMP 可以達到球面 3D 音場增強，讓所有的樂器、人聲、配音、鼓聲、甚至腳步聲都躍然突顯，並且讓重現聲音的「方向性」，來提供身歷其境的感受，音場寬廣度可以達普通喇叭的至少兩倍以上。

▲ 球面音場增強示意圖。

以前，人們需要自行設定等化器（Equalizer），來調校音樂，XPUMP 內建的智慧演算法，能夠動態演算，自動生成最佳的調教效果，不需要再用手動設定。

▲ 動態等化器示意圖。

值得一提的還有，XPUMP 同時搭配「心理聲學」的原理的低頻增強演算法，讓原本沒有辦法供渾厚低頻的小型喇叭，那原來單薄的聽覺感受，變得渾厚又紮實。XPUMP 專門為喜愛音樂、影音及遊戲者打造，讓使用者不受時間、空間限制，都能擁有沉浸式的聲音全新體驗。

不只 Embrace Audio Lab 希望讓所有的人聽得更好，並打破過去杜比、DTS 音效高授權金的壁壘，其實，聲音技術可謂博大精深，同時需要各路英豪加入，此類技術的重兵所在地首推歐美，有許多大大小小的音訊演算法公司，都正努力為了讓消費者有更好的聽覺饗宴，不斷創新。

例如，美國長春藤名校普林斯頓大學應用物理系的 3D3A Lab，由 Edgar Choueiri 教授所帶領，具備專利的 BACCH 演算法得到了 Jawbone 的青睞，目前技術授權 Jambox 無線藍牙音箱使用。

Jambox 無線藍牙音箱，只要同時輕觸大小聲音量鍵，就可以聽到系統語音提示「Live Audio On」，也就是代表了 BACCH 演算法的開啟，原本聽感集中渾厚的聲音立刻轉變成鬆軟寬廣的感覺，音樂細節與音場層次定位感也得到了顯著的提升，小小的缺點就是低頻的份量在 Live Audio 的模式中稍嫌不足。

像是丹麥的 AM3D 音效技術，首度出現在軍事訓練、通訊之中，後來逐漸往消費性電子擴散，應用於許多電競耳機；位於加拿大的老牌音效公司 QSound，成立於 1986 年，知名歌手賈斯汀（Justin Timberlake）也於 2014 年加入 QSound 成為共同創辦人，QSound 提供了一個名 QXpander 的技術，也可以用虛擬多聲道的方式讓雙聲道的音頻變得更寬廣，原廠也大方地提供的技術展示。QSound 音訊技術的商業模式是與 IC 設計業者合作並且提供音訊演算法軟體授權。

在矽谷創業的 Ambidio，以新創之姿加入音效技術領域成績傲人，受到了亞洲首富李嘉誠、饒舌歌手黑眼豆豆、迪士尼與 Skywalker Sound Studio 的青睞，成為大家熱議的話題，他們主要訴求，正是把普通的筆電喇叭，透過他們的音效技術，變成百萬音響，同時訴求可以解密大腦，這也都是「虛擬多聲道環繞」技術的其中一種。

虛擬實境音效（VR 3D audio）

而關於「虛擬實境」音效，指的是讓秀才不出門，也能有親臨現場的感受。很具代表性的，是位於加州的新創公司 OSSIC，創辦成員來自於老牌的動鐵耳機公司 UE （Ultimate Ear 現已被羅技收購），他們開發出一款可以偵測使用者耳朵形狀，並且根據感測器探測結果，使用者的頭部大小、耳朵形狀，重新補償、並最佳化個人音場體驗的「虛擬實境耳機」。他們分別用 4 顆耳機單體，利用頭部轉換函數 HRTF 技術，讓使用者不管頭部怎麼動，音場定位都不會因此改變。

從錄音室軟體起家、擁有高度市佔率的以色列公司 Waves，跟 OSSIC 有著類似的切入點，也看到相同的商機，最近他們把過去給錄音師可以模擬 5.1 聲道喇叭混音工程，隨時隨地工作，不受限是否身處專業錄音室的軟體 Waves NX，簡化後提供給一般遊戲玩家。

Waves 的方法是開發一只小小的頭部姿態偵測器，能精準定位玩家的頭部姿態，訴求任何耳機只要裝上這個頭部姿態偵測器，就能夠模擬建構環繞音效，在 Waves 的特製 App 內播放音樂，就能有聽多聲道喇叭的實境感受。

這樣的虛擬實境音效，在遊戲與虛擬實境應用的重要性是，使用者可以更精準的掌握聲音互動的位置，並且做出最佳操控回應，達到「聽聲辨位」如反射般的速度。

同樣類型的產品，去年一間法國的新創公司 3D Soundlabs 的專案 NEOH 也提供了頭部偵測與音場定位的功能。但是，使用體驗難度在於：必須要在手機或是電腦等終端裝置安裝專用的影音播放軟體，或是遊戲與互動內容需要預先整合軟體開發包（SDK）。因為雖然「頭部偵測」的感測器可裝在耳機裡，但是影音內容的即時補償處理，還是要再連回電腦或手機的軟體運算，這讓使用起來會有點卡卡的，有一些先天限制。

不過，虛擬實境的音效應用，商機非常大，臉書收購的 Oculus Rift 到 HTC VIVE 以及 Sony PlayStation VR 目前都還沒有完整的聲音解決方案，但是虛擬實境的體驗，絕對是需要影音結合的一塊領域。

個人客製聲音科技 Tailored-made audio

另外有一小群人、也就是最了解耳朵構造專業醫療或研究人員，專門為耳朵量身打造的個人化的聲音科技。

非常具代表性的是「AUMEO Audio」是由香港中文大學的耳鼻咽喉─頭頸外科學系系主任，及 AUMEO 創辦人的工程團隊合作研發，由威爾斯親王醫院團隊協助做臨床測試。

AUMEO 訴求最佳化個人聽力的無線音效裝置，先透過手機 App 測試用戶對不同頻段的聽力，得知雙耳的靈敏度差異，然後手機 App 透過藍牙無線裝置調整輸出的音量，透過八段調音（equalization）的方式去補償個人聽覺感受，並且適用於市面上大多數的消費型耳機，他們 2015 年在 Indiegogo 群募到 30 萬美元。

這樣的裝置，能夠快速學習你的耳朵。解決大多數音樂發燒友，每個人左、右耳，對聲音頻率強弱的敏感度有些不同，使得裝置不如預期的落差，讓發燒友花費昂貴價格購入的音響，能得到最絲絲入扣的最佳音色，說實在還是挺有意思的。

除此之外，有一款叫 Revols 的神奇產品，當初看到在 Kickstarter 上的預購金額超過 250 萬美元，令人乍舌。他是一款藍牙運動耳機，看起來跟其他的藍牙耳機沒有什麼不同，不過 Revolve 所提供最神奇的功能，是讓使用者可以在數秒內，自己客製出符合耳朵形狀的「個人耳塞」，藉此功能可以得到最佳化的被動式隔音，隔絕背景雜音與外界干擾，並且能夠完整包覆用戶耳廓，在運動的當下能沉浸樂音中，完全不用擔心耳機會不小心脫落。

筆者猜測他們是使用「特殊的光敏樹酯」，一遇到光線，原本柔軟容易塑型的耳塞會產生韌度並且定型，這樣使用者就得到了完全符合自己耳廓形狀，並且獨一無二的耳塞式耳機，這讓從前只有最頂級的耳機廠才買得到，並且需要花費上千美元才有機會取得的「手工訂製耳機」，玩家們只要花五分之一不到的價格，就可享受。

能夠享受音樂的豐富細節與解析度，並兼顧無線與有線的使用方式，是身為耳機發燒友，夢寐以求的功能，唯一的小缺失，就是 Revols 外型稍微缺乏現代感，不過審美觀見仁見智，250 萬美元的預購額，已經證明了瑕不掩瑜。

雙耳錄製與人頭錄音 Binaural Recording

另外一種改善音場的方式，叫「雙耳錄音」。原理是什麼呢？就是利用一個假人頭，並且在假人頭雙耳的內部，各自安裝一個高品質的麥克風，這兩個麥克風收到的聲音，就像是真人親臨實境所聽到的音訊。

人腦之所所以可以聽音辨位，是因為左、右耳可以偵測音源傳達到耳朵的「音量差」與「時間差」做出定位判斷，搭配以聲波傳送到皮膚與組織造成的衝擊、折射與繞射最後由聽骨、聽覺神經轉換成微電訊號傳遞入大腦，人類就可以做出精準的判斷，正是所謂的「聽聲辨位」。這也是為何武俠小說中的主角總是能在被蒙眼之時，仍能夠迅速聽聲辨位，快速擊落毒針，或是打敗敵人。

早在近百年前、1920 年代美國康乃狄克州，雙耳錄音技術就已出現，那時候的技術始祖們，絕對不可能聽過「虛擬實境」這 4 個字。但卻開始用「雙耳錄音」的技術播送廣播節目。

可惜，當時的廣播只支援單聲道音訊，那我要聽兩聲道要怎麼辦呢？使用者必須擁有兩台收音機，一支聽左耳、一支聽右耳，可是當時候收音機很貴，所以這個收錄技術應用就難以普及，沉入大海了，直到現在將近一世紀後才又重新被大家熱烈的討論。

由於「雙耳錄音」近似完美的錄製符合人類聽覺收音系統內容，再輔以耳機傳送，所以雙耳錄製的影音內容提供了一種身歷其境的「沉浸感」，提供雙耳錄音的產品，從實驗室與錄音室等級到普通消費品都有，例如華語歌手歌林俊傑，就用了要價 8,000 美元的 Neumann KU-100 雙耳錄音設備，錄製了實驗專輯《和自己對話》。

▲ NEUMANN KU-100 雙耳錄音假人頭。

另外，Hooke Audio 也提供了無線雙耳錄音的耳機產品，有趣的是平時不錄音的時候，它是藍牙無線耳機，切換到錄音模式是則變成了無線雙耳錄音的產品，可以搭配 iPhone 甚至是 GoPro 使用，非常適合喜愛實境體驗記錄或壯遊自拍者、以及極限運動玩家來記錄單車、滑板、滑雪甚至自由落體跳傘實境，並分享給他們的粉絲。

只不過，雙耳錄音耳機體驗不方便的地方是，只有在「耳機聆聽」模式下才能得到完整沉浸音響感受，若用一般的喇叭，感受則相當有限。

總而言之，聲音是個注重「體驗」的產業，用文字形容再多「大絃嘈嘈如急雨，小弦竊竊如私語」，或「大珠小珠落玉盤」都不及親耳聆聽的震撼，

只是讓筆者欣喜的是，大家過去習以為常的聲音，終於也迎來一次革命性的改變的起點，不管虛擬多聲道環繞音響技術，虛擬實境的音效體驗、沉浸式的雙耳錄音技術、個人客製化音訊裝置，都有不同的創新及新產品，如雨後春筍般冒出頭，只願大家都能聽得更真、更好。

（本文作者為英霸聲學科技 Embrace Audio Lab 執行長李鵬，原標題為〈聲音科技的文藝復興〉；首圖來源：xpump）