AI 時代,語音會成為主流互動方式嗎?

作者 | 發布日期 2024 年 10 月 09 日 7:50 | 分類 AI 人工智慧 , 科技生活 , 網路 line share Linkedin share follow us in feedly line share
AI 時代,語音會成為主流互動方式嗎?


語音互動漸漸成為生活的一部分。

十年前,如果開口和手機說話,會覺得非常奇怪。十年後,人們每天都對手機說話,還是深度交流。五年前筆者看過全智慧電鍋,說使用者可和電鍋對話,告訴它什麼時候煮好飯,筆者當場頭上冒出上萬個問號:「它煮飯,誰要放米進去?我為什麼要和電鍋說話?」

今天雖然有些差異,但已習慣在家叫智慧音箱開電視、設置掃地機器人工作時間。不得不承認,4G 洪流來臨時,主打語音的微信抓住了行動網路紅利,飛信沒落當然有原因。小拇指的繭見證人與手機互動轉變,語音則努力搶奪人機互動的話語權。

從鍵盤到觸控螢幕,再跳出螢幕

iPhone 風靡全球前,市場並不缺觸控螢幕手機。Nokia、Motorola、BlackBerry 等企業將實體按鍵手機做到登峰造極,造就手機史上最璀璨的篇章。實體按鍵是手機標配,有非常明顯的優勢:精確、可盲打、可替換。這些優勢如今依然在其他設備出現,即使品牌試圖將手機打造成純粹一體成型產品,也跳不出實體按鍵束縛。

只是蘋果將觸控螢幕優點無限放大,還搭配自然操作方式:左滑右滑上滑下滑,當然也能點擊,甚至重重按下去。蘋果為觸控螢幕賦予符合直覺的豐富操作方式。儘管大家都覺得 iPhone 是觸控螢幕手機開創者,但也花了近三年最佳化系統,讓這個當時異類更好用。某種程度看人類很懶,科技發展讓人類更懶,故使用者自然選省力、不費腦的路,就和現在短影音風靡全球一樣。

站在互動邏輯角度,觸控螢幕跳出硬體固定位置,讓手指隨心所欲在螢幕上滑動。就像 PC 時代滑鼠剛出現時,用戶能「所見即所得」操控,軟體要做的,就是為搭配合理的操作 UI。

螢幕越來越大是另一個趨勢。人們總是追求更大螢幕,甚至更多螢幕。凱文‧凱利著作《必然:掌握形塑未來 30 年的 12 科技大趨力》提到「螢幕讀」,即任意表面都能是螢幕,螢幕會越來越多,現在看來,預言正在成真。充斥生活的科技產品螢幕越來越多,就連智慧汽車也在比誰的螢幕大、誰螢幕多。於是新問題出現了,當螢幕越來越多、越來越大,該如何與它們互動?

烽煙傳訊,聲音遙控

人與螢幕互動範圍受人體影響,即手有多大,就能涵蓋多大手機螢幕。賈伯斯曾說手機黃金尺寸是3.5吋不無道理,那是正常人手掌平均蓋住螢幕的大小。現實手臂與螢幕距離也決定能否直接操作。雖然電視有遙控器,但智慧音箱不可能都有遙控器。

遠距通訊,古代有烽煙,今天有智慧語音,尤其 AI 時代。語音互動優點顯而易見,在家聲控智慧家電,上車聲控智慧汽車,躺在床上,也能對手機發一堆語音指令。這符合科技發展規律,畢竟人就是這樣變懶的。

其次,語音對話是最基本交流。文字出現前,人類就有豐富語言系統,即時通訊軟體高度發展的今天,更可以不打字就和千里之外的親友聊天。以往覺得與手機對話很奇怪,是因沒有實體對象,但即時通訊軟體讓我們習慣對手機說話,如 ChatGPT 的 AI 語音助理又有聊天功能,人與手機對話變成現實。

從技術角度說,加入 AI 的自然語義辨識更擬人化,AI 語音助理能接收結合背景、分析全部對話,並提出答案。科技越進步,終端運算能力增強,從語音指令到設備回答,間隔會越來越小,無限接近人與人自然對話。這樣才會出現發表會對電腦喊計算表格,半天沒有結果這場景。

語音是成本最低互動

語音互動已有數十年歷史,從單字辨識到現在複雜語境,甚至推測,技術角度看,語音已做好登台準備。對用戶來說,語音互動成本最低,因很直覺,即時回應,沒有學習門檻。人機互動領域,也能跨設備、跨系統、跨距離,幾乎無處不在。

AI 時代真正來臨前,德勤就發表《德勤互動式人工智慧白皮書:互動式人工智慧正在重塑人機互動》報告說「隨著科技發展,語音互動將在更多領域展現價值,成為人機互動的重要方法」。

邁過違和感、技術門檻及普及率三大關後,語音互動無疑潛力極大,改變人類與設備機器互動方式,尤其手機。蘋果從 Siri 到 Apple Intelligence,描繪碩大 AI iPhone 藍圖。從鍵盤到觸控螢幕,再到跨空間高效語音互動,人機互動時代即將翻章。

(本文由 品玩 授權轉載;首圖來源:shutterstock)

想請我們喝幾杯咖啡?

icon-tag

每杯咖啡 65 元

icon-coffee x 1
icon-coffee x 3
icon-coffee x 5
icon-coffee x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0
《關於請喝咖啡的 Q & A》