有了 AI 後,成熟手機應該會自己做事了吧?

作者 | 發布日期 2023 年 12 月 26 日 8:10 | 分類 AI 人工智慧 , 自動化 , 軟體、系統 line share follow us in feedly line share
有了 AI 後,成熟手機應該會自己做事了吧?


雖然我們習慣用手機打上下班卡、聯絡、處理文書等,很多人還是會偶爾感慨,科技都這麼發達了,手機就不能自己做好這些事嗎?還真的,以上那些可能不用多久就不需要我們親自動手了。

騰訊近期聯手德州大學達拉斯分校團隊在Arxiv發表〈AppAgent: Multimodal Agents as Smartphone Users〉論文,介紹AppAgent多模組模型應用。論文表示,AppAgent會學習使用者習慣,自動執行各種操作。

它能模仿用戶語氣社群媒體App發文,以用戶慣用語寫信,還會修圖、導航、評論影片,甚至用購物App買東西。

AppAgent操作分成兩階段,稱為探索和部署。探索階段,AppAgent觀察不同應用程式使用者互動,像牙牙學語的孩子,只要充分觀察,AppAgent就能熟悉使用某應用程式,知識會精心整理成文件,放入AppAgent知識庫。

學習階段完成後,AppAgent就能自己行動了。它能處理任何支援應用程式操作任務,有條不紊完成不同應用程式各種複雜任務。

騰訊測試過Temu、Gmail、X、YouTube等十款App,確任50多種任務都可執行。開放測試後,AppAgent也會學到更多App操作方法,讓不同族群使用。騰訊舉例為叫AppAgent用Gmail寫信,只見AppAgent輕車熟路打開Gmail,找到聯絡人,洋洋灑灑寫完信發送,全程都不需要人類動手。

這聽起來很酷,有了AppAgent,一些繁瑣功能就能用AI完成,對許多上班族來說,AppAgent也能用手機打上下班卡,再也不用擔心忘記打卡錯失全勤獎。AppAgent也解決Android用戶無法用Siri回覆訊息,只要之後開放語音接口,就能解放雙手,動動嘴就讓手機自己回覆訊息。

AppAgent公開後,不少人對此很感興趣。也有些用戶感慨AppAgent很酷同時,擔心起使用場景:「這可能是雙面刃,提高工作效率同時,也能操縱社群媒體」。

還有人擔憂個資安全。

這些擔憂都有道理,畢竟誰也不能確保AppAgent會否讓手機自己執行任務,到時一覺醒來發現手機清空結帳購物車了,恐怕很多人會覺得這是場惡夢。

(本文由 品玩 授權轉載;首圖來源:Created by Freepik