多模態大型語言模型(Multimodal Large Language Model,MLLM)近來進展值得關注,然而通用領域的 MLLM 在解讀螢幕資訊和使用者介面(User Interface,UI)常常表現不佳。蘋果最新研究描述該公司如何開發「Ferret-UI」,是一種專門用於理解手機螢幕畫面的 MLLM,預期可為未來更強大的 Siri 提供動力。
蘋果提出多模態大型語言模型 Ferret-UI,有望強化 Siri 能力 |
|
作者
陳 冠榮 |
發布日期
2024 年 04 月 12 日 17:16 |
分類
AI 人工智慧
, Apple
, 會員專區
| edit
Loading...
Now Translating...
|
多模態大型語言模型(Multimodal Large Language Model,MLLM)近來進展值得關注,然而通用領域的 MLLM 在解讀螢幕資訊和使用者介面(User Interface,UI)常常表現不佳。蘋果最新研究描述該公司如何開發「Ferret-UI」,是一種專門用於理解手機螢幕畫面的 MLLM,預期可為未來更強大的 Siri 提供動力。
文章看完覺得有幫助,何不給我們一個鼓勵
