飞行者联盟-色综合天天综合-飞机模拟机_色综合天天色_无人机_色综合天天_低空经济_航空技术交流平台

飛行者聯盟 門戶 新聞資訊 模擬飛行 查看內容

你的榮耀手機學會「點屏幕」了,為什么笨 AI 也有未來?

2025-3-14 16:12| 發布者: 8Bobo8Jun 758 0

摘要: 在移動世界通信大會 MWC 2025 上,我們看到榮耀和訂餐訂位產品 OpenTable 做的一次演示:用戶用語音命令手機 AI 助理找家西班牙餐館訂個位,接著就看到手機屏幕被「接管」,一通自己操作。這個 MWC 版本的演示,其實 ...

你的榮耀手機學會「點屏幕」了,為什么笨 AI 也有未來?-8788


在移動世界通信大會 MWC 2025 上,我們看到榮耀和訂餐訂位產品 OpenTable 做的一次演示:用戶用語音命令手機 AI 助理找家西班牙餐館訂個位,接著就看到手機屏幕被「接管」,一通自己操作。

這個 MWC 版本的演示,其實和榮耀去年 Magic 7 Pro 發布會上策劃的那次「行為藝術」,是同一件事。

當時在深圳的發布會上,時任榮耀 CEO 的趙明指揮 AI Agent YOYO 打開美團。他的手沒動,而是 YOYO 自己在屏幕上點來點去,一家店點了幾十杯飲料,支付,循環到下一家,繼續點,再循環,重復操作——直到最后下單了總共 2000 杯左右。

一通操作過后,深圳發布會場地周邊的瑞幸門店紛紛「爆單」,門店咖啡師忙到崩潰,接到訂單的騎手更是在門店排起長隊。

這次效果顯著卻略帶荒誕意味的事件營銷,一定程度上讓公眾忽略了榮耀試圖展示的核心技術:「基于 GUI 的個人 AI 智能體」

時至今日,AI Agent 功能確實已經不新鮮了。而這個技術的關鍵點,在「GUI」這三個字上。

GUI 全稱 Graphical User Interface,圖形用戶界面。作為一個基于 GUI 的 AI Agent,YOYO 不再依賴傳統的 API 接口,而是有了一只虛擬的「手」,直接在代替用戶進行圖形界面操作。整個代行操作不在「后臺」,而是直接在「前臺」,在用戶的眼皮底下實時發生。

需要澄清的是:Magic 7 Pro 市售機型用戶的體驗可能會與發布會演示存在差異。據財聯社報道,當時現場演示用的測試機權限更高,能夠自動免密支付和循環點單,這才不停地點出了2000杯飲料。至少在目前,市售機型需要用戶明確告知點單細節(例如品牌、品名、杯型、溫度等),并且在支付環節需要用戶接管確認。

這個細節確實重要,但也不至于抹殺這項技術的存在意義。正相反,我們認為,「基于 GUI」是個很另類,很有趣,頗具試驗性的 AI Agent實現路徑。

AI Agent 交互的「前臺」新路


榮耀 YOYO 的核心是多模態模型,GUI 交互的本質是語言 視覺的理解。

你的榮耀手機學會「點屏幕」了,為什么笨 AI 也有未來?-9209

  • 自然語言處理 (NLP):理解「點一杯冰美式」的指令;
  • 屏幕狀態感知:識別當前界面中的內容,找到正確的按鈕、輸入框等界面元素;
  • 擬人化操作:像人類一樣點擊按鈕、輸入信息;
  • 循環操作:在新的界面中持續解析內容、定位和點擊界面元素。

關于 GUI 的操作部分,這最后一步具體是怎樣實現的,榮耀方面沒有明確透露。一種穩妥的猜測是:它能夠獲得手機的無障礙功能 (accessibility features) 或類似的底層權限,從而控制屏幕點擊事件。

這最后一步并不是什么難事,甚至比前面幾步都簡單得多。但除了此前智譜的 AutoGLM 等極少數之外,確實很少有其它第三方開發者和終端廠商在走 GUI 交互的路徑。

在過去,虛擬助理控制軟件和智能硬件的方式主要是通過 API 調用以及物聯網協議。這可以理解為一種純數字 (digital) 的通訊方式。

今年一月,谷歌在三星的指定機型上激活了基于 Gemini 2.0 的 AI Agent 功能。這次合作也是通過 API 或類似方式實現的(谷歌稱之為 Gemini 擴展),初期僅支持 Gmail、谷歌地圖、三星日歷、三星時鐘等第一方應用,以及 Spotify 等極少量第三方應用。

想要做到規模化,擴充支持的應用,需要開發者做一定量的 API 接入工作,同時也需要用戶許可使用 Gemini 擴展。

你的榮耀手機學會「點屏幕」了,為什么笨 AI 也有未來?-941


Gemini 控制手機演示 圖源:Google

谷歌依賴 API 調用后臺接口,而榮耀通過 GUI 模擬前臺操作,二者在實現邏輯上形成了明顯區別。后者的好處,在于可以規避 API 調用這一常規方式,繞過了其背后的商業博弈和數據成本,也可以更快、更容易地擴充支持的應用,實現規模化并改善用戶體驗。

成本是個關鍵問題。一方面是云服務費用,因為無論是 API 提供方還是調用方都需要運行服務器來進行操作。另一方面,通過 API 交換的數據也具有價值,因此具有更高數據價值的 API,往往收費也更高。

以美團舉例,其訂單服務在內的基礎 API 收費標準為每百次調用0.15元(前百萬次免費)。這還只是基礎類 API,如果涉及價值更高的管理類 API,調用收費提高到每百次0.3元,且無免費額度。

另外,API 的使用也暗含著一些隱性的商業競爭要素。調用方獲得了數據,同時也在向提供方發送數據,而不排除在特定條件下,雙方都不希望肥水流向外人田。

而在基于 GUI 的方案下,至少就目前的演示效果來看,榮耀既不需要向美團支付 API 費用,雙方也無需擔心數據的歸屬,包括與之關聯的隱私安全等問題。

AI Agent 只是在「模仿人類」點擊屏幕,多么原始卻有效的交互方式。

回歸模擬,返璞歸真


這種「返祖」式技術路徑,讓人聯想到谷歌在2018年推出的 AI 電話助手Duplex。

Duplex 的思路在當時同樣有點腦洞清奇:谷歌合成了一個 AI 語音,替用戶給餐館打電話訂位。這個 AI 語音聽起來并不生硬,甚至能夠模仿真人的口音、語速、語調,以及加入「嗯」、「you know」 之類的填充詞。

你的榮耀手機學會「點屏幕」了,為什么笨 AI 也有未來?-5962


Duplex 技術演示 圖源:Google

今時今日,AI 生成語音已經徹底「污染」了電銷和客服行業,讓人感到厭煩。但至少在當時,用頂尖的 NLP和語音合成技術,通過「打電話」這種模擬人類的方式訂餐,這種另類的,從數字到模擬 (analog) 的交互方式,確實令人耳目一新。

目前榮耀正在推進的基于 GUI 的 AI Agent,在我看來同樣屬于一種從數字到模擬的實現方式,用原始與先進相結合的思路,帶來了全新的可能性。

基于 GUI 不一定是實現手機 AI Agent 的最佳路徑,但不可否認它確實很有趣,甚至有點「硬來」的意思。
  • 對于用戶來說,使喚這樣的 AI Agent沒有學習成本,不需要研究提示語法;
  • 而對于第三方應用和服務平臺來說,也幾乎不需要額外的開發成本就可以接入。甚至反過來看,它們也無法拒絕被「接入」,因為壓根就沒有發生真正意義上的「接入」行為。至少以 Android 目前的沙箱機制來看,應用層不太能夠「抵抗」系統底層的行為。

基于 GUI 的 AI Agent,既是一種對傳統人機交互的致敬,也為 AI Agent 的落地和體驗提升,提供了一種降低門檻、提高兼容性的路徑。

有時候,最趁手的工具,真就只是一根干凈簡潔的大棒。

你的榮耀手機學會「點屏幕」了,為什么笨 AI 也有未來?-3339


大模型與人機交互結合,「笨」AI 也有未來


在今天用戶的主要需求場景上,有兩種 AI Agent。一種是高智商型,能夠解答復雜問題,完成困難的工作,比如 DeepSeek、Claude、以及前幾天大熱門的 Manus。這也是現在最流行最受關注的 AI Agent/Chatbot種類。

但我們同樣需要另一種懂事能干的 AI Agent,它對用戶的使用技巧沒有很高的門檻,用戶只要輸入一兩句簡單直白的命令,它就能理解,并且把各種并不復雜的事給辦好。

今天可以點外賣,將來它還能夠幫你掛機放置類游戲,給指定好友的朋友圈點贊,甚至自動把剛拍下的一張照片修改一下發到社交網絡。只要是用戶能做的,基于 GUI 的 AI agent一樣能做。門檻低,上限高,適應性強,用起來更順手,可能是這一類 AI Agent的主要特色。

這類選手不需要成為理解世界的大學者,只當好執行任務的工具人就足矣。

2013年的電影《云端情人》(Her),曾經賦予人們展開無限的遐想。當時也正值 NLP 技術大爆發,許多優秀的語音場景產品和技術涌現出來。一些研究者和從業者篤信,自然語言對話將會成為 AI 交流的最主流方式。

然而去年曇花一現的硬件產品 AI Pin,以及開發它的 Humane 公司越走越黑的路,不禁令人懷疑《云端情人》設想的烏托邦是否那般美好,語音究竟是不是 Chatbot/Agent的終極答案。

Humane AI Pin 圖源:Humane

進入觸屏時代,交互的門檻顯著降低,以至于幼兒也能輕松地掌握。按照 AI 開發者們經常采用的比喻,大模型們的「智力」也恰如兒童。那么讓 AI 通過觸屏界面學習人類行為,聽上去上還是很有希望的。

畢竟,你的伴侶不一定需要一首 AI 寫的詩,卻可能需要你按爛屏幕去搶一張周杰倫的演唱會門票。

前幾天 Manus 刷屏,再次佐證了我們曾做出的一個預測:大模型將成為智能手機新的操作系統,自然用戶界面 (Natural user interface, NUI) 將逐步替代現有的 GUI。

至少在目前看來,歷經半個世紀發展的 GUI 仍會是人機交互的絕對主流。不過,大模型與 UI 結合,對人機交互進行一次前所未有的重新定義,甚至成為新的操作系統——這樣的未來,的確越來越清晰了。

#歡迎關注愛范兒官方微信公眾號:愛范兒(微信號:ifanr),更多精彩內容第一時間為您奉上。

愛范兒|原文鏈接· ·新浪微博

路過

雷人

握手

鮮花

雞蛋

最新評論

返回頂部
主站蜘蛛池模板: 首页-浙江橙树网络技术有限公司| 净化工程_无尘车间_无尘车间装修-广州科凌净化工程有限公司 | 幂简集成 - 品种超全的API接口平台, 一站搜索、试用、集成国内外API接口 | 盘式曝气器-微孔曝气器-管式曝气器-曝气盘-斜管填料 | 郑州市前程水处理有限公司 | 专注氟塑料泵_衬氟泵_磁力泵_卧龙泵阀_化工泵专业品牌 - 梭川泵阀 | 加盟店-品牌招商加盟-创业项目商机平台 | 网优资讯-为循环资源、大宗商品、工业服务提供资讯与行情分析的数据服务平台 | 全温恒温摇床-水浴气浴恒温摇床-光照恒温培养摇床-常州金坛精达仪器制造有限公司 | 食药成分检测_调料配方还原_洗涤剂化学成分分析_饲料_百检信息科技有限公司 | 蔬菜清洗机_环速洗菜机_异物去除清洗机_蔬菜清洗机_商用洗菜机 - 环速科技有限公司 | 楼承板-开口楼承板-闭口楼承板-无锡海逵 | 银川美容培训-美睫美甲培训-彩妆纹绣培训-新娘化妆-学化妆-宁夏倍莱妮职业技能培训学校有限公司 临时厕所租赁_玻璃钢厕所租赁_蹲式|坐式厕所出租-北京慧海通 | 超细|超微气流粉碎机|气流磨|气流分级机|粉体改性机|磨粉机|粉碎设备-山东埃尔派粉体科技 | 网架支座@球铰支座@钢结构支座@成品支座厂家@万向滑动支座_桥兴工程橡胶有限公司 | 代理记账_公司起名核名_公司注册_工商注册-睿婕实业有限公司 | 垃圾清运公司_环卫保洁公司_市政道路保洁公司-华富环境 | 移动机器人产业联盟官网| 奥因-光触媒除甲醛公司-除甲醛加盟公司十大品牌 | 珠宝展柜-玻璃精品展柜-首饰珠宝展示柜定制-鸿钛展柜厂家 | 碳化硅,氮化硅,冰晶石,绢云母,氟化铝,白刚玉,棕刚玉,石墨,铝粉,铁粉,金属硅粉,金属铝粉,氧化铝粉,硅微粉,蓝晶石,红柱石,莫来石,粉煤灰,三聚磷酸钠,六偏磷酸钠,硫酸镁-皓泉新材料 | 点焊机-缝焊机-闪光对焊机-电阻焊设备生产厂家-上海骏腾发智能设备有限公司 | 苏州教学设备-化工教学设备-环境工程教学模型|同科教仪 | 玻璃瓶厂家_酱菜瓶厂家_饮料瓶厂家_酒瓶厂家_玻璃杯厂家_徐州东明玻璃制品有限公司 | 金联宇电缆|广东金联宇电缆厂家_广东金联宇电缆实业有限公司 | 实验室隔膜泵-无油防腐蚀隔膜泵-耐腐蚀隔膜真空泵-杭州景程仪器 电杆荷载挠度测试仪-电杆荷载位移-管桩测试仪-北京绿野创能机电设备有限公司 | 杰恒蠕动泵-蠕动泵专业厂家-19年专注蠕动泵 | 机器视觉检测系统-视觉检测系统-机器视觉系统-ccd检测系统-视觉控制器-视控一体机 -海克易邦 | 北京森语科技有限公司-模型制作专家-展览展示-沙盘模型设计制作-多媒体模型软硬件开发-三维地理信息交互沙盘 | 微量水分测定仪_厂家_卡尔费休微量水分测定仪-淄博库仑 | HYDAC过滤器,HYDAC滤芯,现货ATOS油泵,ATOS比例阀-东莞市广联自动化科技有限公司 | 企典软件一站式企业管理平台,可私有、本地化部署!在线CRM客户关系管理系统|移动办公OA管理系统|HR人事管理系统|人力 | 浙江宝泉阀门有限公司| 光栅尺_Magnescale探规_磁栅尺_笔式位移传感器_苏州德美达 | 钢骨架轻型板_膨石轻型板_钢骨架轻型板价格_恒道新材料 | 论文查重_免费论文查重_知网学术不端论文查重检测系统入口_论文查重软件 | 生物颗粒燃烧机-生物质燃烧机-热风炉-生物颗粒蒸汽发生器-丽水市久凯能源设备有限公司 | 精密交叉滚子轴承厂家,转盘轴承,YRT转台轴承-洛阳千协轴承 | 双吸泵,双吸泵厂家,OS双吸泵-山东博二泵业有限公司 | 威客电竞(vk·game)·电子竞技赛事官网| 书法培训-高考书法艺考培训班-山东艺霖书法培训凭实力挺进央美 | 刺绳_刀片刺网_刺丝滚笼_不锈钢刺绳生产厂家_安平县浩荣金属丝网制品有限公司-安平县浩荣金属丝网制品有限公司 |