在人工智能技术的推动下,智能体(AI Agent)正迅速发展并被众多厂商布局。
近日,vivo在其2024开发者大会上推出了名为PhoneGPT的手机智能体,是手机中可以基于用户意图主动完成任务的多模态助理,它可以准确地识别手机屏幕界面中的内容,自动操作手机中各种各样的应用,完成用户交代的任务,比如打电话、短信等。
事实上,2024年,越来越多的手机厂商开始频繁提及手机智能体相关概念。
2024年9月,荣耀在2024德国柏林消费电子展上发布跨应用开放生态智能体。再早之前的6月,华为也在其开发者大会期间宣布了“鸿蒙原生智能”(Harmony Intelligence),小艺升级为系统级智能体。
谈及手机厂商布局智能体的相关动作,IDC中国研究经理郭天翔分析,各厂商对于AI布局更多地从落地使用场景出发,而不是单纯地提升之前手机上一些功能的使用体验。未来除了智能体使用功能的丰富,更多还是会往每个用户的个性化AI助手方向发展。
智能体涌向终端
智能体是一个能够感知环境并作出决策以实现特定目标的实体。在人工智能领域,智能体通常指的是能够自主执行任务、学习、解决问题、作出决策的软件或硬件系统,通常具备反应性、主动性、社会性、交互性以及适应性等特性。此前,不仅是谷歌、亚马逊,还有国内的百度、阿里、腾讯等都已布局了智能体赛道。而智能体技术也在快速发展并逐步落地到各种终端设备中。
据vivo方面介绍,PhoneGPT可以代替人自动完成任务,具备完整的认知、决策、执行和记忆的能力,可以在懂人的基础上自主决策,并去解决一些复杂的任务,将人从琐碎的事务中解放出来。
在演示中,蓝心小V不仅可以对屏幕界面进行识别和操作,也可以通过接管音频进行自主对话,以完成用户交代的任务,例如帮助我们去订餐厅、订咖啡、买电影票等。
vivo AI全球研究院院长周围表示,PhoneGPT是主动智能,而主动智能是需要训练的,训练完之后它能像人一样操作手机。
除了vivo,之前也有不少手机企业已提及手机智能体相关概念。
2024年9月,荣耀发布了跨应用开放的生态智能体——荣耀AI Agent,并透露荣耀AI Agent将在下一代旗舰手机荣耀Magic7系列上落地商用。用户只需要简单一句话对荣耀语音助手YoYo发出语音指令,它就可以自动检查支付宝和微信的自动续费项目,一键关闭自动续费。其也能实现一键点饮品、一键旅行规划与订票等。
华为方舟实验室此前发布了盘古智能(23.570, 0.66, 2.88%)体框架(Pangu-智能体),展现了其在智能体领域的研究和布局。小艺智能体也能理解用户的意图,规划多步骤任务,并跨多个应用来执行。
2024年年初,OPPO 推出了“1+N”智能体生态战略,由AI超级智能体和AI Pro开发平台组成。OPPO超级AI智能体能够准确理解用户意图,基于庞大的模型库和识别能力给出精准结果,并形成记忆习惯。10月17日,OPPO AI 中心产品总监张峻在2024 OPPO开发者大会(ODC 24)上表示,智能体成为服务生态中一个新的发展方向,可以提供更加自然的交互方式,也可以提供更加符合用户偏好的个性化服务模式,同时可以自动化执行指令。为此,AI将重构开发范式,OPPO宣布OPPO智能体平台正式上线,是手机厂商中的首个智能体开发平台。
从交互方面来看,在传统的交互模式下,应用程序通常是被动的,需要用户点击才能提供相应的反馈。随着AI智能体的出现,交互变得更加主动和智能,能够根据用户的行为、偏好和上下文来预测需求,并主动提供相关的信息或服务,在AI智能体和隐私受保护的服务推荐引擎的推动下,这将显著提升用户的互动体验。此外,目前来看手机端的智能体更多是集成在系统层级去打造,比如华为的鸿蒙是AI原生系统,vivo的OriginOS 5是系统层级的AI,荣耀AI Agent交互方式也是从系统层级去打造的。
朱嘉弢表示,自2023年以来,我们看到落地在手机的AI功能展示更多是文生图、AI消除、搜索、翻译等,使用率不一定高,且很多都是依靠云端大模型实现的。消费者感知并不强,这也是厂商不得不从系统层面布局智能体的重要原因。
App服务变革
周围提到,vivo的PhoneGPT将带来类似自动驾驶般的智能体验。荣耀CEO赵明则认为,荣耀AI智能体将开启手机自动驾驶时代。
注意到,多家手机厂商对其智能体的描述中都提到了类似自动驾驶的概念,不仅能理解用户需求,并执行任务,还能帮助用户去做App之间的复杂交互。
2024年年初,行业就设想未来AI Agent成为用户私人助理的同时,而这可能会取代手机里的一个个App,或者至少不需要用户再一个个点开App了,从而改变手机,(未来用户可能)只需要一个平台。
而智能体落地手机或也将使得用户行为流量导向发生变化。
在传统智能手机模式下,App通过智能手机平台,直接为用户提供服务,用户支付的大多数费用和流量归App应用,手机只能获取一些App应用预装和使用分发费。而AI时代下,由智能手机(智能体)直接服务最终用户,App为智能手机提供服务,手机的重要性增加,手机将完全直接对接用户,App将变成toB端服务手机的服务商。
vivo AI系统中心高级总监熊官敬举例道,PhoneGPT是多模态的,简单一个订餐的场景,它不仅能点击屏幕,找到用户需要的内容,还关掉了中间的广告,与店员进行对话,同时完成了用户交代的任务。
“自主性(Autonomy)是智能体的核心特征之一,当其觉得当前弹窗与用户的需求任务并不相干时,会把它关掉。”熊官敬也提到,由于AI能直接将广告关掉,目前的确也看到一些App平台并不十分愿意接入。
郭天翔表示:“如果这样发展,肯定会遇到App开发者极大的阻力,而且现在手机厂商的主要盈利来自互联网收入,硬件利润很低,手机如果取代了App,那互联网收入就会减少,而如果手机厂商直接向用户收费的话,势必会改变用户的消费行为,也会遭遇阻碍。”
不过,在郭天翔看来,未来手机智能体并不会完全取代App,而是作为一个开发平台,手机厂商从系统底层与App开发者共同合作,一起服务于消费者,互利共赢。
技术仍不成熟
Canalys 预计,智能手机厂商至少有三个商业模式/产品发展阶段:AI即功能、AI即服务和AI即界面,这取决于每个厂商的资源和战略选择。其中,智能手机厂商开发全新的原生AI用户界面(如个人AI 智能体)作为连接多个应用程序、服务和第三方AI智能体的可信门户,厂商可以根据其AI智能体的能力实现差异化,从而提高用户忠诚度和黏性,并突破传统的智能手机UI或操作系统限制。由于这些 AI智能体是根据每个用户的决策序列、记忆长度和其他上下文信息进行训练的,因此用户更换品牌的成本会更高。
朱嘉弢说道,在智能体技术趋势下,众多App会通过厂商所属的智能体进行交互,相当于智能体把控了流量入口,未来也可能成为厂商布局端侧AI实现商业盈利的一种模式,手机厂商也想抓住AI流量的接入口,目前看到的手机厂商与互联网厂商打通的一些AI功能算是初步阶段,但是谁都不会把流量端口拱手让出,仍需要一些时间进行博弈、发展。
手机智能体落地目前也存在一些落地难点。
熊官敬说,其一是响应速度问题,“我们尽量在做前端化,但前端化带来的问题就是智能体每执行一步,用户就需要等两秒,可能会觉得很慢,这需要与行业、各方用户有一个体验平衡的过程”。
其二是准确问题,目前每一步的准确率都是95%,但是对于一个复杂型任务,有时候需要十几步或二十几步才能完成,综合下来成功率可能就相对低一些,只有80%多,但因为这是一个开创性的技术,所以vivo还是想把它标准设得再高一些。
“就从技术成熟度、监管成熟度和消费者的体验都还没有做好准备,我们其实特别担心它就是完全的自动驾驶。”其三是来自监管和行业难点,这是一个全新的自动驾驶技术项目。熊官敬表示,监管层面如何定义?行业对这件事情的反响是怎么样的?vivo也要看发布后市场各方的反应,对消费者而言,vivo可能会以类似测试版的形式尽快给大家去体验和尝鲜,前期不会是一个非常大规模的放量,什么应用都支持。