分享

智谱爆红 AI助手从0到1 我们离“贾维斯”还有多远?

市场经济网
作者:纪伦
2024-11-02 1.87w

《科创板日报》11月2日讯(编写 宋子乔) “您好,贾维斯。”“随时随地为您效劳,老先生。”

漫威系列电影《复仇者联盟》中,不锈钢与AI智能管家贾维斯的互相调侃,呈现了一个高级智能体应该有的样子。

时下,大模型对复杂任务逻辑推理能力提高、视觉处理水平提高、计算机系统控制水平呈现,加上更流畅的人机交互,为高级智能论的发展趋势提供了更好的基本。

智谱AutoGLM为首AI助手专用工具,仅需接受文本/语音命令,就能模拟人类实际操作手机上、处理日常琐事,现阶段可支持微信、淘宝网、美团外卖、大众点评网、小红书的、高德导航、12306、携程网等App的常用跨网页页面实际操作,在购票、订外卖等场景下充足释放客户两手,这在资本掀起一阵硬件配置智能化系统热潮。

微软公司、百度等互联网巨头更是在想象科幻片变成现实的场景,致力于开发AI助手(AI Agent),让AI能自主实际操作手机上、像人一样进行繁杂的逻辑推理每日任务——

微软公司最近不张扬开源系统了AI专用工具OmniParser,它可帮助大家建立人性化智能体,以实际操作PC机;10月22日,微软公司宣布在Dynamics 365中集成化10个独立AI Agent,适用OpenAI全新实体模型o1,具有自学能力,可自动完成混合开发繁杂业务流程;9月,微软公司发布了一款名为Windows Agent Arena的标准架构,同样属于AI助手开发设计范围。

据The Information公布,谷歌搜索打算在12月浏览其大中型姿势实体模型“Project Jarvis”,此项目将帮助大家实行例如“搜集科学研究、选购产品或者订购飞机航班”等相关工作。

10月22日,Anthropic为大模型Claude迭代更新了特色功能——Computer Use,让AI能够像人一样操纵计算机。Claude3.5 Sonnet是首个适用计算机系统控制模型,可以模拟人类实际操作电子计算机,包含移动鼠标、点击图标和输入文本。

苹果公司会将Siri与ChatGPT集成化,完成更智能的人机交互技术,另网友发现苹果公司早已默默地发布Ferret-UI的两大完成版本号(各自根据Gemma 2B和Llama 8B),这也是苹果公司在今年的5月公布的一个可使AI了解手机屏的专业技术。

华为公司则发布了一项可使AI像人类一样实际操作手机上的全新科研成果,有关精英团队提出了一个手机控制架构设计:Lightweight Multi-modal App Control(轻量跨模态运用操纵,通称LiMAC)。

OpenAI也开源系统了多用途协作AI Agent——Swarm,可构建好几个智能体协调工作,以更加高效地完成每日任务。其GPT o1实体模型提升了逻辑推理能力,进而在繁杂问题解决和用户交互的原生性层面都有明显发展,亦使其更加适用AI Agent情景。

值得关注的是,前不久,OpenAI CEO阿尔特曼在一次互动交流采访中讲述了自己对AI助手的观点。在他看来,AI助手能像一个聪慧同事一样,和用户一起合作实施项目。阿尔特曼与此同时谈及AI助手定价——这项服务并不是按连接AI助手的个数付钱,而是基于解答问题所需要的运算量标价。

极大商业领域酝酿中

AI助手的使用场景包含B端与C端,可饰演谋士、大管家、委托代理人等多重角色。

做为个人助理,它能够进行日程提醒、记录查询、每日任务自动化技术;在制造业、货运物流、诊疗、教育等领域,根据主动学习和改进,AI助手可以实现视频监控系统、数据统计分析、业务流程优化、决策分析、沟通交流等高级功能。

对操作者来讲,公司可以用它实现降本增效,本人可以用它提升工作、日常生活高效率。

伴随着运用场景落地,更多的商业领域正在酝酿中。针对AI助手提供服务的提供者、配备AI助手硬件制造商、联接AI助手的使用方,一个新的运营模式有希望从这当中创造——

连接AI助手的手机可以不容易销售量更强?手机制造商就是选择自主研发AI助手或是连接第三方服务?与第三方进行合作的模式是什么?应该如何分为?当你需要购物,AI助手会打开哪一个电子商务平台?引流方法依据是什么?

产业链端,苹果公司、荣誉、三星等终端厂商最近开始发力、落地式根据AI助手科技的边端AI作用。在其中,前不久推出的荣誉Magic7系列产品先发YOYO智能体,华为荣耀CEO赵明对YOYO助手说了一句话,便取得成功提交订单2000杯咖啡。据了解,Magic 7系列产品配备的AI助手,其智能化水平达到L3级别,不仅可以进行帮助传文件、智能填表、购物比价等基本操作,而且可根据用户命令进行关闭自动扣费、选购健康饮品、整体规划旅行路线及购票等各项跨运用实际操作。

在硬件厂商言必称AI的年代,AI助手或成为终端设备智能的突破点。

广发证券表明,AutoGLM等终端AI助手技术性将产生较短路径的交互形式,接纳语音命令并自动执行繁杂操控的可能将为消费者提供极大便利,其跻身AI终端设备的一大亮点作用并吸引顾客更新换代。

国金证券还表示,AI助手是通往AGI的核心要素,AI助手落地式产生好几个层级的产业链机会,在其中,Agent+终端设备有希望促进人机交互技术转型,除开在终端销量价方面的变化外,很有可能对终端运用的运营模式造成更为深刻的影响。

此外,AI助手与具身智能化/仿生机器人、区块链技术、5G等设备将碰撞出怎样的火花?将如何帮搭建智能体社会与群体智能?各种问题一同变成了勾勒产业链蓝图的画笔工具。

沉醉于将来设想之际,更冷冰冰的难题立身时下:AI助手究竟有多少用途?

AI助手还没有那么“聪慧”

与Siri、爱酱助手、小爱同学、小度等“老前辈”对比,AutoGLM等AI助手确实更为人的本性¬¬¬¬化、回应更准确、能处理更为复杂每日任务、学习培训能力很强。

在其中,互动性、独立实际操作这两个闪光点让AI助手爆红,例如AutoGLM仅需客户一个嘱咐就可网上购物、订外卖、订高铁票,乃至发信息、领红包、评论朋友圈、整理笔记并形成攻略大全、汇总毕业论文。

但和人们期盼的“贾维斯”对比,这种AI助手的头脑是不够的用。以智谱AI为例子,抢鲜者呈现出的典型案例包含:

应该更精细化命令,不容易比较,AutoGLM给你购买的商品或许不是最优价格;无法很好地应对突发状况,如广告弹出等;可以打开的App比较有限,据统计,现阶段AutoGLM可兼容手机微信、淘宝网、美团外卖、小红书的、大众点评网、12306、携程网、高德导航共8款运用。

Claude的Computer Use存有同样的问题。一个有意义的案例是,某技术工程师应用该工具给一个团队订外卖,未找到实际要吃什么,接到任务的Claude只用1min入手了比萨,3个比萨共用掉95美金,一则网友调侃被推上第一条评价位:3个比萨95美金是违法犯罪。

这就意味着,虽然AI助手能够帮你省掉操作流程(开启App,选中网页页面),但是它不能完全主动地、“很好地”处理问题,客户仍然需要做思索、参与决策。

结束语:我们跟高级智能体中间依然存在很远的地方

技术层面难题需要一段时间处理,紧紧围绕AI助手落地式,还有一系列非技术性要素,例如数据隐私保护与安全隐患、自主决策的伦理困境、责任划分难题、优化算法成见与岐视等。

安全性是一个重要话题。为了达到更深度的实际操作,AI助手必须获取客户手机上的无障碍管理权限、和企业其他软件(如ERP、CRM)集成化,实现信息共享和协作。

个人隐私泄露的情况怎样避免?有着超自由的AI假如作出了错误行为,问题过错方到底是谁?

怎样在便捷和安全之间找到均衡,必将成为AI助手发展趋势务必面对的挑战。

助手
声明:市场经济网所刊载信息来源于网络,并不代表本站观点。本文所涉及的信息、数据和分析均来自公开渠道,如有任何不实之处、涉及版权问题,请联系我们及时处理。举报邮箱:scdzw_jubao@163.com