实测智谱新智能体AutoGLM沉思:跨平台“边想边干”破信息壁垒,免费不限量开放

内容摘要图片来源:视觉中国蓝鲸新闻3月31日讯(记者 朱俊熹)3月31日,大模型独角兽智谱AI在中关村论坛上正式发布全新智能体“AutoGLM沉思”。据智谱介绍,该智能体具备深度研究能力(Deep Research),同时还能实现实际操作(Oper
图片来源:视觉中国

蓝鲸新闻3月31日讯(记者 朱俊熹)3月31日,大模型独角兽智谱AI在中关村论坛上正式发布全新智能体“AutoGLM沉思”。据智谱介绍,该智能体具备深度研究能力(Deep Research),同时还能实现实际操作(Operator),推动AI Agent进入“边想边干”的阶段。

智能体一直是国内外AI公司竞相押注的方向。本月初,中国初创企业Monica发布智能体产品Manus,称其为“全球首款通用Agent”,引发科技行业热议。OpenAI也于2月推出deep research(深度研究)功能,通过智能体对复杂任务进行多步骤研究,在数十分钟内做到人类需要数小时才能完成的工作。

智谱CEO张鹏在中关村论坛的演讲中表示,“智谱很早在布局AI Agent,甚至早过海外的OpenAI和Anthropic。”自去年10月起,智谱陆续推出能模拟人类操作手机、计算机等电子设备的智能体,支持跨应用操作,一句话让AI帮忙发微信红包或下单采购外卖。

据智谱介绍,最新的AutoGLM沉思是国内首个正式开放给所有用户的deep research类智能体功能。除deep research能力外,AutoGLM沉思还具备实际操作能力,能够主动行动。智谱称,这一能力的实现依赖于三个关键特性:一是深度思考,模拟人类在面对复杂问题时的推理与决策过程;二是感知世界,像人一样获取并理解环境信息;三是工具使用,像人一样调用和操作工具,完成复杂任务。

“此次发布的是preview版本,核心是以research类场景为主。在未来的两周时间之内,我们将进一步扩展更多的agent场景和执行的能力。”张鹏介绍称。

在实测中,蓝鲸新闻向AutoGLM沉思测试版提出这样的prompt:我最近在研究AI Coding(AI编程)领域,帮我整理一份行业报告,要包含国内外主流的AI Coding工具。

AutoGLM沉思会先对用户的请求进行拆解,再逐步执行研究计划。该智能体的操作过程贴近人类的行为方式,会跳转打开Cursor、Windsurf等AI编程工具的官网。浏览网页并收集相关信息,整合到最终生成的研究报告中。

图片来源:AutoGLM沉思实测

蓝鲸新闻发现,AutoGLM沉思通过浏览器插件的方式实现对网页的调用。如果用户此前未登陆相关官网,智能体在执行任务时会受阻,需要用户介入,等待手动确认。或者它也会主动调整搜索策略,转向其他信源来获取详细信息。

图片来源:AutoGLM沉思实测

相较而言,当通过Manus执行同一任务时,虽然Manus也会主动浏览不同AI编程工具的官网,但仅体现在对步骤的简要描述中,不会像AutoGLM沉思一样弹出浏览器页面。

图片来源:Manus截图

通过模拟人类浏览网页的方式,智谱的智能体AutoGLM沉思能够突破各平台间的“信息壁垒”。以制定一项旅游计划的任务为例,Manus等产品参考的是互联网上能被抓取到的公开信息,而AutoGLM沉思可以触达更多相对封闭的内容生态,包括小红书笔记、知乎、哔哩哔哩视频等,提供更优质的信息来源。

图片来源:AutoGLM沉思实测

从用户体验来看,Manus运行在独立虚拟机中,执行任务时可以关闭其页面,不影响它在后台继续保持工作。当用户提出任务请求后,Manus会补充提问以进一步确认需求细节。用户也可以随时发送信息,对任务进行修改、补充或要求停止。

图片来源:Manus截图

而智谱的AutoGLM沉思在任务进行过程中,不支持对任务进行修改或开启新对话,否则会直接终止任务进程。AutoGLM沉思跳转打开的浏览器页面虽然可以小窗化,但必须全程保持在线,且用户难以直观判断任务的进度条。智谱表示,之后计划推出“虚拟机”版本,进一步增强AI Agent的实际落地能力。

图片来源:Manus任务进度

智谱称,AutoGLM沉思向用户免费、不限量地开放体验。OpenAI的deep research功能需要用户每月至少付费20美元。Manus也在3月28日公布了其收费方案:Manus Starter每月收费39美元,获得3900积分;Manus Pro每月收费199美元,获得19900积分。

积分是Manus使用的标准计量单位,任务越复杂或越耗时,所需积分越多。以蓝鲸新闻实测的任务为例,生成一份关于AI编程的行业报告需要花费23分钟,消耗456积分。而生成旅游计划需要17分钟,消耗197积分。

智谱表示,AutoGLM沉思的背后,融合了新版基座模型GLM-4-Air-0414的通用能力、全新深度思考模型 GLM-Z1-Air的反思能力、沉思模型GLM-Z1-Rumination,以及AutoGLM的自动执行能力。其中核心链路的模型和技术,预计将于4月14日正式开源。

新版GLM-Z1-Air在性能表现上可媲美DeepSeek-R1。其推理速度相比R1提升了8倍,成本可以降低至1/30。基于GLM-Z1训练出的沉思模型GLM-Z1-Rumination,能通过更长的深度思考时间来换取更优的效果,突破了实时联网搜索、动态工具调用、深度分析和自我验证。

“相比于传统的推理模型,我们期待沉思模型引领AI助手进入一个‘高智商’到‘高智商+高自主’的阶段。”智谱称。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1