首页 > 科技快讯 > GenFlow2.0要来了,这可能是一个和所有Agent都不同的产品

GenFlow2.0要来了,这可能是一个和所有Agent都不同的产品

本文来自微信公众号:APPSO (ID:appsolution),作者:WAIC 在现场的,原文标题:《GenFlow 2.0 要来了,这可能是一个和所有Agent都不同的产品|WAIC2025》

从OpenAI、字节跳动,到一众创业团队,今年几乎所有AI公司都在推进自己的Agent战略:有人做工具执行器,有人做工作流代理,有人主打插件调度,有人想做全能副驾……

在这场尚未定型的「Agent大战」里,百度也选择了自己的切入方式,从内容创作工具出发,用一个更「擅长干活」的智能体系统来回应实际用户的使用场景。

在今年的WAIC 2025上,百度文库预告了全新升级的GenFlow 2.0,一个打包了模型调度、多智能体协作、主动干预与全链路内容交付的「通用Agent平台」。

它的出现,标志着「AI帮你干活」这件事,正式进入了协作化、多模态、高并发的新阶段。

相比于4月份发布的GenFlow 1.0,百度文库这一次将战线拉到了「通用智能体操作系统」的高度,不仅能接住你的模糊指令,自主调用各种模型和数百个多模态Agent,更是提出了一个极具野心的目标。

一个入口,N种模式,无所不能」。

目前,GenFlow 2.0还未正式发布,APPSO获悉预计将于8月面向全体用户开放。

GenFlow 2.0的关键升级点:六种模式切换

从百度的设计理念来看,GenFlow 2.0想解决的不是「AI不够聪明」,而是「AI不够协作」。

在用户侧,它提供了一个统一的入口,用户只需输入一句自然语言指令,就可以由系统自动规划任务,调用不同类型的Agent同步执行,生成PPT、报告、网页、动画、图表等多模态内容。

官方将这种方式称为「通用多智能体协作调度」,强调每个子任务由不同Agent并行完成,而不是一个大模型串行处理所有请求。

这种架构思路在此前的GenFlow 1.0中已有所展现,新版本则进一步引入了更细化的协作模式。

你可以把它想象成一个AI协作团队,有人做内容,有人做图表,有人做排版,有人懂你的过往历史,还有人给结果「擦屁股」做最后润色。GenFlow 2.0就像是在操作一整个内容流水线。

这背后依赖的是百度文库最新上线的沧舟OS+MCP模型调度系统,为多模态Agent的并发与高效协作提供了基础设施。

最基础的是简单模式,用于快速返回直接答案,比如「8月上海有哪些演唱会」,GenFlow 2会直接给出答案,提升交互体验。

而面对需要图文多模态生成的任务,系统会切换到通用模式,自动调度多个Agent协同生成内容。

如果用户曾使用过百度文库、百度网盘,记忆模式则能基于过往对话、网盘文件等提供个性化补全;像是如果输入「我们上次做的那份报告」,GenFlow 2.0也能被准确理解和调用。

处理复杂任务时,并行模式可同步启动多个Agent,各自负责不同子任务,大幅缩短交付时间。同时,用户在生成中可随时调整需求,而干预模式支持「边生成边修改」;在更高复杂度场景下,系统还会进入深度模式,灵活组合以上能力,系统性完成交付。

记忆模式和并行模式都是GenFlow 2.0的首创。

这些模式的组合带来了显著的使用体验跃迁:一句话丢给GenFlow,不再是等一个模型返回一份内容,而是触发一整套系统开始「动脑、动手、动工具」,最后生成内容翔实、格式丰富、风格统一的可编辑内容。

相比其他Agent产品,GenFlow 2.0补了这些「现实的坑」

GenFlow 2.0的定位,与目前市面上正在开发或测试的多款智能体产品形成了对照,比如OpenAI的ChatGPT Agent、Kimi K2、Manus、MiniMax等。

从百度方面公开的信息来看,GenFlow 2.0目前强调的几个差异点主要集中在:

1.

任务执行的「并发性」:不靠一个模型多轮调用,而是多个Agent同步工作,目标是减少等待时间。

2.

中文语境下的信息检索能力:背靠百度文库14亿文档和百度学术6.8亿篇文献,内容生成更贴近中文用户的语料系统。

3.

个性化程度:通过网盘数据、聊天记录等历史行为建立「记忆库」,尝试更长线地理解用户。

4.

可编辑性:生成结果不是「最终答案」,而是可修改的中间稿,依托百度融合编辑器支持继续打磨。

当然,目前这些能力多是基于演示视频和官方说明呈现,后续真实交付效果还需观察。但从产品思路上,GenFlow明显在「内容生产工具化」这条路上做了更深的系统化尝试。

GenFlow 2.0在深度模式下完成手机信息查询及整理总结

GenFlow 2.0在并行模式下设计手办盲盒

官方给出的GenFlow 2.0演示项目里,使用它完成了物理备课、研究报告、校招宣讲、绘本制作等多个场景的交付能力。

一个Agent能不能搞定?也许更重要的是协作方式

GenFlow本质上是一次对「通用Agent」的落地探索,它的特别之处,在于:

通用不是一个模型通用,而是一整套Agent分工合作的能力通用;

调度不仅发生在内容生成阶段,更包含编辑、检索、个人记忆的上下链协作;

它不仅懂你说什么,还懂你「说过什么」,系统记住你的风格、偏好与习惯。

WAIC百度展台现场

百度文库显然是想用GenFlow 2.0,率先打造出中国语境下真正可用、可商用、可协作的AI助理产品,未来也许会走向全场景智能办公平台、企业级交付工具,甚至是基于Agent的工作流操作系统。

而它的野心,其实藏在那句口号里:

一个入口,N种模式,无所不能。

GenFlow 2.0的万能,大概就在于更高效、更贴合场景。

目前,GenFlow 2.0尚在测试阶段,最终体验效果和适用边界仍待8月份正式上线后验证。但它所呈现出的多智能体并行调度框架,确实为当前Agent领域提供了一个结构上不同的解法。

相关推荐

我不给人做产品,给Agent做
从1到10:AI产品和互联网产品有什么不同?
多模态和Agent成为大厂AI的新赛点
曝OpenAI 本周发布重磅Agent 功能,字节宣布启动AGI 计划,这可能是最卷的一年
你是一个成熟的Agent了,该自己报道ChatGPT Agent的新闻了
万字长文,聊聊下一代AI Agent的新范式
Agent爆火背后的隐形推手
融资飙涨背后,Agent赛道的投资逻辑正在重构
Salesforce AI Research 刘志伟:像Agent一样思考 | Agent Insights
5000字读懂:Agent世界里的A2A、MCP协议到底是个啥?

网址: GenFlow2.0要来了,这可能是一个和所有Agent都不同的产品 http://m.xishuta.com/newsview139470.html

所属分类:行业热点