这可能是今年最能打的 ToC Agent 产品。

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
这可能是今年最能打的 ToC Agent 产品。
6197点击    2025-11-15 17:30

昨天测试了一款很拉跨的 AIGC 类产品,再也不用了。


我不清楚,为什么有些生成类的产品还在可劲强调生成能力,而不花心思做修改和编辑的体验。


一个项目做到九成,我们脑子里经常会冒出个错觉,好像离终点只差一步。


但其实有经验的人都知道,后面 10% 的细节,会再吃掉我们第二个九成的力气。写一篇文章,做一张图片,开发一个App,都是如此。


指望用户通过几个提示词,就能够生成成品,这是沉浸在 Demo 里的幻觉。用户要的不是 Demo,是真正能用的东西。


编辑大于生成。这是我一直的观点。


这方面,百度文库的 GenFlow是一个非常好的观察样本。我给很多做产品的朋友都推荐过这款产品,然后自己也在用。


比如下面这张截图是他们最新的能力。


这可能是今年最能打的 ToC Agent 产品。


AI 生成好初稿之后,我不需要再下载到本地才能继续编辑,直接在 GenFlow 里改就行。调整排版、更换图片、增加新内容,非常方便。


左侧是我们熟悉的 PPT 交互界面,右侧是对话框,输入自然语言也能改。比如可以说更换 PPT 模板,更换本页的样式,更换字体颜色。


很多产品过于强调 AI,根本不做类似的功能。


AI 生成仅仅是冰山之上的一点功能,冰山之下GenFlow 把一整套 Office 的编辑操作都融合到了自己的产品中,并进行了 AI 化。这也是我最喜欢这款产品的地方。


前天百度宣布,GenFlow 已经突破 2000 万活跃用户。我查了下数据,如果不把 ChatGPT、Gemini 之类的 ChatBot 定位为 Agent 的话,那 GenFlow 已经成为全球体量最大的 Agent 产品。


这可能是今年最能打的 ToC Agent 产品。


#01


GenFlow 的新功能


而且,百度世界大会上新发布的 GenFlow 3.0,带来了三个我认为极其重要的特性:


第一,记忆能力。有了记忆之后,AI 就能够千人千面,记住我之前的习惯和表达风格。这意味着每次打开 GenFlow 3.0,它都不是从头开始。


要不然,每次都啰啰嗦嗦输入自己的要求,也很耽误事儿。我觉得有了记忆之后,Agent 就会真的更像助理了。懂我们的助理。


第二,全面支持 Office 三件套。我们可以在 GenFlow Office Agent 中自由的编辑 Word、Excel、PPT 这些格式的文件。


举个简单的例子,在 Word 里,我们可以直接让它把某一段内容做成双栏排版、让它自动校对、自动加图表、自动优化段落结构。


第三,多模态。这一点不用多解释。在现在的时代,视频、音频、图片、文字,不同的表达方式早就融在一起了。


我们做内容,不再是单纯写一篇文案、做一份 PPT 就结束,而是要在同一条链路里完成图文、短视频、播客脚本、甚至网页原型。


现在我们可以在同一个界面里,一次性生成图文、视频、音频等等模态。


咱们先看看记忆功能。


应该是 Sam Altman 说过,记忆功能正在成为 AI 产品的重要壁垒。


这事我有感触。比如我经常用 GPT,我发现它已经非常懂我,知道我是什么职业,知道我为什么事情烦恼。


模型能力是一部分,但如果模型可以基于他对我的理解生成内容,这种体验绝对是颠覆性的。


以前的 Agent 像是一张白纸,说一句它写一句,换个项目它就失忆,根本不知道我们之前做过什么、喜欢什么风格、对什么特别敏感。每次都得重来,讲需求讲得像录音机一样。


但有了记忆之后完全不同。你让它改一篇文章,它知道你喜欢的语气是什么,知道开头不要废话,知道段落之间要自然流动。


你让它生成 PPT 方案,它知道你偏好简洁、偏好实用,不会给你整一堆花里胡哨的动画和样式。


举个例子,我让 GenFlow 3.0 给我制定一份 15 天的徒步和轻阅读计划。


收到任务需求后,它干的第一件事是了解我的背景信息,而不是直接生成内容。


这就对了。要不然,千篇一律的信息,有什么价值呢?AI 能够为我制定好计划的前提,是先了解我。


这可能是今年最能打的 ToC Agent 产品。


紧接着,我看到 GenFlow 对我的描述,惊呆了。


因为之前我查过很多科幻小说的解读,所以它就记住我喜欢读科幻小说这事......就像我和一个朋友经常聊 NBA,自然而然会知道我喜欢篮球一样。


这可能是今年最能打的 ToC Agent 产品。


再比如,我想写篇高碳水摄入的文章,它也会第一时间查阅之前相关的讨论。也就是说,我不需要重复给到背景信息,GenFlow 就能够理解我最关注什么。


这可能是今年最能打的 ToC Agent 产品。


这一点确实能省不少事情。因为有的时候,我也说不清楚自己的需求。


刚刚第一次生成完后,我希望文章能够具体化下饮食调整建议。下面截图大家能看到,它很清楚我的语言风格是通俗易懂。


这可能是今年最能打的 ToC Agent 产品。


很快,内容修正完毕。有了记忆功能后,我明显感觉它给出的内容更对我的胃口了。这其实也是效率的提升,省得来回调整。

这可能是今年最能打的 ToC Agent 产品。


还有 Office Agent,也是这次 GenFlow 3.0 的重要升级。


拿 Word 举例子,我知道很多人现在都用不明白 Word,特别是论文中要求的那些奇奇怪怪的格式。


今年有亲戚写论文,让我帮忙调整 Word 的格式。我折腾半天后,心中不免奇怪,Word 这玩意不是上个时代的产品么?


菜单栏那么多复杂的操作,还有学校奇奇怪怪的格式要求,难道大家就不变化吗?我后来,也没帮亲戚搞定 Word 排版的事情。


但现在,GenFlow 3.0 可以了。我们可以把论文导入到 GenFlow 3.0,在这里面通过自然语言的方式调整就好。


下面是我的一个例子,我现在让它编辑前面生成的徒步计划文档,增加结构化的列表。

这可能是今年最能打的 ToC Agent 产品。


继续让它把加粗文章中的关键信息,很快也成功搞定。

这可能是今年最能打的 ToC Agent 产品。


前面都不算难。咱们继续加难度,让它给我的文章分栏。也搞定了。这个功能简直太方便了。也就是说,以后编辑复杂的 Word 文档,我们可以先把它传到 GenFlow 上。


这可能是今年最能打的 ToC Agent 产品。


接下来,我们再看看多模态的部分。我让 GenFlow 3.0 给我生成一个小马过河的绘本:

这可能是今年最能打的 ToC Agent 产品。


看完绘本后,我想把它转成播客,这样孩子睡觉的时候可以听。以我输入提示词让 GenFlow 把绘本内容生成一个播客。


这可能是今年最能打的 ToC Agent 产品。


下面是最终的效果。真的震惊到我了,非常不错。

这可能是今年最能打的 ToC Agent 产品。


#02


写在最后


这次 GenFlow 3.0 给了我不少惊喜。我不想用太多夸大的表达,不然反而显得不真诚。


过去一年,各种创作类 Agent 我基本都试过,有些只是在第一眼看着不错,有些刚上手两天就被我放弃了。真正能让我一直留下来的,还是 GenFlow。


原因很简单:它把那些不起眼、但对创作效率非常关键的细节,一点点补上了。


这些东西不像模型分数、参数规模那样适合宣传,也没有什么震撼性的突破,它就是老老实实地把工具打磨得更顺、更贴近日常使用的方式。


我见过太多 Agent,说句话不中听的,那就是半成品。


生成只占整个创作流程的一半,剩下那一半才是真正耗时间的地方,编辑、微调、补内容、调节结构……这些如果不认真做,用户是无法把事情真正做完的。这样的产品,也很难长期留住人。


而且这次,GenFlow 3.0 的记忆功能,应该也是行业内少有的支持记忆的 Agent 产品。


我觉得 Memory 会成为接下来 Agent 的分水岭。当模型能力越来越接近之后,能不能记住用户、理解用户、延续上下文,会直接影响内容的质量,甚至决定用户愿不愿意一直用下去。


我自己的体验也很明显。以前和 Agent 打交道,总觉得是在反复说明自己需要什么风格、什么语气、怎么开头、怎么衔接……每次都得用一套同样的提示词和他讲自己的要求。


现在有了记忆,它能自动沿用我之前的偏好,我说一句接着写、按上次的风格改一下,它就能明白是什么意思,甚至会提前猜到我接下来可能想要什么。


这种变化,让 Agent 更像一位长期协作的伙伴。


等 Memory 能力再成熟一些,Agent 大概就会从一个工具,变成真正嵌入日常工作的一部分。


现在 GenFlow 3.0 在百度文库和百度网盘网页端、App 端都已经全量上线,大家可以用起来了。


文章来自于微信公众号 “AI产品阿颖”,作者 “AI产品阿颖”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0