高考志愿填报结束啦!敲锣打鼓ing
我长舒一口气。当然不是因为我要上大学,而是这段时间兼职了一把“志愿顾问”。
过去十天里,我帮亲戚、朋友、朋友的朋友、朋友的朋友的朋友......
生成了快四五十份报告,给夸克这几周生成的1000万份高考志愿报告贡献了
0.0005%
没想到我跟夸克的缘分未了啊,昨天还参加了夸克内部的技术分享,拿到了一些一手信息,马上写成文章给大家分享分享。
夸克能在那么短的时间,在高考这个场景成为国内规模最大的深度研究(Deep Research)应用,这也是深度研究 Agent 第一次在大规模场景中,完成了真正的落地闭环。
先用简单一段话,定义一下深度研究 Agent
「深度研究Agent」(Deep Research Agents)
由大语言模型(LLMs)驱动的 AI 代理,具备动态推理、自适应规划、多轮外部数据获取与工具调用能力,并能自动生成完整分析报告,用于完成复杂的信息研究任务。
具体来说,深度研究 Agent 以大语言模型为“脑”,通过网页浏览器或结构化 API 实时获取外部知识,并使用定制化工具箱或标准接口(如 MCP:模型上下文协议)调用分析工具。这种架构让智能体可以自主执行复杂的、端到端的研究流程,将推理过程与多模态资源(例如文字、图像、结构化数据等)无缝融合在一起。
举个栗子,我印象最深的一份高考报告是一个朋友的妹妹,
河北考生,物化生组合,560分,对药学感兴趣,家长预算有限,希望选个学费不高、就业不错的院校。
因为夸克的报告可以生成多次,所以我前后试了很多关键词:公办本科、药学专业、就业导向、经济型城市等等,
最后生成的志愿报告里,给出了合理的冲稳保结构,还特别标注了该校的学费标准、就业率,从院校选择逻辑,到专业排布建议,再到家长普遍关心的调剂风险、转专业政策、就业导向,都给出了合理甚至贴心的解释。
甚至附带了一句“该校所在城市有XX制药集团,与本专业联系紧密”。
我当时真的服了。
它是真的在思考:
什么是对这个考生真正重要的信息。
能做到这一步,夸克志愿报告 Agent 是基于高考志愿大模型,用了两个工具和一个工作流架构,我来一个个拆解!
当你给夸克提要求后,在规划阶段它就会先根据分数信息初始志愿表,明确考生的大概分数段水平,然后通过定向提问补充信息,像是个人偏好的城市之类的,
再根据输入规划策略,分成学校、专业、地域、未来就业、家庭背景、个人情况等维度,类似的方法也被隔壁 OpenAI 采用。
再具体一点说,就是在执行过程中,Agent通过多轮“工具调用+反思调整”的机制,来动态优化志愿方案。
比如,如果我们给出的信息中倾向“留在省内(广州、深圳优先)、 不考虑偏远地区”的意向时,模型会自动生成搜索指令:
优先推荐广州、深圳的高校,其次考虑广东省内其他城市院校,排除偏远地区选项;若优质选项受限,Agent还能主动反思扩展搜索范围,如增加广东周边发达城市,或在高层次高校(如985)上适度放开地域限制,为考生争取冲一冲的机会。
而且,夸克这个高考 Agent 具备处理复杂、甚至是自相矛盾的诉求的能力。比如说“数学成绩差,但想报考计算机”这种学科之间的矛盾,系统就会触发深度研究 Agent 流程,提示我这一选择可能存在的能力匹配问题。
这就很人性化了,就是它不是一味的只是去迁就的给出提问所匹配的答案,而是真的会认真思考问题,然后给出相当合理化的建议,
就像我们真的会去找的咨询师一样,ta不是完全顺着你的要求来的,而是知道什么是更好的,什么是不适合你的。
思考过程讲完了,那执行过程用到的两个工具:搜索工具和志愿填报工具。
单是搜索工具就收录了快9000个站点,20多亿网页,我们熟悉的阳光高考、就业信息网、学信网等等都包含进去了,
而且在中间流程还加了多重事实性校验,毕竟高考年年变,没有比这个更考验模型信息获取和整合能力更好的场景了。
刚好我最近看到了一份《DEEP RESEARCH AGENTS: A SYSTEMATIC EXAMINATION AND ROADMAP》的论文,
跟夸克这次做了一些对比,找到了更多更加真实的数据。首先就是深度研究智能体们都在用什么工具获取信息?
目前还是使用API检索为主(左),浏览器为辅(右)。
截止目前为止已经有36个深度研究Agent(实际上肯定不止)
这里面的主力模型就是 gpt 和 qwen 系列,主要就是集中在今年的5月份发布的,所以说夸克能在那么短时间做到千万报告输出真的很牛🐂
我甚至还交流到了志愿填报工具的一些实现细节,
这个是实打实跟其他家拉开距离的。
填志愿,看起来是选学校、选专业,但实际是一场复杂的非结构化任务:
每个学生的报考需求都不同,甚至每个省份的投档制度、专业组规则都不一样,那怎么能在一个工具里考虑到这么多细节:
比如,当前的省控线与专业组制度、志愿序之间的差异化、调剂可能引发的方向偏移、家庭意愿和个人偏好之间的平衡、本科后的考研/就业预期路径,
这些东西不说自己报考的时候会忘记,就是弄明白其中一个就要花不少时间了。
那夸克这个高考志愿大模型是怎么做的呢?
它做了件很吃力不讨好的事,将综合历年录取位次情况及专业省份扩缩招情况,判断专业综合位次,根据分段选科统计建模,不同选科不同分段下的波动范围,来匹配各种分数段竞争程度,
说白了就是尽可能盘点所有的影响因子,估算出你今年得分是处于什么水平。
当新专业、新学校出现时怎么办?
夸克就会选取同校相似专业(专业类型相近且招生条件相同),然后根据相似度做加权。
如果没有有效的相似专业或者为本省首次招生院校,他们会选取相似学校相似专业在本省的去年分,做相似度加权。
然后在缺失有效信息下会回退学校分/等策略 。
真的很复杂,而且是平时靠人力报考的话一个人完全做不到的事情,
所以,看似非常个性化的场景需求也是能够探索出一个结构,配合大量训练,调试出一个能够适配所有人的思考流程,
这些就是我一直认同的行业里的优势,
只要你这样做了,这个产品就肯定差不了,
也肯定可以跟一般的通用Agent拉开极大的距离。
分享会有个细节让我印象特别深。
他们说,夸克高考这块,最早就是为了“解决考生和家长找不到信息”的需求起步的。
在大家还停留在“某度搜高校”阶段,夸克就尝试“智能搜索+结构抽取”去做“高考AI助手”。
2024年,夸克也是率先将其AI搜索能力在高考信息服务中落地,升级高考AI搜索,,
当时大家的反馈就很积极,高考季期间“夸克高考”AI搜索的使用量超过了1亿次。
但你可能没想到,一个志愿报告的生成背后,调动的是十几项结构查询、数百次规则匹配、几十页文案编写。
更厉害的是,夸克还不收钱。
它在做的是用真实场景打磨出真正的AI代理决策力。你看到的不是一份报告,而是一个AI在说:
“我理解你的困惑,我替你跑完了那些你不想做、做不好的事。”
而这些,最终都反映在了产品体验里。
当然,除了志愿报告,夸克还有很多意外之喜。
比如:
这种细节体验,也让我意识到一个事:
夸克做这个产品,不是为了秀AI能力,而是真的当一件服务来做。
目前除了高考,夸克还上线了通用的深度研究,含金量有多高,相信不需要我再说了 。
而且在分享会最后,夸克算法负责人蒋冠军也分享了夸克的下一步,
我稍微总结了一下
高考志愿填报,是夸克率先试验深度研究能力的任务型场景,他们会把在这里积累下来的范式、数据处理方式、逻辑建模方法,逐步推广到更多需要高质量决策的领域。
比如健康、比如教育、比如未来的职业选择场景。
这是我第一次,感觉到AI正在变成一个“社会角色”。
而我们能做的,就是继续和它一起并肩作战,
把一个又一个复杂难题,拆成有希望的未来。
这一次,夸克让AI成为志愿专家;
下一次,它也许能成为你人生中每一个关键决定的合伙人。
深度研究的时代,
才刚刚开始。
文章来自于微信公众号“卡尔的AI沃茨”,作者是“AI沃茨”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/