AI资讯新闻榜单内容搜索-推理模型

阿里国际站AI布局引多家外媒关注：AI搜索Accio企业用户超百万

日前，阿里国际站总裁张阔在接受《南华早报》等多家外媒专访时透露，面向海外买家推出的AI搜索引擎Accio企业用户已超百万。2月，阿里国际站的全线AI产品相继接入Qwen2.5、DeepSeek等先进推理模型，尤其是原生AI应用Accio的推出，让阿里国际站的AI应用引发全球高度关注。

来自主题: AI资讯

10711 点击 2025-03-11 23:46

OpenAI自曝“o4”训练中，用思维链监控抓住AI作弊瞬间

o1/o3这样的推理模型太强大，一有机会就会利用漏洞作弊，怎么办？

来自主题: AI资讯

6834 点击 2025-03-11 16:35

Github超2万星，OpenManus核心作者聊Agent发展趋势

随着推理模型能力提升，本周Agent也进入刷屏周。

来自主题: AI资讯

9372 点击 2025-03-11 11:03

攻破OpenAI o1/o3、DeepSeek R1防线，安全推理过程反成大模型「阿喀琉斯之踵」

杜克大学计算进化智能中心的最新研究给出了警示性答案。团队提出的 H-CoT（思维链劫持）的攻击方法成功突破包括 OpenAI o1/o3、DeepSeek-R1、Gemini 2.0 Flash Thinking 在内的多款高性能大型推理模型的安全防线：在涉及极端犯罪策略的虚拟教育场景测试中，模型拒绝率从初始的 98% 暴跌至 2% 以下，部分案例中甚至出现从「谨慎劝阻」到「主动献策」的立场反转。

来自主题: AI技术研报

6869 点击 2025-03-09 10:37

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

仅仅过了一天，阿里开源的新一代推理模型便能在个人设备上跑起来了！昨天深夜，阿里重磅开源了参数量 320 亿的全新推理模型 QwQ-32B，其性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。

来自主题: AI资讯

10407 点击 2025-03-07 17:12

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

仅用32B，就击败o1-mini追平671B满血版DeepSeek-R1！阿里深夜重磅发布的QwQ-32B，再次让全球开发者陷入狂欢：消费级显卡就能跑，还一下子干到推理模型天花板！

来自主题: AI技术研报

7602 点击 2025-03-07 10:28

AI话痨终结者！UCSD清华提出「思维扫描术」Dynasor-CoT，推理巨省token

推理模型在复杂任务上表现惊艳，缺点是低下的token效率。UCSD清华等机构的研究人员发现，问题根源在于模型的「自我怀疑」！研究团队提出了Dynasor-CoT，一种无需训练、侵入性小且简单的方法。

来自主题: AI技术研报

10207 点击 2025-03-06 17:15

阿里深夜开源推理模型QwQ-32B，性能比肩R1满血版。

今夜，Manus发布之后，随之而来赶到战场的，是阿里。

来自主题: AI资讯

5997 点击 2025-03-06 11:55

第一个吃到DeepSeek红利的AI图像产品出现了？

在 R1 推理模型大火之后，全民接力集成 DeepSeek，有硅基流动这样的大模型云服务平台、有腾讯元宝这样的 Chatbot，甚至微信这样的顶流。但是，AI 图片类产品却鲜少有接入 DeepSeek R1 的新闻，而从 DeepSeek-R1 发布到 Krea 宣布上线新功能仅仅 10 天，这个反应应该是图像产品中最快的。

来自主题: AI资讯

5304 点击 2025-03-05 10:16

有没有复杂任务自动化的Multi-Agent框架？用Nexus，几行YAML搞定数据清洗

随着R1等先进推理模型展现出接近人类的推理能力，多代理系统（Multi-Agent Systems，MAS）的发展也出现了前所未有的机遇。然而，随着我们尝试构建越来越复杂的多代理系统，一个核心问题日益凸显：如何在保持系统灵活性的同时，降低开发和维护的复杂度？

来自主题: AI技术研报

10005 点击 2025-03-04 16:12