AI资讯新闻榜单内容搜索-o1

腾讯押注非Transformer！推理模型混合Mamba也能搞，深度思考也能秒回

首个基于混合Mamba架构的超大型推理模型来了！就在刚刚，腾讯宣布推出自研深度思考模型混元T1正式版，并同步在腾讯云官网上线。对标o1、DeepSeek R1之外，值得关注的是，混元T1正式版采用的是Hybrid-Mamba-Transformer融合模式——

来自主题: AI资讯

10738 点击 2025-03-22 11:12

OpenAI史上最贵模型来了！比DeepSeek贵270倍，100万输出token 600美元

比DeepSeek-R1贵270倍，OpenAI史上最贵模型来了！

来自主题: AI资讯

7355 点击 2025-03-20 16:58

刚刚，OpenAI史上最贵API上线！o1-pro比DeepSeek-R1溢价千倍

刚刚，OpenAI正式上线史上最贵API——o1-pro，输入/输出价格贵到离谱，最高可达DeepSeek-R1的千倍。OpenAI研究员戏称，大模型界的劳斯莱斯。

来自主题: AI资讯

9332 点击 2025-03-20 11:02

想纠正LMM犯错？没用！NUS华人团队：最强o1反馈修正率不到50%

LMM在人类反馈下表现如何？新加坡国立大学华人团队提出InterFeedback框架，结果显示，最先进的LMM通过人类反馈纠正结果的比例不到50%！

来自主题: AI技术研报

7958 点击 2025-03-17 09:32

ChatGPT再进化：o1支持调用Python分析数据，网友：已经成为Copilot了

今天一大早，ChatGPT突然更新——基于Python的数据分析功能，在o1和o3-mini当中也可以使用了。OpenAI介绍，现在可以通过两款模型调用Python，完成数据分析、可视化、基于场景的模拟等任务。

来自主题: AI资讯

8884 点击 2025-03-14 12:27

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

大语言模型（LLM）在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力，比如 OpenAI 的 o1 系列。

来自主题: AI技术研报

8146 点击 2025-03-13 14:41

DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

乙巳新春，中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型，DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮，并不令人意外，但这款来自大厂体系外创业团队的开源大模型，经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果，则是非常耐人寻味了。

来自主题: AI监管政策

11411 点击 2025-03-11 23:53

OpenAI自曝“o4”训练中，用思维链监控抓住AI作弊瞬间

o1/o3这样的推理模型太强大，一有机会就会利用漏洞作弊，怎么办？

来自主题: AI资讯

6141 点击 2025-03-11 16:35

优于o1预览版，推理阶段KV缓存缩减一半，LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的能力，例如 o1 已能生成长度高达 100K tokens 的序列。然而，这也给 KV cache 的存储带来了严峻挑战。

来自主题: AI技术研报

6006 点击 2025-03-11 09:32

攻破OpenAI o1/o3、DeepSeek R1防线，安全推理过程反成大模型「阿喀琉斯之踵」

杜克大学计算进化智能中心的最新研究给出了警示性答案。团队提出的 H-CoT（思维链劫持）的攻击方法成功突破包括 OpenAI o1/o3、DeepSeek-R1、Gemini 2.0 Flash Thinking 在内的多款高性能大型推理模型的安全防线：在涉及极端犯罪策略的虚拟教育场景测试中，模型拒绝率从初始的 98% 暴跌至 2% 以下，部分案例中甚至出现从「谨慎劝阻」到「主动献策」的立场反转。

来自主题: AI技术研报

6166 点击 2025-03-09 10:37