AI资讯新闻榜单内容搜索-模型

DeepSeek精度效率双提升，华为&信工所提出思维链“提前退出”机制

长思维链让大模型具备了推理能力，但如果过度思考，就有可能成为负担。

来自主题: AI技术研报

9502 点击 2025-05-12 10:45

当大模型赛道中不少玩家明确表示放弃基础大模型研发，心思放在更聚焦的方向上时，阶跃星辰站出来——就像这家公司第一次亮相时那样，给外界一个明确的回答：

来自主题: AI资讯

8165 点击 2025-05-12 10:36

Sora、可灵等视频生成模型令人惊艳的性能表现使得创作者仅依靠文本输入就能够创作出高质量的视频内容。然而，我们常见的电影片段通常是由导演在一个场景中精心布置多个目标的运动、摄像机拍摄角度后再剪辑而成的。例如，在拍摄赛车追逐的场景时，镜头通常跟随赛车运动，并通过扣人心弦的超车时刻来展示赛事的白热化。

来自主题: AI技术研报

11713 点击 2025-05-12 10:31

OpenAI GPT-4o发布强大图片生成能力后，业界对大模型生图能力的探索向全模态方向倾斜，训练全模态模型成研发重点。

来自主题: AI技术研报

7406 点击 2025-05-12 10:22

本文详细介绍了斯坦福大学最新提出的"以弱驭强"（W4S）范式，这一创新方法通过训练轻量级的弱模型来优化强大语言模型的工作流。核心亮点包括：

来自主题: AI技术研报

9788 点击 2025-05-12 10:10

《智能涌现》获悉，具身智能公司「自变量机器人」近日完成数亿元A轮融资，由美团战投领投、美团龙珠跟投。本轮融资将用于持续加速全自研端到端通用具身智能大模型与机器人本体的同步迭代，以及未来多个应用场景的智慧化方案合作和落地。

来自主题: AI资讯

10717 点击 2025-05-12 10:00

2025 年 4 月的 AI 月报，你会看到：“评估（Evals）” 成为模型和 AI 产品开发的关键词；Google 继续提升 Gemini 模型能力的思路； OpenAI 的 GPT-4o 为什么变得谄媚，以及背后的问题；用户规模与模型能力提升关系不大？可能要有变化了

来自主题: AI资讯

9845 点击 2025-05-11 20:24

E2B 的愿景很大，CEO 的目标是成为 AI Agent 时代的 AWS，成为一个自动化的 infra 平台，未来可以提供 GPU 支持，满足更复杂的数据分析、小模型训练、游戏生成等需求，并可以托管 agent 构建的应用，覆盖 agent 从开发到部署的完整生命周期。

来自主题: AI资讯

12688 点击 2025-05-11 15:29

本周二，我们报道了菲尔兹奖得主陶哲轩的一个开源项目 —— 在大模型的协助下编写了一个概念验证软件工具，来验证涉及任意正参数的给定估计是否成立（在常数因子范围内）。这才几天的时间，这个估计验证工具的 2.0 版本就来了！

来自主题: AI资讯

9500 点击 2025-05-11 15:22

字节Seed首次开源代码模型！Seed-Coder，8B规模，超越Qwen3，拿下多个SOTA。它证明“只需极少人工参与，LLM就能自行管理代码训练数据”。通过自身生成和筛选高质量训练数据，可大幅提升模型代码生成能力。

来自主题: AI资讯

10145 点击 2025-05-11 15:18