AI资讯新闻榜单内容搜索-模型训练

无需训练、只优化解码策略，DTS框架让大模型推理准确率提升6%，推理长度缩短23%

专注推理任务的 Large Reasoning Models 在数学基准上不断取得突破，但也带来了一个重要问题：越想越长、越长越错。本文解读由 JHU、UNC Charlotte 等机构团队的最新工作

来自主题: AI技术研报

7416 点击 2025-11-22 11:31

4K超分Agent修图师来了！一键救活所有模糊照片

由德克萨斯A&M大学、斯坦福大学、Snap公司、CU Boulder大学、德克萨斯大学奥斯汀分校、加州理工大学、Topaz Labs以及加州大学Merced分校的研究者联合提出的基于AI智能体的方法4KAgent针对不同类型的图像以及需求对图像进行智能修复并放大到4K分辨率，带来优秀的视觉感知效果。该工作已被NeurIPS 2025接收。

来自主题: AI技术研报

8431 点击 2025-11-21 17:03

DeepSeek悄悄开源LPLB：用线性规划解决MoE负载不均

昨天，DeepSeek 在 GitHub 上线了一个新的代码库：LPLB。

来自主题: AI资讯

8649 点击 2025-11-21 10:50

AAAI 2025 Oral | 火山引擎多媒体实验室提出VQ-Insight，AIGC视频画质理解大模型

近日，AAAI 2026 公布了录用结果，该会议是是人工智能领域极具影响力的国际顶级学术会议之一。据悉本次会议共有 23680 篇投稿进入审稿阶段，最终 4167 篇论文被录用，录取率为 17.6%。

来自主题: AI技术研报

10666 点击 2025-11-21 09:42

AI终于学会「读懂人心」，带飞DeepSeek R1，OpenAI o3等模型

“What is meant often goes far beyond what is said, and that is what makes conversation possible.” ——H. P. Grice

来自主题: AI技术研报

8414 点击 2025-11-21 09:16

永别了，Tokenizer！何恺明师徒新作，颠覆AI生图技术

扩散模型「去噪」，是不是反而忘了真正去噪？何恺明携弟子出手，回归本源！

来自主题: AI技术研报

10496 点击 2025-11-20 15:26

AI Agent 工程化，本质是数据库系统设计

最近半年，我阅读了业界关于 AI Agent 的工程实践：Anthropic 的 Context Engineering 论文、Manus 的工程分享、Cline 的 Memory Bank 设计等。同时自己也一直在做跟 AI Agent 相关的项目，如：Jta[1]（开源的翻译 Agent，基于 Agentic Workflow）。

来自主题: AI技术研报

9048 点击 2025-11-20 15:03

大模型：从 .txt 到 .exe

下面这个，来自《人类的认知协议》的最后一个章节，写于一年前

来自主题: AI资讯

10676 点击 2025-11-20 10:04

何恺明团队新作：扩散模型可能被用错了

何恺明又一次返璞归真。

来自主题: AI技术研报

6872 点击 2025-11-20 09:35

NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

在视觉处理任务中，Vision Transformers（ViTs）已发展成为主流架构。然而，近期研究表明，ViT 模型的密集特征中会出现部分与局部语义不一致的伪影（artifact），进而削弱模型在精细定位类任务中的性能表现。因此，如何在不耗费大量计算资源的前提下，保留 ViT 模型预训练核心信息并消除密集特征中的伪影？

来自主题: AI技术研报

8204 点击 2025-11-20 09:33