AI技术研报-这里有最前沿的人工智能技术解读

人大北邮等团队解视触觉感知统一难题，模型代码数据集全开源 | ICLR 2025

机器人怎样感知世界？

来自主题: AI技术研报

10552 点击 2025-03-15 16:18

提出机器人自主学习新范式，深大团队最新顶会论文，刷新6大复杂任务SOTA

让机器人轻松学习复杂技能有新框架了！

来自主题: AI技术研报

7492 点击 2025-03-15 16:05

AI能自主出“竞赛题”了！港大&蚂蚁让大模型学会生成难题，水平已接近AIME

大模型架构研究进展太快，数据却快要不够用了，其中问题数据又尤其缺乏。

来自主题: AI技术研报

9751 点击 2025-03-15 15:39

「压缩即智能」得到实验验证，无需预训练和大量数据就能解决ARC-AGI问题

「压缩即智能」。这并不是一个新想法，著名 AI 研究科学家、OpenAI 与 SSI 联合创始人 Ilya Sutskever 就曾表达过类似的观点。

来自主题: AI技术研报

9079 点击 2025-03-15 15:28

人类秒懂，AI却懵圈：VLM²-Bench揭示视觉语言模型「视觉关联」能力短板

当前，视觉语言模型（VLMs）的能力边界不断被突破，但大多数评测基准仍聚焦于复杂知识推理或专业场景。本文提出全新视角：如果一项能力对人类而言是 “无需思考” 的本能，但对 AI 却是巨大挑战，它是否才是 VLMs 亟待突破的核心瓶颈？

来自主题: AI技术研报

8116 点击 2025-03-15 15:05

CVPR 2025：长Prompt对齐问题也能评估了！当前最大AIGC评估数据集，模型评分超越当前SOTA

今年，CVPR共有13008份有效投稿并进入评审流程，其中2878篇被录用，最终录用率为22.1%。

来自主题: AI技术研报

8996 点击 2025-03-15 14:50

何恺明LeCun暴击Transformer命门，9行代码砍掉归一化层！性能反而更强了？

Transformer架构迎来历史性突破！刚刚，何恺明LeCun、清华姚班刘壮联手，用9行代码砍掉了Transformer「标配」归一化层，创造了性能不减反增的奇迹。

来自主题: AI技术研报

8798 点击 2025-03-15 14:11

arXiv科研神器：Mistral OCR、Claude 3.7合体实现论文速读

现在是 2025 年，新论文要以博客形式出现。

来自主题: AI技术研报

8884 点击 2025-03-14 16:47

出海应用也能享受高速稳定的DeepSeek-R1？亚马逊云科技出手了

给大模型落地，加入极致的务实主义。

来自主题: AI技术研报

9941 点击 2025-03-14 16:35

医学可用！推理增强RAG：精准诊断、智能补问、高效解析 | WWW 2025

南洋理工大学的研究团队提出了MedRAG模型，通过结合知识图谱推理增强大语言模型（LLM）的诊断能力，显著提升智能健康助手的诊断精度和个性化建议水平。MedRAG在真实临床数据集上表现优于现有模型，准确率提升11.32%，并具备良好的泛化能力，可广泛应用于不同LLM基模型。

来自主题: AI技术研报

7204 点击 2025-03-14 16:19

AI逆袭5G芯片设计，几分钟媲美半个月工作量！研究登Nature子刊

来自普林斯顿和印度技术学院的学者在《自然通讯》发表论文，他们发现，如果给定设计参数，AI可以在90nm的芯片上设计高性能集成电路。过去这是需要花费数周时间的高技能工作，但如今的AI可以在数小时内完成。

来自主题: AI技术研报

4867 点击 2025-03-14 15:54

CVPR 2025 | VAST和北航开源MIDI，从单张图像端到端生成三维组合场景

在 Sora 引爆世界模型技术革命的当下，3D 场景作为物理世界的数字基座，正成为构建动态可交互 AI 系统的关键基础设施。当前，单张图像生成三维资产的技术突破，已为三维内容生产提供了 "从想象到三维" 的原子能力。

来自主题: AI技术研报

9359 点击 2025-03-14 15:40

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

尽管 DeepSeek-R1 在单模态推理中取得了显著成功，但已有的多模态尝试（如 R1-V、R1-Multimodal-Journey、LMM-R1）尚未完全复现其核心特征。

来自主题: AI技术研报

9138 点击 2025-03-14 15:32

中国AI Agent行业研究报告（二）

AI飞速发展的时代，AI Agent在大模型能力升级的推动下实现从任务执行者（copilot）向决策主体的跨越。甲子光年智库全面深入地探讨了AI Agent发展演进、产业价值与商业模式变革、技术路径与能力提升以及面临的挑战等方面，旨在为关注AI Agent领域的投资者、从业者、研究者等提供全面且权威的参考依据。

来自主题: AI技术研报

9731 点击 2025-03-14 10:15

3700次预训练总结超参规律，开源海量实验，告别盲猜

近年来，大语言模型 LLMs 在多种任务上的卓越表现已得到广泛认可。然而，要实现其高效部署，精细的超参数优化至关重要。为了探究最佳超参数的规律，我们开展了大规模的实证研究，通过在不同配置上进行网格搜索，我们揭示了一套通用的最优超参数缩放定律（Optimal Hyperparameter Scaling Law）。

来自主题: AI技术研报

10625 点击 2025-03-13 15:15