AI资讯新闻榜单内容搜索-模型训练

直指具身智能核心瓶颈，千寻智能高阳团队提出 Point-VLA：首次以视觉定位实现语言指令精准执行

设想这样一个场景：你打电话让同事去办公室某个地方拿东西，仅凭语言描述位置是多么困难。在办公室里，从一堆已经喝过的矿泉水瓶中，让对面同学递过来你之前喝过的那个，只用语言几乎无法准确描述——「左边第二个」？「有点旧的那个」？这时候，人们更倾向于用手指一下，或者拿出图片来指代。

来自主题: AI技术研报

7581 点击 2026-03-31 14:37

想让大模型重点关注提示词里的某句话可没那么容易。

来自主题: AI技术研报

8788 点击 2026-03-31 14:07

Anthropic 研究科学家 Nicholas Carlini 在 [un]prompted 2026 安全会议上用不到 25 分钟演示了一件事：语言模型现在可以自主找到并利用零日漏洞，目标包括 Linux 内核这种被人类安全专家审计了几十年的软件。

来自主题: AI技术研报

10317 点击 2026-03-31 14:06

做深度估计、深度补全的人，大概都有过这样一个瞬间。

来自主题: AI技术研报

8161 点击 2026-03-31 14:04

你开会时，AI竟在偷偷升级？伯克利等四校开源MetaClaw，让Agent趁你开会、离席、睡觉时持续进化，直接打破「上线即冻结」这条行业铁律。

来自主题: AI资讯

9423 点击 2026-03-31 10:29

ICLR论文STEM架构率先提出「查表式记忆」架构，早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表，用token索引的embedding表直接读取记忆，彻底解耦记忆容量与计算开销。

来自主题: AI技术研报

8419 点击 2026-03-31 10:04

在生成式 AI 领域，视觉分词器（Visual Tokenizer）通常采用固定压缩率 —— 无论是单调的监控画面，还是复杂的动作大片，都被切分为等量的 Token。这种 "一刀切" 的做法不仅会造成巨大的计算冗余，也产生了 “信息量” 不同的 Token，不利于下游理解生成任务处理。

来自主题: AI技术研报

5781 点击 2026-03-31 10:03

几何问题，真的只是“推理难”吗？

来自主题: AI技术研报

7544 点击 2026-03-31 10:02

自从大语言模型诞生起至今，AI 已经润物无声地融入了我们的工作生活，也成为了现代社会的重要组成部分。

来自主题: AI技术研报

6665 点击 2026-03-30 16:06

机器人能认出杯子，却看不懂杯口朝哪、离自己多远、该抓哪里。

来自主题: AI技术研报

8555 点击 2026-03-30 15:03