AI资讯新闻榜单内容搜索-Ed

哈佛医学院做了5679次组学分析：大模型能力没差别，关键在验证

生物医学AI智能体正从「能不能做组学分析」快速进入下一阶段的检验：做出来的结果，能不能撑得住真实的治疗决策？哈佛医学院Zitnik团队的MEDEA 给出了一条明确的技术路线：与其追求更强的骨干大模型，不如在分析流程的每一步嵌入验证机制。

来自主题: AI技术研报

8699 点击 2026-04-02 16:22

ICLR 2026 | 世界模型卡在多机器人协作？一个「顺序分解」思路打通

近年来，Decision-Coupled World Model 与 Model-based RL 在机器人领域取得了显著成功。通过学习环境动力学模型，智能体能够在内部模拟未来，从而进行规划与决策。但当系统从单机器人扩展到多机器人时，问题开始变得棘手。

来自主题: AI技术研报

10823 点击 2026-04-02 16:22

美团开源“语音克隆”模型，1B/3.5B双选，超自然复刻你的声音

相似度超越Seed-TTS、MiniMax-Speech等知名模型。昨晚，美团LongCat团队发布了文本转语音模型LongCat-AudioDiT，并开源1B、3.5B参数量的版本。这一模型的最大特点，是彻底抛弃了梅尔谱等中间表示，直接在波形潜空间进行基于扩散模型的文本转语音。通俗地说，这一模型直接根据声音本身的规律进行生成，“雕刻”出最原始的声音波形，从根源阻断数据转换的级联误差。

来自主题: AI资讯

9153 点击 2026-04-02 13:51

这是一个划时代的生图模型，一手实测Wan2.7-Image

3月30日，阿里巴巴内部发布了 Wan2.7-Image 图像生成与编辑统一模型。根据官方公布的数据，在人类偏好盲测评分中，Wan2.7-Image 目前位列国内第一。从放出的评测雷达图来看，无论是文本生图（Text-to-Image）还是综合图像编辑（Image Editing），它的各项指标基本都盖过了市面上主流的几家头部模型。

来自主题: AI资讯

9173 点击 2026-04-02 10:42

别等ASI了！OpenAI上演「资产大逃亡」，模型只是流量诱饵

全世界都在等ASI降临，OpenAI却在年初悄悄上线广告位。9亿用户撑不起数百亿美元的算力账单，智力正在贬值，神仙也得下凡赚钱！

来自主题: AI资讯

7688 点击 2026-04-01 10:14

1毫秒级，最快的人体动作捕捉服！开源715万帧数据集| CVPR'26

全球首个1毫秒级人体动作捕捉系统FlashCap，通过闪烁LED与事件相机结合，实现1000Hz超高帧率捕捉。无需昂贵设备或强光环境，低成本穿戴服即可精准捕捉极速动作。团队同步开源715万帧的FlashMotion数据集与多模态模型ResPose，显著提升运动分析精度，推动体育、VR与机器人领域迈向高动态智能新阶段。

来自主题: AI技术研报

6844 点击 2026-03-31 14:40

Nicholas Carlini：当 AI 比所有人都更擅长找漏洞，安全行业还剩几个月？

Anthropic 研究科学家 Nicholas Carlini 在 [un]prompted 2026 安全会议上用不到 25 分钟演示了一件事：语言模型现在可以自主找到并利用零日漏洞，目标包括 Linux 内核这种被人类安全专家审计了几十年的软件。

来自主题: AI技术研报

10536 点击 2026-03-31 14:06

一个西方 VC 的中国 AI 考察笔记：深圳硬件让我震惊，看空中国软件

本文作者 José Maria Macedo 是加密行业老牌研究机构 Delphi Digital 的联合创始人，也是 Delphi Ventures 的创始合伙人。Delphi 的客户包括 Polychain、Pantera、Ark Invest 等顶级基金，最近还专门开设了 AI 研究线 Delphi Intelligence。

来自主题: AI资讯

6913 点击 2026-03-31 10:30

搞懂“记忆”必看｜吃透Engram，坐等Deepseek新模型

第一篇论文来自字节SEED团队，打了一些基础；《Over-Tokenized Transformer》。论文标题看上去在讨论“过度分词”。而重点必然是在第二篇上—— DeepSeek公司的学术成果Engram。《Conditional Memory via Scalable Lookup》也就是Engram模块所出处的论文。

来自主题: AI技术研报

10281 点击 2026-03-31 10:30

早于DeepSeek Engram！用「查表」重置Transformer记忆 | ICLR

ICLR论文STEM架构率先提出「查表式记忆」架构，早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表，用token索引的embedding表直接读取记忆，彻底解耦记忆容量与计算开销。

来自主题: AI技术研报

8588 点击 2026-03-31 10:04