AI资讯新闻榜单内容搜索-SOTA

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

智象未来正式发布基于新一代原生全模态模型架构 Unified Transformer（UiT）打造的图像大模型 HiDream-O1-Image-Pro。这一超2千亿参数的原生全模态图像大模型，不仅在多个基准测试中刷新 SOTA 纪录，也标志着智象未来正向图像、视频、文本、音频等多模态统一建模的“原生全模态”阶段迈进。

来自主题: AI资讯

8959 点击 2026-05-25 09:49

Siggraph 26 | 视频版Vision-Banana来了？大一统框架UniVidX刷新多项视频任务SOTA

近日，由香港科技大学 MMLab 及合作团队完成的研究工作「UniVidX: A Unified Multimodal Framework for Versatile Video Generation via Diffusion Priors」被计算机图形学顶级会议 SIGGRAPH 2026 正式接收。

来自主题: AI技术研报

10112 点击 2026-05-12 08:53

残酷真相：硅谷顶尖AI甩开世界1年！你用的不过是「技术余晖」

顶级大佬Elad Gil抛出残酷真相：顶级实验室员工领先硅谷4个月，硅谷领先世界1年。你引以为傲的SOTA，在实验室里可能早已是淘汰的旧引擎。

来自主题: AI资讯

7342 点击 2026-05-11 09:34

谷歌「AI联合数学家」来了！刷新最难数学AI基准SOTA，牛津教授用它解开群论悬案

群论领域几十年无解的第21.10号问题，被牛津数学家Marc Lackenby用谷歌一个新系统破解了。过程也很有意思：AI第一次给出的证明是错的，被系统里的审查Agent揪出了漏洞。

来自主题: AI资讯

8731 点击 2026-05-09 13:18

CVPR 2026 Oral｜横扫室内3D场景，港科大（广州）打造单目开放词汇占据预测新SOTA

在具身智能研究中，如何让智能体精准理解周围环境的精细几何结构与开放语义信息，始终是具身感知的核心难题。近年来，语义占据预测（Semantic Occupancy Prediction）将稠密几何与语义信息统一到三维体素网格中，用于构建 3D 语义占据地图，为机器人的空间推理、导航与交互操作提供了场景表达基础。

来自主题: AI技术研报

10527 点击 2026-05-06 09:07

字节「Seed3D 2.0」炸场：一张图秒生 3D 物体，评测胜率近 90%！推主却说——Meshy 现在更能打

字节跳动 Seed 团队正式发布 Seed3D 2.0——一张图片就能生成高精度 3D 模型，几何和材质两大核心指标均达到 SOTA。60 位专业评测者盲评，人类偏好胜率最高达 89.9%，还能直接输出带关节信息的仿真级资产。推文近 900 赞、5.6 万次浏览迅速刷屏，但连发帖人自己都在评论区承认：「Meshy 和 Tripo 现在还是更好用。」

来自主题: AI资讯

8615 点击 2026-05-05 13:20

“游戏圈野蛮人”跳进AI火坑，周亚辉要“拳打Netflix、脚踢Spotify”！

昆仑万维在年报中宣告，公司正全面All in AGI与AIGC，并在2026年将战略升级为"4+3"，即以视频、音乐音频、世界、基座文本四大SOTA模型为底座，支撑AI短剧、AI音乐、AI游戏三大平台。

来自主题: AI资讯

8380 点击 2026-05-02 13:36

对话EverMind：4个月做到SOTA，要给所有Agent装上长期记忆

EverMind 想做点不一样的。这家由盛大集团孵化的公司，定位是为所有AI Agent提供一个通用的"记忆层"（Memory Layer）。它的核心产品EverOS是一套开源的长期记忆系统，开发者可以把它接入自己的Agent，让AI不仅能记住用户的历史对话和偏好，还能像人一样对记忆进行整理、更新，甚至从过去的经验中学习和进化。

来自主题: AI资讯

8569 点击 2026-05-02 11:12

龙虾冲浪终于不迷路了！网页智能体新框架Avenir-Web开源即SOTA

伦敦大学学院（UCL）、普林斯顿大学和爱丁堡大学的研究团队联合推出了Avenir-Web，让现有多模态模型像人类一样使用网页。现有的Web Agent在面对复杂的网页结构（如 iframe、Shadow DOM）时，往往会陷入“定位不准”“缺乏常识”或“走着走着就忘了”的窘境。

来自主题: AI技术研报

8551 点击 2026-04-30 08:32

超越Claude Mythos和GPT-5.5！斯坦福Agent验证框架拿下SOTA，Transformer作者转发

Transformer论文作者Lukasz Kaiser以及GAN作者Bing Xu转发关注了一项工作——LLM-as-a-Verifier验证框架，该方法是一种通用的验证机制，可与任意Agent Harness和模型结合。

来自主题: AI技术研报

8787 点击 2026-04-27 15:18