AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
智源:ArXiv CLI重磅开源!2亿+开放论文,即将化身科研智能体的技能包

智源:ArXiv CLI重磅开源!2亿+开放论文,即将化身科研智能体的技能包

智源:ArXiv CLI重磅开源!2亿+开放论文,即将化身科研智能体的技能包

DeepXiv 是专为智能体设计的科技文献基础设施,把论文搜索、渐进式阅读、热点追踪和深度调研变成可调用、可编排、可自动化的能力。

来自主题: AI技术研报
9557 点击    2026-04-09 10:46
OpenClaw作者不想让你知道的3件事:Hermes Agent内置一键迁移命令,把35万Star对手的整套数据直接搬过来

OpenClaw作者不想让你知道的3件事:Hermes Agent内置一键迁移命令,把35万Star对手的整套数据直接搬过来

OpenClaw作者不想让你知道的3件事:Hermes Agent内置一键迁移命令,把35万Star对手的整套数据直接搬过来

我认真看 Hermes Agent,不是因为它2.9万Star,而是因为那条 hermes claw migrate。一个新框架敢把"把旧用户整套资产搬过来"做成默认入口,这事本身就很说明问题。

来自主题: AI技术研报
9835 点击    2026-04-09 10:18
全行业的「龙虾热」中,什么是AI Infra下半场的「神之一手」?

全行业的「龙虾热」中,什么是AI Infra下半场的「神之一手」?

全行业的「龙虾热」中,什么是AI Infra下半场的「神之一手」?

我确实对运行 OpenClaw 持相当怀疑的态度。…… 整个生态给人的感觉就像是一个彻底的狂野西部,在安全性上简直是一场噩梦。 —— Andrej Karpathy

来自主题: AI技术研报
8335 点击    2026-04-09 09:48
Mac用户可以在oMLX中使用TurboQuant了,搭配Gemma-4-31B,谷歌全家桶实测很能打!

Mac用户可以在oMLX中使用TurboQuant了,搭配Gemma-4-31B,谷歌全家桶实测很能打!

Mac用户可以在oMLX中使用TurboQuant了,搭配Gemma-4-31B,谷歌全家桶实测很能打!

对本地部署玩家,尤其是Mac用户来说,长上下文推理最大的痛点往往不是“模型不够聪明”,而是稍微多用点上下文,统一内存就被撑爆了”,这一点在最近的Gemma-4 31B的部署中尤为明显,在同等上下文的情况,显存占用比Qwen3.5-27B高约一倍不止,直接劝退了不少人。但好消息是,谷歌近期提出的TurboQuant KV缓存量化算法,正是为了解决这个痛点而生。

来自主题: AI技术研报
7709 点击    2026-04-09 09:47
让机器人学会手往哪儿伸、怎么操作,东大团队给了新解法

让机器人学会手往哪儿伸、怎么操作,东大团队给了新解法

让机器人学会手往哪儿伸、怎么操作,东大团队给了新解法

在具身智能领域,可供性(affordance)预测 —— 即让机器人从视觉观测中理解 "在哪里操作"(接触点)与 "如何操作"(动作方向)—— 是实现精细化机器人操作的基础之一。精细操作要求机器人不仅能定位到物体的可交互区域,更要掌握接触后的准确运动方向,例如判断抽屉把手的精确拉动方向完成开合。

来自主题: AI技术研报
8688 点击    2026-04-09 09:47
不要接盘!七巨头暗套84亿,20万亿AI泡沫濒临崩塌

不要接盘!七巨头暗套84亿,20万亿AI泡沫濒临崩塌

不要接盘!七巨头暗套84亿,20万亿AI泡沫濒临崩塌

穆迪最新报告揭示了两条平行宇宙:要么AI让生产率狂飙,失业率降至3.8%;要么泡沫破裂,460万人失去饭碗。Anthropic CEO预警白领消亡,经济学家却说还没到时候。2026年1月创纪录的裁员数据,似乎正在验证前者。

来自主题: AI技术研报
8781 点击    2026-04-09 09:46
生成式推理再排序,可能会是LLM4RecSys的新突破口吗?

生成式推理再排序,可能会是LLM4RecSys的新突破口吗?

生成式推理再排序,可能会是LLM4RecSys的新突破口吗?

大模型(LLM)的世界知识和推理能力是实现下一代推荐系统,即基于大模型的推荐系统(LLM4Recsys)的重要基石。来自meta ai的研究者们尝试将推理模型引入再排序阶段,推荐系统的最后一环。

来自主题: AI技术研报
10031 点击    2026-04-09 09:46
「生化危机」女主用Claude手搓满分AI,一年0.7美元反杀大厂!

「生化危机」女主用Claude手搓满分AI,一年0.7美元反杀大厂!

「生化危机」女主用Claude手搓满分AI,一年0.7美元反杀大厂!

全网震撼!《生化危机》女主跨界撸码,用Claude造出地表最强AI记忆系统,斩获全球首个满分。一年仅0.7美元,就能让大模型拥有永久记忆。

来自主题: AI技术研报
10238 点击    2026-04-08 17:31
小米AI语音新框架:人人都能当声音导演

小米AI语音新框架:人人都能当声音导演

小米AI语音新框架:人人都能当声音导演

语音合成大家都不陌生,这两年市面上各种AI配音也层出不穷。

来自主题: AI技术研报
9990 点击    2026-04-08 16:58
不止动起来:SentiAvatar重新定义3D数字人动作生成范式

不止动起来:SentiAvatar重新定义3D数字人动作生成范式

不止动起来:SentiAvatar重新定义3D数字人动作生成范式

当你和 3D 数字人对话时,有没有遇到过这种诡异时刻:它的嘴在动,但表情依旧僵硬;手在挥舞,但和说话内容完全脱节;更糟的是,那种外表像真人但动作不自然的违和感,让人瞬间陷入 “恐怖谷”。

来自主题: AI技术研报
5343 点击    2026-04-08 16:30
谷歌的Gemma-4-31B适合哪些人?值得你放弃Qwen3.5-27B吗?深度调研战略报告

谷歌的Gemma-4-31B适合哪些人?值得你放弃Qwen3.5-27B吗?深度调研战略报告

谷歌的Gemma-4-31B适合哪些人?值得你放弃Qwen3.5-27B吗?深度调研战略报告

Gemma4 31B的发布,在开源模型社区引发了巨大的关注。面对这款由谷歌DeepMind于2026年4月2日 推出的重磅模型,很多技术团队和本地部署玩家都在问同一个问题:Gemma4的出现,到底是在开辟一条新的本地部署路线,还是只是给高端玩家多了一个可选项?我们到底需不需要把现有的Qwen3.5 27B工作流整体迁移过去?

来自主题: AI技术研报
8522 点击    2026-04-08 16:29
再不怕乱引文献!绕过付费墙,BibAgent把学术核验转为证据链

再不怕乱引文献!绕过付费墙,BibAgent把学术核验转为证据链

再不怕乱引文献!绕过付费墙,BibAgent把学术核验转为证据链

大模型正在批量生成「看起来很像真的」学术论述,但这些论述背后的引用,真的成立吗?更关键的是:当被引论文被付费墙锁住、原文根本读不到时,自动化核验是否就注定失效?

来自主题: AI技术研报
9749 点击    2026-04-08 16:29
CVPR 2026|1分钟单图变4D视频!AI看图直接脑补物理规律

CVPR 2026|1分钟单图变4D视频!AI看图直接脑补物理规律

CVPR 2026|1分钟单图变4D视频!AI看图直接脑补物理规律

让静态的图片变成三维物体并动起来已经不算新鲜,但如果让图片不仅动起来,还能完美遵循现实世界的物理规律(比如蛋糕的Q弹、沙堆的散落、石雕的坚硬)呢?

来自主题: AI技术研报
5939 点击    2026-04-08 16:27
同一个模型,换个Harness排名跳了25位:智能体基础设施完全解剖

同一个模型,换个Harness排名跳了25位:智能体基础设施完全解剖

同一个模型,换个Harness排名跳了25位:智能体基础设施完全解剖

LangChain 只换了模型外面的基础设施——同一个模型、同一套权重——就从 TerminalBench 2.0 排行榜 30 名开外直接跳到了第 5 名。另一个独立研究项目让大模型自己优化这层基础设施,达到了 76.4% 的通过率,超过了所有人工设计的方案。

来自主题: AI技术研报
8869 点击    2026-04-08 10:23
Claude Mythos Preview来了!强大又危险,Anthropic还专门组了个研究团

Claude Mythos Preview来了!强大又危险,Anthropic还专门组了个研究团

Claude Mythos Preview来了!强大又危险,Anthropic还专门组了个研究团

和之前 Claude Code 泄漏的代码揭示的一样,Claude Mythos 它真的来了。今天凌晨,Anthropic 发布了大量关于其新模型 Claude Mythos Preview 的信息(包含一份长达 244 页的系统卡)。同时,Anthropic 还宣布了一个基于此模型的 AI 网络安全项目 Project Glasswing。

来自主题: AI技术研报
8680 点击    2026-04-08 09:54
关于具身智能「触觉」,你想知道的都在这篇综述里了

关于具身智能「触觉」,你想知道的都在这篇综述里了

关于具身智能「触觉」,你想知道的都在这篇综述里了

在具身智能的感知拼图中,触觉一直扮演着不可或缺却难以被完美量化的角色。它提供了视觉等远程传感器无法替代的关于接触几何、材料特性和交互动态的直接反馈。

来自主题: AI技术研报
6684 点击    2026-04-08 09:14
CVPR 2026|DROID-W:复杂室外动态场景,也能稳定SLAM

CVPR 2026|DROID-W:复杂室外动态场景,也能稳定SLAM

CVPR 2026|DROID-W:复杂室外动态场景,也能稳定SLAM

SLAM 在自动驾驶、机器人、AR/VR 乃至具身智能系统中都是至关重要的环节,它决定了算法能否在一个陌生环境中一边“看懂世界”,一边“知道自己在哪”。

来自主题: AI技术研报
7256 点击    2026-04-08 09:13
AI邪修时刻!Meta联手MIT投毒,左脚踩右脚强行升天

AI邪修时刻!Meta联手MIT投毒,左脚踩右脚强行升天

AI邪修时刻!Meta联手MIT投毒,左脚踩右脚强行升天

Meta SOAR用「剧毒数据」当垫脚石,硬生生把模型从Fail@128的认知黑洞里拽出来,推理能力暴涨9.3%!2026年,这才是最硬核的反杀路线。

来自主题: AI技术研报
5999 点击    2026-04-07 14:57
CVPR2026 | 鬼手想点谁就点谁?LaSM让GUI智能体把注意力「收回来」

CVPR2026 | 鬼手想点谁就点谁?LaSM让GUI智能体把注意力「收回来」

CVPR2026 | 鬼手想点谁就点谁?LaSM让GUI智能体把注意力「收回来」

如果把手机屏幕想象成一个舞台,GUI 智能体就是台下那个 “被授权动手” 的人:它能看懂屏幕上的按钮、输入框和弹窗,能按你的指令去点、去滑、去输入。

来自主题: AI技术研报
10130 点击    2026-04-07 14:28
用雨伞「钓」无人机?首个针对自主目标跟踪闭环系统的物理攻击

用雨伞「钓」无人机?首个针对自主目标跟踪闭环系统的物理攻击

用雨伞「钓」无人机?首个针对自主目标跟踪闭环系统的物理攻击

研究者用特制雨伞干扰无人机视觉系统,让其误判目标在远去,从而失控俯冲。FlyTrap攻击无需信号干扰,仅靠物理图案就能欺骗多款商用无人机,实现静默捕获或击毁。实验显示,物理闭环攻击成功率超60%,且对新人物、新场景均有强泛化能力。这项研究揭示了AI感知系统的重大安全隐患,警示我们:视觉安全正成为智能设备的阿喀琉斯之踵。

来自主题: AI技术研报
9871 点击    2026-04-07 14:28
北大团队改造DeepSeek注意力,速度快四倍还不丢精度

北大团队改造DeepSeek注意力,速度快四倍还不丢精度

北大团队改造DeepSeek注意力,速度快四倍还不丢精度

就在大家都急头白脸地等待DeepSeek-V4的时候,冷不丁一篇新论文引起了网友们的注意—— 提出新稀疏注意力机制HISA(分层索引稀疏注意力),突破64K上下文的索引瓶颈,相比DeepSeek正在用的DSA(DeepSeek Sparse Attention)提速2-4倍。

来自主题: AI技术研报
7079 点击    2026-04-07 10:30
斯坦福最新研究:睡一觉,AI 就知道你还能活多久

斯坦福最新研究:睡一觉,AI 就知道你还能活多久

斯坦福最新研究:睡一觉,AI 就知道你还能活多久

通过一晚上的睡眠,AI 模型就能监控最多 130 种疾病。

来自主题: AI技术研报
7009 点击    2026-04-07 10:02
访谈|Codex 团队如何用自己的产品构建产品——整个 Spec 只有 10 个要点

访谈|Codex 团队如何用自己的产品构建产品——整个 Spec 只有 10 个要点

访谈|Codex 团队如何用自己的产品构建产品——整个 Spec 只有 10 个要点

OpenAI Codex 团队的产品规格文档只有 10 个要点。不是说每个功能的文档只有 10 个要点,而是整个产品的 spec 就这么多。设计师写的代码量超过了六个月前工程师写的。50 到 100 人的团队,直到最近才有了第二个产品经理。

来自主题: AI技术研报
5878 点击    2026-04-07 10:02
跨越智能体落地的可信鸿沟:玄甲(AgentWard)全链路防御操作系统正式发布

跨越智能体落地的可信鸿沟:玄甲(AgentWard)全链路防御操作系统正式发布

跨越智能体落地的可信鸿沟:玄甲(AgentWard)全链路防御操作系统正式发布

大模型技术正在经历一场从 “对话助手” 向 “自主智能体(Agent)” 的深刻演进。智能体不再局限于被动地理解与生成,而是具备了多步规划、工具调用、长期记忆与管理物理 / 数字世界的能力,正逐步深度嵌入企业侧的核心业务流程。这意味着,AI 的边界已从虚拟屏幕的对话框,正式延伸到了真实的生产系统中。

来自主题: AI技术研报
8144 点击    2026-04-07 10:00