AI资讯新闻榜单内容搜索-AL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AL
关于Personal Agent:搓出次留70%的个人助手之后的一些反思

关于Personal Agent:搓出次留70%的个人助手之后的一些反思

关于Personal Agent:搓出次留70%的个人助手之后的一些反思

这半年我自己做了一款次留70%,月留存30%的个人助手产品,也把市场上所有和沾边的产品都上手用过一遍。想来写写这几个月对这个领域的一手的产品观察。第一部分是做产品的过程,第二部分是一手的观察和判断,按需取用~

来自主题: AI资讯
8382 点击    2026-06-01 10:31
观猹榜,五月排名第一的 Agent 长什么样?

观猹榜,五月排名第一的 Agent 长什么样?

观猹榜,五月排名第一的 Agent 长什么样?

2026 年上半年快过完了,Agent 领域发生了哪些有趣的事呢?

来自主题: AI资讯
8032 点击    2026-06-01 09:24
终于,清华快手养出了通人性的AI!

终于,清华快手养出了通人性的AI!

终于,清华快手养出了通人性的AI!

清华大学经济管理学院的陈柯均博士生、张佳音教授、徐心教授与快手消费策略算法部合作探索完成了一项联合实验:从视频传递的价值观的角度,去理解观看视频后用户的行为和心理变化。

来自主题: AI技术研报
8288 点击    2026-05-31 11:15
DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek陈德里AI论文第二弹:从6分到8分,DeliAutoResearch SKILL又进化了

DeepSeek 研究员陈德里(Deli Chen)和 AI 合作的第二篇论文来了!论文地址:https://victorchen96.github.io/continual_learning_survey.pdf这篇论文聚焦 continual learning(持续学习) 与 self-iteration(自我迭代)。在陈德里看来,这是 AI 迈向 AGI 过程中极为关键的一步。

来自主题: AI技术研报
10081 点击    2026-05-30 22:40
刚刚,全球⾸个“事件级预测”具身智能世界模型WALL-WM来了!

刚刚,全球⾸个“事件级预测”具身智能世界模型WALL-WM来了!

刚刚,全球⾸个“事件级预测”具身智能世界模型WALL-WM来了!

刚刚,自变量机器人团队带来全新解法——发布全球首个「事件级预测」具身智能世界模型WALL-WM。WALL-WM把世界模型的预测单位从时间帧换成了语义事件:

来自主题: AI资讯
8973 点击    2026-05-29 15:12
消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

消耗1830亿token,Meta用AI把数学教材翻译成了一个超大Lean库

编辑|Panda 数学正在迎来 AI 革命。 最近几个月尤为明显。比如,就在前几天,Google DeepMind 新论文宣布其最新系统 AlphaProof Nexus 在一次自主运行中,解决了 3

来自主题: AI资讯
8781 点击    2026-05-29 15:11
刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

刚刚,国产预训练具身大模型开源了,让后训练不再是必选项!

2026 年初,国内具身智能赛道掀起了一波开源潮,越来越多团队开始公开自己的视觉-语言-动作(VLA)模型、数据集与训练框架。与此同时,行业竞争也逐渐集中到 benchmark 成绩、任务成功率以及跨任务泛化能力上,尤其是在标准化或已训练任务中的表现。

来自主题: AI技术研报
8168 点击    2026-05-29 09:19
多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

多变量神经缩放定律迈向大一统:Mila联手DeepMind提出UNSL

过去的大模型 scaling law 通常回答的是:当模型参数量、数据量和训练计算量增加后,loss 会如何下降。

来自主题: AI技术研报
6515 点击    2026-05-29 09:19
DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

DeepSeek、Claude、GPT、Gemini、Qwen实测五大旗舰模型AI编程能力,看Qwen3.7 Max 是否实至名归?!

超越 GPT-5.5、Gemini 3.5 Flash、DeepSeek V4 Pro,阿里的最新旗舰模型 Qwen3.7 Max 在编程竞技榜拿下第二名,仅次于 Claude Opus 4.7。除了真实场景的用户选择,在传统的大模型固定评测榜单上,像是终端能力 Terminal Bench、编程能力 SWE Bench 等,Qwen3.7 Max 的表现也是拿下了国产模型的冠军。

来自主题: AI产品测评
9259 点击    2026-05-28 12:06