AITNT-让一部分人先用AI实现商业化

Agent2025年终报告来了，UC伯克利、斯坦福和IBM联合发布

2025就要过去了。UC Berkeley、Stanford和IBM联手做了一件大事。他们调研了306份在一线“造 Agent”的从业者问卷，并深度访谈了20个已经成功落地并产生价值的一线企业案例（涵盖金融、科技、医疗等领域）。试图回答一个最朴素的工程问题：一个能用的、赚钱的Agent，到底是用什么架构搭出来的？

来自主题: AI技术研报

7233 点击 2025-12-08 08:52

Agent微调复活？英伟达开源8B新模型带飞GPT-5：在HLE狂卷37分，还把成本打下来

当问题又深又复杂时，一味上最强模型既贵又慢。测试时扩展能想得更久，却不一定想得更对。

来自主题: AI技术研报

10490 点击 2025-12-08 08:51

实测完豆包Seedream 4.5，替我设计师朋友哭了

豆包升级上新，火山引擎带着图像创作模型Doubao-Seedream-4.5来了。新模型有三个主打点。一是强化了原图保持能力，最大化保持原图的人脸、光影与色调、画面细节，可以用来P图。例如“只保留绿线中的人物，将其他角色都删掉”：

来自主题: AI资讯

10123 点击 2025-12-07 22:42

奥特曼仓促亮剑GPT-5.2！一张图爆火全网，全面碾压Gemini 3

紧急反击！自从谷歌放出Gemini 3之后，OpenAI快被逼疯了，奥特曼甚至宣布公司进入了「红色警戒」状态。据The Verge爆料，熟悉OpenAI计划的消息人士透露，OpenAI将在下周（12月9号）发布GPT-5.2，首次对Gemini 3做出正面回应。

来自主题: AI资讯

9003 点击 2025-12-07 12:21

刚刚，英伟达CUDA迎来史上最大更新！

几个小时前，NVIDIA CUDA Toolkit 13.1 正式发布，英伟达官方表示：「这是 20 年来最大的一次更新。」CUDA Tile 是 NVIDIA CUDA Toolkit 13.1 最核心的更新。它是一种基于 tile 的编程模型，能够以更高的层次编写算法，并抽象化专用硬件（例如张量核心）的细节。

来自主题: AI资讯

9546 点击 2025-12-06 21:48

1500 万围观的「疯狂动物城」游戏，Nano Banana Pro+可灵保姆级教程带你复刻

左下角的血条、右下角的小地图，还有这一连串丝滑的跑酷动作…… 看到这个画面，你是不是以为《疯狂动物城2》这边刚拿下中国影史进口动画片票房第一，那边就趁势要推出 3A 开放世界游戏了？甚至这光影和物理碰撞，比很多大厂的游戏都要真实。

来自主题: AI资讯

10349 点击 2025-12-06 12:05

登顶SuperCLUE DeepSearch，openPangu-R-72B深度搜索能力跃升

近日，第三方评测机构 SuperCLUE 发布 11 月 DeepSearch 评测报告，国产大模型 openPangu-R-72B 凭借在长链推理、复杂信息检索领域的卓越表现，在模型榜单中名列第一，体现了基于国产昇腾算力的大模型研发实力。

来自主题: AI资讯

9083 点击 2025-12-06 11:23

谷歌最强大模型付费上线，在DeepSeek开源后被吐槽太贵

奥特曼又得拉响红色警报了。刚刚，谷歌再次扔出重磅炸弹——Gemini 3 Deep Think正式上线！轻松把草图变成逼真3D场景，不仅结构还原到位，就连镂空花纹与光影都处理得明明白白。

来自主题: AI资讯

9104 点击 2025-12-06 11:19

2年内AI生成世界90%知识！老黄2小时重磅访谈「剧透」未来

黄仁勋的最新2.5小时的访谈，吐露了很多震撼人心的故事：2-3年内世界上90%的知识可能将由AI生成；英伟达1996年的生死时刻；童年在烂透了的寄宿学校被迫扫厕所；未来会有巨大的机器人时装产业等。

来自主题: AI资讯

9205 点击 2025-12-06 11:18

GPT-5从零提出量子物理新想法，物理学家写成论文已登Physics Letters B

密歇根州立大学物理学家Stephen Hsu刚刚在《Physics Letters B》上发表了一篇量子物理论文，核心思想由GPT-5从零提出，这可能是第一篇主要想法来自AI的理论物理研究论文。作者本人也在社交媒体上确认了这一点：

来自主题: AI资讯

9083 点击 2025-12-06 11:16

浙大00后硕士破局AI记忆难题！新技术让长对话响应速度快十余倍

走上了堪称是“最佳 AI 转型路径”之后，他也在读研期间和合作者针对 AI 记忆开展了一项研究，借此发明出一种名为 LightMem（轻量记忆）的技术。在 LongMemEval 和 LoCoMo 这两个专门用于考察 AI 长期记忆能力的基准测试上，LightMem 回答问题的准确率全面超越之前的冠军模型，最高提升了 7% 以上，在某些数据集上甚至提升了将近 30%。

来自主题: AI技术研报

8380 点击 2025-12-06 11:15

AAAI 2026 | 北航、东京大学填补AI「语义鸿沟」，过程感知视频理解如何找到「状态」锚点？

在具身智能与视频理解飞速发展的今天，如何让 AI 真正 “看懂” 复杂的操作步骤？北京航空航天大学陆峰教授团队联合东京大学，提出视频理解新框架。该工作引入了 “状态（State）” 作为视觉锚点，解决了抽象文本指令与具象视频之间的对齐难题，已被人工智能顶级会议 AAAI 2026 接收。

来自主题: AI资讯

8252 点击 2025-12-06 11:13

无情淘汰PPT选手！美国AI创业圈，PhD才是敲门砖

在AI浪潮中，博士学位正成为创业者的新宠，取代了传统的MBA文凭。昔日辍学神话渐成例外，如今的技术精英们凭借科研深度，引领小型高效团队迅速崛起。

来自主题: AI技术研报

7818 点击 2025-12-06 11:12

谷歌新架构突破Transformer超长上下文瓶颈！Hinton灵魂拷问：后悔Open吗？

两项关于大模型新架构的研究一口气在NeurIPS 2025上发布，通过“测试时训练”机制，能在推理阶段将上下文窗口扩展至200万token。两项新成果分别是：Titans：兼具RNN速度和Transformer性能的全新架构；MIRAS：Titans背后的核心理论框架。

来自主题: AI技术研报

8211 点击 2025-12-06 11:10

基于文本AI的终结？Agent协作可直接「复制思维」，Token效率暴涨

一直以来，传统 MAS 依赖自然语言沟通，各个 LLM 之间用文本交流思路。这种方法虽然可解释，但冗长、低效、信息易丢失。LatentMAS 则让智能体直接交换内部的隐藏层表示与 KV-cache 工作记忆，做到了：

来自主题: AI技术研报

7981 点击 2025-12-06 11:08

Office危！阿里千问这回把“办公全家桶”打包进了对话框

能写作策划、能生成PPT，还能在线编辑，最关键的是：还能白嫖～刚刚，阿里千问悄悄把办公和写作能力升级了一遍：文档生成、智能排版、在线编辑、多格式转换全都打包进一个入口里：

来自主题: AI资讯

9042 点击 2025-12-06 11:05

首帧的真正秘密被揭开了：视频生成模型竟然把它当成「记忆体」

在 Text-to-Video / Image-to-Video 技术突飞猛进的今天，我们已经习惯了这样一个常识：视频生成的第一帧（First Frame）只是时间轴的起点，是后续动画的起始画面。

来自主题: AI技术研报

9122 点击 2025-12-06 11:03

优理奇机器人完成两轮合计3亿元天使++++轮及天使+++++轮融资，“算法-硬件-场景”三位一体加速具身智能应用落地

优理奇机器人（UniX AI）近日宣布完成两轮合计3亿元天使++++轮及天使+++++轮融资，由川商基金、吴中金控、益华资本、青域基金、太浩创投等机构，以及若干上市公司及产业方参与投资，老股东赛纳资本追加投资。

来自主题: AI资讯

9238 点击 2025-12-06 11:01

告别「2D错觉」，SpatialActor通过解耦语义与几何，为具身智能注入强鲁棒空间基因

作者在包含 50 多个任务的多个仿真和真实世界场景中评估了 SpatialActor。它在 RLBench 上取得了 87.4% 的成绩，达到 SOTA 水平；在不同噪声条件下，性能提升了 13.9% 至 19.4%，展现出强大的鲁棒性。目前该论文已被收录为 AAAI 2026 Oral，并将于近期开源。

来自主题: AI技术研报

8361 点击 2025-12-06 10:59

视频模型也能推理，Sora2推理能力超过GPT-5

DeepWisdom研究团队提出：视频生成模型不仅能画画，更能推理。为了验证这一观点，团队推出了VR-Bench——这是首个通过迷宫任务评估视频模型空间推理（spatial reasoning）能力的基准测试

来自主题: AI技术研报

8874 点击 2025-12-06 10:57

刚刚，2026年英伟达奖学金名单公布，华人博士生霸榜占比80%

一年一度的英伟达奖学金出炉了。二十五年来，英伟达研究生奖学金计划（NVIDIA Graduate Fellowship Program）一直为研究生提供与英伟达技术相关的杰出工作支持。

来自主题: AI资讯

8956 点击 2025-12-06 10:56

北航领衔发布300页代码智能综述：从基础模型到智能体，一次读懂Code LLM全景图

这篇学术论长文由北京航空航天大学复杂关键软件环境全国重点实验室领衔。《From Code Foundation Models to Agents and Applications》一文是对过去几年代码智能领域的一次系统梳理：模型、任务、训练、智能体、安全与应用都被串联成了一条完整、连贯的技术链路。

来自主题: AI技术研报

9385 点击 2025-12-06 10:54

人们用AI在做什么？答案藏在100万亿token背后

2025 年 12 月，硅谷风险投资机构 Andreessen Horowitz（简称 a16z）与 AI 推理服务平台 OpenRouter 联合发布了一份名为《State of AI》的研究报告。这份报告基于 OpenRouter 平台上超过 100 万亿 token 的真实用户交互数据，试图呈现过去一年间大语言模型在实际应用中的真实状态。

来自主题: AI技术研报

10552 点击 2025-12-06 10:22

知名数学家辞职投身AI创业：老板是00后华人女生

确实也是轰动数学和AI两界了。因为就在最近，世界级顶尖数学家宣布辞职，前往硅谷，全职加入AI初创公司——这家公司，还是自己学生创办的——一个24岁00后华人女生。吸引他的这家公司，也不是等闲之辈，而是硅谷新贵——Axiom，一家主打AI数学的明星公司。

来自主题: AI资讯

9166 点击 2025-12-06 10:21

字节前技术负责人创业，联手清华姚班校友，编程智能体世界登顶

来自中国的初创团队词元无限给出了自己的答案。由清华姚班校友带队设计开发的编码智能体 InfCode，在 SWE-Bench Verified 和 Multi-SWE-bench-CPP 两项非常权威的 AI Coding 基准中双双登顶，力压一众编程智能体。

来自主题: AI资讯

10694 点击 2025-12-05 14:51

656行代码5小时搞定，Axiom AI自主完成两项Erdős猜想形式化证明

近日，AI 初创公司 Axiom 宣布其模型在没有人类干预的情况下，自动完成了两个数学猜想的证明——埃尔德什问题（Erdős Problem）中的 481 号和 124 号。据称，481 号问题仅用时 5 小时，代码量为 656 行；124 号问题则耗时超 24 小时。值得关注的是，这些证明均通过 Lean 验证，Lean 的特点是其形式化证明过程无需人工干预，为数学正确性提供了保障。

来自主题: AI资讯

9250 点击 2025-12-05 14:49

速递｜AI音乐黑马Klay融资千万美元签约三大唱片公司，不做歌曲生成做“歌曲改编”

阿蒂从洛杉矶飞来，谈论他的初创公司上周发布的重磅消息。Klay 已与各大唱片公司——环球音乐集团、华纳音乐集团和索尼音乐—— 达成批准上市许可/注册协议，成为首家与这三巨头全部签约的人工智能初创企业。

来自主题: AI资讯

8765 点击 2025-12-05 14:49

Anthropic官宣PTC突破，中国开发者一年前就实现了

Anthropic发布了Programmatic Tool Calling（PTC）特性，让Claude通过代码编排工具执行，降低token消耗、减少延迟并提升准确性。

来自主题: AI技术研报

8778 点击 2025-12-05 14:48

Ilya刚预言完，世界首个原生多模态架构NEO就来了：视觉和语言彻底被焊死

全球首个可大规模落地的开源原生多模态架构（Native VLM），名曰NEO。要知道，此前主流的多模态大模型，例如我们熟悉的GPT-4V、Claude 3.5等，它们的底层逻辑本质上其实玩的就是拼接。

来自主题: AI技术研报

9260 点击 2025-12-05 14:46

AGI新路径！谷歌神作！NIPS大会现场谷歌新模型架构被疯狂围观：模型本身就是记忆系统！网友：Transformer到头了

当地时间12月4日下午，谷歌研究员的一篇论文在现场引来了超多AI爱好者的围观。甚至，被业界专家视为“为AGI发展提供了新框架”，一位人士评价为：这篇论文将成为逐步推动实现AGI的5~10篇论文中的一篇。

来自主题: AI资讯

8718 点击 2025-12-05 14:45

AITNT-让一部分人先用AI实现商业化

AI资讯-这里有最及时全面的人工智能资讯报道

AI技术研报-这里有最前沿的人工智能技术解读

AI监管政策-这里有最深刻的人工智能政策解读

AI产品测评-这里有最详细的人工智能工具测评解析

AI商业项目-这里有洞察力最强的AI项目的商业逻辑解析

AI排行榜-这里有最新的AI产品,大模型等人工智能行业的排行榜单

Agent2025年终报告来了，UC伯克利、斯坦福和IBM联合发布

Agent微调复活？英伟达开源8B新模型带飞GPT-5：在HLE狂卷37分，还把成本打下来

实测完豆包Seedream 4.5，替我设计师朋友哭了

奥特曼仓促亮剑GPT-5.2！一张图爆火全网，全面碾压Gemini 3

刚刚，英伟达CUDA迎来史上最大更新！

1500 万围观的「疯狂动物城」游戏，Nano Banana Pro+可灵保姆级教程带你复刻

登顶SuperCLUE DeepSearch，openPangu-R-72B深度搜索能力跃升

谷歌最强大模型付费上线，在DeepSeek开源后被吐槽太贵

2年内AI生成世界90%知识！老黄2小时重磅访谈「剧透」未来

GPT-5从零提出量子物理新想法，物理学家写成论文已登Physics Letters B

浙大00后硕士破局AI记忆难题！新技术让长对话响应速度快十余倍

AAAI 2026 | 北航、东京大学填补AI「语义鸿沟」，过程感知视频理解如何找到「状态」锚点？

无情淘汰PPT选手！美国AI创业圈，PhD才是敲门砖

谷歌新架构突破Transformer超长上下文瓶颈！Hinton灵魂拷问：后悔Open吗？

基于文本AI的终结？Agent协作可直接「复制思维」，Token效率暴涨

Office危！阿里千问这回把“办公全家桶”打包进了对话框

首帧的真正秘密被揭开了：视频生成模型竟然把它当成「记忆体」

优理奇机器人完成两轮合计3亿元天使++++轮及天使+++++轮融资，“算法-硬件-场景”三位一体加速具身智能应用落地

告别「2D错觉」，SpatialActor通过解耦语义与几何，为具身智能注入强鲁棒空间基因

视频模型也能推理，Sora2推理能力超过GPT-5

刚刚，2026年英伟达奖学金名单公布，华人博士生霸榜占比80%

北航领衔发布300页代码智能综述：从基础模型到智能体，一次读懂Code LLM全景图

人们用AI在做什么？答案藏在100万亿token背后

知名数学家辞职投身AI创业：老板是00后华人女生

字节前技术负责人创业，联手清华姚班校友，编程智能体世界登顶

656行代码5小时搞定，Axiom AI自主完成两项Erdős猜想形式化证明

速递｜AI音乐黑马Klay融资千万美元签约三大唱片公司，不做歌曲生成做“歌曲改编”

Anthropic官宣PTC突破，中国开发者一年前就实现了

Ilya刚预言完，世界首个原生多模态架构NEO就来了：视觉和语言彻底被焊死

AGI新路径！谷歌神作！NIPS大会现场谷歌新模型架构被疯狂围观：模型本身就是记忆系统！网友：Transformer到头了