AITNT-让一部分人先用AI实现商业化

跟这个音乐Agent聊会儿，分分钟生成抖音神曲 | 对话音乐创作Agent产品Tunee

“人人都能玩点音乐”，Tunee真的做到了。这也说明，AI创作领域产品真的从“工具产品”迈向“智能体交互产品”了。在AI创作领域，玩家可不少。诸如星流、Manus、海螺AI、美图秀秀等成熟玩家，以及近期爆火的Liblib AI纷纷入场卷起Agent能力，产品功能或围绕平台生态、或深入垂直场景不断迭代优化细节。

来自主题: AI资讯

9110 点击 2025-11-02 10:22

Meta裁员、OpenAI重组：万字复盘谷歌起笔的AI史诗，如何被「群雄」改写剧本？

知名科技播客《Acquired》最近的一期节目，以谷歌（Google）的 AI 发展史与战略为主线，巧妙地穿插了其他 AI 巨头的崛起历程，节目几乎涵盖了当今 AI 领域大部分的关键人物，为听众系统地梳理出一部简明的 AI 发展史。

来自主题: AI技术研报

9353 点击 2025-11-02 10:16

锁定角色，「多主体」也可控！个性化文生图，给你PS般交互体验

LayerComposer革新了个性化图像生成，让用户像在Photoshop里一样自由操控元素位置、大小，解决传统方法交互性与多主体扩展难题，实现更自然、高效的创作，推动个性化生成迈向主动交互新阶段。

来自主题: AI技术研报

9516 点击 2025-11-02 10:07

少量视角也能得到完整3D几何，即插即用的语义增强重建插件来了

直观经验却告诉我们，只要把同一物体的 “对应部分” 对齐，形状就会变得清晰。基于这一朴素而有效的直觉，作者提出SERES（Semantic-Aware Reconstruction from Sparse Views），在不改动主干框架的前提下，把跨视角的语义一致性变成一种训练期先验注入到模型里，用低成本的方法去解决高价值的歧义问题，让少量视角也能得到清晰而完整的几何。

来自主题: AI技术研报

7639 点击 2025-11-02 10:03

消失的Ilya，被马斯克和OpenAI逼进法庭

还记得Ilya把奥特曼赶出OpenAI的那场宫斗大戏吗？时隔两年，又有新的猛料爆出来了。10月1日，在旧金山，马斯克和OpenAI的律师对Ilya Sutskever进行了长达近10个小时的质询。

来自主题: AI资讯

9376 点击 2025-11-01 23:41

AI 画作卖出 100 多万，这个世界没有疯

不知道还有多少人记得，三年前有一幅名为《太空歌剧院》的作品：恢弘的大厅里，名伶身着华服，站在舞台上，庄重又华丽。这幅作品由游戏设计师杰森·艾伦（Jason Allen）借助 Midjourney 生成，并经由 Photoshop 润色完成。美国科罗拉多州博览会的艺术比赛中夺得数字艺术类别的头奖——一经公示，质疑声四起，许多人指责艾伦「拿 AI 的成果充当自己的作品」去参赛。

来自主题: AI资讯

9303 点击 2025-11-01 13:11

一场直播，10万人被骗！「AI黄仁勋」比真人火8倍

论直播，AI版黄仁勋，竟碾压了本尊？周三的GTC 2025大会上，黄仁勋在华盛顿登台激情演讲。但怪事发生了。另一个打着「NVIDIA LIVE」旗号的直播，却悄悄聚集了近10万观众。

来自主题: AI资讯

10400 点击 2025-11-01 13:10

最新外国「自研」大模型，都是套壳国产？

绷不住了，美国科技公司最新发布的大模型，思考时怎么一直在说中文？据官方博客介绍，在研发过程中，他们试验了一个代号为 Cheetah 的原型智能体模型，以更好地理解更高速智能体模型的影响。Composer 是该模型的更智能升级版，凭借足够的速度支撑交互式体验，让编码始终丝滑。

来自主题: AI资讯

9292 点击 2025-11-01 13:08

原神LOL齐聚的Unity开发者大会，我看到了AI游戏的未来

在上海，“AI+游戏”的浪潮得到了最新证明。从《恋与深空》到LOL，技术论道的背后，开发者们正在用AI创造全新的世界。下面就让我们将目光转向2025 Unity开发者大会，看看AI+游戏又会碰撞出怎么的火花：

来自主题: AI资讯

9633 点击 2025-11-01 13:01

上海AI Lab发布混合扩散语言模型SDAR：首个突破6600 tgs的开源扩散语言模型

近日，上海人工智能实验室针对该难题提出全新范式 SDAR (Synergistic Diffusion-AutoRegression)。该方法通过「训练-推理解耦」的巧妙设计，无缝融合了 AR 模型的高性能与扩散模型的并行推理优势，能以极低成本将任意 AR 模型「改造」为并行解码模型。

来自主题: AI技术研报

8688 点击 2025-11-01 12:57

刚刚，英伟达拟10亿美元砸向这家AI编码创企！Copilot 技术大佬带队、成立两年估值近千亿

10 月 30 日，据彭博社援引知情人士报道，英伟达计划向人工智能初创公司 Poolside 投资最高达 10 亿美元，这笔交易预计将使后者的估值翻四倍。消息人士称，Poolside 目前正在洽谈一轮新融资，拟以 120 亿美元的投前估值融资 20 亿美元。其中，英伟达计划出资至少 5 亿美元，若本轮融资顺利完成，英伟达的总投资额可能达到 10 亿美元。

来自主题: AI资讯

9102 点击 2025-11-01 09:50

微软AI新天团曝光！只有1位华人，「谷歌系」超1/3

微软AI CEO苏莱曼领导的17名核心高管阵容曝光：新增9名核心成员中有5位来自谷歌（包含DeepMind）系；8名老将中有2名来自苏莱曼共同创办的Inflection AI；17人中有7位是原微软的资深高管。新核心团队将聚焦AI产品落地、安全与隐私、增长与商业化。

来自主题: AI资讯

9737 点击 2025-11-01 09:46

字节发布通用游戏智能体！5000亿token训练，用鼠标键盘吊打GPT-5！

Game-TARS基于统一、可扩展的键盘—鼠标动作空间训练，可在操作系统、网页与模拟环境中进行大规模预训练。依托超5000亿标注量级的多模态训练数据，结合稀疏推理（Sparse-Thinking）与衰减持续损失（decaying continual loss），大幅提升了智能体的可扩展性和泛化性。

来自主题: AI技术研报

8999 点击 2025-11-01 09:42

人在美国，待过三家AI Lab，全凉了！

科技行业全球10万大裁员，连10年老将田渊栋都被Meta裁掉了！昨天，南洋理工大学的副教授Boyang Li吊足了大家的胃口：Meta FAIR最近的事件很抓马，但工业研究为什么这么难？我想知道大家愿不愿意听一下我的观点。

来自主题: AI资讯

9043 点击 2025-11-01 09:40

世界模型有了开源基座Emu3.5！拿下多模态SOTA，性能超越Nano Banana

最新最强的开源原生多模态世界模型—— 北京智源人工智能研究院（BAAI）的悟界·Emu3.5来炸场了。图、文、视频任务一网打尽，不仅能画图改图，还能生成图文教程，视频任务更是增加了物理真实性。

来自主题: AI资讯

8374 点击 2025-11-01 09:36

港科提出新算法革新大模型推理范式：随机策略估值竟成LLM数学推理「神操作」

论文第一作者何浩然是香港科技大学博士生，研究方向包括强化学习和基础模型等，研究目标是通过经验和奖励激发超级智能。共同第一作者叶语霄是香港科技大学一年级博士。通讯作者为香港科技大学电子及计算机工程系、计

来自主题: AI技术研报

9193 点击 2025-11-01 09:24

内存直降50%，token需求少56%！用视觉方式处理长文本

在NeurIPS 2025论文中，来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是，这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报

9721 点击 2025-11-01 09:23

从 SD 到 Wan2.5-Preview，AI 视频 2025 质变启示录

最大的时代红利，属于今年四季度发布的中美两大明星产品，OpenAI 的 Sora 2 与阿里的 Wan2.5-Preview。其中，Sora 2 的登场堪称一场教科书级的营销战役。熟悉的邀请码机制再次奏效，用户为了获得一个入场券除了需要购买 GPT 的会员之外，甚至还在二手平台再花几十美金购买邀请码。更绝的是，它把自己变成了一个 AI 版抖音，

来自主题: AI资讯

8468 点击 2025-11-01 09:21

无需训练一键调用超600种工具，哈佛MIT打造AI科学家的“Linux操作系统”，让大模型秒变专家自主做实验

近日，OpenAI 宣称要在 2028 年实现让 AI 完全自主做研究，一下子又把焦点聚在了AI 科学家。过去，AI 只是作为“助理”辅助研究者们进行科学研究。现在，美国哈佛大学与美国麻省理工学院联

来自主题: AI资讯

10541 点击 2025-11-01 09:14

Sora天才辍学生归来！OpenAI组建3人神秘小队，豪赌超级人工智能

Sora背后的核心贡献者之一，这位00后的天才辍学生Will Depue，准备再次搞个大事情。刚刚，他宣布下一个目标是，超级人工智能ASI！在结束一段长期休息后，Will Depue宣布他再次回到OpenAI。

来自主题: AI资讯

8957 点击 2025-10-31 15:47

Kimi开源新线性注意力架构，首次超越全注意力模型，推理速度暴涨6倍

月之暗面最新发布的开源Kimi Linear架构，用一种全新的注意力机制，在相同训练条件下首次超越了全注意力模型。在长上下文任务中，它不仅减少了75%的KV缓存需求，还实现了高达6倍的推理加速。

来自主题: AI技术研报

10580 点击 2025-10-31 15:46

让 AI 开口「像人」：最难的不是智能，是「嗓音」

Voice Agent 赛道正在爆发，但它迫切需要一个能让对话真正「流动起来」的底层引擎，一个能撑起下一代交互体验的 TTS 模型。竞争的焦点，已经从 LLM 的「大脑」，延伸到了 TTS 的「嗓音」。谁掌握嗓音，谁就掌握着下一代 AI 商业化的钥匙。而 10 月 30 日 MiniMax 发布的 Speech 2.6 模型，似乎正是一个专为解决这些痛点而来的答案。

来自主题: AI资讯

9455 点击 2025-10-31 15:35

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

刚刚，OpenAI推出了使用GPT-5寻找和修复安全漏洞的智能体Aardvark。目前，Aardvark还处于beta测试阶段。OpenAI称，Aardvark开创了「防御者优先」的新范式：作为自主安全研究智能体，随代码不断演化，为团队提供持续保护（continuous protection）。

来自主题: AI资讯

9518 点击 2025-10-31 15:34

AI营销效率战下半场：“一人市场部”从“工具赋能”走向“生态整合”

Xsignal AI Holo（AI全息）数据库的1-9月数据显示，市场（MAU）已自发掀起了一场“效率革命”的上半场：营销人员用脚投票，从Mailchimp等“旧势力”涌向GetResponse和“万相营造”等“效率新势力”。这证明了市场对“单点工具”效率提升的极度渴求。

来自主题: AI技术研报

10399 点击 2025-10-31 15:32

重磅发布！国家队出手解决企业跨省通信「老大难」，语音识别错误率暴降20%

还在忍受方言听不懂、跨省业务推进难？联通直接放出「云+AI」大招，把这些通信顽疾一锅端！本文为你揭秘，运营商如何用科技智慧破局，打开信息「黑匣子」，让效率飙升！

来自主题: AI资讯

8486 点击 2025-10-31 15:30

大模型公司不搞浏览器搞Agent，实测找到原因了

闻乐发自凹非寺量子位 | 公众号 QbitAI 如果Agent能操作命令行，就有了与整个计算机系统交互的能力。也意味着一台计算机的几乎所有功能，都可以通过自然语言来驱动。这种产品终于有雏形了

来自主题: AI资讯

9453 点击 2025-10-31 15:17

海外AI应用行业全景丨万字长文丨2025年9月丨赛道格局 + 赛道之王 + TOP 50 AI应用 + 增长之星丨Xsignal

本次，X博士继续应用Xsignal数据交互平台的AI Holo（AI 全息）数据库数据，为你提供海外AI应用市场2025年9月的最新发展动态，发布2025年9月海外“赛道格局”、“赛道之王”、“TOP 50 AI应用”和“增长之星”四大数据榜单及深度洞察。

来自主题: AI技术研报

14049 点击 2025-10-31 15:16

微软独家：OpenAI最新季度净亏损115亿美元

这下知道OpenAI为啥要转型公共利益公司了……眼尖的网友发现，OpenAI上季度居然亏了115亿美元！重点是，这可不是哪家媒体的小道消息啊，而是OpenAI的最大金主——微软自己亲手捅出来的。

来自主题: AI资讯

9378 点击 2025-10-31 15:14

你有多久没在下五子棋的时候又唱又跳了？我用 AI 试了试

你有多久没试过在用 AI 写歌的时候又唱又跳了？——没有人在用 AI 写歌的时候又唱又跳！这是 YouTube 上的一位音乐博主，本想用音乐生成软件做一些糟糕的 AI 音乐，取笑一下人工智能，却意外得到了「味挺正」的日本金属摇滚，一下子就在 TikTok 上迅速爆红。

来自主题: AI资讯

9067 点击 2025-10-31 15:13

重新定义跨模态生成的流匹配范式，VAFlow让视频「自己发声」

在多模态生成领域，由视频生成音频（Video-to-Audio，V2A）的任务要求模型理解视频语义，还要在时间维度上精准对齐声音与动态。早期的 V2A 方法采用自回归（Auto-Regressive）的方式将视频特征作为前缀来逐个生成音频 token，或者以掩码预测（Mask-Prediction）的方式并行地预测音频 token，逐步生成完整音频。

来自主题: AI技术研报

8581 点击 2025-10-31 15:00

AITNT-让一部分人先用AI实现商业化

AI资讯-这里有最及时全面的人工智能资讯报道

AI技术研报-这里有最前沿的人工智能技术解读

AI监管政策-这里有最深刻的人工智能政策解读

AI产品测评-这里有最详细的人工智能工具测评解析

AI商业项目-这里有洞察力最强的AI项目的商业逻辑解析

AI排行榜-这里有最新的AI产品,大模型等人工智能行业的排行榜单

跟这个音乐Agent聊会儿，分分钟生成抖音神曲 | 对话音乐创作Agent产品Tunee

Meta裁员、OpenAI重组：万字复盘谷歌起笔的AI史诗，如何被「群雄」改写剧本？

锁定角色，「多主体」也可控！个性化文生图，给你PS般交互体验

少量视角也能得到完整3D几何，即插即用的语义增强重建插件来了

消失的Ilya，被马斯克和OpenAI逼进法庭

AI 画作卖出 100 多万，这个世界没有疯

一场直播，10万人被骗！「AI黄仁勋」比真人火8倍

最新外国「自研」大模型，都是套壳国产？

原神LOL齐聚的Unity开发者大会，我看到了AI游戏的未来

上海AI Lab发布混合扩散语言模型SDAR：首个突破6600 tgs的开源扩散语言模型

刚刚，英伟达拟10亿美元砸向这家AI编码创企！Copilot 技术大佬带队、成立两年估值近千亿

微软AI新天团曝光！只有1位华人，「谷歌系」超1/3

字节发布通用游戏智能体！5000亿token训练，用鼠标键盘吊打GPT-5！

人在美国，待过三家AI Lab，全凉了！

世界模型有了开源基座Emu3.5！拿下多模态SOTA，性能超越Nano Banana

港科提出新算法革新大模型推理范式：随机策略估值竟成LLM数学推理「神操作」

内存直降50%，token需求少56%！用视觉方式处理长文本

从 SD 到 Wan2.5-Preview，AI 视频 2025 质变启示录

无需训练一键调用超600种工具，哈佛MIT打造AI科学家的“Linux操作系统”，让大模型秒变专家自主做实验

Sora天才辍学生归来！OpenAI组建3人神秘小队，豪赌超级人工智能

Kimi开源新线性注意力架构，首次超越全注意力模型，推理速度暴涨6倍

让 AI 开口「像人」：最难的不是智能，是「嗓音」

颤抖吧，Bug！OpenAI放出GPT-5「夜行神兽」，命中92%漏洞

AI营销效率战下半场：“一人市场部”从“工具赋能”走向“生态整合”

重磅发布！国家队出手解决企业跨省通信「老大难」，语音识别错误率暴降20%

大模型公司不搞浏览器搞Agent，实测找到原因了

海外AI应用行业全景丨万字长文丨2025年9月丨赛道格局 + 赛道之王 + TOP 50 AI应用 + 增长之星丨Xsignal

微软独家：OpenAI最新季度净亏损115亿美元

你有多久没在下五子棋的时候又唱又跳了？我用 AI 试了试

重新定义跨模态生成的流匹配范式，VAFlow让视频「自己发声」