AITNT-让一部分人先用AI实现商业化

AI资讯-这里有最及时全面的人工智能资讯报道

AI技术研报-这里有最前沿的人工智能技术解读

AI监管政策-这里有最深刻的人工智能政策解读

AI产品测评-这里有最详细的人工智能工具测评解析

AI商业项目-这里有洞察力最强的AI项目的商业逻辑解析

AI排行榜-这里有最新的AI产品,大模型等人工智能行业的排行榜单

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
最新文章
内存直降50%,token需求少56%!用视觉方式处理长文本

内存直降50%,token需求少56%!用视觉方式处理长文本

内存直降50%,token需求少56%!用视觉方式处理长文本

在NeurIPS 2025论文中,来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST(Vision-centric Token Compression in LLM),为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是,这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报
8454 点击    2025-11-01 09:23
从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录

从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录

从 SD 到 Wan2.5-Preview,AI 视频 2025 质变启示录

最大的时代红利,属于今年四季度发布的中美两大明星产品,OpenAI 的 Sora 2 与阿里的 Wan2.5-Preview。其中,Sora 2 的登场堪称一场教科书级的营销战役。熟悉的邀请码机制再次奏效,用户为了获得一个入场券除了需要购买 GPT 的会员之外,甚至还在二手平台再花几十美金购买邀请码。更绝的是,它把自己变成了一个 AI 版抖音,

来自主题: AI资讯
7074 点击    2025-11-01 09:21
无需训练一键调用超600种工具,哈佛MIT打造AI科学家的“Linux操作系统”,让大模型秒变专家自主做实验

无需训练一键调用超600种工具,哈佛MIT打造AI科学家的“Linux操作系统”,让大模型秒变专家自主做实验

无需训练一键调用超600种工具,哈佛MIT打造AI科学家的“Linux操作系统”,让大模型秒变专家自主做实验

近日,OpenAI 宣称要在 2028 年实现让 AI 完全自主做研究,一下子又把焦点聚在了AI 科学家。 过去,AI 只是作为“助理”辅助研究者们进行科学研究。现在,美国哈佛大学与美国麻省理工学院联

来自主题: AI资讯
9249 点击    2025-11-01 09:14
Sora天才辍学生归来!OpenAI组建3人神秘小队,豪赌超级人工智能

Sora天才辍学生归来!OpenAI组建3人神秘小队,豪赌超级人工智能

Sora天才辍学生归来!OpenAI组建3人神秘小队,豪赌超级人工智能

Sora背后的核心贡献者之一,这位00后的天才辍学生Will Depue,准备再次搞个大事情。刚刚,他宣布下一个目标是,超级人工智能ASI!在结束一段长期休息后,Will Depue宣布他再次回到OpenAI。

来自主题: AI资讯
8028 点击    2025-10-31 15:47
Kimi开源新线性注意力架构,首次超越全注意力模型,推理速度暴涨6倍

Kimi开源新线性注意力架构,首次超越全注意力模型,推理速度暴涨6倍

Kimi开源新线性注意力架构,首次超越全注意力模型,推理速度暴涨6倍

月之暗面最新发布的开源Kimi Linear架构,用一种全新的注意力机制,在相同训练条件下首次超越了全注意力模型。在长上下文任务中,它不仅减少了75%的KV缓存需求,还实现了高达6倍的推理加速。

来自主题: AI技术研报
9522 点击    2025-10-31 15:46
让 AI 开口「像人」:最难的不是智能,是「嗓音」

让 AI 开口「像人」:最难的不是智能,是「嗓音」

让 AI 开口「像人」:最难的不是智能,是「嗓音」

Voice Agent 赛道正在爆发,但它迫切需要一个能让对话真正「流动起来」的底层引擎,一个能撑起下一代交互体验的 TTS 模型。竞争的焦点,已经从 LLM 的「大脑」,延伸到了 TTS 的「嗓音」。谁掌握嗓音,谁就掌握着下一代 AI 商业化的钥匙。而 10 月 30 日 MiniMax 发布的 Speech 2.6 模型,似乎正是一个专为解决这些痛点而来的答案。

来自主题: AI资讯
8169 点击    2025-10-31 15:35
颤抖吧,Bug!OpenAI放出GPT-5「夜行神兽」,命中92%漏洞

颤抖吧,Bug!OpenAI放出GPT-5「夜行神兽」,命中92%漏洞

颤抖吧,Bug!OpenAI放出GPT-5「夜行神兽」,命中92%漏洞

刚刚,OpenAI推出了使用GPT-5寻找和修复安全漏洞的智能体Aardvark。目前,Aardvark还处于beta测试阶段。OpenAI称,Aardvark开创了「防御者优先」的新范式:作为自主安全研究智能体,随代码不断演化,为团队提供持续保护(continuous protection)。

来自主题: AI资讯
8415 点击    2025-10-31 15:34
AI营销效率战下半场:“一人市场部”从“工具赋能”走向“生态整合”

AI营销效率战下半场:“一人市场部”从“工具赋能”走向“生态整合”

AI营销效率战下半场:“一人市场部”从“工具赋能”走向“生态整合”

Xsignal AI Holo(AI全息)数据库的1-9月数据显示,市场(MAU)已自发掀起了一场“效率革命”的上半场:营销人员用脚投票,从Mailchimp等“旧势力”涌向GetResponse和“万相营造”等“效率新势力”。这证明了市场对“单点工具”效率提升的极度渴求。

来自主题: AI技术研报
9134 点击    2025-10-31 15:32
重磅发布!国家队出手解决企业跨省通信「老大难」,语音识别错误率暴降20%

重磅发布!国家队出手解决企业跨省通信「老大难」,语音识别错误率暴降20%

重磅发布!国家队出手解决企业跨省通信「老大难」,语音识别错误率暴降20%

还在忍受方言听不懂、跨省业务推进难?联通直接放出「云+AI」大招,把这些通信顽疾一锅端!本文为你揭秘,运营商如何用科技智慧破局,打开信息「黑匣子」,让效率飙升!

来自主题: AI资讯
7448 点击    2025-10-31 15:30
大模型公司不搞浏览器搞Agent,实测找到原因了

大模型公司不搞浏览器搞Agent,实测找到原因了

大模型公司不搞浏览器搞Agent,实测找到原因了

闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 如果Agent能操作命令行,就有了与整个计算机系统交互的能力。 也意味着一台计算机的几乎所有功能,都可以通过自然语言来驱动。 这种产品终于有雏形了

来自主题: AI资讯
8353 点击    2025-10-31 15:17
海外AI应用行业全景丨万字长文丨2025年9月丨赛道格局 + 赛道之王 + TOP 50 AI应用 + 增长之星丨Xsignal

海外AI应用行业全景丨万字长文丨2025年9月丨赛道格局 + 赛道之王 + TOP 50 AI应用 + 增长之星丨Xsignal

海外AI应用行业全景丨万字长文丨2025年9月丨赛道格局 + 赛道之王 + TOP 50 AI应用 + 增长之星丨Xsignal

本次,X博士继续应用Xsignal数据交互平台的AI Holo(AI 全息)数据库数据,为你提供海外AI应用市场2025年9月的最新发展动态,发布2025年9月海外“赛道格局”、“赛道之王”、“TOP 50 AI应用”和“增长之星”四大数据榜单及深度洞察。

来自主题: AI技术研报
11770 点击    2025-10-31 15:16
微软独家:OpenAI最新季度净亏损115亿美元

微软独家:OpenAI最新季度净亏损115亿美元

微软独家:OpenAI最新季度净亏损115亿美元

这下知道OpenAI为啥要转型公共利益公司了……眼尖的网友发现,OpenAI上季度居然亏了115亿美元!重点是,这可不是哪家媒体的小道消息啊,而是OpenAI的最大金主——微软自己亲手捅出来的。

来自主题: AI资讯
8654 点击    2025-10-31 15:14
你有多久没在下五子棋的时候又唱又跳了?我用 AI 试了试

你有多久没在下五子棋的时候又唱又跳了?我用 AI 试了试

你有多久没在下五子棋的时候又唱又跳了?我用 AI 试了试

你有多久没试过在用 AI 写歌的时候又唱又跳了?——没有人在用 AI 写歌的时候又唱又跳!这是 YouTube 上的一位音乐博主,本想用音乐生成软件做一些糟糕的 AI 音乐,取笑一下人工智能,却意外得到了「味挺正」的日本金属摇滚,一下子就在 TikTok 上迅速爆红。

来自主题: AI资讯
7649 点击    2025-10-31 15:13
重新定义跨模态生成的流匹配范式,VAFlow让视频「自己发声」

重新定义跨模态生成的流匹配范式,VAFlow让视频「自己发声」

重新定义跨模态生成的流匹配范式,VAFlow让视频「自己发声」

在多模态生成领域,由视频生成音频(Video-to-Audio,V2A)的任务要求模型理解视频语义,还要在时间维度上精准对齐声音与动态。早期的 V2A 方法采用自回归(Auto-Regressive)的方式将视频特征作为前缀来逐个生成音频 token,或者以掩码预测(Mask-Prediction)的方式并行地预测音频 token,逐步生成完整音频。

来自主题: AI技术研报
7436 点击    2025-10-31 15:00
最火VLA,看这一篇综述就够了

最火VLA,看这一篇综述就够了

最火VLA,看这一篇综述就够了

ICLR 2026爆火领域VLA(Vision-Language-Action,视觉-语言-动作)全面综述来了! 如果你还不了解VLA是什么,以及这个让机器人学者集体兴奋的领域进展如何,看这一篇就够了。

来自主题: AI技术研报
7606 点击    2025-10-31 14:59
陶哲轩敲警钟!谷歌DeepMind联手五大神殿,用AI向世纪难题宣战

陶哲轩敲警钟!谷歌DeepMind联手五大神殿,用AI向世纪难题宣战

陶哲轩敲警钟!谷歌DeepMind联手五大神殿,用AI向世纪难题宣战

今天,谷歌DeepMind重磅发起「AI赋能数学计划」,集结了全球五大顶尖机构。他们将用上谷歌最强数学AI,去探索发现新的疆域。这其中,有夺下IMO金牌的Gemini Deep Think,有算法发现AI智能体AlphaEvolve,还有形式化证明自动补全AlphaProof。

来自主题: AI资讯
6270 点击    2025-10-31 14:58
从兼职工程师直接跳到CTO,他用两个月让一款 Agent 干掉60%复杂工作并放话:“代码质量与产品成功没有直接关系”!

从兼职工程师直接跳到CTO,他用两个月让一款 Agent 干掉60%复杂工作并放话:“代码质量与产品成功没有直接关系”!

从兼职工程师直接跳到CTO,他用两个月让一款 Agent 干掉60%复杂工作并放话:“代码质量与产品成功没有直接关系”!

在 AI 与自动化方面,Block 在 2025 年初推出了一个名为 “Goose” 的开源 AI Agent 框架。Goose 的设计初衷是:将大型语言模型输出与实际系统行为(如读取/写入文件、运行测试、自动化工作流)连接起来,从而不仅让模型能“聊”而且能“干活“。

来自主题: AI资讯
7122 点击    2025-10-31 14:57
首个实例理解3D重建模型!NTU&阶越提出基于实例解耦的3D重建模型,助理场景理解

首个实例理解3D重建模型!NTU&阶越提出基于实例解耦的3D重建模型,助理场景理解

首个实例理解3D重建模型!NTU&阶越提出基于实例解耦的3D重建模型,助理场景理解

现在,NTU联合StepFun提出了IGGT (Instance-Grounded Geometry Transformer) ,一个创新的端到端大型统一Transformer,首次将空间重建与实例级上下文理解融为一体。

来自主题: AI技术研报
5585 点击    2025-10-31 14:49
AI「上班流」首次完整曝光!不点鼠标,只写代码,PPT也当函数调

AI「上班流」首次完整曝光!不点鼠标,只写代码,PPT也当函数调

AI「上班流」首次完整曝光!不点鼠标,只写代码,PPT也当函数调

AI已经不止会写代码、画图、做PPT,它也开始「上班」了!CMU与斯坦福的研究团队首次完整追踪了AI的工作过程,发现一个惊人事实:它并不是在模仿人类,而是在用编程的方式重写工作的定义。这场关于「谁在工作」的实验,正在重构未来职场的逻辑。

来自主题: AI技术研报
7210 点击    2025-10-31 14:47
刚刚,Kimi开源新架构,开始押注线性注意力

刚刚,Kimi开源新架构,开始押注线性注意力

刚刚,Kimi开源新架构,开始押注线性注意力

月之暗面在这一方向有所突破。在一篇新的技术报告中,他们提出了一种新的混合线性注意力架构 ——Kimi Linear。该架构在各种场景中都优于传统的全注意力方法,包括短文本、长文本以及强化学习的 scaling 机制。

来自主题: AI技术研报
6750 点击    2025-10-31 14:33
4倍速吊打Cursor新模型!英伟达数千GB200堆出的SWE-1.5,圆了Devin的梦!实测被曝性能“滑铁卢”?

4倍速吊打Cursor新模型!英伟达数千GB200堆出的SWE-1.5,圆了Devin的梦!实测被曝性能“滑铁卢”?

4倍速吊打Cursor新模型!英伟达数千GB200堆出的SWE-1.5,圆了Devin的梦!实测被曝性能“滑铁卢”?

近日,开发出 Devin 智能体的知名人工智能公司 Cognition 推出其全新高速 AI 编码模型 SWE-1.5。据介绍,该模型专为在软件工程任务中实现高性能与高速度而设计,现已在 Windsurf 代码编辑器中开放使用。今年 7 月,Cognition 高调收购开发工具 Windsurf。

来自主题: AI资讯
7074 点击    2025-10-31 13:57
「套壳」的最高境界:OpenAI揭秘Atlas浏览器架构OWL

「套壳」的最高境界:OpenAI揭秘Atlas浏览器架构OWL

「套壳」的最高境界:OpenAI揭秘Atlas浏览器架构OWL

尽管今天还有 Sora 角色客串功能和 GPT-5 查找和修复安全漏洞智能体的消息,但本文的重点是深扒 Atlas 背后的「灵魂」—— OWL 架构。看看 OpenAI 究竟是如何驯服 Chromium,把它从浏览器「换皮」玩成了「架构重组」的。

来自主题: AI资讯
7856 点击    2025-10-31 11:38
世界模型可单GPU秒级生成了?厦大、腾讯开源FlashWorld,效果惊艳、免费体验

世界模型可单GPU秒级生成了?厦大、腾讯开源FlashWorld,效果惊艳、免费体验

世界模型可单GPU秒级生成了?厦大、腾讯开源FlashWorld,效果惊艳、免费体验

厦门大学和腾讯合作的最新论文《FlashWorld: High-quality 3D Scene Generation within Seconds》获得了海内外的广泛关注,在当日 Huggingface Daily Paper 榜单位列第一,并在 X 上获得 AK、Midjourney 创始人、SuperSplat 创始人等 AI 大佬点赞转发。

来自主题: AI技术研报
6347 点击    2025-10-31 10:27
别再迷信大模型!吴恩达亲授AI秘籍:小模型+边缘计算=财富密码

别再迷信大模型!吴恩达亲授AI秘籍:小模型+边缘计算=财富密码

别再迷信大模型!吴恩达亲授AI秘籍:小模型+边缘计算=财富密码

吴恩达指出,当下大模型的卷生卷死,谁是赢家不重要。关键的是谁能构建可信的AI应用,谁才能成为真正塑造未来之人,顺便成为下一个通过AI财富自由者。

来自主题: AI资讯
10454 点击    2025-10-31 10:25
Eino ADK:一文搞定 AI Agent 核心设计模式,从 0 到 1 搭建智能体系统

Eino ADK:一文搞定 AI Agent 核心设计模式,从 0 到 1 搭建智能体系统

Eino ADK:一文搞定 AI Agent 核心设计模式,从 0 到 1 搭建智能体系统

当大语言模型突破了 “理解与生成” 的瓶颈,Agent 迅速成为 AI 落地的主流形态。从智能客服到自动化办公,几乎所有场景都需要 Agent 来承接 LLM 能力、执行具体任务。

来自主题: AI技术研报
8755 点击    2025-10-31 10:24
史上最惨一代?AI延长人类寿命,下一代活到200岁不是梦!

史上最惨一代?AI延长人类寿命,下一代活到200岁不是梦!

史上最惨一代?AI延长人类寿命,下一代活到200岁不是梦!

AGI炒作还是现实?AI新闻老将Matt Wolfe直击美国AI核心:从Demis Hassabis的理性谨慎,到扎克伯格的巨资投入,探索递归自我改进的潜在爆炸风险。

来自主题: AI资讯
6189 点击    2025-10-31 09:53
人大、清华DeepAnalyze,让LLM化身数据科学家

人大、清华DeepAnalyze,让LLM化身数据科学家

人大、清华DeepAnalyze,让LLM化身数据科学家

来自人大和清华的研究团队发布了 DeepAnalyze,首个面向自主数据科学的 agentic LLM。DeepAnalyze引起了社区内广泛讨论,一周内收获1000多个GitHub星标、20w余次社交媒体浏览量。

来自主题: AI技术研报
10558 点击    2025-10-31 09:52
AITNT官方交流群 AITNT APP上线