AI资讯新闻榜单内容搜索-ATI

拆解Gemini 3：Scaling Law的极致执行与“全模态”的威力

毫无疑问，Google最新推出的Gemini 3再次搅动了硅谷的AI格局。在OpenAI与Anthropic激战正酣之时，谷歌凭借其深厚的基建底蕴与全模态（Native Multimodal）路线，如今已从“追赶者”变成了“领跑者”。

来自主题: AI资讯

9804 点击 2025-11-24 15:26

硅谷天选之女，刷脸刷出3500亿AI独角兽！

硅谷这帮人，胆子是真的大啊！一个几乎0模型、0产品的公司，就靠着创始人的出身，硬生生估值到500亿美元！Thinking Machines Lab又要融资了，这次要筹集40亿至50亿美元。

来自主题: AI资讯

9648 点击 2025-11-22 11:38

AI终于学会「读懂人心」，带飞DeepSeek R1，OpenAI o3等模型

“What is meant often goes far beyond what is said, and that is what makes conversation possible.” ——H. P. Grice

来自主题: AI技术研报

8373 点击 2025-11-21 09:16

让大模型学会「心灵感应」：基于思维沟通的多智能体合作范式来了

如果多个大模型能读懂彼此的想法，会发生什么？

来自主题: AI技术研报

10905 点击 2025-11-18 15:12

AI Native 的影像公司们，颠覆赛道的机会来了！

最近看了不少早期硬件创业项目，逐渐发现 AI 的能力确实是一批新兴硬件公司和硬件品类的「惊蛰」时刻。

来自主题: AI资讯

7164 点击 2025-11-18 10:09

VinciCoder：多模态统一代码生成框架和视觉反馈强化学习，数据代码模型权重已开源

长期以来，多模态代码生成（Multimodal Code Generation）的训练严重依赖于特定任务的监督微调（SFT）。尽管这种范式在 Chart-to-code 等单一任务上取得了显著成功，但其 “狭隘的训练范围” 从根本上限制了模型的泛化能力，阻碍了通用视觉代码智能（Generalized VIsioN Code Intelligence）的发展。

来自主题: AI技术研报

9572 点击 2025-11-17 14:32

RAE+VAE? 预训练表征助力扩散模型Tokenizer，加速像素压缩到语义提取

近期，RAE（Diffusion Transformers with Representation Autoencoders）提出以「冻结的预训练视觉表征」直接作为潜空间，以显著提升扩散模型的生成性能。

来自主题: AI技术研报

11244 点击 2025-11-14 10:21

只演示一次，机器人就会干活了？北大&BeingBeyond联合团队用“分层小脑+仿真分身”让G1零样本上岗

近日，来自北京大学与BeingBeyond的研究团队提出DemoHLM框架，为人形机器人移动操作（loco-manipulation）领域提供一种新思路——仅需1次仿真环境中的人类演示，即可自动生成海量训练数据，实现真实人形机器人在多任务场景下的泛化操作，有效解决了传统方法依赖硬编码、真实数据成本高、跨场景泛化差的核心痛点。

来自主题: AI技术研报

8655 点击 2025-11-14 09:44

让LLM像公司一样干活：微软把“思维并发”做成了协议，准确率更高、关键路径时延降28%

我们长期把LLM当成能独闯难关的“单兵”，在很多任务上，这确实有效。

来自主题: AI技术研报

9309 点击 2025-11-13 09:09

开源又赢闭源！商汤8B模型空间智能碾压GPT-5，AI看懂世界又进了一步

昨晚，商汤正式发布并开源SenseNova-SI系列空间智能大模型，涵盖2B与8B两个版本。该系列模型在多个空间智能基准测试中均表现突出，其中SenseNova-SI-8B模型在VSI-Bench、MMSI-Bench、MindCube-Tiny与ViewSpatial四个核心任务上获得60.99的平均成绩

来自主题: AI资讯

9714 点击 2025-11-11 19:45