AI资讯新闻榜单内容搜索-ATI

不靠死记布局也能按图生成，多实例生成的布局控制终于“可控且不串脸”了丨浙大团队

尽管扩散模型在单图像生成上已经日渐成熟，但当任务升级为高度定制化的多实例图像生成（Multi-Instance Image Generation, MIG）时，挑战随之显现：

来自主题: AI技术研报

10700 点击 2025-12-22 09:33

速递｜OpenAI据传以7500亿美元估值融资，亚马逊百亿美元竞标“船票”试图以算力绑定

据《The Information》报道，OpenAI 正与投资者进行融资谈判，计划以 7500 亿美元的估值筹集数百亿美元资金。

来自主题: AI资讯

10311 点击 2025-12-18 16:23

挖掘注意力中的运动线索：无需训练，解锁4D场景重建能力

如何让针对静态场景训练的3D基础模型（3D Foundation Models），在不增加训练成本的前提下，具备处理动态4D场景的能力？

来自主题: AI技术研报

10995 点击 2025-12-18 09:48

VGGT4D：无需训练，挖掘3D基础模型潜力，实现4D动态场景重建

如何让针对静态场景训练的 3D 基础模型（3D Foundation Models）在不增加训练成本的前提下，具备处理动态 4D 场景的能力？

来自主题: AI技术研报

7797 点击 2025-12-17 14:38

Thinking Machines首款产品重大更新：K2 Thinking、Qwen3-VL都可以微调了

当前，AI 领域的研究者与开发者在关注 OpenAI、Google 等领先机构最新进展的同时，也将目光投向了由前 OpenAI CTO Mira Murati 创办的 Thinking Machines Lab。

来自主题: AI技术研报

6689 点击 2025-12-16 16:31

完爆ChatGPT！谷歌这招太狠：连你的「阴阳怪气」都能神还原

谷歌发布Gemini 2.5 Flash原生音频模型，不仅能保留语调进行实时语音翻译，更让AI在复杂指令和连续对话中像真人一样自然流畅。这一更新标志着AI从简单的「文本转语音」跨越到了真正的「拟人化交互」时代。

来自主题: AI资讯

10428 点击 2025-12-15 11:36

微软GigaTIME登上《Cell》：5美元切片变成免疫图谱

微软在《Cell》公布了最新成果：GigaTIME能把一张H&E切片翻译成过去稀缺的免疫图谱，并在人群尺度重建TIME。癌症免疫研究的许多旧限制，也因此开始松动。

来自主题: AI资讯

8775 点击 2025-12-14 10:49

NeurIPS 2025 | 告别全量扫描！浙大提出COIDO：破解多模态数据选择「高耗」难题

在深入技术细节之前，我们先用一张漫画来直观理解 COIDO (Coupled Importance-Diversity Optimization) 解决的核心问题与方案：正如钟离在漫画中所言，面对海量视觉指令数据的选择任务，传统方法需要遍历全部数据才能进行筛选造成大量「磨损」（高昂计算成本）。同时在面对数据重要性和多样性问题时，传统方法往往顾此失彼。

来自主题: AI技术研报

7777 点击 2025-12-14 10:46

AI女王强势归来！前OpenAI CTO的“思考机器”彻底开放！接入KimiK2、千问VL，一个样本让千问VLM识别新物种！

大家还记得Mira Murati吗？那个曾经主导ChatGPT开发的“AI女王”，OpenAI的前CTO，2024年突然离职后，让整个科技圈炸锅！短短几个月，融资20亿美元，估值飙到120亿美元，现在更传出新一轮融资目标直冲500亿美元！这速度，这手笔，简直是AI界的“神话”！而最近的重磅炸弹来了：他们的首款产品Tinker正式全面开放！不再需要等待名单，人人可用！

来自主题: AI资讯

10423 点击 2025-12-13 15:53

a16z 年度预测：2026 年，AI 创业的新机会都在垂直行业，AI 产品会走向定制化

a16z 把旗下的一线投资人聚在了一起，来预测 2026 年的 AI 行业要解决的核心问题和新机会。整体看下来，一个核心趋势：2026 年，AI 已经不仅仅是一个提升效率的工具了，将彻底重塑从工业制造、企业软件到个人体验的方方面面。我们将从单纯「使用 AI」迈入到一个在「AI Native」环境中思考、创造和运营的全新时代。

来自主题: AI资讯

10824 点击 2025-12-13 11:19