AI资讯新闻榜单内容搜索-AL

速递｜Stability AI联手Arm推出最快手机端免云模型，8秒生成11秒音频

AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型，该公司宣称这是市场上速度最快的模型，且效率高到足以在智能手机上运行。

来自主题: AI资讯

10373 点击 2025-05-15 14:14

谷歌揭开安卓系统的“未来面纱”：让Android界面有情感，让Gemini模型无处不在

在Google I/O（谷歌开发者大会）前夕，谷歌全球安卓团队的核心成员们，提前组织了一场全球媒体沟通会，剧透了安卓系统的未来新动向。科技行者TechWalker受邀参加了此次活动。

来自主题: AI资讯

10491 点击 2025-05-15 12:50

Notion 重磅更新打造 All-In-One AI 平台，AI 会议笔记正变成一个功能

昨晚的文章里，我介绍了一个 12 人团队做的 AI 社交伴侣产品做到 3000 万美金 ARR，它主要通过 AI 的能力释放了年轻人的娱乐和创作体验《12 个人做的 AI 社交产品 ARR 破 3000 万美金，Perplexity 最新估值 140 亿美金》。

来自主题: AI资讯

9095 点击 2025-05-14 15:29

精准提取数据太折磨人，试下pip install -U contextgem，自动生成提示 | 痛快

最近ContextGem很火。它既不是RAG也不是Agent，而是专注于"结构化提取"的框架，它像一个"文档理解层"，通过文档中心设计和神经网络技术(SAT)将非结构化文档转化为精确的结构化数据。它可作为RAG的前置处理器、Agent的感知模块，也可独立使用。

来自主题: AI技术研报

9571 点击 2025-05-14 15:12

奥特曼最新专访：智能体今年大规模“上岗”，2026年将可独立搞科研

OpenAI奥特曼：DALL·E先于ChatGPT，未来聚焦智能体与编程核心。

来自主题: AI资讯

10745 点击 2025-05-14 14:53

首次！流匹配模型引入GRPO，GenEval几近满分，组合生图能力远超GPT-4o

流匹配模型因其坚实的理论基础和在生成高质量图像方面的优异性能，已成为图像生成（Stable Diffusion, Flux）和视频生成（可灵，WanX，Hunyuan）领域最先进模型的训练方法。然而，这些最先进的模型在处理包含多个物体、属性与关系的复杂场景，以及文本渲染任务时仍存在较大困难。

来自主题: AI技术研报

11605 点击 2025-05-14 10:19

o3完爆人类医生，OpenAI联合262名执业医师推出AI健康基准，直击医疗AGI！

OpenAI发布新基准HealthBench，联手60个国家262名执业医生，树立新的「AGI标志性用例」。OpenAI o3碾压Grok 3和Gemini 2.5 Pro，成功登顶。而最强AI几乎达到了人类医生最佳水平！

来自主题: AI资讯

11304 点击 2025-05-13 19:48

突破大模型推理瓶颈！首篇「Test-Time Scaling」全景综述，深入剖析AI深思之道

当训练成本飙升、数据枯竭，如何继续激发大模型潜能？

来自主题: AI技术研报

9249 点击 2025-05-13 14:48

美军引入AI指挥官“泰坦”推动国防技术转型

帕兰泰尔（Palantir Technologies）向美国陆军交付首批AI驱动的战场情报车，标志着软件主导的军事技术进入新阶段。战术情报目标访问节点（TITAN）系统是价值1.78亿美元合同的成果，该移动式指挥单元旨在优化目标锁定与决策流程。

来自主题: AI资讯

11063 点击 2025-05-13 10:54

CVPR2025｜MCA-Ctrl：多方协同注意力控制助力AIGC时代图像精准定制化

近年来，生成式人工智能（Generative AI）技术的突破性进展，特别是文本到图像 T2I 生成模型的快速发展，已经使 AI 系统能够根据用户输入的文本提示（prompt）生成高度逼真的图像。从早期的 DALL・E 到 Stable Diffusion、Midjourney 等模型，这一领域的技术迭代呈现出加速发展的态势。

来自主题: AI技术研报

12191 点击 2025-05-12 14:59