腾讯混元最新开源:一键生成电影级音效,性能表现全面SOTA
腾讯混元最新开源:一键生成电影级音效,性能表现全面SOTA自带声音的视频生成模型,开源版开卷! 最新赶到的是腾讯混元:刚刚正式开源端到端的视频音效生成模型HunyuanVideo-Foley。
自带声音的视频生成模型,开源版开卷! 最新赶到的是腾讯混元:刚刚正式开源端到端的视频音效生成模型HunyuanVideo-Foley。
本文介绍了来自北京大学王选计算机研究所王勇涛团队及合作者的最新研究成果 AutoOcc。针对开放自动驾驶场景,该篇工作提出了一个高效、高质量的 Open-ended 三维语义占据栅格真值标注框架,无需任何人类标注即可超越现有语义占据栅格自动化标注和预测管线,并展现优秀的通用性和泛化能力,论文已被 ICCV 2025 录用为 Highlight。
杜克大学与 Zoom 的研究者们推出了 LiveMCP-101,这是首个专门针对真实动态环境设计的 MCP-enabled Agent 评测基准。该基准包含 101 个精心设计的任务,涵盖旅行规划,体育娱乐,软件工程等多种不同场景,要求 Agent 在多步骤、多工具协同的场景下完成任务。
今天,AI 行业发展更进一步,将“光”引入 AIGC 领域,完全基于系统硬件物理定律,首次实现了具备特定特征的全新(未见过的)图像生成。来自加州大学洛杉矶分校的研究团队成功实现了手写数字、时尚产品、蝴蝶、人脸及艺术品(如梵高风格)的单色与多色图像光学生成,且整体性能媲美基于数字神经网络的生成式模型。
刚刚,马斯克xAI加入Coding战局:推出智能编程模型Grok Code Fast 1。Fast写进名字里,新模型主打的就是快速、经济,且支持256K上下文,可在GitHub Copilot、Cursor、Cline、Kilo Code、Roo Code、opencode和Windsurf上使用,还限时7天免费!
OpenAI和Anthropic罕见合作!因为AI安全「分手」后,这次双方却因为安全合作:测试双方模型在幻觉等四大安全方面的具体表现。这场合作,不仅是技术碰撞,更是AI安全的里程碑,百万用户每天的互动,正推动安全边界不断扩展。
大模型爆发以来,围绕AI陪伴、AI教育、AI玩具等领域的创业一茬接一茬。但对于什么是合适的硬件形态、交互模态,市场还未有一个PMF的成功样板。
近日,Physical AI 公司极佳视界宣布完成Pre-A&Pre-A+连续两轮数亿元融资。Pre-A 轮融资由国中资本领投,紫峰资本、老股东 PKSHA Algorithm Fund跟投;Pre-A+ 轮融资由中金资本、广州产投、一村淞灵、华强资本投资。
智东西8月27日消息,据外媒The Information报道,苹果高管曾在内部讨论收购生成式AI搜索独角兽Perplexity、欧洲大模型独角兽Mistral的可能性,但目前尚无定论。
一切皆可用上 AI,包括浏览器本身。 今天,AI 大模型公司 Anthropic 发布了一则最新公告——《Chrome 版 Claude 试运行》。简而言之,他们给 Chrome 浏览器开发了一款插件,让 Claude 这个大模型可以帮人自动操作网页。