会叠衣服的中美机器人,谁离具身智能更近?
会叠衣服的中美机器人,谁离具身智能更近?会思考的机器才是革命 。中国人形机器人产业的手中,握着制造业的王牌,也卡着智能模型的瓶颈。
会思考的机器才是革命 。中国人形机器人产业的手中,握着制造业的王牌,也卡着智能模型的瓶颈。
现有视觉语言大模型(VLMs)在多模态感知和推理任务上仍存在明显短板:1. 对图像中的细粒度视觉信息理解有限,视觉感知和推理能力未被充分激发;2. 强化学习虽能带来改进,但缺乏高质量、易扩展的 RL 数据。
给歌曲做MV,现在已经是一个AI就能搞定的时代了。 来,请欣赏用AI给神曲《八方来财》做的东方赛博朋克MV:
真正的科研利器诞生了!Claude生命科学版出世,搭载最强Claude Sonnet 4.5,实验基准碾压人类。不论是统计代码编写,还是文献总结,AI数小时搞定数月课题。
谷歌这回整了个大活儿!
甲骨文于上周发布全球最大云端AI超级计算机「OCI Zettascale10」,由80万块NVIDIA GPU组成,峰值算力高达16 ZettaFLOPS,成为OpenAI「星际之门」集群的算力核心。其独创Acceleron RoCE网络实现GPU间高效互联,显著提升性能与能效。该系统象征甲骨文在AI基础设施竞争中的强势布局。
你知道“支付宝”已经杀入AI医疗赛道了吧……
当特斯拉、Figure还在发量产蓝图时,中国公司已率先量产独特的绳驱AI机器人,并进入科研商业应用。IROS 2025顶会上,他们以跨国遥操和半身机器人新品引发关注。「Design for AI」的长期主义设计哲学,也获《Nature》报道认可。
大语言模型(LLM)不仅在推动通用自然语言处理方面发挥了关键作用,更重要的是,它们已成为支撑多种下游应用如推荐、分类和检索的核心引擎。尽管 LLM 具有广泛的适用性,但在下游任务中高效部署仍面临重大挑战。
全球智能手机迈入AI决战期!在此节点,一个全新自进化AI系统——MagicOS 10破局而出,会思考、会协作,真正懂你所想,一语搞定任务,让手机从此成为一部活着的原生设备。这家中国头部企业,正执掌全球AI终端话语权。
2025 年 10 月,国际数据公司(International Data Corporation,IDC)发布了《中国 AI 翻译技术评估》报告。这份以“大模型驱动 AI 翻译能力全面换新”为主题的报告指出,大模型技术的全面渗透正在深刻重塑 AI 翻译市场。
“我有两张券,分别为满1000减140、满2000减280,我看中商品的价格分别为……分两次结算怎么凑单最划算?”双11开启后,在社交平台上,有人向Deepseek抛出这个问题。
不再依赖人工设计,让模型真正学会管理记忆。
近日刚好得了空闲,在研读 Anthropic 官方技术博客和一些相关论文,主题是「Agent 与 Context 工程」。2025 年 6 月以来,原名为「Prompt Engineering」的提示词工程,在 AI Agent 概念日趋火热的应用潮中,
在视频生成与理解的赛道上,常常见到分头发力的模型:有的专注做视频生成,有的专注做视频理解(如问答、分类、检索等)。而最近,一个开源项目 UniVid,提出了一个「融合」方向:把理解 + 生成融为一体 —— 他们希望用一个统一的模型,兼顾「看懂视频」+「生成视频」的能力。
复旦大学NLP实验室研发Game-RL,利用游戏丰富视觉元素和明确规则生成多模态可验证推理数据,通过强化训练提升视觉语言模型的推理能力。创新性地提出Code2Logic方法,系统化合成游戏任务数据,构建GameQA数据集,验证了游戏数据在复杂推理训练中的优势。
AI 会写字吗?在写字机器人衍生换代的今天,你或许并不觉得 AI 写字有多么困难。
AI视频领域杀疯了! 发布Vidu Q2图生视频不到2周,Vidu又又又更新了,而且直接甩出三张王牌。 首先是AI创作者们等待良久的Vidu Q2参考生功能终于要正式发布了。此外,Vidu视频延长功能一来就亮绝杀,最高可延长至五分钟。
据业内人士透露,微软已向英特尔下达其下一代人工智能芯片Maia 2的晶圆代工订单,计划采用英特尔的18A或18A-P制程。该芯片或将用于微软Azure数据中心等人工智能基础设施。
今天凌晨,Anthropic 上线了「Claude Code on the web」(即网页版 Claude Code)功能,这种全新的方式可以让用户直接从浏览器中委派编程任务。目前,网页版 Claude Code 处于 Beta 阶段,作为研究预览版向 Pro 和 Max 用户开放使用。
C.ai 之后,AI 陪伴还可能长出怎样的新物种?前 B 站副总裁刘斌新选择了一条非共识路线——从游戏陪伴切入,打造「逗逗游戏伙伴」。目前「逗逗游戏伙伴」已经拿下千万用户、月活突破 200 万,成为 AI 陪伴赛道里的另类黑马,如今,它正以「Hakko AI」之名加速出海。
刚刚,DeepSeek 推出了全新的视觉文本压缩模型 DeepSeek-OCR。 该模型最大的突破在于极高的压缩效率: 20 个节点每天可处理 3300 万页数据,硬件要求仅为 A100-40G。
刚刚,宇树发布第四款人形机器人 H2,高 180cm,重 70kg。和前代 H1 相比,今天发布的 H2 无论是在运动流畅性、还是仿生特征上,都有了相当大的升级。首先是整体的外观形态,和 H 系列都是 180cm 的身高一致,但是 H2 的重量突破性地来到了 70kg 左右,H1 仅有约 47kg。如果要计算它的 BMI,21.6 的结果,妥妥的一个健康好身材。
今天,网络文学行业面临着一个根本性问题:对于文学创作,AI 未来究竟是创作者,还是工具?10 月 16 日,在武汉光谷举行的 2025 阅文创作大会上,成立十周年的阅文给出了一个清晰而审慎的答案。会上,阅文密集发布了三款 AI 应用:「妙笔通鉴」、「版权助手」和「漫剧助手」。
美国麻省理工学院李巨团队在国际顶尖学术期刊Nature上发表了一篇研究论文,展示了一种多模态机器人平台CRESt(Copilot for Real-world Experimental Scientists),通过将多模态模型(融合文本知识、化学成分以及微观结构信息)驱动的材料设计与高通量自动化实验相结合,大幅提升催化剂的研发速度和质量。
这世上有太多 AI benchmark 了,但没有一个 benchmark 能让你心跳加速。 直到近日,AlphaArena 出现了。 这是由初创团队 NOF1 推出的一个「AI 炒币实盘竞技场」,现在已开放全网围观:竞技场地址:https://nof1.ai/
在某种程度上,GPT-5可以被视作是o3.1。 该观点出自OpenAI研究副总裁Jerry Tworek的首次播客采访,而Jerry其人,正是o1模型的主导者之一。
前OpenAI研究员Karina Nguyen宣布创立时尚品牌Maison AGI,首个系列就前OpenAI研究员Karina Nguyen宣布创立时尚品牌Maison AGI,首个系列就与Ilya Sutskever合作,甚至要推出一顶以他头型为原型的帽子。她称,这可能是人类在被AI超越前,最后一次「手作」。当科学家成了灵感缪斯,研究员开始做纪念品,AI的故事,正从技术革命变成人类的自我信仰。
AI智能助手的全球格局,来了个新玩家。 一款名为Cici的AI智能助手应用,近期在多个国家应用商店悄然“霸榜”。