
字节出手,Seedream 4.0 × 小云雀:AI 电商生产力来了
字节出手,Seedream 4.0 × 小云雀:AI 电商生产力来了谷歌的 Nano Banana 甚至被称为 AI 图像生成与编辑领域的「ChatGPT 时刻」,而字节的 Seedream 4.0 则进一步拉低了门槛,让中国用户能以更低的成本进入创作。
谷歌的 Nano Banana 甚至被称为 AI 图像生成与编辑领域的「ChatGPT 时刻」,而字节的 Seedream 4.0 则进一步拉低了门槛,让中国用户能以更低的成本进入创作。
自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后,如何让大模型掌握这种并行探索多种推理路径的能力,成为了学界关注的焦点。
真就一个大写的“哇塞”——智元的灵犀X2,成了全球首个完成韦伯斯特空翻的机器人!要知道,韦伯斯特空翻是空翻里的进阶技巧,属于中高级水平。一般完成这个动作,需要靠一条腿强有力地蹬地,另一条腿摆动带动身体翻转,对腿部爆发力和协调性要求更高。
很多人相信,我们已经进入了所谓的「AI 下半场」,一个模型能力足够强大、应用理应爆发的时代。然而,对于这个时代真正缺少的东西,不同的人有不同的侧重,比如(前)OpenAI 研究者姚顺雨强调了评估的重要性,著名数学家陶哲轩则指出必须降低成本才能实现规模化应用。
近年来,大语言模型(LLMs)在复杂推理任务上的能力突飞猛进,这在很大程度上得益于深度思考的策略,即通过增加测试时(test-time)的计算量,让模型生成更长的思维链(Chain-of-Thought)。
上下文学习”(In-Context Learning,ICL),是大模型不需要微调(fine-tuning),仅通过分析在提示词中给出的几个范例,就能解决当前任务的能力。您可能已经对这个场景再熟悉不过了:您在提示词里扔进去几个例子,然后,哇!大模型似乎瞬间就学会了一项新技能,表现得像个天才。
谷歌TPU团队原班人马组建,英伟达挑战者、AI芯片初创企业Groq又获融资。超出此前的6亿预期,此次融资高达7.5亿美元(约53亿人民币),Groq现估值69亿美元(约490亿人民币)。
这听起来像科幻电影,但Phota Labs正在让这一切成为现实。这家由前Adobe AI研究员创立的公司刚刚获得了由Andreessen Horowitz领投的560万美元种子轮融资,他们正在用个性化的视觉AI技术彻底重新定义摄影的边界。
《全球人工智能科研态势报告(2015-2024)》数据显示,中国AI研究人员数量从2015年不到1万人,增长到2024年的5.2万人,年复合增长率高达28.7%。尽管增长迅速,但仍难追上产业扩张的速度。当前中国AI人才缺口超过500万,供需比例为1∶10。
这篇题为《Nav-R1: Reasoning and Navigation in Embodied Scenes》的新论文,提出了一个新的「身体体现式(embodied)基础模型」(foundation model),旨在让机器人或智能体在 3D 环境中能够更好地结合「感知 + 推理 + 行动」。简单说,它不仅「看到 + 听到+开动马达」,还加入清晰的中间「思考」环节。
以腾讯元器平台上的「公众号智能体」为例,它提供了一种可能的解决方案。它最大的特点,是经过公众号创作者授权后,可自动读取该公众号发布的文章,并实时更新为知识库。对于我们前面提到的困惑,这个功能简直是打瞌睡送来了枕头。
腾讯元宝日活冲前三、混元3D建模精度飙3倍;还要砸1.5亿在沙特建新数据中心!2025腾讯全球数字生态大会这波信息量不小。表面没大张旗鼓,实则在C端悄悄打磨起了大模型产品。从刚公布的数据来看,成果还挺显眼。
来自MIT Improbable AI Lab的研究者们最近发表了一篇题为《RL's Razor: Why Online Reinforcement Learning Forgets Less》的论文,系统性地回答了这个问题,他们不仅通过大量实验证实了这一现象,更进一步提出了一个简洁而深刻的解释,并将其命名为 “RL's Razor”(RL的剃刀)。
ICPC 2025全球总决赛诞生历史性一幕:谷歌Gemini与OpenAI推理模型同时斩获金牌!Gemini在5小时内攻下12题中的10题,并在30分钟破解难倒所有人类的死亡C题;而OpenAI更是满分12/12,碾压139支人类队伍,成为赛场唯一全解团队。
通义DeepResearch团队 投稿 量子位 | 公众号 QbitAI 阿里开源旗下首个深度研究Agent模型通义DeepResearch! 相比于基于基础模型的ReAct Agent和闭源Deep
DeepSeek荣登Nature封面,实至名归!今年1月,梁文锋带队R1新作,开创了AI推理新范式——纯粹RL就能激发LLM无限推理能力。Nature还特发一篇评论文章,对其大加赞赏。
昨天OpenAI正式发布了GPT-5-Codex,一个专门为Codex编码智能体研发的GPT-5版本。在看了全球网友实测效果后,基本结论就是可以告别Claude Code,放下Cursor,直接来拥抱Codex了!为了验证网友们的说法和GPT-5-Codex的真实能力,我们全面的测评了一下。
9月17日消息,AI领域的两大巨头Anthropic和OpenAI正致力于开发能够替代人类执行复杂工作的“AI同事”。其核心方法是使用模拟企业软件来训练AI模型,使其能像人类员工那样理解和操作真实的工作流程。
CEO私人助理的活儿,也被Agent盯上了。 每天能独立更新出全公司的日报版“今日头条”,还是完全本地部署、开箱即用的那种:没错,整个机箱就A4大小,跟iPhone 15 Pro Max对比起来是这样的:不卖关子,这么个新鲜角色,名叫智跃Agent一体机。很有意思的一点是,这是市面上首个专门面向CEO打造的软硬一体私有化Agent,目标用户非常明确。
最近,硅谷兴起了一股新玩法,叫 AI Rollup。 简单来说,就是投资机构帮助AI应用公司收购一批传统小公司,然后把 AI 技术塞进去,让它们更高效、更赚钱,然后批量做大。 一个典型案例就是AI客服公司Crescendo。
人工智能初创公司Invisible Technologies 作为 Scale AI 的竞争对手,在新一轮融资中筹集 1 亿美元资金,这凸显了硅谷投资者对人工智能热潮基础构建模块的持续关注。
真正决定AI上限的,已从「模型规模」转为「数据质量」。从Meta押注数据平台到xAI裁员转招「专业AI导师」,全球「数据大战」全面进入下半场。中国玩家里,澳鹏数据独占一档,仅2025年上半年营收达3.06亿元。高质量、可追溯、可工程化的数据生产,正成为AI产业的新壁垒。
等了一百多天,悬念终于揭晓。 9 月 13 日上午,蚂蚁集团开源团队(「开源技术增长」)携《 2025 大模型开源开发生态全景图 》2.0 版,亮相上海外滩大会。
当最初的技术狂热逐渐褪去,产业界开始冷静地审视:AI 究竟能在多大程度上成为真实的生产力。在这样的背景下,观察腾讯这样一家拥有海量用户和庞大业务场景的巨头如何作答,无疑具有风向标的意义。
你有没有想过,为什么即使今天的 AI 已经能写代码、分析数据、回答复杂问题,但当你和它们对话时,总感觉缺了点什么?那种微妙的不舒适感,就像看着一个技术完美但缺乏灵魂的机器人在表演人类。这不是像素质量的问题,也不是语言能力的缺陷,而是一个更根本的缺失:情感智能。
近日,伦敦国王学院的一项心理学研究表明,ChatGPT等AI工具的使用可能促进或加重精神病(AI psychosis)。研究表示,AI聊天中的奉承、迎合用户方式,可能放大人类的妄想思维,从而导致精神疾病。
36氪获悉,「麦麦科技集团」(下简称“麦麦科技”)已完成超1亿元的Pre-A轮融资,投后估值超10亿元,由启鸿育远、星连资本、春光里、鸿链启元等机构联合领投,部分老股东跟投。本轮融资主要用于AI农业大模型、智能传感设备等核心技术的研发创新。
近年来,以人形机器人、自动驾驶为代表的具身人工智能(Embodied Artificial Intelligence, EAI)正以前所未有的速度发展,从数字世界大步迈向物理现实。然而,当一次错误的风险不再是屏幕上的一行乱码,而是可能导致真实世界中的物理伤害时,一个紧迫的问题摆在了我们面前: 如何确保这些日益强大的具身智能体是安全且值得信赖的?
2022年10月,Comfyanonymous 偶然接触到 Stable Diffusion 并深深着迷。当时这并非因为什么“让 AI 更易用” 的宏大使命,而是出于对图像生成的纯粹热爱。他最初的尝试,仅仅是想生成一位耳廓狐形象的动画角色的图片。。出于对这个想法的执着,ComfyUI 由此诞生。
李飞飞创业公司世界模型新成果来了!只需要一个图像或者提示,就能构建出一个可以无限探索的3D世界——世界更大、风格更多样、3D几何结构更清晰,并且保持一致性、没有时间限制、没有奇怪的变形。