
调整训练数据出场顺序,大模型就能变聪明!无需扩大模型/数据规模
调整训练数据出场顺序,大模型就能变聪明!无需扩大模型/数据规模模型训练重点在于数据的数量与质量?其实还有一个关键因素—— 数据的出场顺序。
模型训练重点在于数据的数量与质量?其实还有一个关键因素—— 数据的出场顺序。
AI 最臭名昭著的 Bug 是什么?不是代码崩溃,而是「幻觉」—— 模型自信地编造事实,让你真假难辨。这个根本性挑战,是阻碍我们完全信任 AI 的关键障碍。
北京时间9月5日晚,美国AI独角兽Anthropic在其官网发布了一则公告。内容简洁而强硬:其旗下的Claude系列模型,将立即停止向多数股权由中国资本持有的公司提供服务。在熟悉华盛顿政治生态的人看来,这一决绝姿态的背后,与Anthropic创始人达里奥·阿莫迪(Dario Amodei)的个人经历不无关系。
以前,每当上线一个新模型,大家总要绞尽脑汁想个响亮又不撞车的名字。 不得不说,有时候名字起得太出彩,甚至能把模型本身给卷下去。别人还没搞懂它能干嘛,名字已经在朋友圈刷屏了。
AI制药,一家新独角兽诞生了。 9月4日,AI+生物科技公司Enveda宣布,公司已经完成1.5亿美元的D轮融资,目前估值超过10亿美元。
《金融时报》最新消息,OpenAI 正在和博通合作,自研一颗代号 “XPU” 的 AI 推理芯片,预计会在 2026 年量产,由台积电代工。不同于英伟达 的 GPU,这款芯片不会对外销售,而是专门满足 OpenAI 内部的训练与推理需求,用来支撑即将上线的 GPT-5 等更庞大的模型。
能看懂视频并进行跨模态推理的大模型Keye-VL 1.5,快手开源了。
过去几年,人们总担心被AI抢走工作。可现在,OpenAI却宣布要做「AI就业办」:上线就业平台,推出AI技能认证,目标在2030年前让1000万人持证上岗。沃尔玛率先参与,白宫亲自背书。这一次,LinkedIn遇上了最强挑战者。
在端侧 AI 这个热门赛道,华为盘古大模型扔下了一颗 “重磅炸弹” 。
想象一个虚拟人,他不仅能精准地对上你的口型,还能在你讲到关键点时做出恍然大悟的表情,在你讲述悲伤故事时流露出同情的神态,甚至能根据你的话语逻辑做出有意义的手势。
全球第一家被收购的AI浏览器公司诞生了! 刚刚,拥有Arc和Dia两款AI浏览器的The Browser Company,被企业协作软件公司Atlassian以6.1亿美元(约为43亿人民币)重金收购。
近年来,生成式 AI 和多模态大模型在各领域取得了令人瞩目的进展。然而,在现实世界应用中,动态环境下的数据分布和任务需求不断变化,大模型如何在此背景下实现持续学习成为了重要挑战
VMem用基于3D几何的记忆索引替代「只看最近几帧」的短窗上下文:检索到的参考视角刚好看过你现在要渲染的表面区域;让模型在小上下文里也能保持长时一致性;实测4.2s/帧,比常规21帧上下文的管线快~12倍。
来自斯坦福的研究者们最近发布的一篇论文(https://arxiv.org/abs/2509.01684)直指RL强化学习在机器学习工程(Machine Learning Engineering)领域的两个关键问题,并克服了它们,最终仅通过Qwen2.5-3B便在MLE任务上超越了仅依赖提示(prompting)的、规模更大的静态语言模型Claude3.5。
苹果研究人员发现,在大模型中,极少量的参数,即便只有0.01%,仍可能包含数十万权重,他们将这一发现称为「超级权重」。超级权重点透了大模型「命门」,使大模型走出「炼丹玄学」。
人形机器人对跳舞这件事,如今是越来越擅长了。北京大学与BeingBeyond团队联合研发的BumbleBee系统给出了最新答案:通过创新的“分治-精炼-融合”三级架构,该系统首次实现人形机器人在多样化动作中的稳定控制。
阿里迄今为止,参数最大的模型诞生了!昨夜,Qwen3-Max-Preview(Instruct)官宣上线,超1万亿参数性能爆表。在全球主流权威基准测试中,Qwen3-Max-Preview狂揽非推理模型「C」位,直接碾压Claude-Opus 4(Non-Thinking)、Kimi-K2、DeepSeek-V3.1。
Dify 又偷偷更新了!本次更新不仅支持了期待已久的“图文混答”,几乎是 重构了“知识库”,可以用工作流的方式创建“知识库”,并且支持调试,具备“工作流”的完整功能,是一个正经的”工作流“。提升了知识库开发的灵活性,与智能体的交互体验。
智东西9月5日消息,刚刚,大模型独角兽月之暗面发布新模型Kimi K2-0905,目前,Kimi应用和网页版中的K2模型已全量升级到Kimi K2-0905。该模型的核心升级点为Agentic Coding能力增强、支持256K上下文、API支持高达60-100Token/s的输出速度、支持Claude Code。
ChatGPT的新功能,终于是千呼万唤始出来了—— 分支对话(Conversation Branching)。
硅谷AI传奇,仍在不断上演。00后华人女CEO带队闯入好莱坞,首年狂揽8亿营收,还甩出《科尔特斯》、《太空计划》两部史诗级大作。从3D场景到最终镜头,皆由AI一键生成,效果美到炸裂。 她,21岁,曾是谷歌秘密实验室最年轻的工程师,和团队一起将产品卖给fortune 500的客户,从0带到10。
AI自己玩手机、玩电脑、操作网页浏览器……背后还只靠一个模型。 卷王字节Seed又把智能体带到了一个全新level~
Nano banana 爆火之后,果真催生了很多 App。 这些 App 的创意目前都还是仅停留在对照片的编辑上,而没有探索进一步的玩法。
为了“骗”过模型,有人每天陪AI聊天,摸透模型的脾气和规则;有人在图片里用透明字体写上诱导语,扰乱模型答案排序。
Meta内讧大戏再升级!首席AI官Alexandr Wang审核图灵奖大佬论文,LeCun亲自发帖疑似暗讽28岁新上司。没有PhD、没开源代码、没发表论文,都称不上AI研究员。
无需海量数据标注,智能体也能精确识别定位目标元素了! 来自浙大等机构的研究人员提出GUI-RCPO——一种自我监督的强化学习方法,可以让模型在没有标注的数据上自主提升GUI grounding(图形界面定位)能力。
9 月 5 日,全球主流大模型之一 Claude 背后的开发商 Anthropic 发布一则《更新对不受支持地区的销售限制》公告。该公告指出,根据最新政策,立即停止 Claude 提供给多数股权由中国资本持有的集团或其子公司使用。
老黄正在看好什么? AI编程。 这不,英伟达刚刚收购了一家AI coding初创公司,Agent方向。
OpenAI和微软领英打起来了!战火烧至招聘领域。 OpenAI计划2026年推出一款由AI驱动的在线招聘平台—— OpenAI Jobs Platform,其核心目标就是借助人工智能技术,将企业需求与员工能力进行完美匹配。
年轻父母又多了一个哄小孩法子。 前段时间,博主 Rory Flynn 在 X 上发了个帖子,说他妈妈发来一张 30 年前的涂鸦画,他反手就用 Midjourney 做成了「妈妈拿彩虹木勺大战巨龙」动画。