
GUI智能体训练迎来新范式!半在线强化学习让7B模型媲美GPT-4o
GUI智能体训练迎来新范式!半在线强化学习让7B模型媲美GPT-4o浙江大学与通义实验室Mobile-Agent团队在UI-R1的基础上,推出全新研究成果——UI-S1,提出了一种名为半在线强化学习(Semi-online Reinforcement Learning)的创新训练范式。
浙江大学与通义实验室Mobile-Agent团队在UI-R1的基础上,推出全新研究成果——UI-S1,提出了一种名为半在线强化学习(Semi-online Reinforcement Learning)的创新训练范式。
AI崛起使程序员行业受冲击,基础岗位需求暴跌、薪资缩水。应届生橘子等就业艰难,大厂招聘减少且要求提高。曾高薪的资深码农如冰淇、马原和刘星被迫转型正脊师、律师或创业汽车修复,反映职业稳定性丧失并分化为精英与易替代群体。
所谓“AI精神病”并非正式医学诊断,实际报道案例多表现为被AI强化的妄想而非全面精神病症状。专家指出这是AI(特别是其“谄媚效应”设计)对脆弱人群(如有精神病史)既有妄想的触发或放大,需警惕过早贴标签的污名化风险,应将其理解为AI加速的精神问题,纳入现有诊疗框架而非创造新类别。
继英伟达千亿投资OpenAI之后,「星际之门」立即官宣新增五个站点,预计年底前达成10GW目标。奥特曼发文称,目标打造一个每周GW级「AI工厂」,AI无限算力或将治愈癌症。
WithFeeling.ai 创始人肖敏此前是微信 AI 的产品负责人。2022 年中,她选择创业,在 2023 年初推出主打「真诚、真实」的 AI 陪伴产品 Paradot,上线至今已经积累了 1000 多万用户,且实现了盈利,成为品类的佼佼者。
作为华为服务金融客户的窗口,华为数字金融军团不仅在全联接大会上回顾了过往案例,更重点推出了应对 AI 落地挑战的 FAB(FinAgent Booster)金融智能体加速器。帮助客户快速建立自己的 Agent 能力,缩短开发周期,让 AI 加速融入业务流程。
谷歌云刚发布了一篇《Google Cloud Startup technical guide: Al agents》(Google Cloud 创业公司技术指南:AI 代理)这是一份非常详尽和全面的手册,这篇文档要解决的问题:原型到生产之间最大鸿沟,Agent的非确定性、复杂推理轨迹如何验证、如何部署与运维等。初创公司业务负责人或开发者看完后能获得一个系统性的、
OpenAI携手APOLLO的新研究发现,大模型会对指令阳奉阴违,为了达成目的故意答错问题、暗中修改数据或者操作记录来掩盖自己的违规行为……比如,o3模型在化学测试中,通过推理得出如果正确率超过50%将不会被部署的结论后,
深夜,阿里通义大模型团队连放三个大招:开源原生全模态大模型Qwen3-Omni、语音生成模型Qwen3-TTS、图像编辑模型Qwen-Image-Edit-2509更新。Qwen3-Omni能无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音输出。
“极你太美”bug,果然在DeepSeek V3.1最新版本中被修复了。DeepSeek-V3.1刚刚更新至DeepSeek-V3.1-Terminus版本。
2025 年是 AI Agent 的元年时刻——这句话最近频繁出现在各种报道中。我也认同。但我觉得元年的意义,不是一个新概念的诞生,而应该是价值兑现。也就是说,AI Agent 不再只是技术演示,而是成为提升生产力、改变工作方式的实用工具。
回溯TOB工具与数据库领域的发展历程,从早期依赖代码开发的传统数据库,到Airtable开启的表格式数据库新赛道,再到Notion等工具推动的 “无代码” 协作浪潮,每一次技术迭代都在降低企业数据管理的门槛。
2025 年 9 月 19 日,亚马逊云科技官宣:Qwen3 和 DeepSeek v3.1,首次上线 Amazon Bedrock ,正式对外提供服务,再一次引起了全球生成式 AI 市场对 Amazon Bedrock 这一产品的关注。
Keplar 是一家市场调研初创公司,该公司运用语音 AI 技术进行客户访谈,能以远低于传统调研咨询公司的成本,为客户提供更快速的分析报告。
监督微调(SFT)和强化学习(RL)微调是大模型后训练常见的两种手段。通过强化学习微调大模型在众多 NLP 场景都取得了较好的进展,但是在文本分类场景,强化学习未取得较大的进展,其表现往往不如监督学习。
可灵2.5,来了。 不仅已经对可灵的超级创作者们正式进行灰度内测,还在这个周末,登上了釜山国际电影节。
AIGC正在迎来平台层面的集体热捧。 9月16日,腾讯视频官宣首届AI短片创作大赛,面向全球创作者征集AI短片。而事实上,今年以来,爱奇艺、快手、抖音等多个平台均纷纷加码AIGC相关扶持与创投计划。相较去年偏重于“创意尝鲜”,平台今年的重点已明显转向“商业落地”的探索。
CBD 算法则是快手商业化算法团队在本月初公布的新方法,全名 Causal auto-Bidding method based on Diffusion completer-aligner,即基于扩散式补全器-对齐器的因果自动出价方法。
人工996,智能体就能做了!刚刚,「基础设施智能体蜂群」正式诞生,多智能体系统,打造感知-决策-执行闭环,彻底颠覆传统运维模式。从此,智能体专业团队加持,集群排障效率起飞。
美国时间 9 月 22 日,北京时间 9 月 23 日凌晨,英伟达和 OpenAI 突然宣布战略合作伙伴和重大投资。
“优时映画”正在通过AI工具,把动漫改编的周期缩短到1-2个月。
近日,Sensor Tower 发布《2025 年 AI 应用市场调查报告》,报告中提到,移动端 AI 产品 IAP 收入在 2025 年上半年半年度环比增长率为 100%,但具体到产品上,全球 IAP 收入 Top10 全部都是 ChatBot,相比于 Web 端的百花齐放,App 端能赚到钱的 AI 原生产品依旧单一。
2017 年,一篇标题看似简单、甚至有些狂妄的论文在线上出现:《Attention Is All You Need》。
上周,全球创投圈的“风向标”YC,它的2025夏季演示日落下帷幕,169多家初创公司集中亮相。
美国七巨头AI基建支出掀狂潮:经济提振了,大批人失业了。
近日,国内首次针对AI大模型的实网众测结果正式公布,一场大型“安全体检”透露出不容忽视的信号:本次活动累计发现安全漏洞281个,其中大模型特有漏洞高达177个,占比超过六成,这组数据表明,AI正面临着超出传统安全范畴的新型威胁。
近日,吴恩达(Andrew Ng)在首届Buildathon上发表主题演讲,内容围绕AI辅助编程、快速开发产品原型,以及AI工程师技能需求展开。
今年春天,医学教育平台 AMBOSS 宣布完成 2.6 亿美元融资;不久后,AI 编程公司 Windsurf 的估值也跃升至 28.5 亿美元。与此同时,在东南亚、欧洲和印度市场,Manabie、Knowunity、Eruditus、Lingokids 等公司也相继拿下千万至上亿美元的新一轮资金。
天玑9500围绕这一目标重构芯片底座:首发双NPU架构,结合存算一体、硬件压缩等多项关键技术,在ETHZ苏黎世移动SoC AI榜单中蝉联榜首,相比上一代跑分翻倍。
LeCun 这次不是批评 LLM,而是亲自改造。当前 LLM 的训练(包括预训练、微调和评估)主要依赖于在「输入空间」进行重构与生成,例如预测下一个词。 而在 CV 领域,基于「嵌入空间」的训练目标,如联合嵌入预测架构(JEPA),已被证明远优于在输入空间操作的同类方法。