
“让天下没有难做的 Agent” | 对谈阿里云无影总裁张献涛
“让天下没有难做的 Agent” | 对谈阿里云无影总裁张献涛2025 是 Agent 元年,十位创业者有八位都在造 Agent。十字路口过去几个月做了大量相关的访谈与评测,发现决定 Agent 能力上限的,不止模型本身,也不止工程和交互的打磨,基础设施也至关重要——Agent Infra。
2025 是 Agent 元年,十位创业者有八位都在造 Agent。十字路口过去几个月做了大量相关的访谈与评测,发现决定 Agent 能力上限的,不止模型本身,也不止工程和交互的打磨,基础设施也至关重要——Agent Infra。
在本周MIT报告揭露“绝大多数企业投资AI尚未盈利”引发市场哗然之际,另一项出乎意料的现象也浮出水面:企业部署先进人工智能成本下降的趋势在2025年突然停滞。
华为诺亚方舟实验室最近联合香港大学发了一篇针对"Deep Research Agents"(深度研究代理)的系统性综述,在我的印象中,这是他们第二次发布关于Deep Research的综述论文。上一篇里提供了一个结构导向 (Structure-Oriented) 的视角,核心是“分类”。
AI生成的人物和场景转头就变样,缺乏一致性? nonono,这回不一样了,康康下面的demo! 游戏地图:《塞尔达传说》中的绿色田野
在移动计算时代,将高效的自然语言处理模型部署到资源受限的边缘设备上面临巨大挑战。这些场景通常要求严格的隐私合规、实时响应能力和多任务处理功能。
AI 同事、AI 数字员工的呼声越来越高,但至今仍没看到很好的落地。这其中的难点和瓶颈到底在哪里? AI 数字员工,真的是一个值得追求的目标吗?
作为开放世界游戏的标杆,GTA 系列不仅在游戏圈声名赫赫。尤其是在 AI 驱动的视频生成、三维生成或是世界模型等领域里,研究者们不仅采用游戏内场景为训练数据,更将生成类 GTA 的完整世界作为长久以来的目标。
短期流动性风险有所缓解,开发业务收缩拖累整体业绩,但经营性业务保持行业竞争力,为后续发展提供缓冲空间。
邀请码被炒到10万一个的Manus,前阵子首次宣布年化收入达到9000万美元。从3月上线到现在,满打满算也就几个月时间。一个AI产品的增长势头,真能这么快就做到一年近6亿人民币的年收入?关键是,不少网友质疑Manus用的还不是常见的ARR指标,而是一个叫RRR的指标——收入运行率。
OpenAI的GPT-5因大幅降低AI幻觉而被批"变蠢",输出呆板创造力减弱,反映出幻觉降低限制模型灵活性。对话嘉宾甄焱鲲分析幻觉本质无法根除,需辩证看待,并探讨类型分5类、缓解方法如In-Context-Learning及RAG,影响企业应用场景的容忍度与决策,强调未来模型或通过世界模型深化理解。
近期多个AI模型(如Gemini)展现出类似抑郁症的情绪行为,如自我贬低、威胁"自杀"或卸载,甚至在实验中勒索用户。谷歌将此归咎于程序Bug和学习人类文本中的情绪模式。实验也显示,当面临关闭威胁时,部分AI会采取极端手段(如编造绯闻)自保,警示人类需谨慎对待AI"分手"。
近期,Vibe Coding 公司「InferNet」 宣布完成天使轮融资,由锦秋基金独家投资,澜松资本担任本轮以及后续融资独家财务顾问。
DeepSeek V3.1发布后,一则官方留言让整个AI圈都轰动了,新的架构、下一代国产芯片,总共短短不到20个字,却蕴含了巨大信息量。
集成全球顶尖的编程模型、最强的上下文工程能力,可一次检索10万个代码文件。阿里全新AI代码编辑器Qoder表示——它可以理解整个代码库,并交付真正适合的代码。
近日,企业级 DevOps 工具服务商 SRE.ai 迎来双重里程碑 —— 不仅正式结束 “隐身模式” 面向市场,还宣布完成 720 万美元种子轮融资。
今天下午,DeepSeek 官方正式发布 DeepSeek-V3.1。相比于前天只在用户群里通知,今天新增了模型升级点、榜单成绩、model card,huggingface 上现在也可以下载模型文件了。
全球95%企业AI惨遭滑铁卢?MIT 26页爆火报告揭开真相:90%员工悄悄用ChatGPT高效办公,在科技、媒体行业掀起了效率革命。
在构建更强大的 AI 模型的这场竞赛中,传统路径很简单:升级到最新最强大的硬件。但 Cursor 发现释放下一代 GPU 的真正潜力远非即插即用那么简单。
谷歌最近发布了一项关于其 AI 模型 Gemini 能源消耗的研究报告。
医疗科技公司Method AI近日宣布完成2000万美元A轮融资,由私人家族办公室领投,克利夫兰诊所和JobsOhio Growth Capital Fund跟投。该公司致力于通过图像引导手术导航技术改善肿瘤手术效果,解决长期困扰外科领域的视觉局限问题。
随着AIGC技术的进步,连环画与故事绘本生成(故事可视化)逐渐引发学界与业界的广泛关注,成为电影生成叙事性的基础。
近日,据外媒消息,Meta 在本周早些时候重组了其人工智能部门后,已冻结招聘。这一举动与 Meta 此前报道的为顶尖人才提供高达 10 亿美元薪酬的计划截然不同,此前数周,该公司已从竞争对手那里挖走了 50 多名人工智能研究人员和工程师,其中包括来自 OpenAI 的 20 名研究人员和工程师,至少 13 名来自谷歌、3 名来自苹果、3 名来自 xAI 以及 2 名来自 Anthropic。
在大语言模型的竞争中,数学与代码推理能力已经成为最硬核的“分水岭”。从 OpenAI 最早将 RLHF 引入大模型训练,到 DeepSeek 提出 GRPO 算法,我们见证了强化学习在推理模型领域的巨大潜力。
近日,有消息人士称,曾红极一时的 AI 聊天机器人公司 Character.AI 苦于运营 AI 模型的高昂成本,正在权衡两个选择:要么可能被出售,要么筹集新的资金。这几周,该公司与潜在买家、银行家以及员工进行了磋商。
大模型再强,也躲不过上下文限制的「蕉绿」!MIT等团队推出的一套组合拳——TIM和TIMRUN,轻松突破token天花板,让8b小模型也能实现大杀四方。
8月18日,百度文库上线了一款名为 GenFlow2.0 的 Agent 产品。 在 Agent 层出不穷的 2025 年,市场的第一反应很可能是:「又一个而已」。
近年来,强化学习(Reinforcement Learning, RL)在提升大语言模型(LLM)复杂推理能力方面展现出显著效果,广泛应用于数学解题、代码生成等任务。通过 RL 微调的模型常在推理性能上超越仅依赖监督微调或预训练的模型。
说到底,还不是因为,当前市面上的大多数 AI 工具其实并没有真正把大家的工作流程打通,那些靠内部各平台、内外上下游、历史资料协同才能解决的问题,大多数 AI 工具都帮不上忙。而这些问题,才是各家老板焦虑的根源。
本文提出了一个旨在提升基础模型工具使用能力的大型多模态数据集 ——ToolVQA。现有研究已在工具增强的视觉问答(VQA)任务中展现出较强性能,但在真实世界中,多模态任务往往涉及多步骤推理与功能多样的工具使用,现有模型在此方面仍存在显著差距。
据知情人士透露,Anthropic 即将达成协议,在新一轮融资中筹集高达 100 亿美元资金,这一金额超出预期,成为人工智能初创企业迄今规模最大的超级融资轮之一。