
独家 | 与微软“代码女王”关于 GitHub、智能编程的一小时对谈
独家 | 与微软“代码女王”关于 GitHub、智能编程的一小时对谈5月23-24日AICon上海站,聚焦Agent、多模态、端侧智能、Data for AI 等 50+ 热点话题,涉及 20+ AI 应用案例,兼具实操价值与未来洞见。
5月23-24日AICon上海站,聚焦Agent、多模态、端侧智能、Data for AI 等 50+ 热点话题,涉及 20+ AI 应用案例,兼具实操价值与未来洞见。
今夜,谷歌彻底杀疯!2小时发布会,Gemini提及95次点亮全场。Gemini 2.5家族全系升级,Pro深度思考模型正刷榜。全新Imagen 4生成细节超逼真,Veo 3首次实现音视频融合。
AI不再相信人类 关于 Agent, flowith 给出了自己的答案 —— Neo
知名科技记者马克·古尔曼(Mark Gurman)撰文表示,苹果公司正准备允许第三方开发者使用其人工智能模型编写软件,旨在推动新应用的开发,并提升其设备的吸引力。知情人士透露,苹果正在开发一套软件开发工具包(SDK)及相关框架,以便外部开发者能够基于苹果的大语言模型构建AI功能。这一计划预计将在6月9日的全球开发者大会(WWDC)上公布。
就在昨天,纳德拉带着50多个新产品和服务,震撼亮相微软Build大会。他喊出宣言:我们已进入AI智能体时代!现场连线的大佬奥特曼、黄仁勋和马斯克,让气氛推向顶峰。现在,Agent已全面渗透,编程、科研都将彻底颠覆。
微软Build 2025全面转向AI Agent,整合OpenAI及xAI模型
周末和一位在字节做视频 Agent 的 PM 聊天,想到了一个好问题。
微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。
“全球首个XX Agent”快成为现在AI产品发布的标配了,几乎每天一睁眼都能看到。奥特曼在最近的演讲提到,2025年将是AI Agent的突破年。这股Agent热,也席卷到了正在举行的微软Build 2025开发者大会。
理想中的多模态大模型应该是什么样?十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集,用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足,且多数通用模型未能超越专家模型,真正的通用人工智能需要实现模态间的协同效应。