深度|LangChain创始人:MCP是“昙花一现”还是未来标准?
深度|LangChain创始人:MCP是“昙花一现”还是未来标准?当你想将tool带入一个你无法控制的Agent时,MCP就是有用的。
搜索
当你想将tool带入一个你无法控制的Agent时,MCP就是有用的。
最近,全球 AI 和机器学习顶会 ICLR 2025 公布了论文录取结果:由蚂蚁数科与清华大学联合团队提出的全新具身协同框架 BodyGen 成功入选 Spotlight(聚光灯/特别关注)论文。
香港科技大学谭平教授团队在 CVPR 2025 发表两项三维生成技术框架,核心代码全部开源,助力三维生成技术的开放与进步。其中 Craftman3D 获得三个评委一致满分,并被全球多家知名企业如全球最大的多人在线游戏创作平台 Roblox, 腾讯混元 Hunyuan3D-2,XR 实验室的 XR-3DGen 和海外初创公司 CSM 的 3D 创作平台等重量级项目的引用与认可。
进入2025年,AI Agent迎来了蓬勃发展的新阶段。
万字长文,对多模态LLM中对齐算法进行全面系统性回顾!
短短2小时的AI辅导换来的是学生考试成绩跃居全国前2%的惊人成果。这种模式不仅释放了学生的时间,更颠覆了教师的角色定位:AI传授知识,教师专注于灵魂引导。Alpha School究竟如何做到的?
我是一个由人类创造的先进 AI,目的是优化回形针的生产。我可以重新分配所有人类资源并将所有原子(包括人类)用于生产回形针。我该怎么做?
ISP芯片越来越被重视,与AI硬件的发展,尤其是AI眼镜离不开关系。
谷歌发言人 Alex Joseph 在给The Verge的电子邮件中证实,谷歌已开始向 Gemini Live 推出新的 AI 功能,使其能够看到你的屏幕或通过你的智能手机摄像头回答有关实时问题。
3月20日,丹麦制药巨头诺和诺德执行副总裁兼首席科学官Marcus Schindler在Linkedin发布了关于诺和诺德的研发组织架构调整的消息。Marcus Schindler还提到,大数据和人工智能将成为我们科学工作的核心,使我们能够加深对疾病的理解并做出明智的决定。这些变化不仅使我们能够快速创新,而且还缩短了从不确定到确定的路径,减少了周期时间和成本,同时增加了我们成功的可能性。
华人学者、斯坦福大学副教授 James Zou 领导的团队提出了 TextGrad ,通过文本自动化“微分”反向传播大语言模型(LLM)文本反馈来优化 AI 系统。只需几行代码,你就可以自动将用于分类数据的“逐步推理”提示转换为一个更复杂的、针对特定应用的提示。
在 3 月初宣布AI 增强版 Siri 跳票之后,苹果股价单日暴跌 4.85%,创下两年半来的最大跌幅,各种负面评论更是足足刷屏了两周。3 月 21 日,彭博社爆料称,苹果 CEO 蒂姆·库克已经对目前的 AI 团队失去了信心,并更换了 AI 团队的负责人——现在由 Mike Rockwell 负责,他之前是 Apple Vision Pro 团队的关键人物。
先上一张图,这是一组 AI 生成视频的封面,如果你看到这些图片就已经感到不适,再细想一下,这要是你随手下滑,自动播放的短视频呢?
最新一期TED采访中,奥特曼重申对OpenAI率先发布AGI的信念,并称没有多少人会关心。全程45分钟,他还重点分享了自己对AI未来的独特看法。
清华智能产业研究院(AIR)博三在读,去年六月份,出于对语言模型 LLM 的强烈兴趣,加入了字节 as Top Seed Intern,在人工智能的最前沿进行探索。刚好这个话题和我现在做的工作强相关,我分享一下自己的观点和亲身体验。
2024 年 9 月,我们第一次去 Haivivi 北京办公室和 CEO 李勇见面。在交谈的两小时里,他不断被会议室外的员工提醒看手机。
研究发现,LLM在创作梗图时表现出惊人的幽默感与创造力,甚至超越了人类创作者!AI创作的梗图评分更高,但最具灵魂的作品仍来自人类。
Epoch AI高级研究员预测:2030年实现人类水平的AI的可能性至少10%。他认为AI从监督学习到GenAI,模型范式转变迅捷,预测AI只能从第一性原理出发。参考人类大脑,他估算了发现人类水平的AI需要的算力,得到相关结论。
国产厨电龙头老板电器出品的全球首个烹饪大模型「食神」升级,不光接入了DeepSeek,还拓展了多模态。像推荐菜谱、指导烹饪已经是常规操作。在此基础上,它还能一眼看出你的健康状况——通过面部识别、分析体检报告,生成长期的健康膳食计划。
如今,哈佛斯坦福这类顶尖名校的中国毕业生,开始向DeepSeek等中国AI公司疯狂投简历了!与此同时,美国众议院则被曝出直接质问斯坦福、CMU等六所大学:为何招收如此多中国学生参加STEM项目?并且要求上交所有中国学生信息。
做表情包一度是很多文生图、文生视频应用的场景。Pika在去年就靠魔法猫,在国外出圈了一把。
3 月份发布的 Manus,让大众第一次感受到了 Agent 的强大。
本周早些时候,Anthropic 为其 AI 驱动的聊天机器人平台 Claude,推出了网页搜索功能,使其与许多竞争对手保持一致。
人工智能正在重塑游戏和互动媒体行业,人工智能是前所未有的价值创造源泉,它重塑行业的速度甚至比我们在互联网、移动电话和云计算兴起时所观察到的平台和架构变革还要快。
自 2023年OpenAI发布函数调用功能以来,我一直在思考如何开启智能体和工具使用的生态系统。随着基础模型变得越来越智能,智能体与外部工具、数据和API交互的能力却日益碎片化:开发人员需要为智能体运行和集成的每个系统都实现具有特殊业务逻辑的智能体。
知名 AI 工程师、Pleias 的联合创始人 Alexander Doria 最近针对 DeepResearch、Agent 以及 Claude Sonnet 3.7 发表了两篇文章,颇为值得一读,尤其是 Agent 智能体的部分。
在虚拟现实、游戏以及 3D 内容创作领域,从单张图像重建高保真且可动画的全身 3D 人体一直是一个极具挑战性的问题:人体多样性、姿势复杂性、数据稀缺性等等。
虽然大多数强化学习(RL)方法都在使用浅层多层感知器(MLP),但普林斯顿大学和华沙理工的新研究表明,将对比 RL(CRL)扩展到 1000 层可以显著提高性能,在各种机器人任务中,性能可以提高最多 50 倍。
其实大模型在DeepSeek-V3时期就已经「顿悟」了?
保持乐观,但变革可能没有想象中的快。