成本暴降88%!通义实验室、北大发布ZeroSearch,无需搜索即可激活LLM检索能力
成本暴降88%!通义实验室、北大发布ZeroSearch,无需搜索即可激活LLM检索能力信息检索能力对提升大语言模型 (LLMs) 的推理表现至关重要,近期研究尝试引入强化学习 (RL) 框架激活 LLMs 主动搜集信息的能力,但现有方法在训练过程中面临两大核心挑战:
信息检索能力对提升大语言模型 (LLMs) 的推理表现至关重要,近期研究尝试引入强化学习 (RL) 框架激活 LLMs 主动搜集信息的能力,但现有方法在训练过程中面临两大核心挑战:
今年5月,第三届红杉资本AI峰会明确提出下一轮AI的发展方向:未来的AI Agent将不再是卖工具,而是卖成果。早在会议前,一家由00后领军的AI公司——智绘阁(成都)科技有限公司(原“会回AI”,以下简称“福客AI”)已悄然布局,其打造的电商AI智能客服系统,为中小电商企业提供了高效、低成本的AI客服解决方案,创新“按成果付费”的商业模式重塑行业规则,成为红杉预言的先锋实践者。
又是一个让程序员狂欢的研究!来自 OpenHands、耶鲁、南加大和斯坦福的研究团队刚刚发布了 LocAgent—— 一个专门用于代码定位的图索引 LLM Agent 框架,直接把代码定位准确率拉到了 92.7% 的新高度。该研究已被 ACL 2025 录用。
5 月 28 日,有消息称字节跳动发布最新内部邮件,宣布将逐步禁用包括 Cursor、Windsurf 在内的第三方 AI 开发软件,转而推广自研编程助手 Trae 作为替代方案。邮件由字节跳动安全与风控部门发出,称此举是出于防范数据泄露风险的考虑,自 6 月 30 日起将分批在内部实施相关禁用措施。
我们采用了AI暴露度指标构建的方法,随机抽取了2018年1月到2024年5月的125万条招聘大数据进行分析,并最终计算出每个职业的AI大语言模型暴露度。
国补后7649(原价8999),雷鸟正式发布了带有定制大模型和全彩显示的AI眼镜——X3 Pro。
美图要生态,阿里云要算力。
公开信息显示,字节跳动旗下剪映团队近期推出了一款名为「剪小映」的新产品,已正式上架苹果App Store。该应用可以视为剪映的AI简化版,旨在为用户提供更便捷的视频创作体验。
Meta推出KernelLLM,这个基于Llama 3.1微调的8B模型,竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示,它的单次推理性能超越GPT-4o和DeepSeek V3,多次生成时得分飙升。
是的,秘塔AI搜索推出了全新“极速”模型。通过在GPU上进行kernel fusion,以及在CPU上进行动态编译优化,我们在单张H800 GPU上实现了最高400 tokens/秒的响应速度,大部分问题2秒内就能答完。