
LLM省钱大测评!48块GH200,首个百亿级参数量实证
LLM省钱大测评!48块GH200,首个百亿级参数量实证EfficientLLM项目聚焦LLM效率,提出三轴分类法和六大指标,实验包揽全架构、多模态、微调技术,可为研究人员提供效率与性能平衡的参考。
EfficientLLM项目聚焦LLM效率,提出三轴分类法和六大指标,实验包揽全架构、多模态、微调技术,可为研究人员提供效率与性能平衡的参考。
信息检索能力对提升大语言模型 (LLMs) 的推理表现至关重要,近期研究尝试引入强化学习 (RL) 框架激活 LLMs 主动搜集信息的能力,但现有方法在训练过程中面临两大核心挑战:
今年5月,第三届红杉资本AI峰会明确提出下一轮AI的发展方向:未来的AI Agent将不再是卖工具,而是卖成果。早在会议前,一家由00后领军的AI公司——智绘阁(成都)科技有限公司(原“会回AI”,以下简称“福客AI”)已悄然布局,其打造的电商AI智能客服系统,为中小电商企业提供了高效、低成本的AI客服解决方案,创新“按成果付费”的商业模式重塑行业规则,成为红杉预言的先锋实践者。
又是一个让程序员狂欢的研究!来自 OpenHands、耶鲁、南加大和斯坦福的研究团队刚刚发布了 LocAgent—— 一个专门用于代码定位的图索引 LLM Agent 框架,直接把代码定位准确率拉到了 92.7% 的新高度。该研究已被 ACL 2025 录用。
5 月 28 日,有消息称字节跳动发布最新内部邮件,宣布将逐步禁用包括 Cursor、Windsurf 在内的第三方 AI 开发软件,转而推广自研编程助手 Trae 作为替代方案。邮件由字节跳动安全与风控部门发出,称此举是出于防范数据泄露风险的考虑,自 6 月 30 日起将分批在内部实施相关禁用措施。
我们采用了AI暴露度指标构建的方法,随机抽取了2018年1月到2024年5月的125万条招聘大数据进行分析,并最终计算出每个职业的AI大语言模型暴露度。
国补后7649(原价8999),雷鸟正式发布了带有定制大模型和全彩显示的AI眼镜——X3 Pro。
美图要生态,阿里云要算力。
公开信息显示,字节跳动旗下剪映团队近期推出了一款名为「剪小映」的新产品,已正式上架苹果App Store。该应用可以视为剪映的AI简化版,旨在为用户提供更便捷的视频创作体验。
Meta推出KernelLLM,这个基于Llama 3.1微调的8B模型,竟能将PyTorch代码自动转换为高效Triton GPU内核。实测数据显示,它的单次推理性能超越GPT-4o和DeepSeek V3,多次生成时得分飙升。