
这篇超有用!手把手教你搭建 AI 产品 Evals
这篇超有用!手把手教你搭建 AI 产品 EvalsAI 下半场,模型评估比模型训练更重要。我们需要从根本上重新思考评估的方式。
AI 下半场,模型评估比模型训练更重要。我们需要从根本上重新思考评估的方式。
大家好,我是歸藏(guizang)谷歌昨晚举行了他们的 2025 年硬件发布会,早上起来回顾和总结一下。
Meta超级智能实验室一拆四以后,首席AI官Alexandr Wang全员信曝光。这位28岁华人获扎克伯格力挺,出任超级智能实验室负责人。内部信强调「超级智能即将到来」,并宣布实验室拆分为四大部门。同时,AGI Foundations团队被解散,成员分流。Yann LeCun地位明显降级,权力重心全面向Wang集中。
每位中小企业主都能在支付宝里免费雇一名招投标AI员工了。该AI员工叫“芝麻企业助手”,它能准确获取并为企业客户智能推送各类招投标的标讯信息,并结合专家经验分析解读标讯给出投标策略。其处理招投标问题的能力与资深招投标经理相仿。
这辈子,咱也是被人形机器人夹道欢迎过了!
推理大模型(Large Reasoning Model)极大的促进了自然语言处理领域的发展,而信息检索领域的核心问题之一是文档排序,如何利用强大的推理大模型通过主动推理来判断文档的相关性,进而再对文档进行排序是一个值得探索的方向。
过去二十年,我们都在努力让品牌在Google搜索结果中排名靠前,学习SEO优化、关键词策略、外链建设。但现在,ChatGPT每天处理25亿次提示,80%的消费者在近一半的搜索中使用AI摘要。AI不再是搜索的辅助工具,而是发现品牌的主要入口。
在Openai 发布o3后,think with image功能得到了业界和学术界的广泛关注。
Memory 一直是 AI 产品的技术「痛点」和必争之地。因为决定用户留存,很多有野心的创业者在思考如何借助 AI 长期化时,都会聚焦 AI + Memory 领域。
Salesforce近日官宣收购Regrello,这是一家专注于制造业和供应链的自动化工作流公司,也可以定位为AI驱动的制造业运营编排平台,核心技术是将非结构化业务数据转化为动态的自动化工作流。