AI资讯新闻榜单内容搜索-大模型

OpenAI 刚开源了一个 1.5B 参数的隐私过滤模型，却只用 50M 活跃参数就能精准标记姓名、电话、密码这些敏感信息。

你有没有过这样的经历：把聊天记录、用户反馈或内部文档丢给大模型时，总担心里面夹杂着真实姓名、手机号、邮箱甚至 API key，最后只能手动一条条删？或者团队在处理海量数据时，规则写的正则永远漏掉那些“藏在句子里的隐私”。

来自主题: AI技术研报

9444 点击 2026-06-01 10:29

一周3.3k star，微软开启Skills自我进化！像训练神经网络一样训练技能

从大模型的提示词到智能体的 Skills，看着进化了，但又没有完全进化。

来自主题: AI技术研报

5671 点击 2026-06-01 09:57

ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」

大语言模型正在成为人工智能系统的核心组件。从文本生成、数学推理到代码编写，单个大模型已经展现出强大的能力。

来自主题: AI技术研报

8150 点击 2026-06-01 09:26

Rubrics综述：Agent时代，如何定义一个「好答案」？

近年来，随着大模型从简单问答，走向深度研究、医疗咨询、多模态生成和长程 Agent 任务，一个基础问题变得越来越难回答：我们到底应该怎样判断模型输出的质量？

来自主题: AI技术研报

8817 点击 2026-06-01 09:24

打破Agent训练瓶颈！人大&至知研究院开源Claw Agent数据+训练+评测全链条

大模型从“回答问题”走向“完成任务”，正在面临以下瓶颈：面向Claw Agents的数据、训练和评测都比传统environment training更难。为了解决该问题，中国人民大学、至知研究院等最新提出ClawGym——

来自主题: AI技术研报

6773 点击 2026-05-31 11:42

上海大模型龙头MiniMax，启动A股上市！

证监会官网显示，上海AI大模型龙头企业MiniMax已于5月29日向上海证监局提交了上市辅导备案报告，开启A股上市进程，中信证券担任辅导机构。这也意味着，MiniMax将与已经提交A股上市辅导备案的智谱，一同冲刺A股大模型第一股。

来自主题: AI资讯

9265 点击 2026-05-30 10:55

被困在考场里的大模型

昨天，大名鼎鼎的 Claude 4.8 发布了。科技圈照例是一片欢呼。看官方放出来的一堆评测数据，依然是碾压级别的，尤其是说代码（Coding）能力有了史诗级的提升，简直像交了一份满分答卷。

来自主题: AI资讯

8623 点击 2026-05-30 10:50

「马嘉祺」让大模型翻车，而他一年前洗澡时就发现了问题

一家名为脸谱心智（FaceMind）的初创公司就在顶级学术会议 EMNLP 主会上系统性地揭示了这个问题，并给出了解法。更有意思的是，就在「马嘉祺」事件前不到两周，全球最强 AI 公司之一 Anthropic 也在自家产品中悄悄落地了一次高度相关的改造 —— 方向与脸谱心智一年前的论文几乎完全一致。

来自主题: AI技术研报

7658 点击 2026-05-30 10:05

清华系团队给大模型织了一张“智能算力电网”

所有人都在比谁的模型参数更大，但真正决定AI能不能落地的，其实是另一件没那么性感的事：一颗Token，能不能被稳定、便宜、规模化地生产出来。死磕这件事的，是一支从中国超级计算体系里走出来的年轻团队，是石科技。

来自主题: AI资讯

9361 点击 2026-05-30 10:03

AI时代，产品经理涌向字节跳动

Google DeepMind研究院姚顺宇最近接受媒体人采访时说：做一个好的产品经理，是一个我现在想不明白该怎么训练AI去做的事。言外之意，AI时代产品经理很难被替代。招聘市场已经给出了答案。根据脉脉2026年1—4月的数据，热招岗位里大模型算法排第一，产品经理排第二，AI产品经理也排到了前五的位置。

来自主题: AI资讯

8685 点击 2026-05-30 00:21