AI资讯新闻榜单内容搜索-模型

OpenAI 刚开源了一个 1.5B 参数的隐私过滤模型，却只用 50M 活跃参数就能精准标记姓名、电话、密码这些敏感信息。

你有没有过这样的经历：把聊天记录、用户反馈或内部文档丢给大模型时，总担心里面夹杂着真实姓名、手机号、邮箱甚至 API key，最后只能手动一条条删？或者团队在处理海量数据时，规则写的正则永远漏掉那些“藏在句子里的隐私”。

来自主题: AI技术研报

9460 点击 2026-06-01 10:29

一周3.3k star，微软开启Skills自我进化！像训练神经网络一样训练技能

从大模型的提示词到智能体的 Skills，看着进化了，但又没有完全进化。

来自主题: AI技术研报

5689 点击 2026-06-01 09:57

MiniMax M3：前沿 Coding 能力、1M 上下文、原生多模态，一个模型全给你

MiniMax M3 今日正式发布。MiniMax M3 在编程和智能体等专业任务上达到了前沿的能力。它使用了我们提出的全新注意力架构 MSA （MiniMax Sparse Attention），最高支持 1M 超长上下文。如外界所期待的那样，它也是一个原生多模态模型，支持图片和视频的输入，并能操作电脑桌面。

来自主题: AI资讯

9994 点击 2026-06-01 09:49

ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」

大语言模型正在成为人工智能系统的核心组件。从文本生成、数学推理到代码编写，单个大模型已经展现出强大的能力。

来自主题: AI技术研报

8165 点击 2026-06-01 09:26

Rubrics综述：Agent时代，如何定义一个「好答案」？

近年来，随着大模型从简单问答，走向深度研究、医疗咨询、多模态生成和长程 Agent 任务，一个基础问题变得越来越难回答：我们到底应该怎样判断模型输出的质量？

来自主题: AI技术研报

8842 点击 2026-06-01 09:24

τ0-WM：最大规模预训练的开源具身世界模型来了

刚刚，上海创智学院副教授、智元机器人首席科学家罗剑岚带队，发布全球最大规模的开源预训练具身世界模型——τ0-World Model（τ0-WM)。整个τ0-WM参数量达到5B，预训练数据规模高达约3万小时。其中，真机遥操作数据第一次成了绝对主力，占到了1.78万小时。

来自主题: AI技术研报

9608 点击 2026-05-31 19:39

比中转站还赚钱，SillyTavern 角色卡：揭秘上亿级别的隐秘生意

当所有人都在烧钱做 AI 陪伴产品的时候，有一群人在闷声赚钱。他们不做模型，不搞推理，不烧 API 费用。他们只做一件事：卖角色卡。你可能听说过 SillyTavern，一个开源的 AI 聊天前端。但你可能不知道，围绕它已经形成了一个年交易额数亿美元的角色卡市场。

来自主题: AI资讯

9712 点击 2026-05-31 14:44

开源编程语言Zig，向AI代码说「不」

Zig 由一家非营利组织以及一批贡献者共同维护。任何程序员都可以向它的代码仓库提交代码，只要遵守项目的行为准则。规则之一就是：禁止提交 AI 辅助生成的代码。政策写得很清楚：不接受任何由大语言模型生成的内容，也不接受由大语言模型改写、润色、编辑、头脑风暴或调试过的内容。简单来说，就是让 AI 离 Zig 的代码贡献远一点。

来自主题: AI资讯

9052 点击 2026-05-31 12:11

OpenAI明升，Anthropic暗涨：AI包月折扣没了

4月，OpenAI Codex正式把计费口径从按消息估算转向按token用量；Anthropic侧的企业续约和新版模型tokenizer（分词器），也让 Claude Code的实际账单压力集中显现。明升与暗涨，两家各有各的玩法。

来自主题: AI资讯

8178 点击 2026-05-31 12:10

打破Agent训练瓶颈！人大&至知研究院开源Claw Agent数据+训练+评测全链条

大模型从“回答问题”走向“完成任务”，正在面临以下瓶颈：面向Claw Agents的数据、训练和评测都比传统environment training更难。为了解决该问题，中国人民大学、至知研究院等最新提出ClawGym——

来自主题: AI技术研报

6802 点击 2026-05-31 11:42