AI资讯新闻榜单内容搜索-AI安全

真机强化学习如何保证安全性？清华团队提出安全探索均衡机制

近日清华大学于IEEE TPAMI发表论文，探讨了真机强化学习的安全性保障问题，提出了一套「安全探索均衡」新型机制，揭示了安全探索的理论最大边界，并攻克了其收敛性证明难题。

来自主题: AI技术研报

6716 点击 2026-06-24 16:03

「Mythos几小时攻破NSA」在英文社交媒体传疯了，近日，写出这句话的作者亲自站出来为它降温。

来自主题: AI资讯

6602 点击 2026-06-24 09:54

当 AI 智能体真正开始干活，它的每一次请求，都要经过一个你看不见的「中间人」。

来自主题: AI技术研报

9211 点击 2026-06-23 09:35

就在刚刚，OpenAI 直接放出了满血版 GPT-5.5-Cyber。CyberGym 安全评测排行榜，GPT-5.5-Cyber 得分 85.6%，单模型最高分。Claude Mythos 5 第二，83.8%。Claude Opus 4.7 排末尾，73.1%。

来自主题: AI资讯

9316 点击 2026-06-23 09:09

AI写代码的风险隐藏在看似正确的代码中，可能引发数据泄露或资产损失。Narwhal AI Code Risks开源项目整理了真实案例、早期信号和典型风险路径，帮助开发者提前识别隐患，避免重蹈覆辙。

来自主题: AI资讯

6513 点击 2026-06-16 10:24

随着大语言模型逐步进入复杂推理、自动化研究和网络安全等高难度任务，传统的模型评测方式正在面临新的挑战。

来自主题: AI资讯

6669 点击 2026-06-10 15:16

刚刚，AI圈发生了一件很不寻常的事。Sam Altman、Dario Amodei、Demis Hassabis……一群平时打得最凶的人，把名字签在了同一封公开信上。他们联合呼吁美国国会：立法强制筛查所有合成DNA订单。

来自主题: AI资讯

7829 点击 2026-06-06 09:47

今年4-5月，AI信息安全迎来「水门事件级」窗口：攻方落地、守方应急、噪音失控、治理失灵同时暴发。Anthropic主动封印Claude Mythos，只因它强大到必须送进末日火山。

来自主题: AI资讯

7328 点击 2026-06-03 14:32

魔法打败魔法的「骚操作」，属实把我看乐了。

来自主题: AI资讯

10124 点击 2026-06-01 09:57

科技行业还在收缩，网络安全岗位却抢不到人，连OpenAI也开出44.5万美元高薪招揽安全人才。征兆4月已现：Anthropic的Mythos一个月就挖出超1万个高危漏洞。漏洞发现正被AI加速，网络安全的真正瓶颈，已转向验证与修补。

来自主题: AI资讯

7733 点击 2026-06-01 09:26