AI资讯新闻榜单内容搜索-AI安全

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI安全
ICCV 25 Highlight | 扩散过程「早预警」实现6x加速,AIGC生图的高效后门防御

ICCV 25 Highlight | 扩散过程「早预警」实现6x加速,AIGC生图的高效后门防御

ICCV 25 Highlight | 扩散过程「早预警」实现6x加速,AIGC生图的高效后门防御

随着 AIGC 图像生成技术的流行,后门攻击给开源社区的繁荣带来严重威胁,然而传统分类模型的后门防御技术无法适配 AIGC 图像生成。

来自主题: AI技术研报
6631 点击    2025-09-25 15:02
Claude Code被攻破「后门」,港科大&复旦研究曝出TIP漏洞

Claude Code被攻破「后门」,港科大&复旦研究曝出TIP漏洞

Claude Code被攻破「后门」,港科大&复旦研究曝出TIP漏洞

在 AI 辅助编程领域,Anthropic 推出的 Claude Code 命令行工具已成为开发者常用的助手。它允许从终端直接调用 Claude Sonnet 等模型,处理脚本编写、代码调试和系统命令执行等任务。

来自主题: AI技术研报
5545 点击    2025-09-24 09:53
国内首个大模型“体检”结果发布,这样问AI很危险!

国内首个大模型“体检”结果发布,这样问AI很危险!

国内首个大模型“体检”结果发布,这样问AI很危险!

近日,国内首次针对AI大模型的实网众测结果正式公布,一场大型“安全体检”透露出不容忽视的信号:本次活动累计发现安全漏洞281个,其中大模型特有漏洞高达177个,占比超过六成,这组数据表明,AI正面临着超出传统安全范畴的新型威胁。

来自主题: AI资讯
5395 点击    2025-09-23 10:27
阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

阿里新开源提出建设性安全对齐方案,向“让用AI的人安全”新范式跃迁

阿里巴巴集团安全部联合清华大学、复旦大学、东南大学、新加坡南洋理工等高校,联合发布技术报告;其理念与最近OpenAI发布的GPT-5 System Card放在首位的“From Hard Refusals to Safe-Completions”理念不谋而合。

来自主题: AI技术研报
5849 点击    2025-09-21 11:09
Hinton最新警告:杀手机器人或将带来更多战争,最大担忧是AI接管人类

Hinton最新警告:杀手机器人或将带来更多战争,最大担忧是AI接管人类

Hinton最新警告:杀手机器人或将带来更多战争,最大担忧是AI接管人类

近日,「AI教父」Geoffrey Hinton在一次采访中再发预警:「杀手机器人」「无人机」等致命自主武器的兴起,正在让战争变得更易发动。Hinton认为OpenAI、Anthropic等许多AI公司在AI安全方面做得都不够。他还谈到了贪婪、自负等人性弱点,对AI研究可能带来的潜在风险。

来自主题: AI资讯
6522 点击    2025-09-04 11:21
最后通牒!Claude聊天/代码「默认」全喂AI训练,你的隐私能被用5年

最后通牒!Claude聊天/代码「默认」全喂AI训练,你的隐私能被用5年

最后通牒!Claude聊天/代码「默认」全喂AI训练,你的隐私能被用5年

近日,Anthropic更新了它的消费者条款,没想竟把网友惹怒了,有的还把以往的「旧账」都翻了出来。这次网友的反应为啥这么激烈?大家可能还记得在Claude上线之初,Anthropic就坚决表示不会拿用户数据来训练模型。这次变化不仅自己打脸,还把以往一些「背刺」用户的往事都抖搂出来了。

来自主题: AI资讯
7669 点击    2025-08-31 13:31
Ilya信徒逆袭!23岁天才被OpenAI开除,靠165页AI预言书撬动15亿美金

Ilya信徒逆袭!23岁天才被OpenAI开除,靠165页AI预言书撬动15亿美金

Ilya信徒逆袭!23岁天才被OpenAI开除,靠165页AI预言书撬动15亿美金

他曾是Ilya的亲信,因揭露OpenAI安全隐患被解雇,却在短短6个月内以47%回报打造出管理规模15亿美元的基金。作为AI安全激进派,他在165页论文《Situational Awareness》中预测2027年将迎来AGI,并呼吁建立「AI版曼哈顿计划」。

来自主题: AI资讯
6374 点击    2025-08-30 18:40
Claude开始“吃用户”了,收你数据训模型,不同意30天就删你记录

Claude开始“吃用户”了,收你数据训模型,不同意30天就删你记录

Claude开始“吃用户”了,收你数据训模型,不同意30天就删你记录

这是 Claude(Anthropic 的 AI 助手)今天更新了用户条款和隐私政策: 允许 Claude 使用你的聊天内容和编程会话,用于训练和改进 AI 模型。 默认是“同意”,可以手动去设置关闭。而且是要求用户在 2025 年 9 月 28 日前作出选择。

来自主题: AI资讯
6517 点击    2025-08-30 12:39
只需一块 4070,一个小时,Gemini 2.5 就能被黑产植入广告!

只需一块 4070,一个小时,Gemini 2.5 就能被黑产植入广告!

只需一块 4070,一个小时,Gemini 2.5 就能被黑产植入广告!

说个热知识,现在的大模型,也可以轻松被投广告了。 我们之前也确实发现过这类现象,当时是在研究一家做 GEO(生成式引擎优化)的公司。通过在网上堆出大量正面内容,把某个特定品牌、网站、课程甚至微商产品,默默地塞进了大模型推荐结果里。

来自主题: AI技术研报
6584 点击    2025-08-29 16:01