AI资讯新闻榜单内容搜索-Ai安全

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ai安全
Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

Anthropic公布新技术:不靠删数据,参数隔离移除AI危险

近年来,大语言模型的能力突飞猛进,但随之而来的却是愈发棘手的双重用途风险(dual-use risks)。当模型在海量公开互联网数据中学习时,它不仅掌握语言与推理能力,也不可避免地接触到 CBRN(化学、生物、放射、核)危险制造、软件漏洞利用等高敏感度、潜在危险的知识领域。

来自主题: AI技术研报
8438 点击    2025-12-25 10:21
OpenAI这招太狠!AI从「躲猫猫」到「自爆黑料」,主打一个坦白

OpenAI这招太狠!AI从「躲猫猫」到「自爆黑料」,主打一个坦白

OpenAI这招太狠!AI从「躲猫猫」到「自爆黑料」,主打一个坦白

随着AI越来越强大并进入更高风险场景,透明、安全的AI显得越发重要。OpenAI首次提出了一种「忏悔机制」,让模型的幻觉、奖励黑客乃至潜在欺骗行为变得更加可见。

来自主题: AI技术研报
6791 点击    2025-12-23 09:26
速递|成立五年的AI安全初创公司Veza,拟超10亿美元被ServiceNow收购

速递|成立五年的AI安全初创公司Veza,拟超10亿美元被ServiceNow收购

速递|成立五年的AI安全初创公司Veza,拟超10亿美元被ServiceNow收购

Veza 的订阅软件帮助企业了解其员工以及自动化软件任务的 AI Agent对特定客户或公司数据的访问权限,以及他们能对这些数据做什么。ServiceNow 一直在加强其 AI Agent相关的产品,这些产品旨在自动化客户服务和响应IT 帮助台请求等任务。

来自主题: AI资讯
7767 点击    2025-11-30 11:26
上线24小时就被黑!曝谷歌新AI编程工具存在严重Bug:哪怕卸载重装,后门仍会「自动复活」

上线24小时就被黑!曝谷歌新AI编程工具存在严重Bug:哪怕卸载重装,后门仍会「自动复活」

上线24小时就被黑!曝谷歌新AI编程工具存在严重Bug:哪怕卸载重装,后门仍会「自动复活」

如果说过去一年里,AI 让开发者生产力翻倍,那么如今它也开始以同样的速度放大风险。 上周,Google 刚刚推出的基于 Gemini 的全新 AI 编码工具 Antigravity,上线不到 24 小时便被一名安全研究员攻破,指出它存在严重的安全Bug。

来自主题: AI资讯
7774 点击    2025-11-28 21:03
念首诗,就能让AI教你造核弹!Gemini 100%中招

念首诗,就能让AI教你造核弹!Gemini 100%中招

念首诗,就能让AI教你造核弹!Gemini 100%中招

最新研究发现,只要把恶意指令写成一首诗,就能让Gemini和DeepSeek等顶尖模型突破安全限制。这项针对25个主流模型的测试显示,面对「诗歌攻击」,百亿美金堆出来的安全护栏瞬间失效,部分模型的防御成功率直接归零。最讽刺的是,由于小模型「读不懂」诗里的隐喻反而幸免于难,而「有文化」的大模型却因为过度解读而全线破防。

来自主题: AI资讯
8114 点击    2025-11-25 15:31
AI安全新漏洞:一首诗就能攻破顶级大模型?

AI安全新漏洞:一首诗就能攻破顶级大模型?

AI安全新漏洞:一首诗就能攻破顶级大模型?

如果你想恶意攻击一个大语言模型(LLM),比如 Gemini 或者 Deepseek,你会怎么做?

来自主题: AI资讯
5879 点击    2025-11-24 10:44
偶然刷到的一个逆天项目:AI黑客...

偶然刷到的一个逆天项目:AI黑客...

偶然刷到的一个逆天项目:AI黑客...

做过独立开发的朋友都清楚,虽然现在 AI 已经能写出相当不错的前端,后端也有成熟的 BaaS 服务,但应用开发并不仅仅只是写份代码。

来自主题: AI技术研报
6570 点击    2025-11-17 14:33
OpenAI Atlas等AI浏览器暴露Web Agent安全风险!南洋理工破解底层机制

OpenAI Atlas等AI浏览器暴露Web Agent安全风险!南洋理工破解底层机制

OpenAI Atlas等AI浏览器暴露Web Agent安全风险!南洋理工破解底层机制

OpenAI Atlas、Perplexity Comet等AI浏览器的推出,虽提升了网页自动化效率,却也使智能爬虫威胁加剧。南洋理工大学团队研发的WebCloak,创新性地混淆网页结构与语义,打破爬虫技术依赖,为数据安全筑起轻量高效防线,助力抵御新型智能攻击,守护网络安全。

来自主题: AI技术研报
6634 点击    2025-11-03 14:19
史上最惨一代?AI延长人类寿命,下一代活到200岁不是梦!

史上最惨一代?AI延长人类寿命,下一代活到200岁不是梦!

史上最惨一代?AI延长人类寿命,下一代活到200岁不是梦!

AGI炒作还是现实?AI新闻老将Matt Wolfe直击美国AI核心:从Demis Hassabis的理性谨慎,到扎克伯格的巨资投入,探索递归自我改进的潜在爆炸风险。

来自主题: AI资讯
6340 点击    2025-10-31 09:53