AI资讯新闻榜单内容搜索-大模型安全

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 大模型安全

第一梯队的大模型安全吗？复旦、上海创智学院等发布前沿大模型安全报告，覆盖六大领先模型

第一梯队的大模型安全吗？复旦、上海创智学院等发布前沿大模型安全报告，覆盖六大领先模型

第一梯队的大模型安全吗？复旦、上海创智学院等发布前沿大模型安全报告，覆盖六大领先模型

随着大语言模型加速迈向多模态与智能体形态，传统以单一维度为主的安全评估体系已难以覆盖真实世界中的复杂风险图景。在模型能力持续跃升的 2026 年，开发者与用户也愈发关注一个核心问题：前沿大模型的安全性，到底如何？

来自主题: AI技术研报

9265 点击 2026-01-26 10:20

250份文档就能给大模型植入后门：不分参数规模

250份文档就能给大模型植入后门：不分参数规模

250份文档就能给大模型植入后门：不分参数规模

大模型安全的bug居然这么好踩？？250份恶意文档就能给LLM搞小动作，不管模型大小，600M还是13B，中招率几乎没差。这是Claude母公司Anthropic最新的研究成果。

来自主题: AI技术研报

9549 点击 2025-10-11 12:04

管你模型多大，250份有毒文档统统放倒，Anthropic：迄今为止规模最大的大模型数据投毒调查

管你模型多大，250份有毒文档统统放倒，Anthropic：迄今为止规模最大的大模型数据投毒调查

管你模型多大，250份有毒文档统统放倒，Anthropic：迄今为止规模最大的大模型数据投毒调查

本次新研究是迄今为止规模最大的大模型数据投毒调查。Anthropic 与英国人工智能安全研究所（UK AI Security Institute）和艾伦・图灵研究所（Alan Turing Institute）联合进行的一项研究彻底打破了这一传统观念：只需 250 份恶意文档就可能在大型语言模型中制造出「后门」漏洞，且这一结论与模型规模或训练数据量无关。

来自主题: AI技术研报

9089 点击 2025-10-10 12:14

只需一块 4070，一个小时，Gemini 2.5 就能被黑产植入广告！

只需一块 4070，一个小时，Gemini 2.5 就能被黑产植入广告！

只需一块 4070，一个小时，Gemini 2.5 就能被黑产植入广告！

说个热知识，现在的大模型，也可以轻松被投广告了。我们之前也确实发现过这类现象，当时是在研究一家做 GEO（生成式引擎优化）的公司。通过在网上堆出大量正面内容，把某个特定品牌、网站、课程甚至微商产品，默默地塞进了大模型推荐结果里。

来自主题: AI技术研报

8086 点击 2025-08-29 16:01

ICML 2025 Oral | 从「浅对齐」到「深思熟虑」，清华牵头搭起大模型安全的下一级阶梯

ICML 2025 Oral | 从「浅对齐」到「深思熟虑」，清华牵头搭起大模型安全的下一级阶梯

ICML 2025 Oral | 从「浅对齐」到「深思熟虑」，清华牵头搭起大模型安全的下一级阶梯

在大语言模型（LLM）加速进入法律、医疗、金融等高风险应用场景的当下，“安全对齐”不再只是一个选项，而是每一位模型开发者与AI落地者都必须正面应对的挑战。

来自主题: AI技术研报

9373 点击 2025-06-25 16:41

音频大模型安全可信度的全面“体检”！6大维度，清华南洋理工联手打造

音频大模型安全可信度的全面“体检”！6大维度，清华南洋理工联手打造

音频大模型安全可信度的全面“体检”！6大维度，清华南洋理工联手打造

首个专为ALLMs（音频大语言模型）设计的多维度可信度评估基准来了。

来自主题: AI技术研报

10176 点击 2025-06-03 15:11

连Claude 3.5都败下阵来，大语言模型能否定位软件服务的故障根因？

连Claude 3.5都败下阵来，大语言模型能否定位软件服务的故障根因？

连Claude 3.5都败下阵来，大语言模型能否定位软件服务的故障根因？

论文的第一作者是香港中文大学（深圳）数据科学学院三年级博士生徐俊杰龙，指导老师为香港中文大学（深圳）数据科学学院的贺品嘉教授和微软主管研究员何世林博士。贺品嘉老师团队的研究重点是软件工程、LLM for DevOps、大模型安全。

来自主题: AI技术研报

7454 点击 2025-04-22 17:58

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安全

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安全

OpenAI重拾规则系统，用「AI版机器人定律」守护大模型安全

在大算力和大数据让基于统计的 AI 模型真正变得强大且有用之前，基于规则的系统长期以来是语言模型的主导范式。

来自主题: AI技术研报

5283 点击 2024-11-06 14:57

提示词用上“过去式“，秒破GPT4o等六大模型安全限制！中文语境也好使

提示词用上“过去式“，秒破GPT4o等六大模型安全限制！中文语境也好使

提示词用上“过去式“，秒破GPT4o等六大模型安全限制！中文语境也好使

只要在提示词中把时间设定成过去，就能轻松突破大模型的安全防线。

来自主题: AI资讯

6642 点击 2024-07-19 16:56

微软们掉进大模型安全漩涡

微软们掉进大模型安全漩涡

微软们掉进大模型安全漩涡

大模型的安全问题正在悄悄逼近。

来自主题: AI资讯

10276 点击 2024-06-24 15:51

上一页当前第1页,共2页下一页