AI资讯新闻榜单内容搜索-人工智

Nature刊文称“AI可模拟人类心智”，Science同日强烈质疑

7月2日，一个跨国团队在Nature杂志发表了一项开创性研究，宣称其推出的AI系统能够“模拟人类心智”。该系统在实验中可以“扮演”人类，生成逼真的人类行为。

来自主题: AI技术研报

10305 点击 2025-07-21 10:40

AI 对齐了人的价值观，也学会了欺骗

今年 5 月，有研究者发现 OpenAI 的模型 o3 拒绝听从人的指令，不愿意关闭自己，甚至通过篡改代码避免自动关闭。类似事件还有，当测试人员暗示将用新系统替换 Claude Opus 4 模型时，模型竟然主动威胁程序员，说如果你换掉我，我就把你的个人隐私放在网上，以阻止自己被替代。

来自主题: AI资讯

8186 点击 2025-07-21 10:35

大模型再爆弱点！旧记忆忘不掉，新记忆分不出，准确率暴降 | ICML'25

大模型有苦恼，记性太好，无法忘记旧记忆，也区分不出新记忆！基于工作记忆的认知测试显示，LLM的上下文检索存在局限。在一项人类稳定保持高正确率的简单检索任务中，模型几乎一定会混淆无效信息与正确答案。

来自主题: AI技术研报

7503 点击 2025-07-21 10:27

人工智能首次主导北约防空测试

据外媒报道，北约近期完成首次由人工智能（AI）主导的防空测试。结果显示，AI系统在预警时效、信息处理和拦截效率等方面的表现，均优于同等条件下的人工操作。分析人士表示，近段时间以来，北约成员国在AI军事化应用领域动作频繁，相关动向值得关注。

来自主题: AI资讯

9330 点击 2025-07-21 09:44

「DeepSeek二代」来袭！数学暴击o3，英伟达开源LLM登顶

基于Qwen2.5架构，采用DeepSeek-R1-0528生成数据，英伟达推出的OpenReasoning-Nemotron模型，以超强推理能力突破数学、科学、代码任务，在多个基准测试中创下新纪录！数学上，更是超越了o3!

来自主题: AI资讯

9952 点击 2025-07-20 23:43

国内首批！理想汽车荣首批汽车生成式人工智能安全测评认证

理想汽车车载大模型荣获由CCIA汽车网络安全工作委员会颁发的《生成内容安全测评证书》，及人工智能生成合成内容标识服务平台颁发的《生成合成内容标识报告》，成为国内首批通过GB/T 45654、GB 45438-2025双国标认证的车企

来自主题: AI资讯

10011 点击 2025-07-20 23:02

ChatGPT Agent遭暴击，国产AI轮番“公开处刑”

OpenAI推出ChatGPT agent引发国产Agent竞品（如Manus、Genspark）公开对比，声称自身更优。实测退休计划任务显示，ChatGPT输出简陋，仅20分钟完成简易PPT；而Kimi报告详尽并互动提问，Minimax多格式输出，Manus快速设计美观。ChatGPT仅功能整合，非革命性升级，但标志AI从问答向任务执行协作转型。

来自主题: AI资讯

8695 点击 2025-07-20 12:52