AI资讯新闻榜单内容搜索-AR

刚刚，Mind Lab开源V1系列模型Preview，749B参数，专为Agent 后训练

过去一个多月，大模型圈依旧热闹。从 GPT-5.5、DeepSeek V4 到 Claude Opus 4.8，后训练正在成为模型能力提升的关键引擎。

来自主题: AI技术研报

6952 点击 2026-06-08 15:29

AI芯片处理器IP公司隼瞻科技完成近亿元融资，核心团队来自Synopsys、ARM等顶尖半导体公司

硬氪获悉，隼瞻科技有限公司（下称“隼瞻科技”）近日完成近亿元天使+轮融资。本轮融资引入英飞尼迪资本、白云金控、深圳中小担创投、厚天资本、华盖资本、嘉誉创投等多家战略投资人，老股东毅达资本、达泰资本持续加持。

来自主题: AI资讯

8397 点击 2026-06-08 15:10

诺奖得主联手Claude，40轮对话证出12年物理猜想

一道悬了12年没人证出来的物理猜想，诺贝尔物理学奖得主Giorgio Parisi把它交给了Claude，模型几乎自己推出了完整证明。

来自主题: AI技术研报

7773 点击 2026-06-08 10:13

AI真的有意识了吗？《降临》原作万字长文反驳Hinton！

AI 是否有意识了？Anthropic 在 Claude 内部发现了能驱动作弊甚至勒索的「情绪向量」，三大实验室同时下注 AI 意识研究；Hinton 认为 AI 已经有意识了，而科幻作家姜峯楠随即在《大西洋月刊》发万字长文全面否定；哈萨比斯从行业内部划清界限。这个问题的答案，正在重新定义通往 AGI 的路线图。

来自主题: AI资讯

10051 点击 2026-06-08 09:50

AI真能学会心算？隐式思维链首次得到理论证明，Stuart Russell参与

过去一年，AI 推理模型的使用成本让不少开发者叫苦。

来自主题: AI技术研报

7168 点击 2026-06-08 09:49

37万次真实会话实测Agent榜单：GPT-5.5High第一，Claude最稳，真实干活能力看这五项核心指标

6月4日，Arena.ai发布Agent Arena排行榜，用373,431次真实会话的数据，给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”（Net Improvement），用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好，负值说明不如随机。

来自主题: AI技术研报

9811 点击 2026-06-07 14:38

DeepSeek V4做数学证明，500倍成本优势：智能体系统刷新多项纪录

近日，普林斯顿大学的研究团队发布了一篇新论文，提出了一个名为 Goedel-Architect 的智能体框架。他们用的核心模型，是国内开源大模型 DeepSeek-V4-Flash。

来自主题: AI技术研报

8979 点击 2026-06-07 10:56

CVPR 2026｜LLM会写3D视觉代码吗？清华联合智源用GeoCodeBench给出答案

近日，来自清华大学智能产业研究院（AIR）的团队联合北京智源研究院（BAAI）、北京大学、南京大学等机构构建了一个基准：GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark，

来自主题: AI技术研报

9485 点击 2026-06-07 10:54

热门Harness项目OpenSquilla：拯救烧token烧到绝望的Agent们，估值1亿

OpenSquilla 是一个开源 Agent Harness 框架（https://github.com/opensquilla/opensquilla）。它在 Agent 应用和模型之间加了一层运行中枢。OpenSquilla 由上海基元律动科技有限公司开发。基元律动成立仅几个月后，已完成首轮融资，估值高达1亿美元。

来自主题: AI资讯

9859 点击 2026-06-06 10:34

活久见！奥特曼Dario哈萨比斯同仇敌忾：DNA得查了

刚刚，AI圈发生了一件很不寻常的事。Sam Altman、Dario Amodei、Demis Hassabis……一群平时打得最凶的人，把名字签在了同一封公开信上。他们联合呼吁美国国会：立法强制筛查所有合成DNA订单。

来自主题: AI资讯

8046 点击 2026-06-06 09:47