AI资讯新闻榜单内容搜索-大模

跨会话不再「失忆」：openJiuwen社区开源 AutoGenetic Memory，让Agent记忆自主生长

当大模型应用进入深水区，决定一个 Agent 体验上限的，早已不只是 "答得对不对", 而是 "能不能持续记住同一个人"。

来自主题: AI技术研报

5624 点击 2026-07-02 14:31

从答题到做实验：SciAgentGym让大模型进入科学工作流

DeepMind 联合创始人、2024 年诺贝尔化学奖得主 Demis Hassabis 曾谈到，他一直将 AI 视为推动知识前沿的重要工具。AI 可以帮助科学家处理复杂数据、发现隐藏模式，也可能在未来参与更深层的科学探索。

来自主题: AI技术研报

5488 点击 2026-07-02 10:35

卖Token也不是稳赚不赔！硅基流动招股书来了

大模型公司在港股热度正酣，现在，卖Token的公司也开始冲刺了。硅基流动已向港交所提交上市申请，剑指港股「AI Token工厂第一股」。此前，硅基流动已完成7轮融资，估值77.4亿元。阿里、美团、商汤、蔚来、智谱等产业方和明星AI投资机构均有押注。

来自主题: AI资讯

9077 点击 2026-07-01 16:23

冷门新语言AI写不动？IEEE论文：从零到及格线，MoonBit给出完整训练路线

对于Python、Java、JavaScript这些语言，大模型通常能给出相当成熟的答案。

来自主题: AI技术研报

5702 点击 2026-07-01 15:03

都在卷「让大模型多循环几遍」，这个7B模型LoopCoder v2说：多循环 1 次就够了

当所有人都在比谁「想得更久、算得更多」——推理模型动辄输出成千上万个思考 token，循环式架构恨不得在内部反复迭代十遍八遍——一项新研究反手泼了盆冷水：

来自主题: AI技术研报

6534 点击 2026-07-01 10:26

Karpathy又封神！掀翻RAG，把你的笔记变成第二大脑

知识第一次，能像代码一样利滚利。前OpenA 创始团队成员、特斯拉前 AI 高级总监 Andrej Karpathy，提出一个狠招：别再用 RAG 检索你的知识库，让大模型把它「编译」成一座持续生长的活 Wiki。两个多月，他在GitHub屠出 5000+ star。

来自主题: AI资讯

7016 点击 2026-07-01 09:52

美团 LongCat-2.0：第一个在纯国产芯片训练的万亿参数大模型

如果只看标题，它很容易被归到“又一个万亿参数大模型”的队伍里：1.6 万亿总参数、MoE 架构、100 万 token 上下文、面向代码和 Agent 场景。但这次真正值得看的，不只是模型有多大，而是它背后的三个问题：国产算力能不能支撑前沿级大模型训练？

来自主题: AI资讯

9597 点击 2026-06-30 21:04

条条电路通罗马：大模型可解释性的「唯一机制」可能从一开始就不存在

长期以来，机制可解释性（mechanistic interpretability）领域有一个几乎从未被明说、却被视为理所当然的前提：模型对于同一种任务的能力或表现，背后对应着一条唯一的、或近乎唯一的内部「电路」（circuit）。该领域的研究者们之所以要做「电路发现」（circuit discovery），是为了要把这些「特定的」电路找出来。

来自主题: AI技术研报

7764 点击 2026-06-30 15:12

DeepSeek点燃大模型效率之争，阶跃火速接棒：JetSpec让大模型解码速度最高提升近10倍

近期，DeepSeek发布DSpark让大模型推理效率再次成为行业焦点。

来自主题: AI技术研报

9837 点击 2026-06-30 15:11

Claude「断电」背后：中国基准首次捅开了AI万亿市场「死穴」

6月22日Claude全家桶集体宕机，只是冰山一角。当最强大模型被丢进真实机房直面「幽灵故障」，AISHPerf-智算运维智能体评测基准给出残酷答案：全军覆没，无一过50分。这道鸿沟，第一次被量化。

来自主题: AI资讯

6147 点击 2026-06-30 10:21