AI资讯新闻榜单内容搜索-模型

凌晨，Qwen又更新了，3090就能跑，3B激活媲美GPT-4o

继前段时间密集发布了三款 AI 大模型后，Qwen 凌晨又更新了 —— 原本的 Qwen3-30B-A3B 有了一个新版本：Qwen3-30B-A3B-Instruct-2507。

来自主题: AI资讯

8213 点击 2025-07-30 09:27

预测太阳磁暴全球最强！首个空间天气链式AI预报模型亮相WAIC

就在一颗通信卫星以第一宇宙速度飞过我们头顶的几分钟时间里，上百万人正借助由它所搭建的网络去链接这个世界，而实际上，这样的卫星有成千上万颗。

来自主题: AI资讯

5870 点击 2025-07-29 17:13

狂拿大模型明星订单，一家清华系HPC-AI Infra公司浮出水面

不靠囤算力，拿下数家大模型明星公司订单。

来自主题: AI资讯

8031 点击 2025-07-29 16:52

科学能力太强，这个多模态推理「六边形战士」被严重低估！Intern-S1开源登顶

在WAIC 2025大会上，上海AI实验室首席科学周伯文和Hinton教授的尖峰对话轰动全场。而在科学探索上，实验室更是独辟蹊径开创「通专融合」大模型创新路线，全新一代科学大模型拿下多模态能力全球第一。

来自主题: AI资讯

4484 点击 2025-07-29 16:38

全球首次，「AI记忆」开源落地！MIRIX同步上线APP

加利福尼亚大学圣迭戈分校博士生王禹和纽约大学教授陈溪联合推出并开源了 MIRIX，全球首个真正意义上的多模态、多智能体AI记忆系统。MIRIX团队同步上线了一款桌面端APP，可直接下载使用！

来自主题: AI技术研报

8967 点击 2025-07-29 16:22

阿里开源电影级AI视频模型！MoE架构，5B版本消费级显卡可跑

电影级视频生成模型来了。

来自主题: AI资讯

9187 点击 2025-07-29 12:49

ICML25|标点符号竟是LLM记忆核心！正确处理性能暴涨

近年来，大语言模型（LLM）的能力越来越强，但它们的“饭量”也越来越大。这个“饭量”主要体现在计算和内存上。当模型处理的文本越来越长时，一个叫做“自注意力（Self-Attention）”的核心机制会导致计算量呈平方级增长。这就像一个房间里的人开会，如果每个人都要和在场的其他所有人单独聊一遍，那么随着人数增加，总的对话次数会爆炸式增长。

来自主题: AI技术研报

5989 点击 2025-07-29 12:29

EvaLearn：AI下半场的全新评测范式！

在三个月前，OpenAI 研究员 Shunyu Yao 发表了一篇关于 AI 的下半场的博客引起了广泛讨论。他在博客中指出，AI 研究正在从 “能不能做” 转向 “学得是否有效”，传统的基准测试已经难以衡量 AI 的实际效用，他指出现有的评估方式中，模型被要求独立完成每个任务，然后取平均得分。这种方式忽略了任务之间的连贯性，无法评估模型长期适应能力和更类人的动态学习能力。

来自主题: AI技术研报

6827 点击 2025-07-29 10:54

只需一次指令微调，大模型变身全能专家天团，8B模型性能反超全微调基线 | ACL25 Oral

只需一次指令微调，即可让普通大模型变身“全能专家天团”？

来自主题: AI技术研报

7075 点击 2025-07-29 10:45

今夜，国产AI最强一击！智谱发布GLM-4.5，新一代模型狙击OpenAI

智谱新一代旗舰「融合大模型」GLM-4.5，集成推理、代码与智能体能力，实现原生智能体模式。

来自主题: AI资讯

8391 点击 2025-07-29 10:43