AI资讯新闻榜单内容搜索-模型

国产大模型杀疯了！一手横测 MiniMax、DeepSeek V4、Kimi K2.6、MiMo 后，我找到了最能干活的 AI 牛马

从去年开始做这个账号以来，我其实写过不少测模型的文章。我相信也有很多朋友是因为看了我测评的文章关注我的。但从过年之后，真的就很少写模型评测的文章了。主要是我写文章的速度甚至一度跟不上模型发布的速度了。

来自主题: AI产品测评

10980 点击 2026-05-02 11:01

美团万亿级大模型LongCat-2.0-Preview 开启内测，训推全程用国产芯片

一边是 DeepSeek。2026 年 4 月 24 日，正式发布新一代模型DeepSeek-V4 系列预览版，并同步开源。另一边，美团闷声干了件大事——用全国产算力集群，训练出了万亿参数大模型 LongCat-2.0 系列预览版（ LongCat-2.0-Preview ）。

来自主题: AI资讯

10027 点击 2026-05-01 13:34

有人只用API就猜出了GPT、Claude、Gemini的参数量？社区吵翻了

基于此，研究者在 89 个参数量已知的开源模型（规模从 1.35 亿到 1.6 万亿参数）上拟合出事实准确率与参数量的对数线性关系，拟合优度 R² = 0.917，并据此对闭源模型进行参数估算。

来自主题: AI技术研报

9302 点击 2026-05-01 13:13

腾讯混元CL-bench续作发布，让大模型读懂你的日常生活

在 AGI-Next 前沿峰会上，腾讯姚顺雨举了一个很生活化的例子：当你问 AI “今天吃什么” 时，真正限制答案质量的，可能不是模型不够大，也不是推理不够强，而是它不知道你今天冷不冷、想不想吃热的、最近和朋友聊过什么、家人又有什么偏好需要纳入考虑。

来自主题: AI技术研报

7414 点击 2026-05-01 13:12

65元，免费开源！实时AI语音伴侣，Arduino编程 ESP32开发板，支持DeepSeek、Qwen、豆包，跨设备无缝对话

ElatoAI 是一个开源免费的实时AI语音交互系统，采用Arduino 编程，运行在乐鑫 ESP32 主控制器上，通过安全WebSocket连接至部署在Deno边缘函数构建的服务端，通过OpenAI Realtime API等技术实现低成本、长时长、跨设备的自然对话体验，支持多种AI模型，

来自主题: AI资讯

10253 点击 2026-05-01 11:10

实测纳逗 Pro：能做专业影视级内容的AI平台长啥样

3 月 30 日，爱奇艺正式官宣发布的专业级影视制作平台纳逗 Pro，正是其中代表。通过将行业领先基座模型与爱奇艺深耕多年的影视内容制作经验深度结合，纳逗 Pro 直接将目标对准了电视剧、院线级内容从剧本生成、分镜设计到成片输出的创作全流程。

来自主题: AI资讯

8905 点击 2026-05-01 11:10

魔法原子进军硅谷背后：世界模型野望与生态卡位

魔法原子在会上推出了新一代人形机器人 MagicBot X1 和灵巧手 MagicHand H01，而且第一次把其世界模型 Magic-Mix、数据生成与训练反馈闭环，作为一套完整的具身智能底层能力集中展示出来。

来自主题: AI资讯

7858 点击 2026-05-01 11:09

GPT Image 2研究科学家陈博远：我在OpenAI修中文

GPT Image 2的发布给整个AI圈带来了亿点点震撼。但很多人可能没注意到，幕后最会玩梗的居然是他——主力训练者陈博远。他和奥特曼同台主持，悄悄修好了中文渲染；给模型起代号“布基胶带”，还拿香蕉艺术品玩梗；为了秀模型的文字能力，设计了米粒刻字、漫画套娃、视觉证明题这些“彩蛋级”测试。

来自主题: AI资讯

8307 点击 2026-05-01 11:07

ChatGPT数学进阶之路！OpenAI研究员自爆：ChatGPT从数不清数到给出埃尔德什问题全新解法；数学是衡量模型进步的重要基准；AI自动化研究员

今天，OpenAI 官方播客发布了一期节目，让内部研究员 Sebastian Bubeck 和 Ernest Ryu 出来回答这一问题，毕竟大家都十分好奇。Ernest 近期刚加入 OpenAI 担任研究员，他之前是加州大学洛杉矶分校（UCLA）数学系的教授，研究优化和机器学习理论。他是最早尝试用 ChatGPT 解数学开放问题的那批人之一。

来自主题: AI资讯

8493 点击 2026-05-01 10:59

终结多智能体视觉幻觉“滚雪球”！新国立等提出ViF：无需改造模型，即插即用

基于视觉语言模型（VLM）的多智能体系统（MAS）正成为复杂多模态协作的核心方案，却被一个致命痛点死死卡住：多智能体视觉幻觉滚雪球——单个智能体的视觉误判通过纯文本信息流逐级放大，早期细微错误最终演变成系统性崩溃。

来自主题: AI技术研报

7701 点击 2026-05-01 10:46