AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等

同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等

同时监督和强化的单阶段大模型微调,告别“先背书再刷题”,推理泛化双提升|中科院&美团等

通过单阶段监督微调与强化微调结合,让大模型在训练时能同时利用专家演示和自我探索试错,有效提升大模型推理性能。

来自主题: AI技术研报
5921 点击    2025-07-02 15:35
大模型时代,通用视觉模型将何去何从?

大模型时代,通用视觉模型将何去何从?

大模型时代,通用视觉模型将何去何从?

过去几年,通用视觉模型(Vision Generalist Model,简称 VGM)曾是计算机视觉领域的研究热点。

来自主题: AI技术研报
8133 点击    2025-07-02 10:52
重磅!华为联手顶级三甲,AI医疗大模型开源!

重磅!华为联手顶级三甲,AI医疗大模型开源!

重磅!华为联手顶级三甲,AI医疗大模型开源!

6月30日,上海交通大学医学院附属瑞金医院宣布,RuiPath病理大模型的视觉基础模型正式开源。

来自主题: AI资讯
5432 点击    2025-07-02 10:43
ICML 2025 Spotlight | 清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式,刷新图像生成SOTA

ICML 2025 Spotlight | 清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式,刷新图像生成SOTA

ICML 2025 Spotlight | 清华朱军组&NVIDIA提出DDO:扩散/自回归模型训练新范式,刷新图像生成SOTA

清华大学朱军教授团队与 NVIDIA Deep Imagination 研究组联合提出一种全新的视觉生成模型优化范式 —— 直接判别优化(DDO)。

来自主题: AI技术研报
5826 点击    2025-07-02 10:33
Claude烧钱,Cline更烧钱,但聪明的开发者都在抢着用 | Cline 博客分享

Claude烧钱,Cline更烧钱,但聪明的开发者都在抢着用 | Cline 博客分享

Claude烧钱,Cline更烧钱,但聪明的开发者都在抢着用 | Cline 博客分享

这两天读到开源的代码 Agent,Cline 团队的一篇博客,《Why Cline Doesn't Index Your Codebase (And Why That's a Good Thing) 》,做了一些整理和探索,来分享一下这篇博客内容。

来自主题: AI技术研报
7519 点击    2025-07-02 10:13
o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

o3通关「俄罗斯方块」,碾压Gemini夺冠!UCSD新基准击碎宝可梦

UCSD等推出Lmgame Bench标准框架,结合多款经典游戏,分模块测评模型的感知、记忆与推理表现。结果显示,不同模型在各游戏中表现迥异,凸显游戏作为AI评估工具的独特价值。

来自主题: AI资讯
5564 点击    2025-07-01 16:15
华为又开源了个大的:超大规模MoE推理秘籍

华为又开源了个大的:超大规模MoE推理秘籍

华为又开源了个大的:超大规模MoE推理秘籍

超大规模MoE模型(如DeepSeek),到底该怎么推理才能做到又快又稳。现在,这个问题似乎已经有了标准答案——华为一个新项目,直接把推理超大规模MoE背后的架构、技术和代码,统统给开源了!

来自主题: AI资讯
5436 点击    2025-07-01 16:05
SuperCLUE推理榜惊现黑马:原来中兴是一家AI公司?

SuperCLUE推理榜惊现黑马:原来中兴是一家AI公司?

SuperCLUE推理榜惊现黑马:原来中兴是一家AI公司?

中兴通讯,这家数万人的科技大厂,凭借40年 ICT 技术积累正式进军 AI 赛道。 一家信息通信公司,居然拿到了 AI 推理竞赛的冠军,这事儿有点意思。

来自主题: AI资讯
5543 点击    2025-07-01 15:53