AI资讯新闻榜单内容搜索-大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型
大模型性能掺水严重?北大交出答卷:交互评估+动态出题,死记硬背也没用 | ACL 2024

大模型性能掺水严重?北大交出答卷:交互评估+动态出题,死记硬背也没用 | ACL 2024

大模型性能掺水严重?北大交出答卷:交互评估+动态出题,死记硬背也没用 | ACL 2024

当前大语言模型(LLM)的评估方法受到数据污染问题的影响,导致评估结果被高估,无法准确反映模型的真实能力。北京大学等提出的KIEval框架,通过知识基础的交互式评估,克服了数据污染的影响,更全面地评估了模型在知识理解和应用方面的能力。

来自主题: AI技术研报
5833 点击    2024-07-02 18:25
多模态能力全球TOP3,来自中国从容大模型

多模态能力全球TOP3,来自中国从容大模型

多模态能力全球TOP3,来自中国从容大模型

国产多模态大模型的头号交椅,再次易主

来自主题: AI资讯
6852 点击    2024-07-02 18:20
8B尺寸达到GPT-4级性能!北大等提出医疗专家模型训练方法

8B尺寸达到GPT-4级性能!北大等提出医疗专家模型训练方法

8B尺寸达到GPT-4级性能!北大等提出医疗专家模型训练方法

本文研究发现大语言模型在持续预训练过程中出现目标领域性能先下降再上升的现象。

来自主题: AI技术研报
9515 点击    2024-07-02 11:27
Gen-3开放内测,网友实测demo惊人!魔都时装秀一绝,却依旧不懂物理世界

Gen-3开放内测,网友实测demo惊人!魔都时装秀一绝,却依旧不懂物理世界

Gen-3开放内测,网友实测demo惊人!魔都时装秀一绝,却依旧不懂物理世界

Gen-3 Alpha终于开启测试了!第一时间拿到内测资格的网友们,纷纷放出各种炸裂的demo,看得出Gen-3在生成质量完全跃升。不过,模型有时无法理解物理世界的缺陷,依然存在。

来自主题: AI资讯
10569 点击    2024-07-02 11:14