AI资讯新闻榜单内容搜索-模型训练

两个小模型互相验证，直接比肩大模型？微软的rStar甚至没用CoT和微调

互相检查，让小模型也能解决大问题。

来自主题: AI技术研报

9745 点击 2024-08-16 21:12

大神Karpathy：我给大模型「SQL注入」攻击，简直不要太轻松

大模型的安全性，可以说是「有很大进步空间」。

来自主题: AI资讯

9217 点击 2024-08-16 21:10

大模型正在从黄金时代进入白银时代

越来越多人开始关注大模型，很多做工程开发的同学问我怎么入门大模型训练推理系统软件（俗称大模型Infra）。

来自主题: AI资讯

10227 点击 2024-08-16 20:52

10人明星团队炼出首个微调Llama 3.1 405B！角色扮演一秒入戏，代码全开源

发布40天后，最强开源模型Llama 3.1 405B等来了微调版本的发布。但不是来自Meta，而是一个专注于开放模型的神秘初创Nous Research。

来自主题: AI技术研报

6823 点击 2024-08-16 14:49

Nature曝惊人内幕：论文被天价卖出喂AI！出版商狂赚上亿，作者0收入

Nature的一篇文章透露：你发过的paper，很可能已经被拿去训练模型了！有的出版商靠卖数据，已经狂赚2300万美元。然而辛辛苦苦码论文的作者们，却拿不到一分钱，这合理吗？

来自主题: AI技术研报

6331 点击 2024-08-16 14:17

“偷”X数据，用特斯拉显卡，马斯克把AI炼成啥样了？

有个怪事儿，前段时间，大模型竞技场上，一位代码为sus-column-r的匿名模型横空出世

来自主题: AI资讯

7989 点击 2024-08-16 10:45

大模型指令调优数据集万字评测！腾讯上交大联合出品

随着大模型的快速发展，指令调优在提升模型性能和泛化能力方面发挥着至关重要的作用。

来自主题: AI技术研报

10783 点击 2024-08-15 17:10

「肢解」谷歌帝国！Chrome安卓或遭剥离，AI训练数据被迫共享

反垄断案败诉，谷歌或将面临「分家」，一旦与Chrome和安卓操作系统解绑，谷歌该何去何从？

来自主题: AI资讯

11764 点击 2024-08-15 14:37

从ACL 2024录用论文看混合专家模型（MoE）最新研究进展

最近ACL 2024 论文放榜，扫了下，SMoE（稀疏混合专家）的论文不算多，这里就仔细梳理一下，包括动机、方法、有趣的发现，方便大家不看论文也能了解的七七八八，剩下只需要感兴趣再看就好。

来自主题: AI技术研报

4425 点击 2024-08-15 10:17

没有等来OpenAI开源GPT-4o，等来了开源版VITA

大语言模型 (LLM) 经历了重大的演变，最近，我们也目睹了多模态大语言模型 (MLLM) 的蓬勃发展，它们表现出令人惊讶的多模态能力。特别是，GPT-4o 的出现显著推动了 MLLM 领域的发展。然而，与这些模型相对应的开源模型却明显不足。开源社区迫切需要进一步促进该领域的发展，这一点怎么强调也不为过。

来自主题: AI资讯

8825 点击 2024-08-14 17:38