AI资讯新闻榜单内容搜索-小模型

2B小钢炮碾压Mistral-7B，旗舰级端侧模型炸场开年黑马！1080Ti可训，170万tokens成本仅1元

2B性能小钢炮来了！刚刚，面壁智能重磅开源了旗舰级端侧多模态模型MiniCPM，2B就能赶超Mistral-7B，还能越级比肩Llama2-13B。成本更是低到炸裂，170万tokens成本仅为1元！

来自主题: AI资讯

9446 点击 2024-02-02 11:18

梭哈大模型的公司，给自己找了条退路

AI大模型在业界备受关注，但对于一些公司来说，采用小模型可能是一种更好的选择。微软已经开始研发小规模、低算力需求的模型，并组建新团队进行对话式AI的开发。而对于工业、金融和汽车等领域而言，小模型更易于落地，并且具有省电、省钱、省时间的优势。

来自主题: AI资讯

1953 点击 2024-02-01 22:49

摆脱OpenAI依赖！微软组建王牌AI团队专攻「小模型」，为大模型降本增效

根据消息人士曝料，微软调集了各组中的精英，组建了一支新的AI团队，专攻小模型，希望能够摆脱对于OpenAI的依赖。

来自主题: AI技术研报

3323 点击 2024-01-24 13:03

AI狂飙，谁是中国独角兽背后的「超级买家」？

以大模型为代表的生成式AI技术经历了一年多的狂飙突进后，进入一个新的阶段。一是从跳出百模大战的「速度怪圈」，逐步迈向强调模型效果和质量。二是在应用层生态上，强调垂直化与专有化的小模型、基于大模型泛化能力的定制化、智能化的Agent（智能体）也成为了创业者们投身的热门风向。

来自主题: AI资讯

7005 点击 2024-01-23 15:40

三个臭皮匠顶个诸葛亮？可能是真的，已证实混合多个小模型性能比肩GPT3.5

对模型参数量的迷信、执念也许可以放下了，混合多个小模型也是未来构造对话型 AI 的一个光明的方向。

来自主题: AI技术研报

7333 点击 2024-01-18 18:23

小模型当打之年？2024年AI预言“一网打尽”

在本篇文章中，适道将综合Coatue、a16z、Radical Ventures等明星VC预言；The Information、FT、Sifted汇集的投资者预言；以及Greg Brockman等行业大佬的观点，试着归纳接下来一年中AI的发展脉络。

来自主题: AI资讯

7222 点击 2024-01-09 09:25

轻量级模型，重量级性能，TinyLlama、LiteLlama小模型火起来了

当大家都在研究大模型（LLM）参数规模达到百亿甚至千亿级别的同时，小巧且兼具高性能的小模型开始受到研究者的关注。

来自主题: AI资讯

7305 点击 2024-01-08 14:05

无需额外训练提升模型30%性能！DeepMind科学家点赞MIT博士生实习成果

一个来自MIT博士生的惊人发现：只需对Transformer的特定层进行一种非常简单的修剪，即可在缩小模型规模的同时显著提高模型性能。

来自主题: AI技术研报

1509 点击 2023-12-31 12:01

不是大模型用不起，而是小模型更有性价比

无法控制成本的大模型终将被“快好省”的小模型取代今年最热的AI赛道中，机构们自然也得下一些判断，比如说——2024年大模型的一个趋势，是将变得“越来越小”。

来自主题: AI资讯

5257 点击 2023-12-28 14:07

源代码is all you need！7B代码小模型同尺寸无敌，性能媲美ChatGPT和谷歌Gemini

软件开发人员对代码生成 AI 已经不陌生，它们已经成为提高生产力的利器。本文中，伊利诺伊大学香槟分校（UIUC）张令明老师团队带来了代码生成 AI 领域的又一力作 ——Magicoder，在短短一周之内狂揽 1200 多颗 GitHub Star，登上 GitHub Trending 日榜，并获推特大佬 AK（@_akhaliq）发推力荐。

来自主题: AI技术研报

7936 点击 2023-12-18 11:03