AI资讯新闻榜单内容搜索-大模型

少即是多！10亿参数「小巨人」击败ChatGPT

只有10亿参数的xLAM-1B在特定任务中击败了LLM霸主：OpenAI的GPT-3.5 Turbo和Anthropic的Claude-3 Haiku。上个月刚发布的苹果智能模型只有30亿参数，就连奥特曼都表示，我们正处于大模型时代的末期。那么，小语言模型（SLM）会是AI的未来吗？

来自主题: AI技术研报

7894 点击 2024-07-04 16:25

GPT-4o或许还得等到今年秋季才对外开放。不过，由法国8人团队打造的原生多模态Moshi，已经实现了接近GPT-4o的水平，现场演示几乎0延迟，AI大佬纷纷转发。

来自主题: AI资讯

6101 点击 2024-07-04 16:20

最近，公司全体同事都在疯狂沉迷这款《大闹天宫MBTI》测试！各种直击打工人的灵魂拷问，让所有i人和e人在职场极限场景中反复拉扯。国产黑马和上影打造的原汁原味《大闹天宫》画风，简直让人一秒穿越回童年。

来自主题: AI资讯

7775 点击 2024-07-04 16:10

开源大语言模型（LLM）百花齐放，为了让它们适应各种下游任务，微调（fine-tuning）是最广泛采用的基本方法。基于自动微分技术（auto-differentiation）的一阶优化器（SGD、Adam 等）虽然在模型微调中占据主流，然而在模型越来越大的今天，却带来越来越大的显存压力。

来自主题: AI技术研报

11097 点击 2024-07-04 13:35

无需录制团队、拍摄装备、摄像技能或后期编辑。

来自主题: AI资讯

5752 点击 2024-07-04 12:53

AI输入法不止输入。

来自主题: AI资讯

7706 点击 2024-07-04 12:51

趁国内大模型“虚弱”，抢跑者取胜。

来自主题: AI资讯

6284 点击 2024-07-04 12:30

只需Image Tokenizer，Llama也能做图像生成了，而且效果超过了扩散模型。

来自主题: AI资讯

10045 点击 2024-07-04 11:09

为了让大模型在特定任务、场景下发挥更大作用，LoRA这样能够平衡性能和算力资源的方法正在受到研究者们的青睐。

来自主题: AI技术研报

11150 点击 2024-07-04 11:05

Meta的GenAI团队在最新研究中介绍了Meta 3D Gen模型：可以在不到1分钟的时间内从文本直接端到端生成3D资产。

来自主题: AI技术研报

10775 点击 2024-07-03 16:15