英伟达Mistral AI联袂出击!120亿小模型王者强势登场,碾压Llama 3单张4090可跑
英伟达Mistral AI联袂出击!120亿小模型王者强势登场,碾压Llama 3单张4090可跑GPT-4o mini头把交椅还未坐热,Mistral AI联手英伟达发布12B参数小模型Mistral Nemo,性能赶超Gemma 2 9B和Llama 3 8B。
搜索
GPT-4o mini头把交椅还未坐热,Mistral AI联手英伟达发布12B参数小模型Mistral Nemo,性能赶超Gemma 2 9B和Llama 3 8B。
在520时,有位小红书的用户用kimi分析了他们的感情历程。
著名AI学者、斯坦福大学教授吴恩达提出了AI Agent的四种设计方式后,Agentic Workflow(智能体工作流)立即火爆全球,多个行业都在实践智能体工作流的应用,并推动了新的Agentic AI探索热潮。
小模型,正在成为 AI 巨头的新战场。
大模型在语言、图像领域取得了巨大成功,时间序列作为多个行业的重要数据类型,时序领域的大模型构建尚处于起步阶段。近期,清华大学的研究团队基于Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性
2024年AI人才争夺战硝烟弥漫战况升级,马斯克与OpenAI纠葛不断再结新梁子,就在xAI完成巨额融资前,核心成员Kosic竟重返OpenAI。
OpenAI突发新模型,GPT-3.5退役,大模型成本2年骤降99%
《2024 中国开发者调查报告》深度揭示开发者现状。
在2023年初,即便是当时最先进的GPT-3.5,其上下文长度也仅限于2k。然而,时至今日,1M的上下文长度已经成为衡量模型技术先进性的重要标志之一。
大型语言模型(LLMs)在解决问题方面的非凡能力日益显现。最近,一个值得关注的现象是,这些模型在多项数学推理的基准测试中获得了惊人的成绩。以 GPT-4 为例,在高难度小学应用题测试集 GSM8K [1] 中表现优异,准确率高达 90% 以上。同时,许多开源模型也展现出了不俗的实力,准确率超过 80%。