AI资讯新闻榜单内容搜索-模型训练

OpenAI怒斥Scaling撞墙论！o1已产生推理直觉潜力巨大

Scaling Law撞墙了吗？OpenAI高级研究副总裁Mark Chen正式驳斥了这一观点。他表示，OpenAI已经有o系列和GPT系列两个模型，来让模型继续保持Scaling。

来自主题: AI资讯

6254 点击 2024-11-25 15:03

Hugging Face 上的模型数量已经超过了 100 万。但是几乎每个模型都是孤立的，难以与其它模型沟通。尽管有些研究者甚至娱乐播主试过让 LLM 互相交流，但所用的方法大都比较简单。

来自主题: AI技术研报

6329 点击 2024-11-25 14:46

在当今人工智能迅猛发展的时代，大语言模型（LLMs）已成为众多AI应用的核心引擎。然而，来自ETH Zurich和Google DeepMind的一项最新研究揭示了一个令人深思的现象：这些看似强大的模型存在着严重的“盲从效应”。

来自主题: AI技术研报

6673 点击 2024-11-25 09:44

扩散模型的本质竟是进化算法！生物学大佬从数学的角度证实了这个结论，并结合扩散模型创建了全新的进化算法。

来自主题: AI技术研报

6862 点击 2024-11-24 20:26

我们对小型语言模型的增强方法、已存在的小模型、应用、与 LLMs 的协作、以及可信赖性方面进行了详细调查。

来自主题: AI技术研报

7515 点击 2024-11-24 20:02

在机器学习领域，开发一个在未见过领域表现出色的通用智能体一直是长期目标之一。一种观点认为，在大量离线文本和视频数据上训练的大型 transformer 最终可以实现这一目标。

来自主题: AI技术研报

6560 点击 2024-11-24 19:59

用看漫画的方式，大幅提升视频大模型时序定位能力！

来自主题: AI技术研报

7976 点击 2024-11-23 16:55

tokenizer对于图像、视频生成的重要性值得重视。

来自主题: AI技术研报

4776 点击 2024-11-23 16:31

开源模型阵营又迎来一员猛将：Tülu 3。它来自艾伦人工智能研究所（Ai2），目前包含 8B 和 70B 两个版本（未来还会有 405B 版本），并且其性能超过了 Llama 3.1 Instruct 的相应版本！长达 73 的技术报告详细介绍了后训练的细节。

来自主题: AI技术研报

12207 点击 2024-11-23 16:04

Claude 3.5 Sonnet 应该是目前公认综合能力最好的基础模型。

来自主题: AI资讯

9567 点击 2024-11-23 11:19