AI资讯新闻榜单内容搜索-模型训练

大模型步入「推理Scaling」时代，SambaNova如何挑战英伟达的霸主地位？

OpenAI o1 的发布，再次给 AI 领域带来了一场地震。 o1 能像人类一样「思考」复杂问题，拥有优秀的通用推理能力。在未经专门训练的情况下，o1 能够直接拿下数学奥赛金牌，甚至能在博士级别的科学问答环节上超越人类专家。

来自主题: AI资讯

4342 点击 2024-10-18 13:43

NeurIPS 2024 | FaceChain团队新作，开源拓扑对齐人脸表征模型TopoFR

在数字人领域，形象的生成需要依赖于基础的表征学习。FaceChain 团队除了在数字人生成领域持续贡献之外，在基础的人脸表征学习领域也一直在进行深入研究。

来自主题: AI技术研报

6369 点击 2024-10-18 11:09

全模态对齐框架align-anything来了：实现跨模态指令跟随

如何全模态大模型与人类的意图相对齐，已成为一个极具前瞻性且至关重要的挑战。

来自主题: AI技术研报

8801 点击 2024-10-18 10:53

GPU泡沫破灭前夜：2美元/小时出租，H100算力价格暴跌75%

红杉资本的报告曾指出，AI产业的年产值超过6000亿美元，才够支付数据中心、加速GPU卡等AI基础设施费用。而现在一种普遍说法认为，基础模型训练的资本支出是“历史上贬值最快的资产”，但关于GPU基础设施支出的判定仍未出炉，GPU土豪战争仍在进行。

来自主题: AI资讯

6830 点击 2024-10-18 10:02

OpenAI攻克扩散模型短板，清华校友路橙、宋飏合作最新论文

多项改进实现规模空前的连续时间一致性模型。

来自主题: AI技术研报

6698 点击 2024-10-17 16:28

LeCun最新万字演讲：纯语言模型永远到不了人类水平，我们基本已经放弃了

当奥特曼、马斯克、Anthropic CEO都纷纷将AGI实现锚定在2026年前后，LeCun无疑是直接浇了冷水：完全是胡说八道。

来自主题: AI技术研报

9067 点击 2024-10-17 14:45

DeepMind最新：发布说话者-推理者架构实现Agents快慢思考 | 融合系统1+系统2

近期，LLM领域有不少关于系统1和系统2思考的讨论，在Agent方向上这方面的讨论还很少。如何让AI agents既能快速响应用户，又能进行深度思考和规划，一直是一个巨大的挑战。

来自主题: AI技术研报

6978 点击 2024-10-17 10:25

ChatGPT确实会看人下菜！OpenAI官方报告揭示大模型的刻板印象

我们都知道，OpenAI 最近越来越喜欢发博客了。这不，今天他们又更新了一篇，标题是「评估 ChatGPT 中的公平性」，但实际内容却谈的是用户的身份会影响 ChatGPT 给出的响应。

来自主题: AI技术研报

4573 点击 2024-10-17 10:09

补齐Transformer规划短板又不放弃快速思考，田渊栋团队的Dualformer融合System 1和2双重优势

OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其从人类认知理论中获得了灵感，提出了一种新型 Transformer 架构：Dualformer。

来自主题: AI技术研报

5218 点击 2024-10-16 15:56

重新定义自监督学习！LeCun团队让MMCR再进一步

近日，来自斯坦福、MIT、纽约大学和Meta-FAIR等机构的研究人员，通过新的研究重新定义了最大流形容量表示法（MMCR）的可能性。

来自主题: AI技术研报

5418 点击 2024-10-16 15:44