AI资讯新闻榜单内容搜索-泛化能力

让模型预见分布漂移：动态系统颠覆性设计引领时域泛化新革命｜NeurIPS 2024

研究人员提出了一种方法，能够在领域数据分布持续变化的动态环境中，基于随机时刻观测的数据分布，在任意时刻生成适用的神经网络，实现前所未有的泛化能力。

来自主题: AI技术研报

8477 点击 2024-12-02 15:25

全球十亿级轨迹点驱动，首个轨迹基础大模型来了

在智慧城市和大数据时代背景下，人类轨迹数据的分析对于交通优化、城市管理、物流配送等关键领域具有重要意义。然而，现有的轨迹相关模型往往受限于特定任务、区域依赖、轨迹数据规模和多样性困乏等问题，限制了模型的泛化能力和实际应用范围。

来自主题: AI技术研报

9670 点击 2024-11-22 17:21

具身大模型学习——OCTO

在多样化的机器人数据集上预训练的大型策略有潜力改变机器人学习：与从头开始训练新策略相比，这种通用型机器人策略可以通过少量的领域内数据进行微调，同时具备广泛的泛化能力。

来自主题: AI资讯

8435 点击 2024-11-19 21:10

自一致性首选项优化SCPO，让LLM多次回答同一个问题，选输出频率最高的答案 |Meta最新

传统的训练方法通常依赖于大量人工标注的数据和外部奖励模型，这些方法往往受到成本、质量控制和泛化能力的限制。因此，如何减少对人工标注的依赖，并提高模型在复杂推理任务中的表现，成为了当前的主要挑战之一。

来自主题: AI技术研报

8094 点击 2024-11-14 14:42

详解“端到端”下一代模型VLA，通向自动驾驶的关键跳板

近期，智驾行业出现了一个融合了视觉、语言和动作的多模态大模型范式——VLA（Vision-Language-Action Model，即视觉-语言-动作模型），拥有更高的场景推理能力与泛化能力。不少智驾人士都将VLA视为当下“端到端”方案的2.0版本。

来自主题: AI资讯

4578 点击 2024-11-09 09:50

李虹团队发布两款AI模型，预测单药和联合用药疗效

中国科学院上海营养与健康研究所李虹研究组多年来在抗癌药物疗效建模方向持续深耕，发表了基于分子组学预测药物响应和肝癌药物基因组相关的系列论文。但前期研究表明肿瘤用药的计算分析仍存在诸多挑战，例如：肿瘤临床前模型和病人存在差异，计算模型缺乏泛化能力；药物组合的作用机制复杂搜索空间大，对药物联用协同效果的准确和稳健估计仍很困难。

来自主题: AI技术研报

5659 点击 2024-11-03 11:24