AI资讯新闻榜单内容搜索-LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

打破数据质量鸿沟！清华腾讯Bee项目发布1500万高质量数据集，刷新MLLM全栈开源SOTA

打破数据质量鸿沟！清华腾讯Bee项目发布1500万高质量数据集，刷新MLLM全栈开源SOTA

打破数据质量鸿沟！清华腾讯Bee项目发布1500万高质量数据集，刷新MLLM全栈开源SOTA

全开源多模态大模型（MLLM）的性能，长期被闭源和半开源模型“卡脖子”。

来自主题: AI技术研报

7677 点击 2025-11-11 16:39

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

3A大作！阿里ROLL团队从基建->算法->机理，推动RL4LLM全栈协同优化

近期，阿里巴巴 ROLL 团队（淘天未来生活实验室与阿里巴巴智能引擎团队）联合上海交通大学、香港科技大学推出「3A」协同优化框架 ——Async 架构（Asynchronous Training）、Asymmetric PPO（AsyPPO）与 Attention 机制（Attention-based Reasoning Rhythm），

来自主题: AI技术研报

8693 点击 2025-11-11 10:24

PixelRefer ：让AI从“看大图”走向“看懂每个对象”

PixelRefer ：让AI从“看大图”走向“看懂每个对象”

PixelRefer ：让AI从“看大图”走向“看懂每个对象”

多模态大模型（MLLMs）虽然在图像理解、视频分析上表现出色，但多停留在整体场景级理解。

来自主题: AI技术研报

10815 点击 2025-11-11 09:50

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

在处理短文本时，大语言模型（LLM）已经表现出惊人的理解和生成能力。但现实世界中的许多任务 —— 如长文档理解、复杂问答、检索增强生成（RAG）等 —— 都需要模型处理成千上万甚至几十万长度的上下文。

来自主题: AI技术研报

6552 点击 2025-11-10 15:12

HuggingFace发布超200页「实战指南」，从决策到落地「手把手」教你训练大模型

HuggingFace发布超200页「实战指南」，从决策到落地「手把手」教你训练大模型

HuggingFace发布超200页「实战指南」，从决策到落地「手把手」教你训练大模型

近期，HuggingFace 发布的超过 200 页的超长技术博客，系统性地分享训练先进 LLM 的端到端经验。

来自主题: AI技术研报

7367 点击 2025-11-10 09:57

IEEE | LLM Agent的能力边界在哪？首篇「图智能体 (GLA)」综述为复杂系统构建统一蓝图

IEEE | LLM Agent的能力边界在哪？首篇「图智能体 (GLA)」综述为复杂系统构建统一蓝图

IEEE | LLM Agent的能力边界在哪？首篇「图智能体 (GLA)」综述为复杂系统构建统一蓝图

LLM Agent 正以前所未有的速度发展，从网页浏览、软件开发到具身控制，其强大的自主能力令人瞩目。然而，繁荣的背后也带来了研究的「碎片化」和能力的「天花板」：多数 Agent 在可靠规划、长期记忆、海量工具管理和多智能体协调等方面仍显稚嫩，整个领域仿佛一片广袤却缺乏地图的丛林。

来自主题: AI技术研报

7950 点击 2025-11-10 09:20

英伟达、DeepSeek集体跟进！18个月前被忽视，如今统治AI推理

英伟达、DeepSeek集体跟进！18个月前被忽视，如今统治AI推理

英伟达、DeepSeek集体跟进！18个月前被忽视，如今统治AI推理

2024年，加州大学圣地亚哥分校「Hao AI Lab」提出了DistServe的解耦推理理念，短短一年多时间，迅速从实验室概念成长为行业标准，被NVIDIA、vLLM等主流大模型推理框架采用，预示着AI正迈向「模块化智能」的新时代。

来自主题: AI技术研报

10001 点击 2025-11-09 15:37

LLM强化学习新框架！UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍

LLM强化学习新框架！UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍

LLM强化学习新框架！UCSD多智能体训练框架让LLM工具调用能力暴增5.8倍

现有的LLM智能体训练框架都是针对单智能体的，多智能体的“群体强化”仍是一个亟须解决的问题。为了解决这一领域的研究痛点，来自UCSD和英特尔的研究人员，提出了新的提出通用化多智能体强化学习框架——PettingLLMs。支持任意组合的多个LLM一起训练。

来自主题: AI技术研报

7181 点击 2025-11-09 15:36

突破LLM遗忘瓶颈，谷歌「嵌套学习」让AI像人脑一样持续进化

突破LLM遗忘瓶颈，谷歌「嵌套学习」让AI像人脑一样持续进化

突破LLM遗忘瓶颈，谷歌「嵌套学习」让AI像人脑一样持续进化

近日，谷歌推出了一种全新的用于持续学习的机器学习范式 —— 嵌套学习，模型不再采用静态的训练周期，而是以不同的更新速度在嵌套层中进行学习，即将模型视为一系列嵌套问题的堆叠，使其能够不断学习新技能，同时又不会遗忘旧技能。

来自主题: AI技术研报

9006 点击 2025-11-09 10:25

微信、清华连续自回归模型CALM，新范式实现从「离散词元」到「连续向量」转变

微信、清华连续自回归模型CALM，新范式实现从「离散词元」到「连续向量」转变

微信、清华连续自回归模型CALM，新范式实现从「离散词元」到「连续向量」转变

众所周知，大型语言模型（LLM）的根本运作方式是预测下一个 token（词元），能够保证生成的连贯性和逻辑性，但这既是 LLM 强大能力的「灵魂」所在，也是其枷锁，将导致高昂的计算成本和响应延迟。可

来自主题: AI技术研报

7583 点击 2025-11-09 10:21

上一页当前第10页,共142页下一页