AI资讯新闻榜单内容搜索-语言模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 语言模型
微软最新复杂推理:基于过程奖励的LE-MCTS集成新方法

微软最新复杂推理:基于过程奖励的LE-MCTS集成新方法

微软最新复杂推理:基于过程奖励的LE-MCTS集成新方法

在人工智能快速发展的今天,大型语言模型(LLM)在各类任务中展现出惊人的能力。然而,当面对需要复杂推理的任务时,即使是最先进的开源模型也往往难以保持稳定的表现。现有的模型集成方法,无论是在词元层面还是输出层面的集成,都未能有效解决这一挑战。

来自主题: AI技术研报
5910 点击    2025-01-17 10:36
MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

MiniMax开源4M超长上下文新模型!性能比肩DeepSeek-v3、GPT-4o

开源模型上下文窗口卷到超长,达400万token! 刚刚,“大模型六小强”之一MiniMax开源最新模型—— MiniMax-01系列,包含两个模型:基础语言模型MiniMax-Text-01、视觉多模态模型MiniMax-VL-01。

来自主题: AI技术研报
8363 点击    2025-01-15 15:10
重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

重磅突破:首个自适应LLM的智能提示优化系统MAPS,让用例生成效率提升超30%

在软件开发过程中,测试用例的生成一直是一个既重要又耗时的环节。近年来,大型语言模型(LLM)在这一领域展现出了巨大的潜力。然而,实践表明,即使是同一个提示词(Prompt),在不同的LLM上也会产生截然不同的效果。

来自主题: AI技术研报
5543 点击    2025-01-13 10:54
企业Multi-Agent协作通用框架设计揭秘,突破90%成功率,AWS最新

企业Multi-Agent协作通用框架设计揭秘,突破90%成功率,AWS最新

企业Multi-Agent协作通用框架设计揭秘,突破90%成功率,AWS最新

随着大语言模型(LLM)技术的快速发展,单一AI智能体已经展现出强大的问题解决能力。然而,在面对复杂的企业级应用场景时,单一智能体的能力往往显得捉襟见肘。

来自主题: AI技术研报
6296 点击    2025-01-09 10:28
「小模型」有更多机会点

「小模型」有更多机会点

「小模型」有更多机会点

大厂为什么追求大模型? 昨天有提到,为什么要研究语言模型。

来自主题: AI资讯
6713 点击    2025-01-08 14:50
1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据超越GPT-4o!清华等提出隐式过程奖励模型PRIME,在线刷SOTA

1/10训练数据激发高级推理能力!近日,来自清华的研究者提出了PRIME,通过隐式奖励来进行过程强化,提高了语言模型的推理能力,超越了SFT以及蒸馏等方法。

来自主题: AI技术研报
3834 点击    2025-01-08 11:12
DeepMind重磅,用PC-SUBQ提示策略让LLM从相关性推断因果关系

DeepMind重磅,用PC-SUBQ提示策略让LLM从相关性推断因果关系

DeepMind重磅,用PC-SUBQ提示策略让LLM从相关性推断因果关系

在人工智能领域,大语言模型(LLMs)展现出了令人惊叹的能力,但在因果推理这一人类智能的核心能力上仍面临重大挑战。特别是在从相关性信息推断因果关系这一任务上,现有的大语言模型表现出明显的不足。

来自主题: AI技术研报
3828 点击    2025-01-06 13:39
o1 的野路子:用语言模型做动画

o1 的野路子:用语言模型做动画

o1 的野路子:用语言模型做动画

冬天来了,家里下雪了吗?

来自主题: AI技术研报
7464 点击    2025-01-04 16:26
Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE

Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE

Meta探索大模型记忆层,扩展至1280亿个参数,优于MoE

预训练语言模型通常在其参数中编码大量信息,并且随着规模的增加,它们可以更准确地回忆和使用这些信息。

来自主题: AI技术研报
8331 点击    2025-01-04 14:14