AI资讯新闻榜单内容搜索-大模

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模
NeurIPS 2025 | Language Ranker:从推荐系统的视角反思并优化大模型解码过程

NeurIPS 2025 | Language Ranker:从推荐系统的视角反思并优化大模型解码过程

NeurIPS 2025 | Language Ranker:从推荐系统的视角反思并优化大模型解码过程

在大语言模型(LLM)的研究浪潮中,绝大多数工作都聚焦于优化模型的输出分布 —— 扩大模型规模、强化分布学习、优化奖励信号…… 然而,如何将这些输出分布真正转化为高质量的生成结果 —— 即解码(decoding)阶段,却没有得到足够的重视。

来自主题: AI技术研报
6195 点击    2025-12-01 10:06
AI作弊风暴,席卷韩国名校

AI作弊风暴,席卷韩国名校

AI作弊风暴,席卷韩国名校

刚刚过去的深秋,韩国高校涌动着一股意想不到的技术暗流——“生成式人工智能(AI)作弊”事件席卷韩国大学圈,三所顶尖高校无一幸免。在延世大学、首尔大学、高丽大学的考试中,学生在课堂及线上考试中动用ChatGPT或群聊进行作弊。

来自主题: AI资讯
8261 点击    2025-11-30 11:10
NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

NeurIPS 2025 | DynaAct:DeepSeek R1之外,探索大模型推理的另一条道路

大模型推理的爆发,实际源于 scaling 范式的转变:从 train-time scaling 到 test-time scaling(TTS),即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法:通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗?

来自主题: AI技术研报
7893 点击    2025-11-30 09:30
国产最强多模态宝座又易主?671B参数练就“火眼金睛”,基于DeepSeek打造

国产最强多模态宝座又易主?671B参数练就“火眼金睛”,基于DeepSeek打造

国产最强多模态宝座又易主?671B参数练就“火眼金睛”,基于DeepSeek打造

智东西11月28日报道,刚刚,快手开源其新一代旗舰多模态大模型Keye-VL-671B-A37B。该模型基于DeepSeek-V3-Terminus打造,拥有6710亿个参数,在保持基础模型通用能力的前提下,对视觉感知、跨模态对齐与复杂推理链路进行了升级,实现了较强的多模态理解和复杂推理能力。

来自主题: AI技术研报
8584 点击    2025-11-29 20:12
独家 | “文科生”微博,搞出一个数学学霸大模型

独家 | “文科生”微博,搞出一个数学学霸大模型

独家 | “文科生”微博,搞出一个数学学霸大模型

近日,微博发布了首个开源模型 VibeThinker,它以15亿的微小参数 与7800美元的极低成本,在国际顶级数学测试中获得相对高分,刷新智能极限。这一结果,无异于以轻巧之姿,刺向了“规模即智能”的行业铁律。

来自主题: AI资讯
8483 点击    2025-11-29 16:30
混元OCR模型核心技术揭秘:统一框架、真端到端

混元OCR模型核心技术揭秘:统一框架、真端到端

混元OCR模型核心技术揭秘:统一框架、真端到端

腾讯混元大模型团队正式发布并开源HunyuanOCR模型!这是一款商业级、开源且轻量(1B参数)的OCR专用视觉语言模型,模型采用原生ViT和轻量LLM结合的架构。目前,该模型在抱抱脸(Hugging Face)趋势榜排名前四,GitHub标星超过700,并在Day 0被vllm官方团队接入。

来自主题: AI技术研报
7500 点击    2025-11-29 13:43
苹果AI论文太坑了!用GPT写的GT,导致北京程序员通宵加班

苹果AI论文太坑了!用GPT写的GT,导致北京程序员通宵加班

苹果AI论文太坑了!用GPT写的GT,导致北京程序员通宵加班

大无语事件天天有,今天特别多——AI大模型公司阶跃星辰的研究员,自曝被苹果挂在arXiv上的论文,狠狠坑了一把。自己去反馈问题,对方简单回了两句就把issue关了;直到自己留下公开评论,对方才撤稿下架代码了。

来自主题: AI资讯
9786 点击    2025-11-29 10:05
80后诺奖得主:AlphaFold下一步融合大模型

80后诺奖得主:AlphaFold下一步融合大模型

80后诺奖得主:AlphaFold下一步融合大模型

正值AlphaFold问世五周年,其设计者、也是凭借AlphaFold获得诺贝尔化学奖的John Jumper公开表示:AlphaFold的下一步是与大模型融合。不过具体方法并没有透露,或许已有所思路,甚至已经在进程之中。

来自主题: AI资讯
8248 点击    2025-11-28 13:59
AI 语音输入法爆火:豆包输入法全面上线,Typeless 日榜第一,Wispr 融资 8100 万美金

AI 语音输入法爆火:豆包输入法全面上线,Typeless 日榜第一,Wispr 融资 8100 万美金

AI 语音输入法爆火:豆包输入法全面上线,Typeless 日榜第一,Wispr 融资 8100 万美金

如果不是这波大模型的爆发,没人会想到「输入法」这个早已被视为「基础设施」的赛道,会在 2025 年下半年突然变得性感起来。

来自主题: AI资讯
6228 点击    2025-11-28 10:42