AI资讯新闻榜单内容搜索-LLM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LLM

北航提出代码大模型的 Scaling Laws：编程语言差异与多语言最优配比策略

北航提出代码大模型的 Scaling Laws：编程语言差异与多语言最优配比策略

北航提出代码大模型的 Scaling Laws：编程语言差异与多语言最优配比策略

在代码大模型（Code LLMs）的预训练中，行业内长期存在一种惯性思维，即把所有编程语言的代码都视为同质化的文本数据，主要关注数据总量的堆叠。然而，现代软件开发本质上是多语言混合的，不同语言的语法特性、语料规模和应用场景差异巨大。

来自主题: AI技术研报

6935 点击 2025-12-25 09:46

最鲁棒的MLLM！港科大开源「退化感知推理新范式」 | AAAI'26

最鲁棒的MLLM！港科大开源「退化感知推理新范式」 | AAAI'26

最鲁棒的MLLM！港科大开源「退化感知推理新范式」 | AAAI'26

多模态大语言模型（MLLMs）已成为AI视觉理解的核心引擎，但其在真实世界视觉退化（模糊、噪声、遮挡等）下的性能崩溃，始终是制约产业落地的致命瓶颈。

来自主题: AI技术研报

8325 点击 2025-12-25 09:44

VideoCoF：将「时序推理」引入视频编辑，无Mask实现高精度编辑与长视频外推！

VideoCoF：将「时序推理」引入视频编辑，无Mask实现高精度编辑与长视频外推！

VideoCoF：将「时序推理」引入视频编辑，无Mask实现高精度编辑与长视频外推！

现有的视频编辑模型往往面临「鱼与熊掌不可兼得」的困境：专家模型精度高但依赖 Mask，通用模型虽免 Mask 但定位不准。来自悉尼科技大学和浙江大学的研究团队提出了一种全新的视频编辑框架 VideoCoF，受 LLM「思维链」启发，通过「看 - 推理 - 编辑」的流程，仅需 50k 训练数据，就在多项任务上取得了 SOTA 效果，并完美支持长视频外推！

来自主题: AI技术研报

7988 点击 2025-12-23 14:53

所有大模型，都学物理学：北大物理系一篇研究，震撼了AI圈

所有大模型，都学物理学：北大物理系一篇研究，震撼了AI圈

所有大模型，都学物理学：北大物理系一篇研究，震撼了AI圈

LLM 智能体很赞，正在成为一种解决复杂难题的强大范式。

来自主题: AI技术研报

8379 点击 2025-12-17 14:58

临床PK完胜ChatGPT-5！国内团队造出首个OCT影像AI系统

临床PK完胜ChatGPT-5！国内团队造出首个OCT影像AI系统

临床PK完胜ChatGPT-5！国内团队造出首个OCT影像AI系统

通用大模型（LLM）的狂飙突进，终于在医疗垂直领域的「最后一公里」撞上了硬墙。虽然 ChatGPT 在 USMLE（美国执业医师资格考试）中表现优异，但在面对需要「火眼金睛」和「毫厘必争」的心脏手术台上，通用大模型的表现究竟如何？

来自主题: AI技术研报

8013 点击 2025-12-16 17:23

OpenAI最强产品负责人：AGI限制在于人，不在LLM！Codex已能待命自我训练，曝内部压缩机制，18天3人上线安卓Sora

OpenAI最强产品负责人：AGI限制在于人，不在LLM！Codex已能待命自我训练，曝内部压缩机制，18天3人上线安卓Sora

OpenAI最强产品负责人：AGI限制在于人，不在LLM！Codex已能待命自我训练，曝内部压缩机制，18天3人上线安卓Sora

从 0 到上线，在OpenAI内部，安卓版 Sora经历的时间只有 28 天，而且期间只用了 2-3 名员工。

来自主题: AI资讯

7149 点击 2025-12-16 16:30

医疗AI迎来大考！南洋理工发布首个LLM电子病历处理评测 | AAAI'26

医疗AI迎来大考！南洋理工发布首个LLM电子病历处理评测 | AAAI'26

医疗AI迎来大考！南洋理工发布首个LLM电子病历处理评测 | AAAI'26

南洋理工大学研究人员构建了EHRStruct基准，用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务，包含2200个样本，按临床场景、认知层级和功能类别组织。研究发现通用大模型优于医学专用模型，数据驱动任务表现更强，输入格式和微调方式对性能有显著影响。

来自主题: AI技术研报

9904 点击 2025-12-16 16:27

AI模型价格下降1000倍，为什么我们支出的成本没有随之降低？

AI模型价格下降1000倍，为什么我们支出的成本没有随之降低？

AI模型价格下降1000倍，为什么我们支出的成本没有随之降低？

2025年12月12日，波士顿大学的 Andrey Fradkin 团队发布了一项令业界瞩目的研究《The Emerging Market for Intelligence: Pricing, Supply, and Demand for LLMs》（智能的新兴市场：LLM的定价、供给与需求）。

来自主题: AI技术研报

8077 点击 2025-12-16 09:58

AAAI 2026｜视频大语言模型到底可不可信？23款主流模型全面测评来了

AAAI 2026｜视频大语言模型到底可不可信？23款主流模型全面测评来了

AAAI 2026｜视频大语言模型到底可不可信？23款主流模型全面测评来了

近年来，视频大语言模型在理解动态视觉信息方面展现出强大能力，成为处理真实世界多模态数据的重要基础模型。然而，它们在真实性、安全性、公平性、鲁棒性和隐私保护等方面仍面临严峻挑战。

来自主题: AI技术研报

5766 点击 2025-12-16 09:19

高精度知识库≠Milvus+llm！这份PaddleOCR+混合检索+Rerank技巧请收好

高精度知识库≠Milvus+llm！这份PaddleOCR+混合检索+Rerank技巧请收好

高精度知识库≠Milvus+llm！这份PaddleOCR+混合检索+Rerank技巧请收好

在大型语言模型（LLM）的应用落地中，RAG（检索增强生成）是解决模型幻觉和知识时效性的关键技术。

来自主题: AI技术研报

9488 点击 2025-12-16 09:18

上一页当前第5页,共142页下一页