DeepSeek们越来越聪明,却也越来越不听话了。
DeepSeek们越来越聪明,却也越来越不听话了。在今年,DeepSeek R1火了之后。
在今年,DeepSeek R1火了之后。
如果说AI技术在影视行业的价值,一度被视为“创作辅助”与“降本提效”,那么刚刚收官的仙侠剧《落花时节又逢君》,或许提供了另一种想象路径,困扰行业已久的“积压剧”是否有了重获新生的解决方案?
闺蜜机掀起家庭AI新战场,大厂全都来了
微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。
在麻省理工学院工作的好处之一,是能够窥见未来科技的轮廓——从量子计算的突破、可持续性能源的生产,到新型抗生素设计。若问我是否对这些领域都有深刻理解?答案是否定的。但当研究者邀请我为他们的工作拍摄纪实图像时,我能够理解其中的大部分内容。
近日,一份疑似Claude的系统提示词意外泄露,一时引来众多网友和程序员的围观。
“全球首个XX Agent”快成为现在AI产品发布的标配了,几乎每天一睁眼都能看到。奥特曼在最近的演讲提到,2025年将是AI Agent的突破年。这股Agent热,也席卷到了正在举行的微软Build 2025开发者大会。
英伟达官宣新办公室落户中国台湾省台北市,但居然是从太空飞下来的吗?
北大DeepSeek联合发布的NSA论文,目前已被ACL 2025录用并获得了极高评分,甚至有望冲击最佳论文奖。该技术颠覆传统注意力机制,实现算力效率飞跃,被誉为长文本处理的革命性突破。
理想中的多模态大模型应该是什么样?十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集,用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足,且多数通用模型未能超越专家模型,真正的通用人工智能需要实现模态间的协同效应。