FDA对偶锚点:模型知识迁移的新视角——从参数空间到输入空间
FDA对偶锚点:模型知识迁移的新视角——从参数空间到输入空间研究者们提出了 FDA(Model Merging with Functional Dual Anchors)——一个全新的模型融合框架。与传统的参数空间操作不同,FDA 将专家模型的参数知识投射到输入-表征空间中的合成锚点,通过功能对偶的方式实现更高效的知识整合。
研究者们提出了 FDA(Model Merging with Functional Dual Anchors)——一个全新的模型融合框架。与传统的参数空间操作不同,FDA 将专家模型的参数知识投射到输入-表征空间中的合成锚点,通过功能对偶的方式实现更高效的知识整合。
多模态大语言模型(MLLMs)在处理来自图像和文本等多种来源的信息时能力强大 。 然而,一个关键挑战随之而来:当这些模态呈现相互冲突的信息时(例如,图像显示一辆蓝色汽车,而文本描述它为红色),MLLM必须解决这种冲突 。模型最终输出与某一模态信息保持一致的行为,称之为“模态跟随”(modality following)
从人的状态看,李彦宏比以前更「放松」了,而从事儿的角度看,百度似乎有意识的聚焦了。
Llama4性能造假丑闻,OpenAI烧钱的速度远超过了盈利能力;另外一方面:国产模型凭借足够强大的性能与超高性价比,迅速占领了国际开源模型市场。是时候再次为国产AI鼓掌了!
当前视频检索研究正陷入一个闭环困境:以MSRVTT为代表的窄域基准,长期主导模型在粗粒度文本查询上的优化,导致训练数据有偏、模型能力受限,难以应对真实世界中细粒度、长上下文、多模态组合等复杂检索需求。
AI医疗不是一门新生意,但确是一个“性感”的赛道。
Anthropic 周三宣布与英国新锐云服务商 Fluidstack 达成一项雄心勃勃的数据中心合作协议,将投入 500 亿美元在美国多地建设设施以满足其不断增长的计算需求。
答案藏在阿里 AI + 云的全栈布局里。2025 年 11 月 12 日,杭州阿里全球总部的访客登记系统跳出一串特殊信息——柯丝蒂·考文垂,国际奥委会首位非洲籍、女性主席。
具身智能机器人太火了。
“一位老师,用 AI 做了个《林黛玉初进贾府》的互动游戏。”