NAACL2025|中国移动九天团队提出大模型调色板:一种可控文本生成的解决方案
NAACL2025|中国移动九天团队提出大模型调色板:一种可控文本生成的解决方案大模型在文本生成方面取得了卓越的成就,通过合适的prompt设计,往往可以使得生成结果符合特定的需求。但是为属性繁多的任务设计出合适的prompt是很困难的。一种解决方案是通过线性组合方式或者其变种将每个属性对应的模型在生成logits上进行融合。鉴于属性之间可能存在的冲突现象,这种方案无法保证模型的主属性不受其他模型的干扰。
大模型在文本生成方面取得了卓越的成就,通过合适的prompt设计,往往可以使得生成结果符合特定的需求。但是为属性繁多的任务设计出合适的prompt是很困难的。一种解决方案是通过线性组合方式或者其变种将每个属性对应的模型在生成logits上进行融合。鉴于属性之间可能存在的冲突现象,这种方案无法保证模型的主属性不受其他模型的干扰。
事关路由LLM(Routing LLM),一项截至目前最全面的研究,来了——
终于到了适合跟大家介绍大模型的万能接口 MCP(Model Context Protocol)的时候了!
在去年的 Sequoia Capital AI Ascent 2024 上,红杉的几位合伙人在活动期间提出观点:“GenAI 在客服领域已经初步找到了 PMF”。时隔一年,在大模型落地的产品形态逐渐从单纯的 ChatBot 进化为 Agent 的当下,企业级 AI 客服将会有更多落地机会和想象空间。
评估多模态AI模型的那些复杂测试,可能有一半都是“重复劳动”!
多模态大模型虽然在视觉理解方面表现出色,但在需要深度数学推理的任务上往往力不从心,尤其是对于参数量较小的模型来说更是如此。
杰文斯悖论不是天然成立的。在AI的叙事中,要让算力用得越多,就要让算力变得更便宜,也要让AI更有用、好用。兑现杰文斯悖论已经成为了英伟达的命门,黄仁勋要在本届GTC上,让市场再次相信他。
全球首个开源多模态推理大模型来了!38B参数模型性能直逼DeepSeek-R1,同尺寸上横扫多项SOTA。而这家中国公司之所以选择无偿将技术思路开源,正是希望同DeepSeek一样,打造开源界的技术影响力。
AI如何赋能千行百业?最近,中绿讯科中国重磅发布了生态级通用平台——AI生态平台。这一平台以自研「泰山大模型群」为基座,集成了多个技术组件,为企业和开发者搭建了一座连接AI与业务需求的桥梁。
大模型的代码能力在这一年突飞猛进,最近我们看到很多关于用AI直接生成前端代码,做出漂亮网页的讨论。