嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁
嚯!大语言扩散模型来了,何必只预测下一个token | 人大高瓴&蚂蚁用扩散模型替代自回归,大模型的逆诅咒有解了!
用扩散模型替代自回归,大模型的逆诅咒有解了!
刚刚,阶跃星辰联合吉利汽车集团,开源了两款多模态大模型!新模型共2款:全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型,其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议,可任意编辑和商业应用。
一些推理模型的使用技巧和启示
四万字深聊DeepSeek!2025年1月底在媒体聚集的达沃斯论坛上,微软CEO Satya Nadella以及Scale AI创始人Alexandr Wang的发言直接将DeepSeek推到风口浪尖...
用代码训练大模型思考,其他方面的推理能力也能提升。
36氪获悉,具身智能创业公司“自变量机器人(X Square Robot)”完成数亿元Pre-A++轮融资。本轮融资由光速光合与君联资本领投、北京机器人产业基金、神骐资本跟投。融资将用于下一代统一具身智能通用大模型的训练与场景落地。
尽管多模态大模型在通用视觉理解任务中表现出色,但不具备细粒度视觉识别能力,这极大制约了多模态大模型的应用与发展。针对这一问题,北京大学彭宇新教授团队系统地分析了多模态大模型在细粒度视觉识别上所需的 3 项能力:对象信息提取能力、类别知识储备能力、对象 - 类别对齐能力,发现了「视觉对象与细粒度子类别未对齐」
GPT-4o悄悄更新版本,在大模型竞技场超越DeepSeek-R1登上并列第一。
2025年,中国大模型迎来最高光时刻。DeepSeek凭借深度推理、低成本强势崛起,中科院系AI企业祭出的YAYI-Ultra大模型在代码能力上超越GPT-4o,成功跻身OpenCompas榜单全球前十,高精度和低能耗兼而有之。
人工智能科学家吴恩达指出,AI的浪潮将席卷各行各业,催生「10倍专业人士」!这不仅仅是效率的提升,更是工作方式的变革。本文将深入解读AI如何赋能职场,揭示成为「10倍人才」的秘诀!