
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号复刻DeepSeek-R1的长思维链推理,大模型强化学习新范式RLIF成热门话题。
复刻DeepSeek-R1的长思维链推理,大模型强化学习新范式RLIF成热门话题。
随着Gemini、GPT-4o等商业大模型把基于文本的图像编辑这一任务再次推向高峰,获取更高质量的编辑数据用于训练、以及训练更大参数量的模型似乎成了提高图像编辑性能的唯一出路。然而浙大哈佛这个团队却反其道而行之,仅用以往工作0.1%的数据量(获取自公开数据集)和1%的训练参数,以极低成本实现了图像的高质量编辑,在一些方面媲美甚至超越商业大模型!
一场关于协和「4+4」的热议席卷全网,引发了医疗未来之问。浙江用AI给出答案:浙大二院全景智慧医院以「数字孪生」革新手术,德适生物让基层共享尖端影像,安诊儿打造「口袋三甲」健康管家。AI驱动医疗正从「治病」走向「智愈」,让精准健康触手可及。
当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。然而,一些现有智能体更类似于「反应式行动者」(Reactive Actors),主要依赖隐式推理,面对需要复杂规划和错误恢复的任务时常常力不从心。
2025 CSRankings新鲜出炉了!CMU稳坐全球第一,中国高校强势崛起,清华摘得第2,上交大与浙大并列第3,北大位居第5。中国在AI领域表现尤为抢眼,上交大、清华、北大、浙大包揽前四,中国科学院与哈工大也跻身全球前十。
近来风头正盛的GPT-4.5,不仅在日常问答中展现出惊人的上下文连贯性,在设计、咨询等需要高度创造力的任务中也大放异彩。
简单的任务,传统的Transformer却错误率极高。Meta FAIR团队重磅推出多token注意力机制(MTA),精准捕捉复杂信息,带来模型性能飞升!
双人动作生成新SOTA!
如何让你的模型能感知到视频的粒度,随着你的心思想编辑哪就编辑哪呢?
评估多模态AI模型的那些复杂测试,可能有一半都是“重复劳动”!