
感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” | UIUC&阿里通义
感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” | UIUC&阿里通义让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校(UIUC)与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。
让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校(UIUC)与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。
无需CUDA代码,给H100加速33%-50%! Flash Attention、Mamba作者之一Tri Dao的新作火了。
Tech星球独家获悉,BOSS直聘的多支业务团队对部分AI细分赛道进行试水,并研发相应的AI产品,推出了爪爪知道、FanDa、男生听劝等微信小程序产品,涉足宠物、穿搭、约饭社交等领域。
3月份,我在线下分享过办公软件的一个大趋势——未来,每个人的应用使用界面将只保留一个或极少数几个。现在,如果企业同时运行着20个软件,需要分别登录这20个应用进行相应的任务操作。而AI正在让使用界面和操作界面实现分离。以后,用户只需停留在一个高频应用界面,就能让Agent在背后完成绝大部分跨应用操作,人类只需等待执行结果。
距离 3 月凭借 “AI 智能体自主完成复杂任务” 的产品惊艳亮相仅四个月不到,AI Agent 公司 Manus 就因一场大规模裁员陷入舆论漩涡。近日, Manus 向多家媒体证实,公司对国内业务团队展开优化,120 名员工中,除 40 余名核心技术人员迁往新加坡总部,其余皆被裁员。
在光鲜外表下,OpenAI暗藏着令人震惊的黑暗一面!华人女记者郝珂灵深挖了奥特曼背后的秘密。
说实话,看到这个项目估值接近 1 亿美金的时候,我有点震惊。这是最近海内外都很火的一款 AI 工具,Same.new。上线 8 周,就吸引了 35 万用户,年化收入做到 200 万美元。创始团队和 Same.new 的产品数据一样叛逆,3 个辍学的大学生,平均年龄 21。
图片也能开口说话了!昨晚,谷歌Veo 3全新升级,上传一张照片即可生成音频和视频,角色一致性更是达到新高度。
vivo AI Lab发布AI多模态新模型了,专门面向端侧设计,紧凑高效~
“人类最后的考试”首次突破30分,还是咱国内团队干的! 该测试集是出了名的超难,刚推出时无模型得分能超过10分。