AI资讯新闻榜单内容搜索-通义实验室

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 通义实验室
速递|前通义视觉负责人薄列峰加盟腾讯混元,字节和腾讯紧盯阿里AI核心

速递|前通义视觉负责人薄列峰加盟腾讯混元,字节和腾讯紧盯阿里AI核心

速递|前通义视觉负责人薄列峰加盟腾讯混元,字节和腾讯紧盯阿里AI核心

据 AI 科技评论报道,前阿里通义实验室视觉负责人薄列峰已正式加盟腾讯混元大模型团队,直接向腾讯副总裁、混元项目负责人蒋杰汇报,主要负责多模态方向的技术攻坚。早在今年4月30日,薄列峰从阿里离职,外界曾一度传出他将赴美加入某大型科技公司,统筹多模态AI研发。如今尘埃落定,他最终选择落脚深圳,加入国内多模态竞争最激烈的战场之一。

来自主题: AI资讯
7372 点击    2025-07-27 20:07
感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” | UIUC&阿里通义

感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” | UIUC&阿里通义

感知错误率降低30.5%:隐式感知损失让模型主动“睁大眼睛” | UIUC&阿里通义

让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校(UIUC)与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。

来自主题: AI技术研报
6175 点击    2025-07-11 16:23
通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代

通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代

通义实验室最新成果WebDancer:开启自主智能Deep Research的新时代

作者介绍: 本文作者来自通义实验室 RAG 团队,致力于面向下一代 RAG 技术进行基础研究。该团队 WebWalker 工作近期也被 ACL 2025 main conference 录用。

来自主题: AI技术研报
6324 点击    2025-06-12 15:24
阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research

阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research

阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research

能够完成多步信息检索任务,涵盖多轮推理与连续动作执行的智能体来了。通义实验室推出WebWalker(ACL2025)续作自主信息检索智能体WebDancer。

来自主题: AI技术研报
6099 点击    2025-06-06 16:31
成本暴降88%!通义实验室、北大发布ZeroSearch,无需搜索即可激活LLM检索能力

成本暴降88%!通义实验室、北大发布ZeroSearch,无需搜索即可激活LLM检索能力

成本暴降88%!通义实验室、北大发布ZeroSearch,无需搜索即可激活LLM检索能力

信息检索能力对提升大语言模型 (LLMs) 的推理表现至关重要,近期研究尝试引入强化学习 (RL) 框架激活 LLMs 主动搜集信息的能力,但现有方法在训练过程中面临两大核心挑战:

来自主题: AI技术研报
4915 点击    2025-05-29 14:48
阿里通义成了AI的“黄埔军校”?

阿里通义成了AI的“黄埔军校”?

阿里通义成了AI的“黄埔军校”?

最近阿里通义实验室应用视觉团队负责人薄列峰被曝离职,引起了一轮热议。而这已是继2月语音团队负责人鄢志杰、2024年8月大模型技术负责人周畅之后,阿里AI核心部门第三次失去关键人物了。

来自主题: AI资讯
6906 点击    2025-05-11 15:11
免费用!阿里通义大模型上新,超逼真音视频生成SOTA!

免费用!阿里通义大模型上新,超逼真音视频生成SOTA!

免费用!阿里通义大模型上新,超逼真音视频生成SOTA!

近日,阿里通义实验室推出了全新数字人视频生成大模型 OmniTalker,只需上传一段参考视频,不仅能学会视频中人物的表情和声音,还能模仿说话风格。相比传统的数字人生产流程,该方法能够有效降低制作成本,提高生成内容的真实感和互动体验,满足更广泛的应用需求。目前该项目已在魔搭社区、HuggingFace 开放体验入口,并提供了十多个模板,所有人可以直接免费使用。

来自主题: AI技术研报
6106 点击    2025-04-15 14:37