AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

统一多模态模型要求视觉表征必须兼顾语义(理解)和细节(生成 / 编辑)。早期 VAE 因语义不足而理解受限。近期基于 CLIP 的统一编码器,面临理解与重建的权衡:直接量化 CLIP 特征会损害理解性能;而为冻结的 CLIP 训练解码器,又因特征细节缺失而无法精确重建。例如,RAE 使用冻结的 DINOv2 重建,PSNR 仅 19.23。

来自主题: AI技术研报
7438 点击    2025-11-03 09:50
奥特曼豪赌万亿算力,OpenAI估值万亿美元 | 新智元ASI产业图谱10月号

奥特曼豪赌万亿算力,OpenAI估值万亿美元 | 新智元ASI产业图谱10月号

奥特曼豪赌万亿算力,OpenAI估值万亿美元 | 新智元ASI产业图谱10月号

奥特曼正在用万亿美金的算力豪赌,试图买下全球GPU来喂饱「增长黑洞」。为什么AI竞争的终局不是模型,而是算力?

来自主题: AI资讯
5442 点击    2025-11-03 09:49
AI研究员田渊栋:“AI顿悟”的真相、大模型如何学会压缩世界|独家

AI研究员田渊栋:“AI顿悟”的真相、大模型如何学会压缩世界|独家

AI研究员田渊栋:“AI顿悟”的真相、大模型如何学会压缩世界|独家

Meta首席执行官马克·扎克伯格近日批准了一项涉及约600名员工的AI部门裁员计划,这是Meta今年在人工智能领域规模最大的一次调整,主要波及公司核心研发机构。在此消息公布后,田渊栋首次公开露面,接受了腾讯科技特约作者「课代表立正」的独家深度访谈。

来自主题: AI资讯
7871 点击    2025-11-03 09:42
谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

谁是AI之王?聊聊备受争议的AI评测与崛起的LMArena

当AI模型排行榜开始被各种刷分作弊之后,谁家大模型最牛这个问题就变得非常主观,直到一家线上排行榜诞生,它叫:LMArena。在文字、视觉、搜索、文生图、文生视频等不同的AI大模型细分领域,LMArena上每天都有上千场的实时对战,由普通用户来匿名投票选出哪一方的回答更好。

来自主题: AI资讯
7294 点击    2025-11-03 09:41
上线一年用户破百万,这个AI健康管理产品只靠一只海獭? | 对话OtterLife

上线一年用户破百万,这个AI健康管理产品只靠一只海獭? | 对话OtterLife

上线一年用户破百万,这个AI健康管理产品只靠一只海獭? | 对话OtterLife

AI健康管理领域的产品层出不穷,功能设计结合大模型甚至Agent也成为当前发展方向。OtterLife,这款AI健康管理产品,将虚拟游戏宠物角色“海獭”融入用户健康习惯养成过程,却在动力略显不足的市场现状下,获得了上线一年用户破百万的亮眼成绩,且用户留存率超过行业平均水平。

来自主题: AI资讯
7781 点击    2025-11-02 15:29
AEPO:智能体熵平衡策略优化,让探索更稳,推理更深!

AEPO:智能体熵平衡策略优化,让探索更稳,推理更深!

AEPO:智能体熵平衡策略优化,让探索更稳,推理更深!

AEPO 系统性揭示了「高熵 Rollout 采样坍缩」和「高熵梯度裁剪」问题,并设计了「动态熵平衡 Rollout 采样」与「熵平衡策略优化」两项核心机制。前者通过熵预监控与连续分支惩罚实现全局与局部探索预算的自适应分配,后者在策略更新阶段引入梯度停止与熵感知优势估计以保留高熵 token 的探索梯度。

来自主题: AI技术研报
7027 点击    2025-11-02 10:32
锁定角色,「多主体」也可控!个性化文生图,给你PS般交互体验

锁定角色,「多主体」也可控!个性化文生图,给你PS般交互体验

锁定角色,「多主体」也可控!个性化文生图,给你PS般交互体验

LayerComposer革新了个性化图像生成,让用户像在Photoshop里一样自由操控元素位置、大小,解决传统方法交互性与多主体扩展难题,实现更自然、高效的创作,推动个性化生成迈向主动交互新阶段。

来自主题: AI技术研报
8013 点击    2025-11-02 10:07
少量视角也能得到完整3D几何,即插即用的语义增强重建插件来了

少量视角也能得到完整3D几何,即插即用的语义增强重建插件来了

少量视角也能得到完整3D几何,即插即用的语义增强重建插件来了

直观经验却告诉我们,只要把同一物体的 “对应部分” 对齐,形状就会变得清晰。基于这一朴素而有效的直觉,作者提出SERES(Semantic-Aware Reconstruction from Sparse Views),在不改动主干框架的前提下,把跨视角的语义一致性变成一种训练期先验注入到模型里,用低成本的方法去解决高价值的歧义问题,让少量视角也能得到清晰而完整的几何。

来自主题: AI技术研报
6424 点击    2025-11-02 10:03
最新外国「自研」大模型,都是套壳国产?

最新外国「自研」大模型,都是套壳国产?

最新外国「自研」大模型,都是套壳国产?

绷不住了,美国科技公司最新发布的大模型,思考时怎么一直在说中文?据官方博客介绍,在研发过程中,他们试验了一个代号为 Cheetah 的原型智能体模型,以更好地理解更高速智能体模型的影响。Composer 是该模型的更智能升级版,凭借足够的速度支撑交互式体验,让编码始终丝滑。

来自主题: AI资讯
7903 点击    2025-11-01 13:08
上海AI Lab发布混合扩散语言模型SDAR:首个突破6600 tgs的开源扩散语言模型

上海AI Lab发布混合扩散语言模型SDAR:首个突破6600 tgs的开源扩散语言模型

上海AI Lab发布混合扩散语言模型SDAR:首个突破6600 tgs的开源扩散语言模型

近日,上海人工智能实验室针对该难题提出全新范式 SDAR (Synergistic Diffusion-AutoRegression)。该方法通过「训练-推理解耦」的巧妙设计,无缝融合了 AR 模型的高性能与扩散模型的并行推理优势,能以极低成本将任意 AR 模型「改造」为并行解码模型。

来自主题: AI技术研报
7188 点击    2025-11-01 12:57