AI资讯新闻榜单内容搜索-Ed

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ed
3D大模型助力,15分钟即可训练高质量、个性化的数字人模型,代码已开放

3D大模型助力,15分钟即可训练高质量、个性化的数字人模型,代码已开放

3D大模型助力,15分钟即可训练高质量、个性化的数字人模型,代码已开放

个性化精品数字人(Personalized Talking Face Generation)强调合成的数字人视频在感官上与真人具有极高的相似性(不管是说话人的外表还是神态)。

来自主题: AI技术研报
4268 点击    2024-10-31 15:09
登上生图排行榜第一的red_panda,是家创业公司,不是国产模型

登上生图排行榜第一的red_panda,是家创业公司,不是国产模型

登上生图排行榜第一的red_panda,是家创业公司,不是国产模型

前几天在 Hugging Face 文本转图像排行榜上排名第一的 red_panda,是一个名为 Recraft V3 的模型,由 AI 初创公司 Recraft 提供。 Recraft V3 以 1172 的 ELO 评分位居第一,超越了 Midjourney、OpenAI 和其他公司的模型。

来自主题: AI资讯
3899 点击    2024-10-31 14:58
最好的文生图模型“小熊猫”揭秘了,竟然来自一个黑马公司!

最好的文生图模型“小熊猫”揭秘了,竟然来自一个黑马公司!

最好的文生图模型“小熊猫”揭秘了,竟然来自一个黑马公司!

前几天在对战平台Artificial Analysis出现了一个神秘的文生图模型"red_panda",而且排行位列第一,超过之前火爆的Flux 1.1 [pro]模型。

来自主题: AI资讯
3450 点击    2024-10-31 10:02
PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA:商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA(emPowering Unified MLLM with Multi-grAnular visual generation)是一项创新的多模态大型语言模型(MLLM),由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示,巧妙地平衡了视觉生成任务中的多样性与可控性。

来自主题: AI技术研报
3817 点击    2024-10-29 14:32
又来?神秘红熊猫模型Red_panda登顶竞技场!超过FLUX1.1Pro~

又来?神秘红熊猫模型Red_panda登顶竞技场!超过FLUX1.1Pro~

又来?神秘红熊猫模型Red_panda登顶竞技场!超过FLUX1.1Pro~

最近,在全球人工智能模型竞技场(Artificial Analysis)文生图模型排行榜中,一个名叫Red_panda的新模型突然杀出重围,以9%的胜率超越了原榜一大哥Flux1.1Pro成为新王!

来自主题: AI资讯
5691 点击    2024-10-29 11:49
AutoBA:一个用于生信多组学分析的完全自动化AI代理

AutoBA:一个用于生信多组学分析的完全自动化AI代理

AutoBA:一个用于生信多组学分析的完全自动化AI代理

分享一篇近期由华为和阿卜杜拉国王科技大学合作完成的一项生信分析与大语言模型相结合的工作,相关成果发表在《Advanced Science》上。

来自主题: AI技术研报
4094 点击    2024-10-29 09:53
世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

世界模型新突破!极佳科技提出DriveDreamer4D,首次利用世界模型增强4D驾驶场景重建效果

近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。

来自主题: AI技术研报
3476 点击    2024-10-28 15:00
NeurIPS 2024 | 消除多对多问题,清华提出大规模细粒度视频片段标注新范式VERIFIED

NeurIPS 2024 | 消除多对多问题,清华提出大规模细粒度视频片段标注新范式VERIFIED

NeurIPS 2024 | 消除多对多问题,清华提出大规模细粒度视频片段标注新范式VERIFIED

视频内容的快速增长给视频检索技术,特别是细粒度视频片段检索(VCMR),带来了巨大挑战。VCMR 要求系统根据文本查询从视频库中精准定位视频中的匹配片段,需具备跨模态理解和细粒度视频理解能力。

来自主题: AI技术研报
4139 点击    2024-10-28 14:46