AI资讯新闻榜单内容搜索-Lab

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Lab
CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源

CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源

CVPR 2025 | 多模态统一学习新范式来了,数据、模型、代码全部开源

我们人类生活在一个充满视觉和音频信息的世界中,近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力,衍生出了多种不同类型的任务,它们分别要求模型具备不同层面的能力。

来自主题: AI技术研报
7649 点击    2025-06-12 11:43
B轮融资6000万美元:这家公司如何用AI赋能基层医疗?

B轮融资6000万美元:这家公司如何用AI赋能基层医疗?

B轮融资6000万美元:这家公司如何用AI赋能基层医疗?

2025年5月,美国数字健康企业 Akido Labs 宣布完成6000万美元B轮融资,由 McKesson Ventures 和 Polaris Partners 联合领投,老股东 Andreessen Horowitz(a16z)与 SVB Capital 跟投。融资所得将主要用于扩大其核心平台 ScopeAI 的部署,尤其是在医疗资源匮乏的社区加速落地。

来自主题: AI资讯
6920 点击    2025-06-11 14:51
103K「硬核」题,让大模型突破数学推理瓶颈

103K「硬核」题,让大模型突破数学推理瓶颈

103K「硬核」题,让大模型突破数学推理瓶颈

本文将介绍 DeepMath-103K 数据集。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。

来自主题: AI技术研报
8169 点击    2025-06-11 14:50
双胞胎兄弟创业,融资2400万美金,打造视频AI agent必备的基础设施

双胞胎兄弟创业,融资2400万美金,打造视频AI agent必备的基础设施

双胞胎兄弟创业,融资2400万美金,打造视频AI agent必备的基础设施

你有没有想过,那些电视台、制作公司里堆积如山的视频素材,可能马上就要被彻底重新定义了?想象一下,从数千小时的视频内容中找到你需要的那一个镜头,不再需要安排一群人没日没夜地看片子、做标记,而是只需要简单描述一句"奥巴马谈论人权的片段",系统就能立刻定位到精确的时间点,并提供详细的场景描述、人物信息和镜头分析。

来自主题: AI资讯
7547 点击    2025-06-10 12:02
深度|AI语音独角兽11Labs创始人:“人性”中的不完美,恰恰是人愿意互动的关键

深度|AI语音独角兽11Labs创始人:“人性”中的不完美,恰恰是人愿意互动的关键

深度|AI语音独角兽11Labs创始人:“人性”中的不完美,恰恰是人愿意互动的关键

我们很多语音生成工作,正是通过加入这些不完美的“人性化特征”,让合成声音显得更加真实和有情感,这也成为ElevenLabs的声音技术与众不同之处。当然,并不是所有场景都适合这种风格。但总体而言,“人性”中的不完美,恰恰是人愿意互动的关键。

来自主题: AI资讯
4176 点击    2025-06-09 15:27
没想到,最Open的开源新模型,来自小红书

没想到,最Open的开源新模型,来自小红书

没想到,最Open的开源新模型,来自小红书

迄今为止行业最大的开源力度。在大模型上向来低调的小红书,昨天开源了首个自研大模型。

来自主题: AI技术研报
6753 点击    2025-06-07 15:32
AI文本转语音进入“Next Level”!独角兽ElevenLabs发布Eleven v3:狠狠拿捏情感控制

AI文本转语音进入“Next Level”!独角兽ElevenLabs发布Eleven v3:狠狠拿捏情感控制

AI文本转语音进入“Next Level”!独角兽ElevenLabs发布Eleven v3:狠狠拿捏情感控制

AI文本转语音已经进化到这种程度了吗?(⊙ˍ⊙)莎士比亚戏剧腔、体育赛事激情解说、沉浸式有声书等诸多玩法简直轻松拿捏,而且听起来确实人机傻傻分不清楚~

来自主题: AI资讯
6920 点击    2025-06-07 12:05