AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

李飞飞团队统一动作与语言,新的多模态模型不仅超懂指令,还能读懂隐含情绪

人类的沟通交流充满了多模态的信息。为了与他人进行有效沟通,我们既使用言语语言,也使用身体语言,比如手势、面部表情、身体姿势和情绪表达。

来自主题: AI技术研报
6551 点击    2024-12-18 14:38
Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

Florence-VL来了!使用生成式视觉编码器,重新定义多模态大语言模型视觉信息

Florence-VL 提出了使用生成式视觉编码器 Florence-2 作为多模态模型的视觉信息输入,克服了传统视觉编码器(如 CLIP)仅提供单一视觉表征而往往忽略图片中关键的局部信息。

来自主题: AI技术研报
7141 点击    2024-12-18 14:21
微信正式发布多模态大模型POINTS1.5

微信正式发布多模态大模型POINTS1.5

微信正式发布多模态大模型POINTS1.5

距离 POINT1.0 的发布已经过去两个月时间来,在这段时间业界不断涌现出一系列优秀的模型。我们通过不断紧跟前沿技术,并结合过去开发多模态模型沉淀下来的经验,对 POINTS1.0 进行了一系列更新,推出了 POINTS1.5。

来自主题: AI技术研报
8550 点击    2024-12-17 10:52
ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题

ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题

ChatGPT搜索与Her打通了!搜索免费开放,居然还剧透明日直播主题

ChatGPT今天带来的是搜索功能方面的一些迭代升级(更像谷歌了)。根据用户反馈,优化搜索体验,移动端搜索更快,并能搜索出多模态信息;结合前几日发布的Her功能,可以在实时通话的时候进行语音搜索;

来自主题: AI资讯
9324 点击    2024-12-17 09:00
我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

OpenAI 放出了 o1 Pro、GPT-4o 高级语音、GPTCanavas,就跟孔雀开屏一样 ~ 谷歌最近的大动作是发布了 Gemini 2.0 嘛!2.0 比 1.5 版本快一倍,而且是原生的多模态大模型,能输入和生成语言、声音、图片、视频等。

来自主题: AI资讯
6948 点击    2024-12-13 17:12