AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
GPT-5前瞻!艾伦人工智能研究所发布最强多模态模型,预测GPT-5新能力

GPT-5前瞻!艾伦人工智能研究所发布最强多模态模型,预测GPT-5新能力

GPT-5前瞻!艾伦人工智能研究所发布最强多模态模型,预测GPT-5新能力

近日,艾伦人工智能研究所发布了Unified-IO 2,——第一代Unified-IO曾预测了GPT-4等模型的能力,所以我们可以从新一代的模型中一窥GPT-5的真面目

来自主题: AI资讯
9371 点击    2024-01-09 14:26
看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令

看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令

看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令

谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术,多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像,效果堪比 PS 大神抓着你的手助你 P 图。

来自主题: AI技术研报
3611 点击    2024-01-06 16:42
苹果大模型,不藏了

苹果大模型,不藏了

苹果大模型,不藏了

iPhone迎来AI时刻?岁末年初,苹果加快了在大模型领域的步伐。

来自主题: AI资讯
10097 点击    2024-01-06 11:42
大模型都会标注图像了,简单对话即可!来自清华&NUS

大模型都会标注图像了,简单对话即可!来自清华&NUS

大模型都会标注图像了,简单对话即可!来自清华&NUS

多模态大模型集成了检测分割模块后,抠图变得更简单了!

来自主题: AI技术研报
8890 点击    2024-01-04 10:43
骁龙888实时运行,美团、浙大等打造全流程移动端多模态大模型MobileVLM

骁龙888实时运行,美团、浙大等打造全流程移动端多模态大模型MobileVLM

骁龙888实时运行,美团、浙大等打造全流程移动端多模态大模型MobileVLM

近日,美团、浙大等推出了能够在移动端部署的多模态大模型,包含了 LLM 基座训练、SFT、VLM 全流程。也许不久的将来,每个人都能方便、快捷、低成本的拥有属于自己的大模型。

来自主题: AI资讯
10881 点击    2024-01-03 13:42
多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型做“多任务指令微调”,大模型可能会“学得多错得多”,因为不同任务之间的冲突,导致泛化能力下降。

来自主题: AI资讯
4512 点击    2023-12-30 14:39
字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM

字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM

字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM

目前大多数模型的能力还是局限于生成对整体图像或特定区域的文本描述,在像素级理解方面的能力(例如物体分割)相对有限。

来自主题: AI技术研报
10198 点击    2023-12-28 17:37