AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
中科大等意外发现:大模型不看图也能正确回答视觉问题!

中科大等意外发现:大模型不看图也能正确回答视觉问题!

中科大等意外发现:大模型不看图也能正确回答视觉问题!

大模型不看图,竟也能正确回答视觉问题?!中科大、香港中文大学、上海AI Lab的研究团队团队意外发现了这一离奇现象。他们首先看到像GPT-4V、GeminiPro、Qwen1.5-72B、Yi-VL-34B以及LLaVA-Next-34B等大模型,不管是闭源还是开源,语言模型还是多模态,竟然只根据在多模态基准MMMU测试中的问题和选项文本,就能获得不错的成绩。

来自主题: AI技术研报
5109 点击    2024-04-07 13:10
CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%

CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%

CVPR 2024录用结果出炉!2719篇论文被接收,录用率23.6%

一年一度的CVPR 2024录用结果出炉了。今年,共有2719篇论文被接收,录用率为23.6%。

来自主题: AI技术研报
8402 点击    2024-04-05 16:09
阿里7B多模态文档理解大模型拿下新SOTA|开源

阿里7B多模态文档理解大模型拿下新SOTA|开源

阿里7B多模态文档理解大模型拿下新SOTA|开源

多模态文档理解能力新SOTA!阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5,针对高分辨率图片文字识别、通用文档结构理解、指令遵循、外部知识引入四大挑战,提出了一系列解决方案。

来自主题: AI技术研报
7312 点击    2024-04-02 11:40
a16z 对话 Poe 创始人:大模型幻觉是创业公司的机会;AI 的未来是多模型、多模态

a16z 对话 Poe 创始人:大模型幻觉是创业公司的机会;AI 的未来是多模型、多模态

a16z 对话 Poe 创始人:大模型幻觉是创业公司的机会;AI 的未来是多模型、多模态

作为 Meta 的前 CTO,Quora CEO Adam D'Angelo 目前还是 OpenAI 的董事会成员,在 Quora 之外推出的 Poe,成为当下接入大模型最多的 Chatbot 平台:GPT-4、Claude3、Mistral 等模型都有,用户也可以在上面搭建自己的 Chatbot 机器人,如果有别的用户使用,还可以产生收益。

来自主题: AI技术研报
8686 点击    2024-04-02 10:05
具身智能的月亮与六便士

具身智能的月亮与六便士

具身智能的月亮与六便士

“你能算出一个苹果有多少种子,但是永远不知道一颗种子能结多少苹果。” 科技也是一样。 很多时候,我们将科技看为一个结果,一个苹果,但其实科技是一颗种子,是一个开始。绿洲相信人工智能带来的社会变革,绿洲更加相信人工智能只是整个人类进入智能时代的其中一个截面,而具身智能正是另外一个截面。

来自主题: AI资讯
6523 点击    2024-04-01 19:07
国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI

国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI

国产黑马一年肝出万亿参数MoE!霸榜多模态,剑指AGI

LLM战场的新玩家,一出手就是王炸!信仰Scaling Law的阶跃星辰,一口气带来了Step-1千亿参数语言大模型、Step-1V千亿参数多模态大模型,以及Step-2万亿参数MoE语言大模型的预览版。而阶跃星辰之旅,终点就是AGI。

来自主题: AI资讯
3817 点击    2024-04-01 18:50
上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

上海交大新框架解锁CLIP长文本能力,多模态生成细节拿捏,图像检索能力显著提升

CLIP长文本能力被解锁,图像检索任务表现显著提升!一些关键细节也能被捕捉到。上海交大联合上海AI实验室提出新框架Long-CLIP。

来自主题: AI技术研报
8387 点击    2024-04-01 11:26
只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理

只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理

只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理

【新智元导读】从今天起,千元级就能解锁专属大模型了!这款搭载首颗纯国产14nm Chiplet大模型推理芯片的「深目」AI模盒,可以轻松实现百亿级参数多模态大模型的推理+微调。各种碎片化长尾算法,直接秒级生成!

来自主题: AI技术研报
7177 点击    2024-03-29 16:03
微软亚研院新作:让大模型一口气调用数百万个API!

微软亚研院新作:让大模型一口气调用数百万个API!

微软亚研院新作:让大模型一口气调用数百万个API!

近年来,人工智能发展迅速,尤其是像ChatGPT这样的基础大模型,在对话、上下文理解和代码生成等方面表现出色,能够为多种任务提供解决方案。

来自主题: AI资讯
7065 点击    2024-03-29 11:26