AI资讯新闻榜单内容搜索-视觉模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 视觉模型
智能计算加速搜索,中国天眼FAST寻获球状星团中迄今最长周期脉冲星

智能计算加速搜索,中国天眼FAST寻获球状星团中迄今最长周期脉冲星

智能计算加速搜索,中国天眼FAST寻获球状星团中迄今最长周期脉冲星

我们知道,球状星团是一种受引力束缚,成员由几万颗到数百万颗恒星组成的古老星团,在外观上大多呈球形,但也有可能受其他天体系统的引力影响使得形状偏离球形。球状星团的动力学演化过程,星族合成路径等是当今天文学界的研究热点。

来自主题: AI技术研报
8168 点击    2024-05-07 18:15
揭秘Sora:用大语言模型的方法理解视频,实现了对物理世界的“涌现”

揭秘Sora:用大语言模型的方法理解视频,实现了对物理世界的“涌现”

揭秘Sora:用大语言模型的方法理解视频,实现了对物理世界的“涌现”

简单粗暴的理解,就是语言能力足够强大之后,它带来的泛化能力直接可以学习图像视频数据和它体现出的模式,然后还可以直接用学习来的图像生成模型最能理解的方式,给这些利用了引擎等已有的强大而成熟的视频生成技术的视觉模型模块下指令,最终生成我们看到的逼真而强大的对物理世界体现出“理解”的视频。

来自主题: AI资讯
7808 点击    2024-02-17 12:52
模型越大,性能越好?苹果自回归视觉模型AIM:没错

模型越大,性能越好?苹果自回归视觉模型AIM:没错

模型越大,性能越好?苹果自回归视觉模型AIM:没错

视觉模型,同样遵循「参数越多性能越强」的规律?刚刚,一项来自苹果公司的研究验证了这个猜想。

来自主题: AI技术研报
9139 点击    2024-01-18 18:19
ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞

ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞

ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞

来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。

来自主题: AI资讯
7986 点击    2024-01-18 13:07
GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V开源平替!清华浙大领衔,LLaVA、CogAgent等开源视觉模型大爆发

GPT-4V的开源替代方案来了!极低成本,性能却类似,清华、浙大等中国顶尖学府,为我们提供了性能优异的GPT-4V开源平替。

来自主题: AI资讯
7749 点击    2024-01-03 13:50
美图发布自研视觉大模型4.0,主打AI设计与AI视频

美图发布自研视觉大模型4.0,主打AI设计与AI视频

美图发布自研视觉大模型4.0,主打AI设计与AI视频

12月5-6日,主题为“未来AI设计”的美图创造力大会在厦门举行。美图公司发布自研AI视觉大模型MiracleVision(奇想智能)4.0版本,主打AI设计与AI视频。

来自主题: AI资讯
5344 点击    2023-12-06 17:24
通义千问爆甩开源全家桶!最强720亿参数超车Llama 2,新上视觉模型看图直出代码

通义千问爆甩开源全家桶!最强720亿参数超车Llama 2,新上视觉模型看图直出代码

通义千问爆甩开源全家桶!最强720亿参数超车Llama 2,新上视觉模型看图直出代码

通义千问开源全家桶正式上线!业界最强72B模型直接超越开源标杆Llama 2-70B,还有1.8B模型、音频大模型全部开源,阿里云这次真的把家底都掏出来了。

来自主题: AI资讯
7006 点击    2023-12-02 11:32
提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点

提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点

提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点

最近,来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA,使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能,并在图片、视频的13个基准上达到先进的性能。这个结果表明,统一LLM的输入能让LLM的视觉理解能力提升。

来自主题: AI技术研报
5164 点击    2023-11-24 15:10
人工智能初创公司BeSuperhuman.ai利用突破性的计算机视觉模型革新人机交互方式

人工智能初创公司BeSuperhuman.ai利用突破性的计算机视觉模型革新人机交互方式

人工智能初创公司BeSuperhuman.ai利用突破性的计算机视觉模型革新人机交互方式

BeSuperhuman.ai是一家计算机视觉人工智能初创公司,这家公司准备用突破性的新型视觉推理LLM模型,来颠覆AI工作助手的工作模式,以及我们过往操作电脑工具的交互方式。

来自主题: AI资讯
3699 点击    2023-10-24 23:23