AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
一文读懂 CLIP:多模态 AI 的核心原理与应用

一文读懂 CLIP:多模态 AI 的核心原理与应用

一文读懂 CLIP:多模态 AI 的核心原理与应用

「多模态」这个词,相信各位开发者已经比较熟悉了,多模态的含义是让 AI 同时理解包含如图像和文本在内的多种类型的数据。

来自主题: AI资讯
8115 点击    2024-11-15 10:38
国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代

国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代

国产地表最强视频模型震惊歪果仁,官方现场摇人30s直出!视觉模型进入上下文时代

全球首个支持多主体一致性的多模态模型,刚刚诞生!Vidu 1.5一上线,全网网友都震惊了:LLM独有的上下文学习优势,视觉模型居然也有了。

来自主题: AI资讯
6223 点击    2024-11-14 14:36
首个多模态连续学习综述,港中文、清华、UIC联合发布

首个多模态连续学习综述,港中文、清华、UIC联合发布

首个多模态连续学习综述,港中文、清华、UIC联合发布

连续学习(CL)旨在增强机器学习模型的能力,使其能够不断从新数据中学习,而无需进行所有旧数据的重新训练。连续学习的主要挑战是灾难性遗忘:当任务按顺序训练时,新的任务训练会严重干扰之前学习的任务的性能,因为不受约束的微调会使参数远离旧任务的最优状态。

来自主题: AI技术研报
4067 点击    2024-11-13 16:02
谷歌推出教育AI产品“Learn About”,步步引导,多模态呈现

谷歌推出教育AI产品“Learn About”,步步引导,多模态呈现

谷歌推出教育AI产品“Learn About”,步步引导,多模态呈现

11月11日,谷歌推出了一款名为“Learn About” 的实验性的新 AI 工具,它不同于此前的聊天机器人,如 Gemini 和 ChatGPT。

来自主题: AI资讯
3276 点击    2024-11-13 10:39
自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

自动漂移、用LLM和扩散模型“折腾”机器人…顶会CoRL上最佳论文都在研究啥

第8届CoRL于2024年11月6日至9日在德国慕尼黑举行,展示了机器人学习领域的前沿研究和发展,尤其是在自主系统、机器人控制和多模态人工智能领域。

来自主题: AI技术研报
6343 点击    2024-11-12 17:33
0元起步打造你的AI搜索!实测秘塔知识库新功能,竟能指导我升职加薪了

0元起步打造你的AI搜索!实测秘塔知识库新功能,竟能指导我升职加薪了

0元起步打造你的AI搜索!实测秘塔知识库新功能,竟能指导我升职加薪了

要说最近大模型应用里哪个赛道最火爆,AI搜索当属其一。 大厂初创纷纷下场不说,功能也越卷越深度:集成论文库、引入多模态实现图片分析……大有把知识获取成本再打骨折的趋势。 就在量子位近期收到的读者反馈中,我们也实实在在感受到了大家伙儿对AI搜索的期待,还观察到了一个呼声很高的需求——AI搜索+知识库。

来自主题: AI资讯
4150 点击    2024-11-12 10:37
独家|前谷歌、字节、腾讯 AI 核心人物加入闪极,打造AI眼镜端“今日头条”

独家|前谷歌、字节、腾讯 AI 核心人物加入闪极,打造AI眼镜端“今日头条”

独家|前谷歌、字节、腾讯 AI 核心人物加入闪极,打造AI眼镜端“今日头条”

在全球科技市场的前沿浪潮中,AI 与硬件的融合正成为企业创新的关键路径。从苹果的 Vision Pro 到 Meta 的智能拍摄眼镜,众多科技巨头纷纷投身于将大模型、多模态 AI 等顶尖技术与消费级硬件相结合的探索之旅。

来自主题: AI资讯
4205 点击    2024-11-11 14:39
虚拟女友已没有前途,AI陪伴硬件或许才是未来

虚拟女友已没有前途,AI陪伴硬件或许才是未来

虚拟女友已没有前途,AI陪伴硬件或许才是未来

随着AI大模型在今年618前夕打起价格战,当以GPT-4o为代表的多模态大模型将交互体验也推向更高的层次,也意味着杀手级AI应用或许真的来到了奇点时刻。如今AI行业的创业者已经不再聚焦大模型,而是开始尝试用AI赋能具体的应用场景。

来自主题: AI资讯
3308 点击    2024-11-11 10:17
详解“端到端”下一代模型VLA,通向自动驾驶的关键跳板

详解“端到端”下一代模型VLA,通向自动驾驶的关键跳板

详解“端到端”下一代模型VLA,通向自动驾驶的关键跳板

近期,智驾行业出现了一个融合了视觉、语言和动作的多模态大模型范式——VLA(Vision-Language-Action Model,即视觉-语言-动作模型),拥有更高的场景推理能力与泛化能力。不少智驾人士都将VLA视为当下“端到端”方案的2.0版本。

来自主题: AI资讯
2932 点击    2024-11-09 09:50