AI资讯新闻榜单内容搜索-Clip

一文读懂 CLIP：多模态 AI 的核心原理与应用

「多模态」这个词，相信各位开发者已经比较熟悉了，多模态的含义是让 AI 同时理解包含如图像和文本在内的多种类型的数据。

来自主题: AI资讯

9930 点击 2024-11-15 10:38

OpusClip创始人赵洋：7个月，500万用户，ARR千万美金

7 个月时间，用户量超过 500 万，ARR 收入接近 1000 万美元。 OpusClip 可以说是目前 AI 视频剪辑工具的头号种子

来自主题: AI资讯

6382 点击 2024-11-02 10:38

一张图实现街道级定位，端到端图像地理定位大模型AddressCLIP登ECCV2024

拔草星人的好消息来啦！中科院自动化所和阿里云一起推出了街景定位大模型，只要一张照片就能实现街道级精度的定位。

来自主题: AI资讯

5679 点击 2024-09-14 15:40

9个人的公司，做文生图，2500万用户，每年净利润200万美元

Flux 带起又一波文生图模型的热潮，NightCafe 是其中的受益者之一。

来自主题: AI商业项目

15152 点击 2024-09-05 09:41

对比学习滥用隐私数据！中科院等发布「多步误差最小化」方法 | ACM MM2024

多模态对比学习（如CLIP）通过从互联网上抓取的数百万个图像-字幕对中学习，在零样本分类方面取得了显著进展。然而，这种依赖带来了隐私风险，因为黑客可能会未经授权地利用图像-文本数据进行模型训练，其中可能包括个人和隐私敏感信息。

来自主题: AI技术研报

7974 点击 2024-08-01 15:32

关于大模型「越狱」的多种方式，有这些防御手段

随着人工智能（AI）技术的迅猛发展，特别是大语言模型（LLMs）如 GPT-4 和视觉语言模型（VLMs）如 CLIP 和 DALL-E，这些模型在多个技术领域取得了显著的进展。

来自主题: AI技术研报

11681 点击 2024-07-29 20:32

开发者自述：诞生、爆火、开源、沉寂，一款 AI 相册搜索应用的两年

寻隐（英文名 Queryable）是一款 iOS 上的 AI 照片搜索软件，支持用户使用自然语言搜索本地照片。软件诞生的契机是 OpenAI 发布的 CLIP 模型。

来自主题: AI资讯

11746 点击 2024-07-27 15:35

比LERF提速199倍！清华哈佛发布LangSplat：三维语义高斯泼溅 | CVPR 2024 Highlight

本文将为大家介绍CVPR 2024 Highlight的论文LangSplat: 3D Language Gaussian Splatting（三维语义高斯泼溅）。LangSplat在开放文本目标定位和语义分割任务上达到SOTA性能。在1440×1080分辨率的图像上，查询速度比之前的SOTA方法LERF快了199倍。代码已开源。

来自主题: AI技术研报

5100 点击 2024-06-28 16:31

提速199倍！清华&哈佛发布三维语义高斯泼溅LangSplat｜CVPR‘24 Highlight

入选CVPR 2024 Highlight的三维语义高斯泼溅最新成果，查询速度比之前的SOTA方法LERF快了199倍！

来自主题: AI技术研报

10995 点击 2024-06-23 20:03

导师爆料：这篇CVPR最佳学生论文，从想法到成稿只用一个月，源自业余灵感

按部就班 vs. 好奇心驱动，哪个更容易出研究成果？

来自主题: AI资讯

10763 点击 2024-06-22 22:53