AI资讯新闻榜单内容搜索-CLI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CLI
RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

RAE的终极形态?北大&阿里提出UniLIP: 将CLIP拓展到重建、生成和编辑

统一多模态模型要求视觉表征必须兼顾语义(理解)和细节(生成 / 编辑)。早期 VAE 因语义不足而理解受限。近期基于 CLIP 的统一编码器,面临理解与重建的权衡:直接量化 CLIP 特征会损害理解性能;而为冻结的 CLIP 训练解码器,又因特征细节缺失而无法精确重建。例如,RAE 使用冻结的 DINOv2 重建,PSNR 仅 19.23。

来自主题: AI技术研报
8064 点击    2025-11-03 09:50
牛津VGG、港大、上交发布ELIP:超越CLIP等,多模态图片检索的增强视觉语言大模型预训练

牛津VGG、港大、上交发布ELIP:超越CLIP等,多模态图片检索的增强视觉语言大模型预训练

牛津VGG、港大、上交发布ELIP:超越CLIP等,多模态图片检索的增强视觉语言大模型预训练

多模态图片检索是计算机视觉和多模态机器学习领域很重要的一个任务。现在大家做多模态图片检索一般会用 CLIP/SigLIP 这种视觉语言大模型,因为他们经过了大规模的预训练,所以 zero-shot 的能力比较强。

来自主题: AI技术研报
6630 点击    2025-10-30 10:42
微软 AI 全家桶大更新!复刻 ChatGPT 浏览器,经典「大眼夹」回归是最大彩蛋

微软 AI 全家桶大更新!复刻 ChatGPT 浏览器,经典「大眼夹」回归是最大彩蛋

微软 AI 全家桶大更新!复刻 ChatGPT 浏览器,经典「大眼夹」回归是最大彩蛋

昨天在 Copilot 秋季发布会上,微软正式推出了 Mico——一个全新的 Copilot 虚拟角色,它被视为 AI 时代的 Clippy。 这不仅是 Copilot 的一次大整容,也像是在说微软,要继续押注我们需要一个 AI 伴侣,希望 AI 成为一种社交体验。

来自主题: AI资讯
10312 点击    2025-10-24 22:48
别Claude Code了,一个国产免费命令行就够了

别Claude Code了,一个国产免费命令行就够了

别Claude Code了,一个国产免费命令行就够了

Claude Code没法用了后,国内大厂纷纷推出国产平替。最近,阿里心流研究团队就悄咪咪地发布了一款终端AI智能体——iFlow CLI,号称是Claude Code最强平替!iFlow CLI可以使用自然语言命令行的形式直接在终端运行,最重要的一点是,专为国内开发者设计,面向个人用户永久免费,没有限流!

来自主题: AI资讯
10495 点击    2025-10-14 13:42
多个编码智能体同时使用会不会混乱?海外开发者热议

多个编码智能体同时使用会不会混乱?海外开发者热议

多个编码智能体同时使用会不会混乱?海外开发者热议

结合现在已经非常成熟 CLI、IDE 工具等的辅助,采用编码智能体进行开发工作已经成为了一种常态,甚至成为了一种新的生活方式。不仅仅是程序员,产品类、设计类岗位的从业人员都已广泛采用 AI 编码智能体辅助工作,AI 生成的代码比例越来越高。

来自主题: AI资讯
10105 点击    2025-10-08 11:48
多模态检索新突破,用软标签打破传统刚性映射约束,全面超越CLIP|AAAI 2026 Oral

多模态检索新突破,用软标签打破传统刚性映射约束,全面超越CLIP|AAAI 2026 Oral

多模态检索新突破,用软标签打破传统刚性映射约束,全面超越CLIP|AAAI 2026 Oral

基于多模态大模型语义理解能力的统一多模态嵌入模型UniME-V2。该方法首先通过全局检索构建潜在困难负例集,随后创新性地引入“MLLM-as-a-Judge”机制:利用MLLM对查询-候选对进行语义对齐评估,生成软语义匹配分数。

来自主题: AI技术研报
5738 点击    2025-10-06 21:53
腾讯出手了!首款国产AI CLI真有点猛,支持微信登录~

腾讯出手了!首款国产AI CLI真有点猛,支持微信登录~

腾讯出手了!首款国产AI CLI真有点猛,支持微信登录~

大家好,我是袋鼠帝 先给你们看个好玩的东西:隔空手势控制任意网页 食指☝️指向:控制鼠标移动 比耶✌️:进行点击 手掌✋:上下移动页面 这个高难度的手势控制网页功能,被我用腾讯刚刚发布的国内首款AI CLI:CodeBuddy Code搞定了

来自主题: AI资讯
10119 点击    2025-09-10 09:47
苹果端侧AI两连发!模型体积减半、首字延迟降85倍,iPhone离线秒用

苹果端侧AI两连发!模型体积减半、首字延迟降85倍,iPhone离线秒用

苹果端侧AI两连发!模型体积减半、首字延迟降85倍,iPhone离线秒用

苹果在 Hugging Face上放大招了!这次直接甩出两条多模态主线:FastVLM主打「快」,字幕能做到秒回;MobileCLIP2主打「轻」,在 iPhone 上也能起飞。更妙的是,模型和Demo已经全开放,Safari网页就能体验。大模型,真·跑上手机了。

来自主题: AI资讯
8576 点击    2025-09-08 11:34
苹果最新模型,5年前的iPhone能跑

苹果最新模型,5年前的iPhone能跑

苹果最新模型,5年前的iPhone能跑

智东西9月1日消息,苹果又公布了大模型研发新进展! 8月28日,苹果在arXiv发布新论文,介绍新一代多模态基础模型MobileCLIP2及其背后的多模态强化训练机制,同天在GitHub、Hugging Face上开源了模型的预训练权重和数据生成代码。

来自主题: AI技术研报
7587 点击    2025-09-02 11:04
马斯克入局AI编程!xAI新模型限时免费用:256K上下文,主打一个速度快

马斯克入局AI编程!xAI新模型限时免费用:256K上下文,主打一个速度快

马斯克入局AI编程!xAI新模型限时免费用:256K上下文,主打一个速度快

刚刚,马斯克xAI加入Coding战局:推出智能编程模型Grok Code Fast 1。Fast写进名字里,新模型主打的就是快速、经济,且支持256K上下文,可在GitHub Copilot、Cursor、Cline、Kilo Code、Roo Code、opencode和Windsurf上使用,还限时7天免费!

来自主题: AI资讯
10481 点击    2025-08-29 09:57