AI资讯新闻榜单内容搜索-多模态

ECCV 2024 | 提升GPT-4V、Gemini检测任务性能，你需要这种提示范式

多模态大模型（Multimodal Large Language Models，MLLMs）在不同的任务中表现出了令人印象深刻的能力，尽管如此，这些模型在检测任务中的潜力仍被低估。

来自主题: AI技术研报

12000 点击 2024-07-22 14:58

OpenAI竟成ChatGPT“终结者”？更小、更强的多模态模型来了

封面来源｜公司官网 “GPT-3.5（ChatGPT）API将在某个时刻退役——只是不确定在何时。”在The Verge的采访中，OpenAI API平台负责人Olivier Godement如此总结。

来自主题: AI资讯

6575 点击 2024-07-19 16:38

独家对话李岩：宿华、经纬、红点资金支持，第一个「生成式推荐」创业公司｜AI Pioneers

离开快手创业后，「李岩」悄悄拿到了快手联合创始人宿华、红点创投以及经纬创投的3200万美金种子轮融资。

来自主题: AI资讯

10631 点击 2024-07-18 16:47

融合AI技术，「京东方」C100系列智慧一体机上市丨最前线

相比于其他融合多模态AI交互与大模型技术产品，「京东方」更注重产品使用过程中的信息安全问题。

来自主题: AI资讯

6857 点击 2024-07-18 10:47

抛弃视觉编码器，这个「原生版」多模态大模型也能媲美主流方法

近期，关于多模态大模型的研究如火如荼，工业界对此的投入也越来越多。

来自主题: AI技术研报

10661 点击 2024-07-16 19:57

首个视频思维链推理框架Video-of-Thought来了：像人一样从感知到认知全面推理视频

最近，新加坡国立大学联合南洋理工大学和哈工深的研究人员共同提出了一个全新的视频推理框架，这也是首次大模型推理社区提出的面向视频的思维链框架（Video-of-Thought， VoT）。视频思维链VoT让视频多模态大语言模型在复杂视频的理解和推理性能上大幅提升。该工作已被ICML 2024录用为Oral paper。

来自主题: AI技术研报

11745 点击 2024-07-12 17:54