AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
对话智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞争已步入混战后期

对话智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞争已步入混战后期

对话智谱 AI CEO 张鹏:AI Agent 是重要新风向,大模型竞争已步入混战后期

在新模型发布后,智谱 AI CEO 张鹏和极客公园聊了聊他们的近况和一些行业认知。谈到与ChatGLM2相比,智谱 AI 此次瞄准 GPT-4V 推出的 ChatGLM 3 性能更加强大,接入了具有多模态理解能力的模型 CogVLM、代码增强模块 Code Interpreter、网络搜索增强模型 WebGLM,并增强了语义理解和逻辑理解能力,实现了若干功能的迭代升级。

来自主题: AI资讯
5293 点击    2023-11-08 16:00
ChatGPT又变强了,OpenAI会变成下一个苹果吗?

ChatGPT又变强了,OpenAI会变成下一个苹果吗?

ChatGPT又变强了,OpenAI会变成下一个苹果吗?

OpenAI在首次开发者大会上宣布推出GPT-4 Turbo和众多新功能,包括Assistant API、多模态功能和GPT Store。GPT-4 Turbo具有更大的上下文窗口和更快的输出速度,而Assistant API使开发者更容易构建自己的AI应用程序。同时,GPT Store将允许用户创建和分享自定义版本的GPT。

来自主题: AI资讯
15946 点击    2023-11-07 09:58
多模态物体幻觉下降23%!UNC斯坦福等推出通用修正器LURE:兼容任意LVLM,专攻三大幻觉成因

多模态物体幻觉下降23%!UNC斯坦福等推出通用修正器LURE:兼容任意LVLM,专攻三大幻觉成因

多模态物体幻觉下降23%!UNC斯坦福等推出通用修正器LURE:兼容任意LVLM,专攻三大幻觉成因

基于LVLM幻觉频发的三个成因(物体共现、物体不确定性、物体位置),北卡教堂山、斯坦福、哥大、罗格斯等大学的研究人员提出幻觉修正器LURE,通过修改描述来降低幻觉问题。

来自主题: AI技术研报
5647 点击    2023-11-06 23:15
GPT-4V学会用键鼠上网,人类眼睁睁看着它发帖玩游戏

GPT-4V学会用键鼠上网,人类眼睁睁看着它发帖玩游戏

GPT-4V学会用键鼠上网,人类眼睁睁看着它发帖玩游戏

GPT-4V学会自动操纵电脑,这一天终于还是到来了。 只需要给GPT-4V接入鼠标和键盘,它就能根据浏览器界面上网:甚至还能快速摸清楚“播放音乐”的播放器网站和按钮,给自己来一段music:

来自主题: AI资讯
10292 点击    2023-11-06 10:06
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟

视觉幻觉是常见于多模态大语言模型的一个典型问题。最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。

来自主题: AI技术研报
3577 点击    2023-11-01 09:49
元乘象Chatimg3.0来了,赶超GPT-4V,还给出产业升级新打法

元乘象Chatimg3.0来了,赶超GPT-4V,还给出产业升级新打法

元乘象Chatimg3.0来了,赶超GPT-4V,还给出产业升级新打法

在 10 月 28 日举办的 CNCC 2023「超智融合 AI 大模型应用落地发展论坛」上,智子引擎发布了「元乘象 Chatimg3.0」,展示了多模态通用生成模型「元乘象 Chatimg3.0」的最新进展与落地探索。

来自主题: AI资讯
6820 点击    2023-10-29 23:07
ChatGPT发布新功能,多模态的完全体?

ChatGPT发布新功能,多模态的完全体?

ChatGPT发布新功能,多模态的完全体?

Open AI今天给一些人悄咪咪开放了两个新功能,现在他可以上传PDF等文档进行分析和提问了,GPT-4加持下想必能有更好的结果。

来自主题: AI资讯
5058 点击    2023-10-29 21:54
国家天文台开源StarWhisper天文大模型,探索科普和科学中的多模态与工具学习

国家天文台开源StarWhisper天文大模型,探索科普和科学中的多模态与工具学习

国家天文台开源StarWhisper天文大模型,探索科普和科学中的多模态与工具学习

中国科学院国家天文台银河系三维结构团组最近在wisemodel.cn社区开源的星语StarWhisper天文大模型,在甲骨易AI研究院与LanguageX AI Lab联合发布的CG-Eval上达到总排名第二,仅低于GPT-4。

来自主题: AI资讯
9597 点击    2023-10-17 09:50