ChatGPT又变强了,OpenAI会变成下一个苹果吗?
ChatGPT又变强了,OpenAI会变成下一个苹果吗?OpenAI在首次开发者大会上宣布推出GPT-4 Turbo和众多新功能,包括Assistant API、多模态功能和GPT Store。GPT-4 Turbo具有更大的上下文窗口和更快的输出速度,而Assistant API使开发者更容易构建自己的AI应用程序。同时,GPT Store将允许用户创建和分享自定义版本的GPT。
OpenAI在首次开发者大会上宣布推出GPT-4 Turbo和众多新功能,包括Assistant API、多模态功能和GPT Store。GPT-4 Turbo具有更大的上下文窗口和更快的输出速度,而Assistant API使开发者更容易构建自己的AI应用程序。同时,GPT Store将允许用户创建和分享自定义版本的GPT。
基于LVLM幻觉频发的三个成因(物体共现、物体不确定性、物体位置),北卡教堂山、斯坦福、哥大、罗格斯等大学的研究人员提出幻觉修正器LURE,通过修改描述来降低幻觉问题。
GPT-4V学会自动操纵电脑,这一天终于还是到来了。 只需要给GPT-4V接入鼠标和键盘,它就能根据浏览器界面上网:甚至还能快速摸清楚“播放音乐”的播放器网站和按钮,给自己来一段music:
视觉幻觉是常见于多模态大语言模型的一个典型问题。最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。
在 10 月 28 日举办的 CNCC 2023「超智融合 AI 大模型应用落地发展论坛」上,智子引擎发布了「元乘象 Chatimg3.0」,展示了多模态通用生成模型「元乘象 Chatimg3.0」的最新进展与落地探索。
Open AI今天给一些人悄咪咪开放了两个新功能,现在他可以上传PDF等文档进行分析和提问了,GPT-4加持下想必能有更好的结果。
最近,智源、清华和北大联合发布了全新的10亿参数的3D视觉通用模型——Uni3D,在主流3D视觉能力上取得了全方位的性能突出!
最近多模态大模型是真热闹啊。 这不,Transformer一作携团队也带来了新作,一个规模为80亿参数的多模态大模型Fuyu-8B
中国科学院国家天文台银河系三维结构团组最近在wisemodel.cn社区开源的星语StarWhisper天文大模型,在甲骨易AI研究院与LanguageX AI Lab联合发布的CG-Eval上达到总排名第二,仅低于GPT-4。
GPT-4V风头正盛,LLaVA-1.5就来踢馆了!它不仅在11个基准测试上都实现了SOTA,而且13B模型的训练,只用8个A100就可以在1天内完成。