AI资讯新闻榜单内容搜索-GPT-4

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平，其在纯文本性能甚至超过了LLM骨干模型，特别是在文本数学和编码基准测试中，平均准确率提高了4.3个百分点。

来自主题: AI技术研报

9971 点击 2024-09-24 12:27

两个多月前那个对标GPT-4o的端到端语音模型，终于开源了。大神Karpathy体验之后表示：nice！

来自主题: AI技术研报

7565 点击 2024-09-24 12:07

GPT-4o 读万卷书，「o1」行万里路。

来自主题: AI资讯

7407 点击 2024-09-24 09:49

AI玩黑神话，第一个精英怪牯护院轻松拿捏啊。

来自主题: AI技术研报

9322 点击 2024-09-23 15:42

LLaMA-Omni能够接收语音指令，同步生成文本和语音响应，响应延迟低至 226ms，低于 GPT-4o 的平均音频响应延迟 320ms。

来自主题: AI资讯

4449 点击 2024-09-23 15:25

多个LLM联合，可以迈向更强大系统！最新研究发现，GPT-4能够提升同伴的性能，能够让数学能力暴涨11.6%。

来自主题: AI资讯

10625 点击 2024-09-22 14:57

击败LIama3！Qwen2.5登上全球开源王座。而后者仅以五分之一的参数规模，就在多任务中超越LIama3 405B。

来自主题: AI资讯

5795 点击 2024-09-19 14:34

MMMU-Pro通过三步构建过程（筛选问题、增加候选选项、引入纯视觉输入设置）更严格地评估模型的多模态理解能力；模型在新基准上的性能下降明显，表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。

来自主题: AI技术研报

10413 点击 2024-09-16 21:08

大语言模型（如 GPT-4）具备强大的语言处理能力，但其独立运作时仍存在局限性，如无法进行复杂计算，获取不到实时信息，难以提供专业定制化功能等。而大语言模型的工具调用能力使其不仅限于文字处理，更能提供全面、实时、精确的服务，极大地扩展了其应用范围和实际价值。

来自主题: AI技术研报

9402 点击 2024-09-15 14:32

OpenAI o1，在IQ测试中拿到了第一名！大佬Maxim Lott，给o1、Claude-3 Opus、Gemini、GPT-4、Grok-2、Llama-3.1等进行了智商测试，结果表明，o1稳居第一名。

来自主题: AI资讯

6822 点击 2024-09-14 16:02