AI资讯新闻榜单内容搜索-AL

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AL
可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型,LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究,说当前最先进的LLM在多轮对话中表现会大幅下降,平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型(包括Claude 3.7-Sonnet、Deepseek-R1等)在多轮对话中的表现差异,还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报
7036 点击    2025-05-20 10:16
颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

颜水成领衔,给AI分段位!超100款多模态模型,无人达到L5

理想中的多模态大模型应该是什么样?十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集,用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足,且多数通用模型未能超越专家模型,真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报
8060 点击    2025-05-19 17:08
AI大厦需要新的地基!

AI大厦需要新的地基!

AI大厦需要新的地基!

「Scaling Law 即将撞墙。」这一论断的一大主要依据是高质量数据不够用了

来自主题: AI资讯
7089 点击    2025-05-19 14:03
我们做了个帮你深度思考的AI工具-Aletheia

我们做了个帮你深度思考的AI工具-Aletheia

我们做了个帮你深度思考的AI工具-Aletheia

现在大部分的AI工具都在推崇“一句话帮你生成xxx”,它们致力于提供快速答案、自动化任务,甚至替代人类的思考过程。然而,我们认为思考是人类最重要的权利,人类不应该把这个权利让渡给AI,因此我们开发了知己Aletheia。

来自主题: AI资讯
7995 点击    2025-05-19 10:58
史诗时刻!AlphaGo神之一手突现,谷歌AI颠覆科研极限?

史诗时刻!AlphaGo神之一手突现,谷歌AI颠覆科研极限?

史诗时刻!AlphaGo神之一手突现,谷歌AI颠覆科研极限?

太疯狂了,AlphaGo的「第37步」时刻,已经来临。谷歌的AlphaEvolve,让我们从此进入AI创造科学的时代,人类科研将彻底颠覆!背后的研究者也首次接受采访,揭秘研究过程中的一些惊人细节。

来自主题: AI资讯
8874 点击    2025-05-18 10:35
现象级刷屏!AI宝宝播客视频火爆TikTok,背后“推手”Hedra获3200万美金融资

现象级刷屏!AI宝宝播客视频火爆TikTok,背后“推手”Hedra获3200万美金融资

现象级刷屏!AI宝宝播客视频火爆TikTok,背后“推手”Hedra获3200万美金融资

AI宝宝说话视频(AI talking baby)正在席卷TikTok。最近,在X和TikTok等海外社交媒体平台上,有一个非常火爆的AI内容创作趋势,那就是AI baby podcast(AI宝宝播客)。相关视频动辄超千万播放,几十万乃至上百万的点赞,一些专门制作此类内容的账号也迅速蹿红,其中一个代表性账号“babypodcast”,13天涨粉超22万。

来自主题: AI资讯
7992 点击    2025-05-17 10:21
GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

多模态大模型(Multimodal Large Language Models, MLLM)正迅速崛起,从只能理解单一模态,到如今可以同时理解和生成图像、文本、音频甚至视频等多种模态。正因如此,在AI竞赛进入“下半场”之际(由最近的OpenAI研究员姚顺雨所引发的共识观点),设计科学的评估机制俨然成为决定胜负的核心关键。

来自主题: AI技术研报
7043 点击    2025-05-16 15:06
突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

突破300年数学难题!陶哲轩出题,DeepMind通用科学AI智能体AlphaEvolve一夜屠龙

谷歌DeepMind重磅推出AlphaEvolve,最强通用AI智能体横扫数学难题!它不仅推动了300年「接吻数难题」,一举颠覆了56年前Strassen算法神话。而且,还在AI训推、TPU设计、数据中心领域,展现出了极强的实力。

来自主题: AI技术研报
9007 点击    2025-05-15 19:58