10% KV Cache实现无损数学推理!这个开源方法解决推理大模型「记忆过载」难题
10% KV Cache实现无损数学推理!这个开源方法解决推理大模型「记忆过载」难题推理大模型虽好,但一个简单的算数问题能推理整整三页,还都是重复的“废话”,找不到重点……
推理大模型虽好,但一个简单的算数问题能推理整整三页,还都是重复的“废话”,找不到重点……
苹果一篇论文,再遭打脸。研究员联手Claude Opus用一篇4页论文再反击,揭露实验设计漏洞,甚至指出部分测试无解却让模型「背锅」的华点。
在金融科技智能化转型进程中,大语言模型以及多模态大模型(LVLM)正成为核心技术驱动力。尽管 LVLM 展现出卓越的跨模态认知能力
本文深入剖析 MiniCPM4 采用的稀疏注意力结构 InfLLM v2。作为新一代基于 Transformer 架构的语言模型,MiniCPM4 在处理长序列时展现出令人瞩目的效率提升。传统Transformer的稠密注意力机制在面对长上下文时面临着计算开销迅速上升的趋势,这在实际应用中造成了难以逾越的性能瓶颈。
2025年,新药研发领域正迎来专属的“ChatGPT时刻”。
开发一个网站出海赚美金,是AI能带来的2025年最大的「时代红利」之一。
在过去的一段时间里,各种 AI 编程工具扎堆上线,很多人都在问一个问题:现在的 AI 真的能帮我写完一个项目了吗?
你有没有想过,计算机科学专业可能不再是通往科技行业的黄金门票了?曾经,科技公司对应届毕业生张开怀抱,现在这扇门却在逐渐关闭。
多年来,人们一直在探索人工智能(AI)如何改变我们的生活和创新方式。如今,这些假设已经成为现实。HELL Energy率先推出了完全由AI主导研发了一款真正落地的产品——一款可以触碰、感受,甚至饮用的全新能量饮料HELL AI。
最近研究 n8n , 发现各种输入、输出都用到 JSON 格式。对 AI 开发来说, 为了生成可控,也会用这种格式。
昨天最热的的两篇文章是关于多智能体系统构建的讨论。 先是 Anthropic 发布了他们在深度搜索多智能体构建过程中的一些经验,具体:包括多智能体系统的优势、架构概览、提示工程与评估、智能体的有效评估等方面。
AI从医疗工具变身为协作队友,斯坦福大学研究揭示:医生诊断准确率竟飙升10%!70名美国执业医生参与的真实测试,AI-first、AI-second与传统诊断,谁能更精准破解临床谜题?
韩国公司RBW与KLLEON合作推出偶像AI聊天应用Almigo,其付费"辣聊"功能因提供暧昧对话引发物化女性和擦边质疑。在舆论声讨艺人表态后APP迅速下架。
今天,一位研究者加入 OpenAI 的消息吸引了很多人的关注。
AI两天爆肝12年研究,精准吊打人类!多大、哈佛MIT等17家机构联手放大招,基于GPT-4.1和o3-mini,筛选文献提取数据,效率飙3000倍重塑AI科研工作流。
苹果AI,引而不发。 AI,或许是苹果现在最不想听到的词汇。 曾几何时,苹果的Siri独步全球,让全世界都意识到智能语音助手并不是“人工智障”
自Agent火了以后,有关"记忆"的框架如雨后春笋般涌现,但绝大多数仍是为"单兵作战"设计,难以适应需要复杂协作、信息交互量暴增10倍的多智能体系统(MAS)
你有没有想过,为什么有些AI产品一上线就获得用户疯狂追捧,而另一些技术看起来更先进的产品却在市场上反响平平?为什么Cursor这样的AI代码编辑器能够席卷开发者社区,而许多功能更强大的AI工具却始终无法获得用户信任?
AI 决策的可靠性与安全性是其实际部署的核心挑战。当前智能体广泛依赖复杂的机器学习模型进行决策,但由于模型缺乏透明性,其决策过程往往难以被理解与验证,尤其在关键场景中,错误决策可能带来严重后果。因此,提升模型的可解释性成为迫切需求。
只用一个模型,就能边思考边动手,涮火锅、调鸡尾酒,还能听你指挥、自己纠错 —— 未来通用机器人的关键一跃,或许已经到来。
作为一个专注用AI解决具体场景问题的自媒体小博主,每一个场景我一般都搓一个提示词出来,随着覆盖的场景越来越多,我的提示词库也变得越来越庞大。
在人工智能领域,ChatGPT 作为 OpenAI 推出的聊天机器人一直以其强大的文字生成能力受到关注。然而近期一项独特的实验显示,当 ChatGPT 与一款诞生于 1977 年(48 年前)的经典游戏机雅达利 2600(Atari 2600)对弈国际象棋时,却遭遇了意想不到的失败。
凌晨三点的 AI 实验室,键盘敲击声在空荡的房间回响。屏幕上,博士生小王、小李、小赵正疯狂调整模型参数,只为在 NeurIPS 截稿前将准确率从 98.2% 刷到 98.5%。
生成式AI提升内容效率并重塑营销洞察,但品牌本质(用户价值)不变。企业需聚焦垂直数据沉淀、AI原生工作流改造(非仅工具应用),并应对一把手认知不足及组织转型挑战
美国陆军预备役新成立部门,代号「201分队」,汇集了Meta、OpenAI等巨头高管。这些硅谷精英化身中校,每年服役120小时,致力于为美军带来技术升级、AI培训和采购建议。这不仅标志着五角大楼与硅谷的深度合作,也预示着未来战争将由算法与数据主导。
圈粉无数的Arc浏览器,在AI加持下华丽丽“变身”了——
「编程的未来是Human语言」,AI掀起编程70年来最大变革,从对话到代码,「氛围编程」与自然语言成为主角。老黄预言,AI让人人都能成为人机交互的桥梁。
短视频平台熬夜冲浪的我突然发现,AI ASMR突然火了?!
在企业系统和科学研究中普遍存在、结构复杂的关系型数据库(Relational DataBase, RDB)场景中,基础模型的探索仍处于早期阶段。
真正的智能在于理解任务的模糊与复杂,Context Scaling 是通向 AGI 的关键一步。