
国产类脑大模型适配国产沐曦GPU!长序列推理提速超百倍,仅用2%数据匹敌主流模型
国产类脑大模型适配国产沐曦GPU!长序列推理提速超百倍,仅用2%数据匹敌主流模型超长序列推理时的巨大开销如何降低?
超长序列推理时的巨大开销如何降低?
在检索增强生成(RAG)飞速发展的当下,研究者们面临的最大困境并非「生成」,而是「稳定」。
最近我遇到一个甜蜜的烦恼,就是越来越忙了。
LRM通过简单却有效的RLVR范式,培养了强大的CoT推理能力,但伴随而来的冗长的输出内容,不仅显著增加推理开销,还会影响服务的吞吐量,这种消磨用户耐心的现象被称为“过度思考”问题。
昨天,有消息称,OpenAI 著名研究者、清华校友、著名博客《AI 下半场》的作者姚顺雨已经加入了腾讯混元大模型团队,并且还传言说他将在这里组建一支自己领导的研究团队。
幻觉并非什么神秘现象,而是现代语言模型训练和评估方式下必然的统计结果。它是一种无意的、因不确定而产生的错误。根据OpenAI9月4号论文的证明,模型产生幻觉(Hallucination),是一种系统性缺陷。
唱衰人工智能不会带来更好的明天 —— 构建于人工智能之上的未来世界既非乌托邦,也非反乌托邦,而是充满无限奇幻可能的。
又有一批AI玩具牌桌上的玩家拿到钱了。
训练、推理性价比创新高。 大语言模型(LLM),正在进入 Next Level。 周五凌晨,阿里通义团队正式发布、开源了下一代基础模型架构 Qwen3-Next。总参数 80B 的模型仅激活 3B ,性能就可媲美千问 3 旗舰版 235B 模型,也超越了 Gemini-2.5-Flash-Thinking,实现了模型计算效率的重大突破。
2025年4月,OpenAI研究员姚顺雨发布了一篇有名的博文《The Second Half》,宣告AI主线程的游戏已进入下半场。这之后,我们与他进行了一场播客对谈。姚顺雨毕业于清华和普林斯顿大学,博士期间意识到语言是人类发明的最重要的工具,也是最有可能构建通用系统的,于是转向Language Agent研究,至今已6年。
Thinking Machines Lab成立7个月,估值120亿美元,首次公开研究成果:LLM每次回答不一样的真凶——kernel缺乏批处理不变性。Lilian Weng更是爆猛料:首代旗舰叫 Connection Machine,还有更多在路上。
Kimi开源又双叒放大招了!
柏林AI 游戏初创公司 Born 的联合创始人兼 CEO Fabian Kamberi 认为,目前市场上的 AI 伴侣产品本质上具有剥削性,其设计旨在通过用户与 AI 聊天机器人之间的一对一关系来孤立用户。
想象一下,如果 ChatGPT 等 AI 大模型在生成的时候,能把自己不确定的地方都标记出来,你会不会对它们生成的答案放心很多?
大语言模型的局限在哪里?
AI 开发复杂软件的时代即将到来?
在刚刚落幕不久的威尼斯电影节上,导演吉尔莫·德尔·托罗带来了他的最新作品《弗兰肯斯坦》。记者们都很关⼼⼀个“赛博朋克”的问题:这部关于⼈造⽣命失控的电影,是否在隐喻AI?
单台 8 卡 A800 仅需 8 秒即可生成 5 秒视频。
真是谁也没想到……
强化学习之父、2024 年 ACM 图灵奖得主 Richard Sutton 曾指出,人工智能正在迈入「经验时代」—— 在这个时代,真正的智能不再仅仅依赖大量标注数据的监督学习,而是来源于在真实环境中主动探索、不断积累经验的能力。
你的下一个Office,不一定要是Office。
刚刚,0产出估值就已冲破120亿美元的Thinking Machines,终于发布首篇研究博客。
我们今天正式开源 jina-code-embeddings,一套全新的代码向量模型。包含 0.5B 和 1.5B 两种参数规模,并同步推出了 1-4 bit 的 GGUF 量化版本,方便在各类端侧硬件上部署。
当地时间周二,德国汽车制造商大众汽车表示,公司将在2030年前向人工智能(AI)领域投入高达10亿欧元(约合12亿美元)的资金,并将这项技术全面融入业务各个环节,以期撬动数十亿欧元的成本节约。
作为一名有着8年全栈开发经验的技术人员,我最近接手了一个具有挑战性的项目:为某中型服装电商平台开发一套智能商品推荐系统。该系统需要在2个月内完成,包含以下核心功能:
昨天,英伟达重磅发布了专为海量上下文AI打造的CUDA GPU——Rubin CPX,将大模型一次性推理带入「百万Token时代」。NVIDIA创始人兼CEO黄仁勋表示,Vera Rubin平台将再次推动AI计算的前沿,不仅带来下一代Rubin GPU,也将开创一个CPX的全新处理器类别。
你有没有想过,为什么我们明明已经进入AI时代,但大部分客服体验依然糟糕透顶?为什么那些号称"智能"的聊天机器人总是让人更加恼火,只会重复FAQ里的标准答案,却永远无法真正解决你的实际问题?
Meta 已签署一份价值超 1 亿美元的多年度合同,将使用 AI 图像初创公司 Black Forest Labs 的技术,这是这家社交媒体公司为扩展人工智能服务的最新投资。
大模型在科研领域越来越高效了。
从「能用」到「好用」。