当线性注意力学会「写入前思考」:并行化的多步记忆写入
当线性注意力学会「写入前思考」:并行化的多步记忆写入Transformer 依托强大的建模能力和 Scaling 效率在推荐领域被广泛应用于超长序列建模和生成式推荐等方向,
搜索
Transformer 依托强大的建模能力和 Scaling 效率在推荐领域被广泛应用于超长序列建模和生成式推荐等方向,
机器人视觉语言动作(Vision-Language-Action, VLA)模型越来越多地开始展示叠衣服、倒茶、做咖啡等复杂操作。但是,今天的大多数 VLA 更像 “展台机器人”。
36氪获悉,近日,AI原生生物科技公司百奥几何已完成数亿元战略融资。由上海生物医药创新转化基金、国科投资、达晨财智、星连资本联合领投,高榕资本、指数人工智能产业创新基金跟投。
6月5日,北京国家会议中心,原本能容纳上千人的会场被挤得水泄不通。
最近一个月,一个开源项目一直阴魂不散地出现在我的脑海里,每当我用AI写前端代码的时候就会自动想到它。
百亿美元,曾经是顶级独角兽的天花板,如今在火热的AI赛道,可能只是入场的起步价。
一个约 1B 参数的模型,在 MATH 上拿到 56.2,在 GSM8K 上拿到 84.5,在 ARC-Challenge 上拿到 81.9。训练成本约 1500 美元,16 块 H100 跑了不到两天。
入夏之后,我们又迎来了一年一度的深夜终极副本:关灯,躺下。三秒后,耳边准时响起:嗡——嗡嗡——嗡嗡嗡。
我们刚办完的网吧黑客松,哪都好,只有一点不好:网吧禁止未成年人入内。
近日,成立仅半年的高精度现代模拟计算芯片公司【北京安纳智芯科技有限公司】(“安纳智芯”)宣布完成新一轮数亿元融资,本轮由经纬创投领投,峰瑞资本、阿尔法公社跟投,老股东讯飞创投、中赢创投持续加码,心流资本FlowCapital担任长期财务顾问。