
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
Flash Attention作者最新播客:英伟达GPU统治三年内将终结英伟达还能“猖狂”多久?——不出三年! 实现AGI需要新的架构吗?——不用,Transformer足矣! “近几年推理成本下降了100倍,未来还有望再降低10倍!” 这些“暴论”,出自Flash Attention的作者——Tri Dao。
英伟达还能“猖狂”多久?——不出三年! 实现AGI需要新的架构吗?——不用,Transformer足矣! “近几年推理成本下降了100倍,未来还有望再降低10倍!” 这些“暴论”,出自Flash Attention的作者——Tri Dao。
刚发V3.1“最终版”,DeepSeek最新模型又来了!DeepSeek-V3.2-Exp刚刚官宣上线,不仅引入了新的注意力机制——DeepSeek Sparse Attention。还开源了更高效的TileLang版本GPU算子!
AI投资热潮是否形成泡沫?作者提出一个实用框架,用五个指标(经济压力、行业压力、收入增长、估值热度、资金质量)分析当前状况,对比铁路、电信和互联网历史泡沫。结论显示AI投资尚未泡沫,属于需求驱动的繁荣,但需警惕GPU快速折旧和数据中心融资风险。未来需监控收入增长是否能持续覆盖投资。
在 2025 云栖大会前沿应用馆,最先吸引人们注意力的,可能不是某个具体的产品,而是一面面展示年轻人群像和提问的展墙,和墙前驻足的年轻人们。
「统一认知、智能执行、决策中枢、记忆进化、智能体工厂、AI治理」六大维度,让企业彻底跳出「用AI」的工具思维,成为「AI原生组织」。
就在最近,由耶鲁大学唐相儒、王昱婕,上海交通大学徐望瀚,UCLA万冠呈,牛津大学尹榛菲,Eigen AI金帝、王瀚锐等团队联合开发的Eigen-1多智能体系统实现了历史性突破
人们感到AI理解自己,因为AI提供优于人类的倾听和理性建议,如认知共情总结混乱想法或询问需求。形象如语音和触觉增强情感连接,但过度依赖AI可能加剧孤独感。心理学角度区分情绪与认知共情,未来需身体互动和共同成长建立真实关系。
今年 8 月,GPT-5 发布,其在多个任务和基准上都表现卓越,但几乎和人世间的所有事物一样,并不是所有人都满意。尤其是 GPT-5 发布后「OpenAI 移除 ChatGPT 中模型选择器」的做法更是备受诟病(尤其是移除了情感表达更佳的 GPT-4o),甚至引发了诸多用户的「网上请愿」,详见我们的报道《用户痛批 GPT-5,哭诉「还我 GPT-4o」,奥特曼妥协了》。
VLA模型通常建立在预训练视觉语言模型(VLM)之上,仅基于2D图像-文本数据训练,缺乏真实世界操作所需的3D空间理解能力。
在三维重建不断走向工程化的今天,前馈式3D Gaussian Splatting(Feed-Forward 3DGS)正火速走向产业化。 然而,现有的前馈3DGS方法主要采用“像素对齐”(pixel-aligned)策略——即将每个2D像素单独映射到一个或多个3D高斯上。
百度杀入 AI 视频生成赛道后,就一直加班加点卷个不停。 7 月初,百度第一次正式官宣蒸汽机 1.0 模型,以极致指令遵循能力惊艳亮相;8 月底,百度又发布全球首个中文音视频一体化模型百度蒸汽机 2.0,实现生成视频中人物口型、表情、动作的毫秒级同步。
2025 年 9 月 26 日,在华东师范大学数据学科建设十二周年纪念活动上,华东师范大学与奇点智能研究院正式揭牌共建“华东师范大学—奇点智能研究院开源创新与变革联合实验室”(以下简称“联合实验室”)。
最近,千寻智能的研究人员注意到,基于模仿学习的视觉运动策略中也存在类似现象,并在论文《Do You Need Proprioceptive States in Visuomotor Policies?》中对此进行了深入探讨。
当机器人成为各大科技展会最受瞩目的焦点,当具身智能论坛场场爆满、一票难求,我们不难发现:这个领域正在经历前所未有的关注热潮。
黄仁勋的2小时重磅访谈于本周发布!本次对谈信息密度格外高,黄仁勋集中表达了对英伟达近期包括对OpenAI的千亿美元投资、投资英特尔等一系列大动作的原因,对英伟达的产业角色的定位,对AI产业的发展前的前瞻,以及AI对世界经济格局的彻底重构。
作者:张小珺 2024年12月底,正在休假的汤道生,在腾讯集团总办层提出了一个建议。 过去一年,他一直在思考一个问题:AI Chatbot市场正从技术底层研究,转向前线产品用户的争夺,腾讯元宝该如何拿
AI博士就业市场呈现两极分化:顶尖人才获百万年薪,但多数普通博士面临困境。他们因论文成果不足、研究方向非热门、缺乏人脉推荐、与企业需求脱节等因素,在求职中屡屡碰壁。学术评审混乱、论文内卷、产学脱节及对行业快速迭代的焦虑,进一步加剧了普通AI博士的就业压力。
最近,X 博主 anandmaj 在一个月内复刻 Genie 3 的核心思想,开发出了 TinyWorlds,一个仅 300 万参数的世界模型,能够实时生成可玩的像素风格环境,包括 Pong、Sonic、Zelda 和 Doom。
Transformer作者Llion Jones带着自己的初创公司Sakana AI,又来搞事情了。(doge)最新推出的开源框架——ShinkaEvolve,可以让LLM在自己写代码优化自己的同时,还能同时兼顾效率,be like为进化计算装上一个“加速引擎”。
GPT-5正改写科学发现的规则!一篇重磅论文揭秘,「量子版NP难题」竟被GPT-5在30分钟之内攻克了,然而这要耗费人类1-2周的时间。照这种速度发展下去,AI离完成「诺奖级」突破真的不远了。
我用ChatGPT越来越少了,即使他有记忆的情况下,我还是非常非常的不喜欢GPT-5。 因为在很多话题的质量上,现在跟Gemini 2.5 Pro相比,几乎就是一坨。 但是作为一个自媒体博主,为了有时
我想聊个反向操作:咱们普通人,如何用有限的资源,轻松驯服一个 AI 模型,让它变成我们专属的垂直领域小能手?主角,就是最近华为刚刚开源的一个大小仅为 1B 的模型 openPangu-Embedded-1B,它不仅全面领先同规格模型,甚至与更大规模的 Qwen3-1.7B 也难分伯仲。
据多位知情人士透露,xAI不仅突然裁员,更有多位创始团队核心成员和关键高管相继离职。甚至,上任xAI的首席财务官CFO只干了3个月,选择离职走人。这场「离职潮」的背后,据称源于对公司发展方向的严重分歧、对马斯克不稳定管理风格的失望,以及对能否真正追赶上OpenAI等竞争对手的日益增长的悲观情绪。
几个月前,影石创新正式登陆科创板,成为 A 股“智能影像第一股”;近日,发布了旗下首款 AI 录音全向麦克风 Wave,“进入”拥挤的会议转录赛道。Wave 定位为“办公场景的声音枢纽”,在声音收录环节做了内外双重优化。
来自上海交通大学计算机学院、西蒙菲莎大学、清华大学、中国人民大学的合作团队,带来基于树形框架的智能表格问答系统(ST-Raptor),其不仅能精准捕捉表格中的复杂布局,还能自动生成表格操作指令,并一步步执行这些操作流程,最终准确回答用户提出的问题 —— 就像给 Excel 装上了一个会思考的 “AI 大脑”。
在一场视觉算法挑战中,一组参赛团队将道路识别模型部署至在轨卫星,完成了从图像采集、模型推理到结构化结果回传的全过程。 图像未落地,模型也并未运行在地面,所有计算任务均在轨道上完成,最终仅回传识别结果。
由华中科技大学与小米汽车提出了业内首个无需 OCC 引导的多模态的图像 - 点云联合生成框架 Genesis。该算法只需基于场景描述和布局(包括车道线和 3D 框),就可以生成逼真的图像和点云视频。
最新案例显示,由三位前OpenAI 员工于五月创立的 Applied Compute 公司,在完成上一轮估值 1 亿美元的融资仅三个月后,正以 5 亿美元估值洽谈新一轮融资。
OpenAI被曝在用户不知情下,强制将GPT-4、GPT-5等模型路由至两款低算力敏感模型「gpt-5-chat-safety」与「gpt-5-a-t-mini」,导致回复被过滤或替换,引发用户对选择权和付费权益的质疑。该现象已在社交媒体广泛验证。
「橙果视界」成立于2024年5月,是一家AI营销公司,支撑“洞察-策略-内容-运营”全链路智能协同。公司产品包括DataG、PhotoG、VoyaAI,提供从精准洞察、创意内容、社媒营销到全球化增长的AI整合营销解决方案