
Flash Attention作者最新播客:英伟达GPU统治三年内将终结
Flash Attention作者最新播客:英伟达GPU统治三年内将终结英伟达还能“猖狂”多久?——不出三年! 实现AGI需要新的架构吗?——不用,Transformer足矣! “近几年推理成本下降了100倍,未来还有望再降低10倍!” 这些“暴论”,出自Flash Attention的作者——Tri Dao。
英伟达还能“猖狂”多久?——不出三年! 实现AGI需要新的架构吗?——不用,Transformer足矣! “近几年推理成本下降了100倍,未来还有望再降低10倍!” 这些“暴论”,出自Flash Attention的作者——Tri Dao。
在一场视觉算法挑战中,一组参赛团队将道路识别模型部署至在轨卫星,完成了从图像采集、模型推理到结构化结果回传的全过程。 图像未落地,模型也并未运行在地面,所有计算任务均在轨道上完成,最终仅回传识别结果。
云栖大会上,阿里宣布AI平台将把完整的英伟达Physical AI(物理AI)软件栈纳入其开发者选项菜单。这个看似技术性的宣布,实际上标志着人工智能发展的一个重要转折点。英伟达CEO黄仁勋在2025年CES大会上明确表示:AI下一个前沿就是物理AI,蕴藏着巨大的潜力和机遇。
第四届琶洲算法大赛中,一道特殊的题目格外引人注目:选手参赛提交的算法,被送上太空,完成整个推理过程。它不是全场最吸睛的议题,却很有可能成为今年AI产业商业化过程中最具标志性的一个瞬间。这场被称为「慧行·AI上星」的实验,背后是国星宇航与佳都科技的联手推动。
刚刚完成1300万美元种子轮融资的Runware,正在用一种完全不同的方式重新定义AI基础设施。他们不依赖现成的云服务提供商,而是从零开始构建了自己的硬件和软件栈,创造出了所谓的"Sonic推理引擎"。这种垂直整合的方法让他们能够将AI推理成本降低高达90%,同时通过单一API提供对超过40万个AI模型的访问。
9月24日,在杭州召开的云栖大会上,阿里巴巴集团CEO、阿里云智能集团董事长兼CEO吴泳铭发表主旨演讲,他认为实现通用人工智能AGI已是确定性事件,但这只是起点,终极目标是发展出能自我迭代、全面超越人类的超级人工智能ASI。
美国七巨头AI基建支出掀狂潮:经济提振了,大批人失业了。
刚入股了“老对手”英特尔,老黄又豪掷9亿美刀,拿下一家AI Infra公司……的CEO和技术授权。最新消息,AI Infra初创公司Enfabrica的核心团队和技术授权,已经被英伟达打包带走。
特朗普在英国国事访问期间与查尔斯三世共进国宴,黄仁勋、奥特曼等科技巨头齐聚。英美双方签署《科技繁荣协议》,英国版聚焦AI、量子、核能、6G、医疗等前沿领域合作,同时打造英国版「星际之门」数据中心。
刚刚,芯片圈大地震,英伟达将斥资50亿美元入股英特尔,一举成为大股东!英伟达出钱,英特尔出力!英特尔将为英伟达定制AI数据中心所需的x86 CPU,未来还将推出集成英伟达GPU的系统级芯片。