华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断
华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断大模型的落地能力,核心在于性能的稳定输出,而性能稳定的底层支撑,是强大的算力集群。其中,构建万卡级算力集群,已成为全球公认的顶尖技术挑战。
大模型的落地能力,核心在于性能的稳定输出,而性能稳定的底层支撑,是强大的算力集群。其中,构建万卡级算力集群,已成为全球公认的顶尖技术挑战。
近日,中国科学院计算技术研究所联合软件研究所推出「启蒙」系统,基于AI技术,实现处理器芯片软硬件各个步骤的全自动设计,达到或部分超越人类专家手工设计水平。
为什么语言模型很成功,视频模型还是那么弱?
测试时扩展(Test-Time Scaling)极大提升了大语言模型的性能,涌现出了如 OpenAI o 系列模型和 DeepSeek R1 等众多爆款。那么,什么是视觉领域的 test-time scaling?又该如何定义?
1.93bit量化之后的 DeepSeek-R1(0528),编程能力依然能超过Claude 4 Sonnet?
刚刚,理论计算机年度大奖——2025年哥德尔奖揭晓!康奈尔大学副教授Eshan Chattopadhyay与导师David Zuckerman荣获此奖。
虎嗅从多个独立信源获悉,半年前,某DeepSeek核心高管已悄然离职创业,并将于2025年圣诞节前后发布Agent产品。有信源告诉虎嗅,该高管系原DeepSeek CTO。
大模型目前的主导地位只是暂时的,在未来五年甚至十年内都不会是技术前沿。 这是新晋图灵奖得主、强化学习之父Richard Sutton对未来的最新预测。
AI大模型正在医疗服务行业中扎根。 “我们医院在科研平台上已经接入使用了DeepSeek。”北京某三甲医院相关负责人对光锥智能说道,“形式类似于AI助理,能提供科研政策问答、查询、常用文件下载等功能。”
AI越来越靠谱,“张雪峰”们急了,6月9日,全国多地结束了2025年高考,焦灼地等待高考成绩出炉的同时,不少考生和家长已经开始研究如何填报志愿。