
国内首次!8.9毫秒推理速度破纪录,1元打穿百万token
国内首次!8.9毫秒推理速度破纪录,1元打穿百万token当所有人还在为参数内卷时,智能体真正的决胜点已经转向了速度与成本。浪潮信息用两款AI服务器直接给出了答案:一个将token生成速度干到10毫秒以内,一个把每百万token成本打到1元时代。
当所有人还在为参数内卷时,智能体真正的决胜点已经转向了速度与成本。浪潮信息用两款AI服务器直接给出了答案:一个将token生成速度干到10毫秒以内,一个把每百万token成本打到1元时代。
2025年3月25日,美国商务部工业与安全局(BIS)将来自中国、阿联酋、南非等地的80家企业列入实体清单,其中中国企业占54家。此次措施的核心目标是限制中国在高性能计算、量子技术及超算领域的技术进展,尤其是针对中国的军事应用。
马斯克建超算速度,被中国这家公司用120天复刻了。119个集装箱,像搭积木一样拼出一座算力工厂。这不是科幻电影,而是浪潮信息交付的惊艳答卷。一个全新的AI时代,正在这里拉开序幕。
日前,MLCommons协会发布最新MLPerf™ Storage v1.0 AI存储基准测试成绩。浪潮信息分布式存储平台AS13000G7表现出众,在3D-UNet和CosmoFlow两个模型共计8项测试中,斩获5项性能全球第一。
百模大战愈演愈烈,各大厂商卷出了不同形态: 有的大秀肌肉,在文本长度上一骑绝尘;有的与搜索等功能深度融合,成为了全能型AI助手……琳琅满目的大模型产品令人目不暇接。
相比GPT-3,GPT-4 (包括GPT-3.5) 的能力有了非常巨大的进步。这背后其实得益于一个很重要的过程引入:微调。
开源大模型这个圈子,真是卷到不行——国内最新纪录来了,直奔千亿量级,达到1026亿。千亿参数、全面开源、无需授权可商用,GitHub均可全面下载使用,就问你激动不激动!
浪潮信息发布源2.0基础大模型,并一口气开源了1026亿、518亿、21亿三个大模型!而在编程、推理、逻辑这些老大难问题上,源2.0都表现出了令人印象深刻的性能。