对标英伟达!华为重磅发布AI突破性技术,算力利用率提升至70%
软件定义算力,华为正试图通过一场技术革命,打破英伟达在AI算力领域的硬件霸权。
华为将于11月21日发布一项AI领域的突破性技术,旨在解决当前业界普遍存在的算力资源利用效率低下的难题。
这项技术是华为“以软件补硬件”战略思路的最新实践,它能够将GPU、NPU等算力资源的利用率从行业平均的30%-40%大幅提升至70%,显著释放算力硬件潜能。
通过软件创新实现英伟达、昇腾及其他三方算力的统一资源管理与利用,屏蔽算力硬件差异,为AI训练推理提供更高效的资源支撑。
01 突破算力效率瓶颈
在当前AI浪潮中,算力已成为驱动模型训练与应用落地的核心资源。然而,业界一直面临着一个棘手问题:全球AI算力资源的平均利用率仅为30%-40%。
这意味着大部分昂贵的AI硬件资源实际上处于闲置或低效运行状态。
华为此次即将发布的技术,正是瞄准了这一行业痛点。通过软件层面的深度优化,实现硬件利用率的质的飞跃,从本质上提升现有算力基础设施的性能输出。
在先进制程面临外部挑战的背景下,华为持续在软件创新上发力,贯彻“以系统补单点”、“以软件补硬体”的策略来弥补芯片领域的不足。
02 技术定位与对标
值得注意的是,华为此次即将发布的技术与英伟达在2024年底以7亿美元收购的以色列AI初创公司Run:ai有着共同的技术路线。
Run:ai的核心价值在于通过动态调度、池化和分片等技术,优化GPU运算资源,提升深度学习任务的效率。
华为的新软件平台目标正是实现跨硬体的统一资源管理与利用,屏蔽算力硬体的差异性。
这一技术将实现对英伟达GPU、华为昇腾芯片及其他第三方算力的统一调度,为用户提供无缝且高效率的运算环境。
03 华为的软件定义算力战略
华为这一技术突破并非孤立事件,而是其长期坚持的“软件定义算力”战略的延续。
早在揭秘超大规模MoE模型推理部署技术时,华为就提出了 “数学补物理” 的创新思路。
这种思路通过数学理论、工具、算法和建模等方式,来弥补硬件和工艺的局限性,最大化发挥芯片和系统能力。
华为轮值董事长孟晚舟在2025年新年致辞中曾提到,华为十多个实验室与伙伴工程师组成“大杂烩”团队。
创造性应用“数学补物理、非摩尔补摩尔、系统补单点”等思想,在散热、供电、高速、高密及大芯片在板可靠性等工程领域突破极限。
04 已有实践成果支撑
华为在AI算力优化领域已积累了丰富的实战经验。
近期,华为联合硅基流动发布的论文《在华为CloudMatrix384上提供大语言模型》显示,在DeepSeek-R1模型的评估中,应用于华为AI超级节点CloudMatrix384的昇腾910C NPU可实现赶超英伟达H800 GPU的计算效率。
华为的CloudMatrix384超级节点集成384颗昇腾910C NPU和192个鲲鹏CPU,通过超高带宽、低延迟的统一总线网络互连,从而有效解决传统数据中心架构中常见的可扩展性和效率挑战。
基于这一架构,华为推出的CloudMatrix-Infer服务在预填充阶段为每颗NPU提供6688 tokens/s吞吐。
在解码期间为每颗NPU提供1943 tokens/s吞吐,同时始终保持每个输出token低于50ms的低延迟。
对应的预填充阶段计算效率达4.45 tokens/s/TFLOPS,解码阶段1.29 tokens/s/TFLOPS,这超过了NVIDIA H100上的SGLang和H800上的DeepSeek等领先框架的公布效率。
05 生态建设与开源计划
在生态建设方面,华为一直坚定推进开源战略。
在超大规模MoE模型推理技术优化中,华为不仅通过技术报告分享昇腾在超大规模MoE模型的推理部署技术,还在近一个月的时间内,将核心技术的相关代码陆续开源。
华为计划于2025年9月正式开源UCM(推理记忆数据管理器),这是一款以KV Cache为中心的推理加速套件,届时将在魔擎社区首发。
这种开源共享的姿态,旨在激活本土AI生态的协同创新活力,让所有愿意尝试使用昇腾能力的专家有信心长期投入,让所有积极参与贡献的开发者有信心持续耕耘。
06 产业影响与展望
华为此次技术的发布,将对国内AI产业产生深远影响。
随着特朗普政府启动对半导体和半导体生产设备征收关税的相关调查,一直支撑半导体产业的国际分工体系正迎来转折点。
在这一背景下,国内云服务企业正加快采用国产化算力解决方案的步伐。
华为昇腾系列芯片凭借其稳定的技术表现和良好的生态适配性,逐渐成为主流选择之一。
其中,昇腾910C作为昇腾910B的升级型号,采用双芯片封装架构,已在近期实现批量生产,并率先在多个大规模人工智能项目中完成部署,成为首款在国内AI领域实现广泛落地的国产高性能AI芯片。
华为这项技术的推出,将重塑AI算力竞争格局。当业界还在追逐更高性能的硬件时,华为选择了一条通过软件优化释放硬件潜能的差异化路径。
随着21日技术细节的正式公布,中国AI产业有望在算力利用效率上迈上一个全新台阶,为在大模型时代赢得更大发展空间。
|
|