Kaiyun - 中国权威官方网站

『新闻大全』

电子行业点评:384架构引领910C蓄势待发

2025-05-01  

  事件:据韶关发布4月26日消息,全球首个商用智算昇腾超节点在中国电信粤港澳大湾区(韶关)算力集群正式上线。本次昇腾超节点的商用落地,标志着国产AI算力在实际应用场景中的渗透步伐进一步加快,国产算力迎来破局元年。

  CloudMatrix384商用上线,国产算力破局元年。从发布历程来看,CloudMatrix384于今年4月10日在华为云生态大会上正式发布,在面向AI时代海量算力需求背景下,华为云实现从服务器级到矩阵级的资源供给模式转变。目前,CloudMatrix384超节点已在芜湖地区规模部署,并在实际应用中展现出强劲性能。在70亿参数规模的DeepSeek-R1模型训练中,相较于H100集群,迭代速度提升1.8倍,高横向带宽架构有效突破了算例性能与集群线性扩展的瓶颈。同时硅基流动也在同日宣布,基于CloudMatrix384超节点、曻腾云服务及高性能推理框架SiliconLLM,完成了DeepSeek-R1模型的推理上线测试效果显示,在用户保持20TPS水平下,系统推理吞吐量达到1920tokens/s有效比肩H100。同时,经过主流测试集验证及大规模线上盲测,在昇腾算力部署DeepSeek-R1的模型精度与DeepSeek官方保持一致。而在4月26日,CloudMatrix384在中国电信粤港澳大湾区(韶关)的商用落地,也标志着华为云在超节点集开云中国 Kaiyun中国官方网站群领域的重要突破。展望未来,我们认为CloudMatrix384在地方算力数据中心的商用突破有望为CSP厂商认证提供基础,同时华为云超节点加速规模化布局,整体部署增量有望持续释放。

  系统级创新的全面升级,CloudMatrix384在芯片、架构、软件生态多维提升:

  910C作为当前昇腾系列最先进的AI芯片,集成530亿晶体管,采用Davinci增强架构,集成64个AI Core,支持多单位混合精度计算。同时,910C应用3DFabric封装技术,实现Die-to-Die带宽500GB/s,显著提升芯片间互联效率,强化并行处理能力。在能效方面,910C通过三维堆叠散热设计与液冷冷却方案实现2.5kW/片的热密度,单颗功耗仅310W,相较上一代下降约40%,进一步强化高密度集群部署能力。

  完整超节点由16个机柜组成,其中12个为计算机柜,每柜配置32颗GPU,中央4个机柜部署Scale-Up交换设备。系统采用Scale Up网络通过单层架构实现GPU全互联,整体网络基于16800台模块化交换机,搭建扁平化拓扑以降低延迟。为支撑数百颗GPU的全互联能力,华为云在每颗GPU上配备7个400G光收发器,通过堆叠设计实现2800Gbit/s的Scale Up带宽。同时因采用单层扁平化拓扑,交换机端亦部署同样规模的光模块,整体形成5376个收发器用于Scale Up网络,额外1536个用于Scale Out网络,总共搭配6912个400G光收发器,有效保障了功能指标的达成。

  3)软件方面,CloudMatrix384依托910C芯片在性能优化与适配效率上实现了显著提升。系统全面升级至CANN6.0,并实现对CUDA生态的代码自动转换并兼容PyTorch等主流框架,大幅降低开发者的代码迁移成本。同时,系统适配MindSpore3.0,通过引入动态图优化与自动并行技术,模型训练效率提升30%。

  华为云在系统工程设计、光互联、网络架构及软件适配方面持续优化,使CloudMatrix384能够在超大规模集群中实现更高效的算力利用,进一步强化在全球AI基础设施竞争格局中的整体竞争力。

  CloudMatrix384集群性能全面对标NVL72。CloudMatrix384在五倍芯片堆叠配置下,在算力指标上优势明显:BF16性能达到300PFLOPS,约为GB200NVL72的1.7倍;HBM总容量达49.2TB,是GB200的3.6倍;总内存带宽达1229TB/s,为GB200的2.1倍;但在功耗上,CloudMatrix384总功率上达到559.4kW,是GB200NVL72的近四倍功耗,每FLOP计算功耗也高出2.3倍,预计将会带来更多的电力成本。能耗设计上的取舍,换来了在大规模训练及推理场景下显著的性能释放。但考虑到未来硬件和系统架构的持续升级,随着算力性能同步提升,系统能耗问题也有望逐步得到优化与改善。

  CloudMatrix384正式推出,相关供应链有望迎来新一轮放量。液冷方面

  集群密度大幅提升将带来更高的热管理需求,英维克、申菱环境作为华为液冷系统核心供应商,有望受益份额提升;电源方面,384颗910C芯片集中部署带动整体功耗上升,泰嘉股份、欧陆通等电源供应链企业预计将获得持续增量;芯片领域,超节点有望在多地超算中心落地部署,将带动中芯国际等核心晶圆代工厂商需求增长;在高速连接器方面,随着超节点规模化落地,相关需求有望快速增长,预计华丰科技等核心供应商有望在需求增长中收益;PCB/CCL方面,深南电路、南亚新材、生益科技作为华为重点供应商,有望随超节点建设获得新一轮订单需求;同时,在多相控制器领域,杰华特也有望在新一轮高性能AI集群建设中实现价值量提升。

  投资建议:随着超节点未来有望持续规模化部署,相关产业链的需求有望同步放大,建议关注:1)算力芯片:中芯国际;2)电源:泰嘉股份、欧陆通;3温控:申菱环境、英维克;4)其他供应链:华丰科技、杰华特、深南电路、南亚新材、生益科技等

上一篇:展览3D设计需要帮助参展企业解决的五大问题---模大狮模型网
上一篇:3D打印人形机器人将量产?背后供应商铂力特却“增收不增利”

猜你喜欢

  • 2024广交会丨Style3D与合作企业再度受央视关注!

    2024广交会丨Style3D与合作企业再度受央视关注!

      kaiyun中国网站10月15日至11月4日,第136届广交会在广州分举办,以“服务高质量发展,推进高水平开放”为主题,展览总面积155万平方米,展位总数7.4万个,设55个展区、171个专区。分别聚焦“先进制造”“品质家具”“美好生活”题材,展出数以百万计的产品,有力地促进了中国与世界各国各地区地贸易交流和友好往...
  • Adobe推出Substance 3D iewer:从文本快

    Adobe推出Substance 3D iewer:从文本快

      Substance 3D iewer为用户提供了一系列强大的功能,显著提升了操作的灵活性与简便性。用户可以通过将3D模型直接拖放到Photoshop中,实现对模型的实时编辑。模型在Photoshop中会以智能对象形式展现,用户随时可以在Substance 3D iewer中调整位置、大小及灯光效果,这种高度的互动性...
  • 华硕X870X870E主板尽释9800X3D处理器威力

    华硕X870X870E主板尽释9800X3D处理器威力

      要说最近装机圈里最火的处理器,非AMD锐龙7 9800X3D莫属。这款处理器采用8核心16线MB三级缓存,并支持完全超频。如此出众的性能,使其成为当下最强的游戏处理器,自发售起便备受关注,当下更是供不应求。想要充分释放锐龙7 9800X3D处理器的潜力,强力主板的加持不可或缺。推荐三款华硕X870主板,分别是吹雪家...
  • 杭州矩体取得用于积木设计的 3D 内容自动生成方法专利

    杭州矩体取得用于积木设计的 3D 内容自动生成方法专利

      金融界 2025 年 1 月 7 日消息,国家知识产权局信息显示,杭州矩体科技有限公司取得一项名为“用于积木设计的 3D 内容自动生成方法、装置和电子设备”的专利,授权公告号 CN 118314288 B,申请日期为 2024 年 5 月。  天眼查资料显示,杭州矩体科技有限公司,成立于2023年,位于杭州市,是一...
微信

手机扫一扫添加微信