9月18日,华为副董事长、轮值董事长徐直军宣布推出两款基于灵衢的超节点集群Atlas950SuperCluster和Atlas960SuperCluster,算力规模分别超过50万卡和达到百万卡
浏览次数: 发布时间:2025-09-19 00:00:00

这一消息不仅是一次产品发布,更像是一场对未来计算生态的公开宣言。灵衢,作为华为自研的分布式高效算力底座,承载着从数据吞吐到大规模模型训练的全栈能力。Atlas系列在此基础上,打通了芯片、服务器、互连和软件的完整闭环,使一个个看似宏大的算力目标,能够在现实世界的时间线内落地。

在全球AI风口的背景下,大模型的训练成本、扩容难度与能效问题始终是企业关切的核心。Atlas950与Atlas960的核心创新,源于对灵衢底座的深度定制化:高密度节点、统一的资源调度、以及跨区域协同的数据一致性保障。每一个节点都具备独立的计算、显存与网络能力,节点之间通过高带宽、低时延的互连实现协同执行。

灵衢的智能调度能够在数万级别的任务队列中,自动识别数据依赖、模型并行和流水线的最优组合,显著缩短训练时间窗,同时降低资源空转和热沉耗费。

Atlas950的定位,是为中大型模型训练、复杂多任务并行推理提供稳定、灵活的算力来源。它在设计时就考虑了企业级运维和合规要求:统一的监控平台、分层权限管理、端到端的数据加密,以及容灾和自愈机制,确保无论是跨数据中心的灾备,还是边缘到云的分布式部署,都能以极高的可用性运行。

Atlas960则把规模进一步扩展,面向百万级别的训练、超大规模的仿真与数据分析场景。它不仅只是把节点堆砌起来,更是在软件调度、网络互联、存储带宽之间建立了新的同步机制,使海量模型与数据的切换、切块、重分布变得比以往更平滑。

在能效方面,华为把节能设计贯穿在每一个层级。灵衢平台通过动态功率管理、热设计优化和能耗感知的资源分配,使单位算力的能耗显著下降。对于企业来说,这意味着在同样的运维投入下,可以获得更高的计算产出,减少碳排放,符合日益严格的企业社会责任和行业合规要求。

Atlas的自愈与冗余设计,让系统在面对单点故障、网络抖动或任务中断时,能够尽快恢复到正常运行状态,极大降低了停机风险。

从用户视角出发,Atlas950/960将训练、推理与数据治理结合在同一平台上。通过统一的编排与接口,开发者可以在不再为底层细节烦恼的情况下,将算法从研究阶段迁移到生产环境。企业的模型管理、数据版本控制、访问控制和审计日志,能够在同一套工具链中完成,极大提高工作效率和合规性。

无论是银行、电信、制造还是科研机构,都可以以较短的时间窗口完成原型验证、模型调优与上线运行。这就是新一代超节点集群带来的“从零到一”的速度体验。

Atlas950与Atlas960的推出,标志着基于灵衢的超节点集群已经从实验阶段走入规模化生产阶段。它们改变的,不只是算力的数字,更是企业对算力投资回报的认知。随着更多行业应用的落地,灵衢生态正在逐步形成自我增强的循环:更强的算力带来更丰富的应用场景,更多的应用场景又会促进口碑与生态的扩展。

站在这条新征途的起点,华为将继续以开放、协同、可持续的姿态,推动行业把AI的潜力转化为现实的生产力。第二章生态落地与价值放大在落地层面,Atlas950/960提供了从私有云到公有云、再到边缘的全栈部署方案。华为基于灵衢的统一软件栈,支持容器化部署、Kubernetes原生编排和分布式训练框架的无缝对接。

无论企业在自建数据中心还是在云上托管,Atlas的网络互联、存储抽象和任务调度都能够保持一致性,使运维与运作成本显著降低。系统的可观测性也被放在前台,统一的仪表盘将算力利用率、任务吞吐、网络延迟和能耗数据以图形化方式呈现,帮助运维团队在复杂的分布式环境中快速定位瓶颈并做出优化选择。

安全与治理,Atlas950/960具备端到端加密、密钥管理、访问控制、审计日志,以及对关键数据的分级保护。结合华为在网络安全、数据隐私方面的长期积累,企业可以在合规框架下加速应用的落地。对跨区域部署的场景,数据主权、访问控制和合规审计将通过一体化策略进行统一管理,减少重复合规工作量,提升企业对外部监管环境的适应能力。

客户价值导向的案例映射,金融风控仿真、智能制造的数字孪生、药物发现的分布式训练、城市级智能感知等场景正成为Atlas950/960的“落地日常”。在金融领域,海量交易数据的并行分析和复杂场景的风险建模可以在更短时间内完成迭代,帮助机构提升风控的前瞻性与稳健性。

在制造与能源领域,数字孪生与仿真训练将驱动生产线的预测性维护和产线智能优化,降低停机成本与能耗。科研机构则能够以往需要数月甚至数年的算力资源,现在通过Atlas平台在数日内完成原型验证和参数探索,缩短创新周期。

生态与伙伴方面,华为正在推动一个开放而协同的生态体系。与多家系统集成商、云服务商、行业应用开发者建立长期合作,提供算力即服务的定价模型、可重复使用的训练模板和行业组件。通过标准化的接口和丰富的开发者工具,第三方应用可以更快地接入Atlas平台,形成从培训、推理到数据治理的端到端解决方案。

对于硬件制造商、算法公司和行业解决方案提供商而言,灵衢生态不仅是一个算力平台,更是一个推动创新与商业模式共创的舞台。

如何上手,是企业最关心的问题。一个简化的落地路径通常包含需求对齐、平台试点、扩容评估、全面上线和运维优化五个阶段。明确模型规模、数据规模、并发请求与时延目标;在一个封闭的试点环境中验证软硬件协同与数据管线的稳定性;接着,根据业务增长和模型迭代速度进行容量规划和成本评估;随后快速扩展到生产环境,建立容灾、备份与数据治理策略;以持续的监控、自动化运维与性能调优来实现长期稳定运行。

华为方面将提供专业的技术培训、运维工具和现场支持,确保客户在最短时间内获得可观的投资回报。

展望未来,灵衢生态将持续扩张,更多行业解决方案将以Atlas为底座,以数据驱动的新商业模式在云端与边缘之间无缝衔接。随着算力需求进一步跃升,Atlas950/960还将不断迭代,结合新一代存储、网络技术和AI框架优化,提供更高的吞吐、更低的延迟和更强的自愈能力。

对于希望在下一轮AI浪潮中抢占先机的企业与机构,Atlas系列不仅是一个高性能的计算平台,更是一条可持续的价值链,帮助组织在算法创新、业务落地与生态协同中实现三赢。

如果您正在寻求一次真正规模化的AI算力跃迁,Atlas系列将是一个重要的选择。华为诚邀企业客户、科研机构及产业伙伴,参与到灵衢生态的试点与共创计划中,了解更多请联系华为企业服务团队,获取演示、白皮书与定制化路线图。未来已到来,选择Atlas,就是选择一次更高效、可持续的生产力升级之旅。

服务热线
020-83460728