
人工智能(AI)正迈入产业规模化应用的关键阶段。作为连接基础算力、模型与应用落地的核心枢纽,AI计算框架的重要性愈发凸显。与此同时,随着超节点、智能体协同等新趋势不断涌现,AI框架也面临全新的技术挑战。
近日,在以“?N思MindSpore——为超节点而生的AI框架”为主题的?N思人工智能框架峰会上,华为中央软件院总裁谢桂磊说,?N思MindSpore聚焦超节点技术创新,打造?N思HyperParallel架构,以模型结构和训推范式创新,引领AI框架迈入“超节点时代”。
加速模型训推范式创新
随着大模型技术的快速演进,模型规模向长序列和稀疏的十万亿级发展,模型结构趋于非规则化,训推范式走向异构化。这为AI框架带来新的机遇和挑战。
谢桂磊介绍,在硬件层面,基于高速互联的超节点已经成为重要AI算力基础设施。在软件层面,如何降低集群,尤其是超节点的使用门槛,充分调度硬件资源、释放算力潜能,已成为框架技术发展的核心要素。
在模型层面,大模型的规模定律仍在持续演进,模型正不断融合视觉、听觉、文本等多元信息,构建更加立体、丰富的智能世界。这对AI计算框架在全模态模型的复杂算子加速、多节点训练精度与效率优化等方面,提出更高要求。
在应用技术层面,智能体已经进入规模化产业落地阶段。AI正从以单一对话解决问题的工具,升级为具备思考、规划、执行和反馈闭环能力的人工智能体。这对AI框架提出了新的挑战,包括如何结合强化学习和后训练技术,增强长思维链构建与工具调度能力,优化多模型与工具的协同,推动智能体在更多行业实现更广泛、深入的应用。围绕上述趋势与挑战,?N思MindSpore持续打造超节点亲和、全场景融合、架构开放、敏捷使能的AI框架。“?N思在设计之初,就与超节点硬件进行了深度协同设计,总体目标就是把超节点当作一台‘超级计算机’,进行统一编程和调度。”?N思Mindspore社区技术委员会主席金雪锋介绍。
具体来看,?N思HyperParallel架构充分发挥超节点优势,实现HyperOffload多级智能卸载、HyperMPMD异构非规则并行、HyperShard声明式并行编程等关键能力,加速Agentic AI(代理式人工智能)、全模态等新模型结构与训推范式创新。简单来说,?N思HyperParallel架构能够让AI模型在超大规模计算集群上“跑得动、跑得快、跑得省”。
其中,HyperOffload犹如“超能仓库”,通过实现计算与状态的解耦,利用超节点池化存储能力,有效缓解模型规模扩张带来的高带宽存储器存储瓶颈,使训练性能提升超20%,推理序列长度提升超70%;HyperMPMD发挥超节点对等计算架构优势,实现细粒度并行切分与通算并发,如同把一条复杂生产线拆成很多条灵活的小流水线同时开工,为强化学习、全模态提供灵活并行能力,将算力利用率提升超过15%;HyperShard屏蔽超节点集群拓扑的复杂性,为全模态等模型提供极简组合编程体验,使新算法并行化改造时间少于1天,并行策略调优从天级压缩到小时级。
助推千行百业智能转型
2020年3月28日,华为正式开源?N思MindSpore AI框架,迅速获得国内外开发者的积极响应。
目前,?N思MindSpore下载量已超过1300万,覆盖全球156个国家和地区,代码合入请求超过12万次,社区贡献者超过5.2万人。?N思已成为最具创新活力的AI开源社区之一。
“?N思坚持开放治理,践行共建、共治、共享理念,积极融入业界生态,持续为开发者带来更优体验。”?N思MindSpore开源社区理事长丁诚说,从入门级到专业级、科研级,不同层级的开发者正借助?N思实现更高效率的创新。
大飞机被誉为“工业皇冠上的明珠”,空气动力设计是大飞机设计的核心环节。中国工程院院士、中国商飞首席科学家吴光辉介绍,中国商飞上海飞机设计研究院基于?N思MindSpore框架持续创新,推出业界首个民机超临界翼型气动设计智能体——“御风·智翼”,构建基于工程经验的超临界翼型智能一站式解决方案。
“传统飞机设计流程环节多、周期长。过去设计一种新的翼型,需要经历复杂而耗时的计算过程。现在,在新的智能体体系下,气动设计师只需输入翼型几何外形需求,描述期望的几何特征,智能体即可实时生成设计方案,并通过优化模块实现自主优化。”吴光辉解释,在这一过程中,AI承担了建模、仿真、数字筛选等大量重复性工作,并支持通过自然语言对话的方式完成操作。设计师与智能体的协同发力,实现了设计效率和设计质量的双重提升,重塑了民用飞机气动设计范式。
“过去几年,?N思已与多个领域的科学家团队开展合作,在流体力学、电子仿真、分子模拟等领域,通过AI手段解决传统计算问题。未来,我们还将进一步结合智能体技术,与业界共同探索AI for Science的更多可能性。”谢桂磊说,?N思Mindspore将在技术创新和生态拓展方面继续努力,以更前沿的技术、更易用的体验和更开放的社区,满足行业智能化转型需求。
在硬件层面,?N思Mindspore将持续围绕超节点推进软硬件深度协同,打造更加具备硬件亲和性的?N思框架,通过创新的分布式编程和运行范式,进一步降低超节点使用门槛,充分释放大规模集群的算力效能,更好地面向全模态模型、智能体、强化学习等核心场景,提供更完善的并行加速能力。围绕全场景应用,?N思Mindspore将持续构建端—边—云协同的AI框架,既支持数万卡规模的训练,也覆盖耳机、手表等终端设备的训推能力,进一步降低AI应用门槛。在生态建设方面,?N思Mindspore将提供架构灵活、组件化、可复用的AI框架,与社区、生态伙伴共享在超节点、全模态智能体等方面的最新技术进展。