AI服务器场景
一、方案背景
科技自立自强战略:国家将科技创新作为发展的核心驱动力,要求突破关键核心技术"卡脖子"问题。
信创产业发展:信息技术应用创新产业上升为国家战略,要求实现从芯片、操作系统到应用软件的全栈自主可控。
数字经济发展:数字经济成为经济增长新引擎,2025年数字经济占GDP比重将超过50%,需要强大的数字基础设施支撑。
数据要素市场化:数据被列为第五大生产要素,数据安全与高效流通需要自主可控的技术底座。
当前,我国正处于科技强国建设与产业转型升级的关键阶段,国家战略导向、产业发展需求与数字经济浪潮多重因素叠加,对信息技术领域的自主可控、安全高效提出了更高要求,为相关方案的落地实施提供了核心背景支撑。
本解决方案基于全栈国产化、多技术融合、异构算力协同三大核心优势,为企业提供:安全可靠的国产化技术底座、高效灵活的一站式AI与大数据平台、快速落地的行业场景解决方案、持续演进的技术生态支持。通过该方案,企业能够在确保技术自主可控的前提下,快速构建智能化能力,加速数字化转型进程。
二、方案架构

三、异构计算大数据与 AI 融合平台架构对应适用场景
核心优势 | 具体说明 | 对应适用场景 |
全栈国产化适配,自主可控 | 1. 底层硬件基于海光 CPU、DCU 构建,摆脱对国外芯片依赖2. 兼容国产容器运行时、国产分布式存储插件3. AI 框架(PyTorch/TensorFlow)深度适配 DCU 算力 | 政务数据处理、金融核心业务建模、国防科研等对自主可控性要求高的领域 |
多调度器联邦协同,资源利用率最大化 | 1. 整合 Kubernetes(容器)、Slurm(HPC)、YARN(大数据)三大调度器2. 调度器适配器实现全局资源统一分配、任务优先级协调3. 打破资源孤岛,避免部分集群闲置、部分集群过载 | 企业混合负载场景:同时运行大数据批处理、AI 模型训练、科学计算仿真的综合算力中心 |
多计算场景融合,一站式技术栈 | 1. 覆盖大数据引擎(Spark/Flink)、AI 框架(PyTorch/PaddlePaddle)、科学计算库(MPI/OpenMP)2. 上层应用层提供统一门户,无需切换多个平台 | . 智慧医疗:患者数据清洗(大数据)+ 疾病预测模型训练(AI)2. 气象预测:气象数据处理(大数据)+ 气候模拟计算(HPC) |
异构算力高效协同,性能针对性优化 | 1. 海光 CPU 集群支撑通用计算、数据预处理;DCU 集群专攻 AI 训练 / 推理、高性能计算2. 高速网络(InfiniBand/RoCE)保障节点间低延迟通信3. Spark/Flink 经海光优化,提升大数据任务运行效率 | 1. 大模型训练:千亿级参数模型的分布式训练(依赖 DCU 集群并行算力)2. 实时流数据处理:电商实时推荐、金融风控(依赖优化后 Flink 引擎 + 高速网络) |
容器化运行时,部署灵活高效 | 1. 支持 Docker/Containerd 及国产容器运行时,实现任务隔离部署2. 存储插件(CSI)打通容器与分布式存储,数据读写灵活3. 任务秒级启停,资源弹性伸缩 | 1. AI 模型推理服务:按需弹性扩容,应对流量高峰2. 数据科学实验:快速搭建、销毁实验环境,降低资源占用 |
四、解决的核心痛点
算力依赖问题:摆脱对国外AI芯片的绝对依赖
数据孤岛问题:统一管理和处理海量多源异构数据
研发效率问题:简化从数据到AI模型到服务的全流程
运维复杂度问题:云原生统一纳管异构资源和多样工作负载
构建一个 "数据-智能-服务"一体化的国产化异构计算平台,实现从底层硬件到上层应用的全栈可控,支撑企业数字化转型和智能化升级。