元脑服务器系列,由浪潮电子信息产业股份有限公司研发并推出,旨在满足人工智能等高端应用领域对高性能计算的需求。以下内容将对元脑服务器进行详细阐述:
一、发展及定位
2024年4月17日,于浪潮信息生态伙伴大会上,“元脑”品牌经历全面升级,涵盖所有计算产品,成为智算领域的核心品牌。元脑服务器作为浪潮信息针对人工智能时代所推出的旗舰产品,旨在应对日益增长的计算需求以及数据中心运维所面临的挑战,体现了浪潮信息全面进军人工智能产业的坚定意志。
二、技术特点
(1)硬件性能
计算能力强劲:以元脑服务器第八代算力平台为例,拥有23款新品,单机核心数最多到576c,主频高达5.0ghz。
内存优化:元脑服务器第八代算力平台在内存带宽及容量上全面优化,内存带宽提升高达136%。元脑R1推理服务器NF5688G7配备1128GB HBM3e高速显存,NF5868G8更是提供高达1536GB显存容量。
网络通信高效:元脑R1推理服务器NF5688G7的GPU P2P带宽达900GB/s,单台配备3200Gbps无损扩展网络。NF5868G8创新研发基于PCIe Fabric的16卡全互连拓扑,任意两卡P2P通信带宽可达128GB/s,降低通信延迟超60%。
(2)智能管理功能
内存故障预警修复:全新升级的内存故障智能预警修复技术MUPR,从单端预警升级为BIOS、BMC两级防护,可实现对内存UCE故障的精准预测和实时修复,能有效规避80%以上的内存UCE发生。
智能控温:首创服务器开机3秒智能控温技术,通过BMC Linux/RTOS异构双系统并行管理技术,实现上电即开机,开机时间缩短一半以上,噪音比优化前最大下降30.4%。
硬盘故障预测:采用AI算法技术建立硬盘的失效预测模型,累计分析超过300亿条故障特征数据,可提前14天预测风险盘,故障预测准确率超95%,误报率小于1%。
(3)软件支持
操作系统:搭载自研服务器操作系统KOS,与硬件实现协同优化,如KOS AI定制版简单2步即可实现大模型训练环境搭建。
运维管理平台:配备AIops智能运维管理平台,可实现智能均衡调度、实时精准告警等管理功能,能够在秒级内处理超大规模数据中心亿级实时并发运维管理数据。
三、产品型号
元脑R1推理服务器NF5688G7:原生搭载FP8计算引擎,提供1128GB HBM3e高速显存,显存带宽高达4.8TB/s,在推理解码阶段可实现极致加速,单机可支持20-30用户并发。
元脑R1推理服务器NF5868G8:专为大推理模型创新设计的高吞吐推理服务器,业界首次实现单机支持16张标准PCIe双宽卡,通过软硬协同优化,相较传统2机8卡PCIe机型,可将DeepSeek 671B模型推理性能提升近40%。
四、应用领域
浪潮信息依托元脑生态体系,与合作伙伴共同推进元脑服务器在金融、制造、智能制造、智慧城市等多个领域的应用,为各行各业提供高效且可靠的智能计算支持,助力企业以更低的成本探索大型模型的智能潜能,加速推动各行业的智能化转型。