6月15日,中科曙光正式发布新一代通用计算平台。据官方介绍,该平台以国产百核级通用CPU为核心,通过计算、存储与网络的全栈协同优化,整体规格首次达到国际厂商旗舰级水平。
中科曙光方面表示,当前全球算力产业的关注点虽高度集中于AI训练,但在科学与工程计算等对精度和逻辑控制要求极高的场景中,通用计算能力仍是不可替代的基石。此次发布的平台提供风冷、冷板液冷和浸没液冷三种散热形态的计算节点,以适配不同规模的计算需求。
在核心性能上,新一代平台搭载了首个国产10T级通用CPU,拥有128核心,单CPU的FP64双精度算力达10T。中科曙光公布的测试数据显示,该平台HPL双精度浮点相对性能较上一代提升近2倍,STREAM访存性能提升近1倍,应用性能平均提升近1倍,与国际主流高端平台处于同等水平。
官方将性能提升归因于“算—存—传”三级协同设计。计算层引入BurstBuffer缓存加速与SocketDirect通信优化技术;存储层搭载ParaStor F9000以实现端到端无阻塞I/O;网络层则基于自研scaleFabric高速交换机,端到端时延可低至0.93微秒,单子网支持11.4万卡组网。同时,结合HPC-Kit基础软件库在编译、数学库和MPI通信等环节的优化,力求提升整体计算效率。
软件生态兼容性是此次发布的另一重点。中科曙光称,新一代平台原生兼容x86生态,同时是国内首个原生支持AVX-512指令集的国产通用计算平台。AVX-512已成为全球HPC软件生态的事实标准,GROMACS、NAMD等核心科学计算套件均深度绑定其加速路径,这一兼容性意味着大量现有HPC软件无需重新编译或修改源码即可直接运行,并可自动调用优化路径,有助于降低用户的迁移成本。
散热与部署方面,平台提供了从风冷到液冷的多种选择。其中,2U风冷标准双路机架式服务器H620G59单节点可提供20TFLOPS算力;冷板式高密计算柜TC800 G6单柜实现P级计算能力,PUE低至1.08;浸没式超高密计算柜TC8600H G5采用第三代浸没相变液冷技术,最高支持超过80000个CPU核心部署,PUE进一步降至1.04。业内人士认为,从风冷到浸没式液冷的全覆盖,意味着国产高性能计算平台正形成完整的工程化能力。
应用领域方面,该平台覆盖地球科学、工业制造、生命科学、物理化学材料等多个领域。实测数据显示,该平台公里级天气模拟性能达到上一代平台的1.95倍,工业仿真实测性能达到上一代平台的1.86倍,与国际主流高端平台处于同等水平。
中科曙光高级副总裁李斌表示,未来全球算力产业的发展需要从芯片、系统、平台到应用的全链路协同创新。中科曙光将牵头建立自主、开放、高效的全精度算力体系,加强数据、算力、模型与应用的深度协同。