8月30日,阿里云宣布正式启动张北超级智算中心。该智算中心总建设规模为12 EFLOPS(每秒1200京次浮点运算次数)AI算力,将超过谷歌的9 EFLOPS和特斯拉的1.8 EFLOPS,成为全球最大的智算中心,可为AI大模型训练、自动驾驶、空间地理等人工智能探索应用提供强大的智能算力服务。
该智算中心由飞天智算平台支撑建设,以先进的技术架构,将衡量算力效率的核心指标“千卡并行计算效率”,从传统架构的40%提升至90%,可将算力资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。
同期,阿里云正式对外开放这座超级智算中心的技术底座“飞天智算平台”,可通过公共云和专有云的模式服务各类企业机构。
这座超级智算中心能够实现规模和效率的突破,是自大数据AI一体化平台到算力基础设施体系化技术创新的结果。传统智算中心达到一定规模之后,增加算力资源反而会降低算力输出的能力。阿里云通过体系化的自研核心技术,改变了智能计算的损耗难题。
例如,在通信技术上,阿里云采用高性能自研Solar-RDMA网络,实现端对端最低2微秒延迟,配合阿里云自研的无阻塞通信技术,让计算过程中的数据交换速度提升了5倍以上。同时,自然风冷、液冷等绿色技术的应用,让智算中心的能耗降低,PUE(Power Usage Effectiveness,是评价数据中心能源效率的指标,越接近1表明能效水平越好)最低可达1.09。
这座超大规模的智算中心正在服务于AI大模型训练、遥感探测、数字人、自动驾驶、生命科学、新药研发、元宇宙等前沿智能应用。其中,小鹏汽车基于飞天智算将自动驾驶模型训练提速近170倍。深势科技采用飞天智算让分子动力学仿真模拟训练效率提升了5倍。(记者米彦泽)
标签: 全球最大 阿里云正式启动 张北超级智算中心建设 AI大模型训练 自动驾驶