阿里云AI基础设施升级亮相 模型算力利用率提升超20%
9月20日,2024云栖大会现场,阿里云全面展示了全新升级后的AI Infra系列产品及能力。通过全栈优化,阿里云打造出一套稳定和高效的AI基础设施,连续训练有效时长大于99%,模型算力利用率提升20%以上。
“AI创新需要新形态的云基础设施。”阿里云副总裁、弹性计算及存储产品线负责人吴结生表示,阿里云整合底层的计算、存储、网络等资源,实现了统一调度和软硬一体优化,以满足模型训练和推理的爆发式AI算力需求。
基于全新的CIPU2.0,阿里云新推出磐久AI服务器,实现单机16卡、显存1.5T以上,支持Solar RDMA互联。磐久AI服务器采用超钛金电源实现97%以上的高能效,并可通过AI算法预测GPU故障,准确率达92%,保障AI算力的性能和稳定性。
在存储方面,阿里云并行文件存储CPFS实现端到端全链路性能提升,单客户端吞吐达25GB/s,高性能数据流动达到100GB/s,为AI智算提供指数级扩展存储能力。
为AI设计的高性能网络架构HPN7.0,性能和稳定性也再次提升,其中,集合通信性能提升1倍以上,模型端到端训练性能提升10%以上。
通过底层计算、存储、网络等基础设施的升级,阿里云灵骏集群可提供超大规模、超强性能的智能算力,万卡规模性能线性度超过96%,并行存储吞吐20TB/s,万卡规模下网络带宽利用率超过99%,可支持单集群十万卡级别AI算力规模。
面向AI业务,阿里云计算产品也大幅演进更新。本次云栖大会上,容器服务ACK面向AI实现重磅升级,大模型应用冷启动延迟降低85%,并可提供15000个超大规模节点支持。同时,容器计算服务ACS即将推出 GPU容器算力。(李记)
您可能感兴趣的文章
- 08-18横琴单牌车电子标签政策2025年8月施行,通关流程
- 08-18秘境战盟发布英雄档案馆预告,首曝刺客玛菈及
- 08-18无锡梁溪携手天兵科技打造液体火箭研制基地,
- 08-18传奇续写,联想开天X1 Carbon再探信创旗舰至轻之
- 08-18年117万吨碳减排!牛卡福的零碳物流之网正徐徐
- 08-18空气净化器十大品牌排行榜:除甲醛效果实测与
- 08-18“什么值得买”助力丰台惠民文化消费季,发放
- 08-18赫德岛现神秘黑暗空洞,实为罕见冯·卡门涡流现
- 08-18健智达完成1000万元天使轮融资,攀智资本助力健
- 08-182025新规:移动电源与锂电池强制3C认证全面施行


阅读排行
推荐教程
- 02-07《守望先锋2》将于2月13日公开重要情报 或将改变
- 03-23雷泊盾科技:从胎压监测到车载电器的出海布局
- 03-23华为发布FreeBuds6悦彰耳机:预售开启,售价999元
- 03-25问界M9正式发布:全新配色与豪华配置登场
- 03-12小孩哥如愿坐上小米SU7 Ultra:反送车主车模_小米
- 02-23手术治疗阿尔茨海默病成为可能 费用不到两万
- 10-14鸿蒙原生应用开发者激励计划出炉
- 09-28华为刘康:利用AI创新重构 实现产业升级
- 10-16新生态、新服务、新模式 中国移动泛全联盟3.0再升级
- 09-25持续助力高质量跨境发展 SHEIN“优品”出海计划三箭齐发