阿里云Aegaeon方案入选SOSP,GPU用量削减82%


在韩国首尔举办的第31届操作系统原理研讨会(SOSP)上,阿里云发布的“Aegaeon”的计算池化解决方案研究成果成功入选,可解决AI模型服务中普遍存在的GPU资源浪费问题。
在阿里云模型市场进行的为期超过三个月的Beta测试中,Aegaeon系统展现了卓越的效能。测试数据显示,服务数十个参数量高达720亿的大模型,所需的英伟达H20 GPU数量从1192个成功减少至213个,数量削减高达82%。
    联系微信二维码 联系微信
    回到顶部