“平替”英伟达或再下一城,国产GPU在大模型训练迎来突破


蚂蚁称未来将逐步开源分享。今日重要性:✨✨
蚂蚁自研2900亿大模型用国产AI芯片完成高效训练
近日,蚂蚁集团Ling团队发表了一篇技术成果论文。论文显示,蚂蚁集团推出了两款不同规模的MoE大语言模型——百灵轻量版(Ling-Lite)与百灵增强版(Ling-Plus),前者参数规模为168亿(激活参数27.5亿),Plus基座模型参数规模高达2900亿(激活参数288亿),两者性能均达到行业领先水平。(证券时报)

据证券时报3月24日报道,近日蚂蚁集团Ling团队发表了一篇技术成果论文,该技术论文最大的突破在于提出了一系列创新方法,以提升资源受限环境下AI开发的效率与可及性。

实验表明,其3000亿参数的MoE(混合专家)大模型可在使用国产GPU的低性能设备上完成高效训练,性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。

对于此次进展,蚂蚁回应称:针对不同芯片持续调优,以降低AI应用成本,目前取得了一定的进展,也会逐步通过开源分享。

国泰君安表示,随着DeepSeek等国产大模型带来的市场机遇,以及国内厂商在软硬件协同优化方面的持续投入,国产AI芯片有望在特定场景实现突破。特别是在企业级市场,凭借性价比优势和本地化部署能力,国产芯片厂商将迎来重要的市场机遇,有望在新一轮产业变革中占据重要地位。

同时国金证券认为,高算力效率不等于算力通缩,“参数量*效率*数据规模”才是新的scaling law方向。从远期看,多品类APP接入AI大模型有望带来用户数的增长,多模态、AI Agent有望带来单次请求调用tokens数量的增加,这都将带动算力需求的提升。

公司方面,据东吴证券表示,

华丰科技:公司是华为高速背板连接器两大国内供应商之一。

寒武纪海光信息为国内算力芯片龙头。

*免责声明:文章内容仅供参考,不构成投资建议

*风险提示:股市有风险,入市需谨慎

本资讯中的内容来自持牌证券机构,意见仅供参考,并不构成对所述证券买卖做出保证。投资者不应将本资讯作为投资决策的唯一参考因素。亦不应以本资讯取代自己的判断。

本文内容和观点不代表选股通APP平台观点,请独立判断和决策。在任何情况下,选股通APP不对任何人因使用本平台中的内容所引致的任何损失负任何责任。

    联系微信二维码 联系微信
    回到顶部