成本不到50美金,“AI教母”团队训练出新模型,蒸馏技术成关键


该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。今日重要性:✨

据媒体报道,“AI教母”李飞飞等斯坦福大学和华盛顿大学研究人员近日以不到50美元的云计算费用训练了一个名叫s1的人工智能推理模型。该模型在数学和编码能力测试中的表现与OpenAI的o1和DeepSeek的R1等尖端推理模型类似。

s1诞生标志着高效AI模型训练的新时代。研究人员表示,s1是通过蒸馏法由谷歌推理模型Gemini2.0FlashThinkingExperimental提炼出来的。这种方法的核心在于如何有效地传递知识,使得小模型不仅具备大模型的推理能力,而且在资源消耗上表现得极为优越。

证券时报表示,李飞飞团队的这一突破,不仅展现了技术的前瞻性,而且为更多科研机构和创业公司提供了借鉴的蓝本。同时,s1所展现出价格优势的背后,其实也反映了未来AI领域的一个重要趋势:大模型的训练和应用将愈发平民化。此前DeepSeek发布一系列DeepSeek-R1模型,探索了将R1的推理能力蒸馏到更小模型中的潜力,通过知识蒸馏技术,成功将大模型的推理能力传递给小模型,实现了小模型在推理任务上的显著提升,引领了小模型的发展方向。

公司方面,据证券时报表示,

维海德:公司算法团队通过网络选优、模型剪枝、蒸馏训练、量化训练、训练集优化等工作,不断迭代升级AI算法模型,并且在海思、地平线等多个平台部署应用,算法性能和检测精度达到国际先进水平,形成了多系列、多规格的智能化摄像机产品和应用解决方案。

中科通达:公司通过模型知识蒸馏与推理加速工程化等技术,公司“智瞳” 视频图像识别引擎在GPU上的推理速度提升近50%, 并已完成昇腾、算能等国产AI加速卡的适配。

*免责声明:文章内容仅供参考,不构成投资建议

*风险提示:股市有风险,入市需谨慎

本资讯中的内容来自持牌证券机构,意见仅供参考,并不构成对所述证券买卖做出保证。投资者不应将本资讯作为投资决策的唯一参考因素。亦不应以本资讯取代自己的判断。

本文内容和观点不代表选股通APP平台观点,请独立判断和决策。在任何情况下,选股通APP不对任何人因使用本平台中的内容所引致的任何损失负任何责任。

    联系微信二维码 联系微信
    回到顶部