3月31日,在百度AI DAY上,百度发布业界首个基于全新互相关注意力(Cross-Attention)的端到端语音语言大模型,实现超低时延与超低成本,在电话语音频道的语音问答场景中,调用成本较行业均值下降约50%-90%。
据介绍,语音大模型具备极低的训练和使用成本,极快的推理响应速度,语音交互时,可将用户等待时长从行业常见的3-5秒降低至1秒左右。
华创证券表示,字节跳动、科大讯飞、百度、中国电信等纷纷开发语音大模型,在并在语音同传、方言识别、语音合成等领域取得了丰富成果。在当前及未来一段时间内,高质量语料,端到端架构,跨领域识别,以及情感个性化等仍是语音大模型厂商发力的重要方向。
国泰君安也认为,增加了情感的语音交互将显著有利于AI的软硬件应用,能够降低使用门槛、改进效率、提升体验,包括如下应用场景,一是情感陪伴与智慧教育应用、二是AI陪伴硬件如AI玩具、AI宠物,可帮助硬件生产商与IP方扩大需求、三是AI眼镜、AI耳机、AI音箱等生活效率产品将受益于交互方式的改进。
公司方面,据兴业证券表示,包括漫步者、天键股份、国光电器、恒玄科技、炬芯科技、中科蓝讯等。
物联网模组厂商广和通、美格智能,以及物联网终端厂商移为通信、博实结、翱捷科技-U。
*免责声明:文章内容仅供参考,不构成投资建议
*风险提示:股市有风险,入市需谨慎