豆包实时语音大模型上线，测试效果超GPT-4o

据界面新闻报道，1月20日，豆包APP更新实时语音通话功能，面向所有用户开放。该功能基于最新豆包实时语音大模型（Doubao Realtime Voice Model）。

更新后，豆包中文场景的对话能力在语音真实感和“喜怒哀乐”的情绪表现上近乎达到“人机难辨”的AI交互效果，可以模仿不同声线，并且在“逻辑思考”和“情绪感知”上有明显提升，其测试效果超过GPT-4o。同时，豆包最新语音模型在中文场景下体现出了相较于此前更强大和逼真的性能。

中信建投表示，AI大模型在语音交互、高性能运算等方面具有显著优势，因此AI加持的硬件产品通常表现得更加好用，如AI聊天工具更受欢迎是因为：语音交互对人来讲更为便捷高效，AI加持下反馈速度更快、反馈内容更丰富等。

东方证券指出，耳机等可穿戴设备有望成长为AI终端重要新形式。A搭载豆包大模型的OlaFriend智能体耳机于2024年10月发布，用户可以随时唤醒豆包，通过对话的方式调用大模型能力，让AI使用更轻松无门槛。OlaFriend智能体耳机可以帮助用户获取信息、进行英语会话、了解文化知识、获取音乐推荐、倾诉情感等，为用户提供高质量陪伴。

另外，国联证券表示，语音交互将提升AI玩具的陪伴体验。

公司方面，据广发证券表示，

1）与字节在AI领域具有合作基础的公司，如易点天下、蓝色光标等；

2）布局AI语音相关业务的公司，如盛天网络（音乐社交类平台“给麦”等）、昆仑万维（AI音乐产品Melodio和Mureka）等；布局AI玩具的公司，如上海电影、奥飞娱乐等。

*免责声明：文章内容仅供参考，不构成投资建议

*风险提示：股市有风险，入市需谨慎