腾讯申请提示语音姿态生成方法相关专利,提高生成提示语音姿态的准确性和精细度
时间:2025-08-07 10:32:04 阅读:
国家知识产权局信息显示,深圳市腾讯计算机系统有限公司;香港科技大学申请一项名为“提示语音姿态生成方法、相关装置和介质”的专利,公开号CN120409484A,申请日期为2024年01月。
专利摘要显示,本公开提供了一种提示语音姿态生成方法、相关装置和介质。该方法包括:获取目标输入,目标输入包括目标文本与目标语音中的至少一个;将目标输入加入引导语输入大语言模型,得到描述目标提示语音姿态的姿态描述;生成姿态描述对应的姿态描述引导向量;利用姿态描述引导向量对扩散模型进行引导,使扩散模型生成目标提示语音姿态向量;基于目标提示语音姿态向量,生成目标提示语音姿态。本公开实施例能够提高生成提示语音姿态的准确性和精细度。本公开实施例可应用于线上教育、线上交流、处理等各种场景。
源自: