科大讯飞申请语音合成模型训练及方法装置专利,提升最终合成语音的质量
时间:2025-08-11 21:41:41 阅读:
国家知识产权局信息显示,科大讯飞股份有限公司申请一项名为“语音合成模型训练、语音合成方法及装置”的专利,公开号CN120412531A,申请日期为2025年04月。
专利摘要显示,本发明提供一种语音合成模型训练、语音合成方法及装置,所述训练方法包括:获取样本的原始频谱图;基于初始合成模型,应用样本的语义信息,对原始频谱图进行降维映射,得到特征向量,并对特征向量进行上采样后,基于上采样后的特征向量合成得到样本语音,特征向量包括原始频谱图的关键信息,且特征向量的维度小于原始频谱图的维度;基于样本语音对应频谱图与原始频谱图之间的差异,对初始合成模型进行参数迭代,得到语音合成模型。本发明避免了传统语音合成模型训练过程中对中间态频谱图的显式生成,从而规避了由此产生的误差累积问题,提升了最终合成语音的质量。
天眼查资料显示,科大讯飞股份有限公司,成立于1999年,位于合肥市,是一家以从事软件和信息技术服务业为主的企业。企业注册资本231173.4185万人民币。通过天眼查大数据分析,科大讯飞股份有限公司共对外投资了129家企业,参与招投标项目5000次,财产线条,此外企业还拥有行政许可60个。
源自: