谷歌申请分离音轨并与文本字幕进行匹配的系统和方法专利,提供计算机实现的方法
时间:2025-08-05 02:17:01 阅读:
国家知识产权局信息显示,谷歌有限责任公司申请一项名为“分离音轨并与文本字幕进行匹配的系统和方法”的专利,公开号CN120390955A,申请日期为2022年12月。
专利摘要显示,提供了一种计算机实现的方法。该方法包括由计算装置接收输入音频波形和输入文本描述。该方法进一步包括通过神经网络将输入音频波形分离成多个音轨。该方法还包括通过神经网络确定输入文本描述是否描述多个所分离音轨中的音轨。该方法还包括,在确定输入文本描述描述了多个音轨中的音轨时,由计算装置将与输入文本描述相对应的音轨提供给交互式用户界面。
源自: