一种语音自适应降噪方法及系统与流程-j9九游会真人

文档序号:34863799发布日期:2023-07-23 15:29阅读:43来源:国知局


1.本发明涉及语音识别领域,具体地,涉及一种语音自适应降噪方法及系统。


背景技术:

2.随着人工智能的不断发展,越来越多的产品开始支持语音控制功能。例如,通过语音识别即可对ar穿戴设备进行控制,极大地提高了ar穿戴设备的智能性、功能性、便捷性。然而,在实际对ar穿戴设备进行语音控制时,需要考虑不同场景下的环境噪声对于语音识别的干扰。传统的语音降噪处理模式往往只能对某种特定的噪声进行降噪,具有局限性强、降噪效果差、语音信号损失多等诸多缺陷。研究设计一种对语音进行优化降噪的方法,具有重要的现实意义。
3.现有技术中,存在针对ar穿戴设备的语音降噪处理效果不佳,进而造成语音识别准确性不足及ar穿戴设备的控制精准性低的技术问题。


技术实现要素:

4.本技术提供了一种语音自适应降噪方法及系统。解决了现有技术中针对ar穿戴设备的语音降噪处理效果不佳,进而造成语音识别准确性不足及ar穿戴设备的控制精准性低的技术问题。达到了实现智能、高效地语音降噪处理及语音识别,提高ar穿戴设备的语音降噪处理效果,提升语音识别准确性,提高ar穿戴设备的控制精准性的技术效果。
5.鉴于上述问题,本技术提供了一种语音自适应降噪方法及系统。第一方面,本技术提供了一种语音自适应降噪方法,其中,所述方法应用于一种语音自适应降噪系统,所述方法包括:根据所述ar穿戴设备的所述语音采集模块,采集第一用户的实时语音信息,获取实时语音信号;将所述实时语音信号输入语音处理模块中进行特征识别,获取语音信号特征集;按照所述语音信号特征集进行环境音分离,输出环境语音信号和用户语音信号;将所述环境语音信号存储至环境语音信号库中,将所述环境语音信号库写入至所述语音处理模块;将所述用户语音信号输入所述语音识别模块中进行语音识别,输出语音识别结果;按照所述语音识别结果对所述ar穿戴设备进行控制。
6.第二方面,本技术还提供了一种语音自适应降噪系统,其中,所述系统包括:语音信号获取模块,所述语音信号获取模块用于根据所述ar穿戴设备的所述语音采集模块,采集第一用户的实时语音信息,获取实时语音信号;语音特征识别模块,所述语音特征识别模块用于将所述实时语音信号输入语音处理模块中进行特征识别,获取语音信号特征集;环境音分离模块,所述环境音分离模块用于按照所述语音信号特征集进行环境音分离,输出环境语音信号和用户语音信号;存储模块,所述存储模块用于将所述环境语音信号存储至环境语音信号库中,将所述环境语音信号库写入至所述语音处理模块;语音识别模块,所述语音识别模块用于将所述用户语音信号输入所述语音识别模块中进行语音识别,输出语音识别结果;控制模块,所述控制模块用于按照所述语音识别结果对所述ar穿戴设备进行控制。
7.第三方面,本技术还提供了一种电子设备,包括:存储器,用于存储可执行指令;处理器,用于执行所述存储器中存储的可执行指令时,实现本技术提供的一种语音自适应降噪方法。
8.第四方面,本技术还提供了一种计算机可读存储介质,存储有计算机程序,该程序被处理器执行时,实现本技术提供的一种语音自适应降噪方法。
9.本技术中提供的一个或多个技术方案,至少具有如下技术效果或优点:
10.通过ar穿戴设备的语音采集模块,采集第一用户的实时语音信息,获取实时语音信号;将实时语音信号输入语音处理模块中进行特征识别,获取语音信号特征集;按照语音信号特征集进行环境音分离,输出环境语音信号和用户语音信号;将环境语音信号存储至环境语音信号库中,将环境语音信号库写入至语音处理模块;将用户语音信号输入语音识别模块,输出语音识别结果,并按照语音识别结果对ar穿戴设备进行控制。达到了实现智能、高效地语音降噪处理及语音识别,提高ar穿戴设备的语音降噪处理效果,提升语音识别准确性,提高ar穿戴设备的控制精准性的技术效果。
11.上述说明仅是本技术技术方案的概述,为了能够更清楚了解本技术的技术手段,而可依照说明书的内容予以实施,并且为了让本技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本技术的具体实施方式。
附图说明
12.为了更清楚地说明本公开实施例的技术方案,下面将对本公开实施例的附图作简单地介绍。明显地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
13.图1为本技术一种语音自适应降噪方法的流程示意图;
14.图2为本技术一种语音自适应降噪方法中生成环境语音信号库的流程示意图;
15.图3为本技术一种语音自适应降噪系统的结构示意图;
16.图4为本技术示例性电子设备的结构示意图。
17.附图标记说明:语音信号获取模块11,语音特征识别模块12,环境音分离模块13,存储模块14,语音识别模块15,控制模块16,处理器31,存储器32,输入装置33,输出装置34。
具体实施方式
18.本技术通过提供一种语音自适应降噪方法及系统。解决了现有技术中针对ar穿戴设备的语音降噪处理效果不佳,进而造成语音识别准确性不足及ar穿戴设备的控制精准性低的技术问题。达到了实现智能、高效地语音降噪处理及语音识别,提高ar穿戴设备的语音降噪处理效果,提升语音识别准确性,提高ar穿戴设备的控制精准性的技术效果。
19.实施例一
20.请参阅附图1,本技术提供一种语音自适应降噪方法,其中,所述方法应用于一种语音自适应降噪系统,所述系统与ar穿戴设备通信连接,所述ar穿戴设备包括语音采集模块、语音处理模块和语音识别模块,所述方法具体包括如下步骤:
21.步骤s100:根据所述ar穿戴设备的所述语音采集模块,采集第一用户的实时语音信息,获取实时语音信号;
22.具体而言,通过ar穿戴设备的语音采集模块,接收第一用户的实时语音信息,生成实时语音信号。其中,所述ar穿戴设备包括语音采集模块、语音处理模块和语音识别模块。所述ar穿戴设备可以为现有技术中的单目ar设备。第一用户可以将单目ar设备佩戴于头部的右侧或左侧,当单目ar设备位于第一用户的头部不同侧时,可通过调整单目ar设备的转轴,使得单目ar设备的显示端位于右眼前方或左眼前方。所述第一用户可以为使用所述一种语音自适应降噪系统进行智能化语音降噪处理及ar穿戴设备控制的任意用户。所述实时语音信号包括第一用户的实时语音信息。达到了通过ar穿戴设备的语音采集模块,采集第一用户的实时语音信息,获取实时语音信号,为后续对实时语音信号进行特征识别奠定基础的技术效果。
23.步骤s200:将所述实时语音信号输入语音处理模块中进行特征识别,获取语音信号特征集;
24.进一步的,本技术步骤s200还包括:
25.步骤s210:获取所述实时语音信号的语音接收源;
26.步骤s220:根据所述语音接收源,对所述实时语音信号进行分类,得到第一类语音信号和第二类语音信号,其中,所述第一类语音信号为主麦克风的语音接收信号,所述第二类语音信号为副麦克风的语音接收信号;
27.步骤s230:根据所述第一类语音信号和所述第二类语音信号进行时序对应,获取时序主语音信号和时序副语音信号。
28.具体而言,按照语音接收源对实时语音信号进行分类,获得第一类语音信号和第二类语音信号。对第一类语音信号、第二类语音信号进行时序对应,获取时序主语音信号和时序副语音信号。其中,所述语音接收源包括实时语音信号对应的主麦克风、副麦克风。所述第一类语音信号包括实时语音信号中,主麦克风的语音接收信号。所述第二类语音信号包括实时语音信号中,副麦克风的语音接收信号。所述时序主语音信号包括按照语音接收时间进行排列的第一类语音信号。所述时序副语音信号包括按照语音接收时间进行排列的第二类语音信号。达到了通过对实时语音信号进行分类、时序对应处理,获得时序主语音信号和时序副语音信号,从而提高对实时语音信号进行特征识别的准确性的技术效果。
29.进一步的,本技术步骤s230之后,还包括:
30.步骤s240:根据所述语音处理模块对所述时序主语音信号和所述时序副语音信号分别进行降噪参数配置,获取语音降噪参数,其中,所述语音降噪参数包括第一降噪参数和第二降噪参数;
31.步骤s250:按照所述第一降噪参数和所述第二降噪参数进行降噪,获取语音降噪结果,其中,所述语音降噪结果包括主语音信号降噪结果和副语音信号降噪结果;
32.步骤s260:根据所述主语音信号降噪结果和副语音信号降噪结果进行特征识别,获取所述语音信号特征集。
33.具体而言,通过语音处理模块分别对时序主语音信号、时序副语音信号进行降噪参数匹配,获得语音降噪参数。进而,按照语音降噪参数分别对时序主语音信号、时序副语音信号进行降噪,获取语音降噪结果,通过对语音降噪结果进行特征识别,获取语音信号特征集。其中,所述语音降噪参数包括第一降噪参数和第二降噪参数。所述第一降噪参数包括降噪强度参数、降噪深度参数、降噪频宽参数等主麦克风对应的降噪处理参数。所述第二降
噪参数包括降噪强度参数、降噪深度参数、降噪频宽参数等副麦克风对应的降噪处理参数。示例性地,在获得语音降噪参数时,对主麦克风、副麦克风进行降噪记录查询,获得降噪记录数据集,并将降噪记录数据集嵌入至语音处理模块,通过降噪记录数据集对时序主语音信号、时序副语音信号进行降噪参数匹配,获得语音降噪参数。降噪记录数据集包括多个历史时序主语音信号、多个历史时序副语音信号对应多个历史降噪处理参数。所述语音降噪结果包括主语音信号降噪结果和副语音信号降噪结果。所述主语音信号降噪结果包括按照第一降噪参数对时序主语音信号进行降噪,获得的降噪之后的时序主语音信号。所述副语音信号降噪结果包括按照第二降噪参数对时序副语音信号进行降噪,获得的降噪之后的时序副语音信号。所述语音信号特征集包括主语音信号降噪结果、副语音信号降噪结果,以及主语音信号降噪结果、副语音信号降噪结果对应的语音属性信息。语音属性信息包括环境语音属性、用户语音属性。达到了通过对时序主语音信号、时序副语音信号进行降噪、特征识别,获取语音信号特征集,提高噪声场景下的语音识别的识别率,从而提高语音识别的准确性的技术效果。
34.进一步的,本技术步骤s260之后,还包括:
35.步骤s270:搭建所述语音处理模块,其中,所述语音处理模块包括风声降噪、回声降噪和滤波降噪;
36.步骤s280:根据所述语音处理模块,获取风声降噪参数、回声降噪参数和滤波降噪参数;
37.步骤s290:以所述风声降噪参数、所述回声降噪参数和所述滤波降噪参数作为滤波变量,搭建自适应滤波器进行自适应降噪。
38.具体而言,基于语音处理模块进行降噪参数查询,获得风声降噪参数、回声降噪参数和滤波降噪参数。将风声降噪参数、回声降噪参数、滤波降噪参数作为滤波变量,搭建自适应滤波器,通过自适应滤波器对语音信号特征集进行自适应降噪。其中,所述语音处理模块包括风声降噪、回声降噪和滤波降噪。所述滤波变量包括风声降噪参数、回声降噪参数、滤波降噪参数。所述自适应滤波器是指根据语音信号特征集,使用自适应算法来改变滤波变量的参数值的滤波器。所述自适应滤波器具有简单、易实现、应用范围广、自学习能力强等优点。达到了通过自适应滤波器对语音信号特征集进行自适应降噪,提高语音降噪处理的全面性、适应性的技术效果。
39.进一步的,本技术步骤s290还包括:
40.步骤s291:获取所述自适应滤波器的误差性能;
41.步骤s292:判断所述误差性能是否处于预设误差性能阈值中,若所述误差性能不处于所述预设误差性能阈值中,获取优化指令;
42.步骤s293:根据所述优化指令,对所述自适应滤波器进行优化。
43.具体而言,在获得自适应滤波器之后,对自适应滤波器进行误差测试,获得误差性能。进而,对误差性能是否处于预设误差性能阈值中进行判断,如果误差性能处于预设误差性能阈值中,使用自适应滤波器对语音信号特征集进行自适应降噪。如果误差性能不处于预设误差性能阈值中,获取优化指令,并根据优化指令对自适应滤波器进行优化之后,再通过自适应滤波器对语音信号特征集进行自适应降噪。其中,所述误差性能包括自适应滤波器的误差值。所述预设误差性能阈值包括预先设置确定的自适应滤波器的误差阈值。所述
优化指令是用于表征误差性能不处于预设误差性能阈值中,需要对自适应滤波器进行优化的指令信息。达到了通过对误差性能是否处于预设误差性能阈值中进行判断,适应性地对自适应滤波器进行优化,从而提高对语音信号特征集进行自适应降噪的精确度、可靠性的技术效果。
44.步骤s300:按照所述语音信号特征集进行环境音分离,输出环境语音信号和用户语音信号;
45.步骤s400:将所述环境语音信号存储至环境语音信号库中,将所述环境语音信号库写入至所述语音处理模块;
46.具体而言,按照语音属性信息对语音信号特征集进行环境音分离,获得环境语音信号和用户语音信号。将环境语音信号存储至环境语音信号库中,将环境语音信号库存储至语音处理模块。达到了通过语音属性信息对语音信号特征集进行环境音分离,获得环境语音信号和用户语音信号,从而提高语音识别的准确性的技术效果。
47.进一步的,如附图2所示,本技术步骤s400还包括:
48.步骤s410:连接所述ar穿戴设备的语音采集模块,采集实时环境下的预设环境语音信号;
49.步骤s420:以所述预设环境语音信号,生成所述环境语音信号库。
50.具体而言,连接ar穿戴设备的语音采集模块,通过语音采集模块对实时环境下的预设环境语音信号进行采集,获得预设环境语音信号,并将预设环境语音信号添加至环境语音信号库。其中,所述预设环境语音信号包括实时环境信息对应的环境噪音信息。实时环境信息包括第一用户对应的实时位置、实时环境场景信息。所述环境语音信号库包括预设环境语音信号。
51.步骤s500:将所述用户语音信号输入所述语音识别模块中进行语音识别,输出语音识别结果;
52.步骤s600:按照所述语音识别结果对所述ar穿戴设备进行控制。
53.具体而言,将用户语音信号输入语音识别模块,通过语音识别模块中的语音识别模型对用户语音信号进行语音识别,获得语音识别结果,并按照语音识别结果对ar穿戴设备进行控制。其中,所述语音识别模型经由大量与用户语音信号相关的数据信息训练得到,具备智能化语音识别的功能。所述语音识别结果包括用户语音信号对应的文字信息。达到了通过语音识别模块对用户语音信号进行语音识别,获得准确的语音识别结果,并按照语音识别结果对ar穿戴设备进行控制,提高ar穿戴设备的控制精准性的技术效果。
54.综上所述,本技术所提供的一种语音自适应降噪方法具有如下技术效果:
55.1.通过ar穿戴设备的语音采集模块,采集第一用户的实时语音信息,获取实时语音信号;将实时语音信号输入语音处理模块中进行特征识别,获取语音信号特征集;按照语音信号特征集进行环境音分离,输出环境语音信号和用户语音信号;将环境语音信号存储至环境语音信号库中,将环境语音信号库写入至语音处理模块;将用户语音信号输入语音识别模块,输出语音识别结果,并按照语音识别结果对ar穿戴设备进行控制。达到了实现智能、高效地语音降噪处理及语音识别,提高ar穿戴设备的语音降噪处理效果,提升语音识别准确性,提高ar穿戴设备的控制精准性的技术效果。
56.2.通过对实时语音信号进行分类、时序对应处理,获得时序主语音信号和时序副
语音信号,从而提高对实时语音信号进行特征识别的准确性。
57.3.通过对时序主语音信号、时序副语音信号进行降噪、特征识别,获取语音信号特征集,从而提高语音识别的准确性。
58.4.通过自适应滤波器对语音信号特征集进行自适应降噪,提高语音降噪处理的全面性、适应性。
59.实施例二
60.基于与前述实施例中一种语音自适应降噪方法,同样发明构思,本发明还提供了一种语音自适应降噪系统,所述系统与ar穿戴设备通信连接,所述ar穿戴设备包括语音采集模块、语音处理模块和语音识别模块,请参阅附图3,所述系统包括:
61.语音信号获取模块11,所述语音信号获取模块11用于根据所述ar穿戴设备的所述语音采集模块,采集第一用户的实时语音信息,获取实时语音信号;
62.语音特征识别模块12,所述语音特征识别模块12用于将所述实时语音信号输入语音处理模块中进行特征识别,获取语音信号特征集;
63.环境音分离模块13,所述环境音分离模块13用于按照所述语音信号特征集进行环境音分离,输出环境语音信号和用户语音信号;
64.存储模块14,所述存储模块14用于将所述环境语音信号存储至环境语音信号库中,将所述环境语音信号库写入至所述语音处理模块;
65.语音识别模块15,所述语音识别模块15用于将所述用户语音信号输入所述语音识别模块中进行语音识别,输出语音识别结果;
66.控制模块16,所述控制模块16用于按照所述语音识别结果对所述ar穿戴设备进行控制。
67.进一步的,所述系统还包括:
68.语音接收源获取模块,所述语音接收源获取模块语音获取所述实时语音信号的语音接收源;
69.语音信号分类模块,所述语音信号分类模块用于根据所述语音接收源,对所述实时语音信号进行分类,得到第一类语音信号和第二类语音信号,其中,所述第一类语音信号为主麦克风的语音接收信号,所述第二类语音信号为副麦克风的语音接收信号;
70.时序对应处理模块,所述时序对应处理模块用于根据所述第一类语音信号和所述第二类语音信号进行时序对应,获取时序主语音信号和时序副语音信号。
71.进一步的,所述系统还包括:
72.降噪参数配置模块,所述降噪参数配置模块用于根据所述语音处理模块对所述时序主语音信号和所述时序副语音信号分别进行降噪参数配置,获取语音降噪参数,其中,所述语音降噪参数包括第一降噪参数和第二降噪参数;
73.语音降噪结果确定模块,所述语音降噪结果确定模块用于按照所述第一降噪参数和所述第二降噪参数进行降噪,获取语音降噪结果,其中,所述语音降噪结果包括主语音信号降噪结果和副语音信号降噪结果;
74.语音信号特征集确定模块,所述语音信号特征集确定模块用于根据所述主语音信号降噪结果和副语音信号降噪结果进行特征识别,获取所述语音信号特征集。
75.进一步的,所述系统还包括:
76.第一执行模块,所述第一执行模块用于搭建所述语音处理模块,其中,所述语音处理模块包括风声降噪、回声降噪和滤波降噪;
77.第二执行模块,所述第二执行模块用于根据所述语音处理模块,获取风声降噪参数、回声降噪参数和滤波降噪参数;
78.自适应降噪模块,所述自适应降噪模块用于以所述风声降噪参数、所述回声降噪参数和所述滤波降噪参数作为滤波变量,搭建自适应滤波器进行自适应降噪。
79.进一步的,所述系统还包括:
80.第三执行模块,所述第三执行模块用于获取所述自适应滤波器的误差性能;
81.优化指令获取模块,所述优化指令获取模块用于判断所述误差性能是否处于预设误差性能阈值中,若所述误差性能不处于所述预设误差性能阈值中,获取优化指令;
82.优化模块,所述优化模块用于根据所述优化指令,对所述自适应滤波器进行优化。
83.进一步的,所述系统还包括:
84.预设环境语音信号获取模块,所述预设环境语音信号获取模块用于连接所述ar穿戴设备的语音采集模块,采集实时环境下的预设环境语音信号;
85.第四执行模块,所述第四执行模块用于以所述预设环境语音信号,生成所述环境语音信号库。
86.本发明实施例所提供的一种语音自适应降噪系统可执行本发明任意实施例所提供的一种语音自适应降噪方法,具备执行方法相应的功能模块和有益效果。
87.所包括的各个模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
88.实施例三
89.图4为本发明实施例三提供的电子设备的结构示意图,示出了适于用来实现本发明实施方式的示例性电子设备的框图。图4显示的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。如图4所示,该电子设备包括处理器31、存储器32、输入装置33及输出装置34;电子设备中处理器31的数量可以是一个或多个,图4中以一个处理器31为例,电子设备中的处理器31、存储器32、输入装置33及输出装置34可以通过总线或其他方式连接,图4中以通过总线连接为例。
90.存储器32作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种语音自适应降噪方法对应的程序指令/模块。处理器31通过运行存储在存储器32中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述一种语音自适应降噪方法。
91.本技术提供了一种语音自适应降噪方法,其中,所述方法应用于一种语音自适应降噪系统,所述方法包括:通过ar穿戴设备的语音采集模块,采集第一用户的实时语音信息,获取实时语音信号;将实时语音信号输入语音处理模块中进行特征识别,获取语音信号特征集;按照语音信号特征集进行环境音分离,输出环境语音信号和用户语音信号;将环境语音信号存储至环境语音信号库中,将环境语音信号库写入至语音处理模块;将用户语音信号输入语音识别模块,输出语音识别结果,并按照语音识别结果对ar穿戴设备进行控制。解决了现有技术中针对ar穿戴设备的语音降噪处理效果不佳,进而造成语音识别准确性不
足及ar穿戴设备的控制精准性低的技术问题。达到了实现智能、高效地语音降噪处理及语音识别,提高ar穿戴设备的语音降噪处理效果,提升语音识别准确性,提高ar穿戴设备的控制精准性的技术效果。
92.注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
当前第1页1  
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图