风噪抑制方法、装置、设备及计算机可读存储介质与流程-j9九游会真人

文档序号:34864793发布日期:2023-07-23 17:14阅读:8来源:国知局


1.本发明涉及降噪技术领域,尤其涉及一种风噪抑制方法、装置、设备及计算机可读存储介质。


背景技术:

2.风噪声是户外拾音过程中最常见的一类噪声,严重影响了移动电话、助听器等户外拾音系统的拾音质量。风噪声是由于气流和障碍物(如建筑物、人体、传声器腔体等)之间相互作用产生的,因此不同障碍物引起的风噪声的特性也会有所差别。很多情况下风噪声声压级能达到80db spl,能够完全掩盖语声信号,极大降低语声可懂度并造成听觉不适。
3.传统处理风噪的方法包括防风罩,常见于手持式传声器以及专业枪式传声器,有海绵、人造毛皮、铁网等多种材料。原理主要是降低传声器振膜附近的空气流速,打散气流减小湍流的产生。为语音拾音设计的骨导传感器vpu(voice pick up,拾音器)可通过采集人下颌骨的振动信号来拾取语音,由于风噪只存在于气导声中,骨导声不受影响,因此在拾取语音时骨导传感器可以直接规避风噪问题。但是基于防风罩和vpu的风噪抑制方案都会增加设备的成本和结构设计的难度。


技术实现要素:

4.本发明的主要目的在于提供一种风噪抑制方法、装置、设备及计算机可读存储介质,旨在不增加设备的硬件成本和设计难度的情况下提高设备的风噪抑制效果。
5.为实现上述目的,本发明提供一种风噪抑制方法,所述方法包括以下步骤:
6.在确定麦克风信号中存在风噪时,对所述麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号,其中,所述低频信号是频率小于或者等于预设频率的信号;在通过所述深度神经网络对所述低频信号进行噪声消除处理的过程中,通过注意力机制基于注意力权重对所述深度神经网络提取的低频信号特征进行加权处理,所述低频信号特征与去噪后的低频信号特征之间的相似度越高时所述注意力权重越大;
7.对所述麦克风信号中的高频信号采用预设的非神经网络算法进行噪声消除处理得到第二处理信号,其中,所述高频信号是频率大于所述预设频率的信号;
8.对所述第一处理信号和所述第二处理信号进行融合得到风噪抑制结果。
9.可选地,所述深度神经网络包括编码器、循环神经网络模块、注意力机制模块、解码器和全连接层,所述对所述麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号的步骤包括:
10.将所述麦克风信号中的低频信号输入所述编码器进行处理,得到第一处理结果;
11.将所述第一处理结果输入至所述循环神经网络模块进行处理得到第二处理结果,其中,在通过所述循环神经网络模块对所述第一处理结果进行处理时,使用所述循环神经网络模块对前一帧处理结果进行处理得到的结果,所述前一帧处理结果为所述编码器对所
述麦克风信号的前一帧信号进行处理得到的结果;
12.将所述第二处理结果输入至所述解码器进行处理得到第三处理结果;
13.将所述第一处理结果和所述第三处理结果输入至所述注意力机制模块进行处理得到第四处理结果;
14.连接所述第三处理结果和所述第四处理结果,将连接得到的结果输入至所述全连接层进行处理得到第一处理信号。
15.可选地,所述注意力机制模块包括权重计算块和加权处理块,所述将所述第一处理结果和所述第三处理结果输入至所述注意力机制模块进行处理得到第四处理结果的步骤包括:
16.将所述第一处理结果和所述第三处理结果输入至所述权重计算块进行处理,得到注意力权重矩阵;
17.将所述注意力权重矩阵和所述第一处理结果输入所述加权处理块进行处理得到第四处理结果。
18.可选地,所述权重计算块包括三层卷积层、一层点积层和两层激活函数,所述将所述第一处理结果和所述第三处理结果输入至所述权重计算块进行处理,得到注意力权重矩阵的步骤包括:
19.将所述第一处理结果输入至第一卷积层进行卷积操作得到第一卷积结果,并将所述第三处理结果输入至第二卷积层进行卷积操作得到第二卷积结果;
20.将所述第一卷积结果和所述第二卷积结果输入至第一点积层计算得到第一点积结果,将所述第一点积结果输入至第一激活函数进行处理得到第一激活结果;
21.将所述第一激活结果输入至第三卷积层进行卷积操作得到第三卷积结果,将所述第三卷积结果输入至第二激活函数进行处理得到注意力权重矩阵。
22.可选地,所述加权处理块包括一层卷积层和一层点积层,所述将所述注意力权重矩阵和所述第一处理结果输入所述加权处理块进行处理得到第四处理结果的步骤包括:
23.将所述第一处理结果输入至第四卷积层进行卷积操作得到第四卷积结果;
24.将所述第四卷积结果和所述注意力权重矩阵输入至第二点积层计算得到第四处理结果。
25.可选地,所述在确定麦克风信号中存在风噪时,对所述麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号的步骤之前,还包括:
26.对麦克风信号进行风噪分析,根据风噪分析结果确定所述麦克风信号中是否存在风噪;
27.所述对麦克风信号进行风噪分析,根据风噪分析结果确定所述麦克风信号中是否存在风噪的步骤之后,还包括:
28.当根据所述风噪分析结果确定所述麦克风信号中不存在风噪时,对所述麦克风信号采用所述非神经网络算法进行噪声消除处理,得到抑制风噪后的麦克风信号。
29.可选地,所述对麦克风信号进行风噪分析,根据风噪分析结果确定所述麦克风信号中是否存在风噪的步骤包括:
30.当有两路或两路以上的麦克风信号时,计算各路所述麦克风信号之间的目标相关
度;
31.根据所述目标相关度以及预设的相关度与风速之间的对应关系,匹配得到风噪分析结果;
32.或,计算任意一路所述麦克风信号中频率小于第二预设频率的信号的目标低频能量;
33.根据所述目标低频能量以及预设的低频能量与风速之间的对应关系,匹配得到风噪分析结果。
34.为实现上述目的,本发明还提供一种风噪抑制装置,所述装置包括:
35.噪声消除模块,用于在确定麦克风信号中存在风噪时,对所述麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号,其中,所述低频信号是频率小于或者等于预设频率的信号;在通过所述深度神经网络对所述低频信号进行噪声消除处理的过程中,通过注意力机制基于注意力权重对所述深度神经网络提取的低频信号特征进行加权处理,所述低频信号特征与去噪后的低频信号特征之间的相似度越高时所述注意力权重越大;
36.所述噪声消除模块,还用于对所述麦克风信号中的高频信号采用预设的非神经网络算法进行噪声消除处理得到第二处理信号,其中,所述高频信号是频率大于所述预设频率的信号;
37.融合模块,用于对所述第一处理信号和所述第二处理信号进行融合得到风噪抑制结果。
38.为实现上述目的,本发明还提供一种风噪抑制设备,所述风噪抑制设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的风噪抑制程序,所述风噪抑制程序被所述处理器执行时实现如上所述的风噪抑制方法的步骤。
39.此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有风噪抑制程序,所述风噪抑制程序被处理器执行时实现如上所述的风噪抑制方法的步骤。
40.本发明中,通过在确定麦克风信号中存在风噪时,对麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号,其中,低频信号是频率小于或者等于预设频率的信号;在通过深度神经网络对低频信号进行噪声消除处理的过程中,通过注意力机制基于注意力权重对深度神经网络提取的低频信号特征进行加权处理,低频信号特征与去噪后的低频信号特征之间的相似度越高时注意力权重越大;对麦克风信号中的高频信号采用预设的非神经网络算法进行噪声消除处理,得到第二处理信号,其中,高频信号是频率大于预设频率的信号;对第一处理信号和第二处理信号进行融合得到风噪抑制结果。
41.本发明在深度神经网络中引入注意力机制,通过注意力机制基于注意力权重对深度神经网络提取的低频信号特征进行加权处理,低频信号特征与去噪后的低频信号特征之间的相似度越高时注意力权重越大,使得深度神经网络在对低频信号的处理过程中可以通过注意力机制的加权处理关注低频信号中的重要信息,也即语音信号和语音信号中的重要频段,从而使得深度神经网络对低频信号的噪声消除更准确,从而实现不增加设备的硬件成本和设计难度的情况下提高设备的风噪抑制效果。
附图说明
42.图1为本发明实施例方案涉及的硬件运行环境的结构示意图;
43.图2为本发明风噪抑制方法一实施例的流程示意图;
44.图3为本发明实施例涉及的一种深度神经网络的结构图;
45.图4为本发明实施例涉及的一种注意力机制模块的结构图;
46.图5为本发明实施例涉及的一种循环神经网络层的结构图;
47.图6为本发明实施例涉及的一种风噪抑制流程示意图。
48.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
49.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
50.如图1所示,图1是本发明实施例方案涉及的硬件运行环境的设备结构示意图。
51.需要说明的是,本发明实施例风噪抑制设备,所述风噪抑制设备可以是耳机、智能手机、个人计算机、服务器等设备,在此不做具体限制。
52.如图1所示,该风噪抑制设备可以包括:处理器1001,例如cpu,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(display)、输入单元比如键盘(keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
53.本领域技术人员可以理解,图1中示出的设备结构并不构成对风噪抑制设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
54.如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及风噪抑制程序。操作系统是管理和控制设备硬件和软件资源的程序,支持风噪抑制程序以及其它软件或程序的运行。在图1所示的设备中,用户接口1003主要用于与客户端进行数据通信;网络接口1004主要用于与服务器建立通信连接;而处理器1001可以用于调用存储器1005中存储的风噪抑制程序,并执行以下操作:
55.在确定麦克风信号中存在风噪时,对所述麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号,其中,所述低频信号是频率小于或者等于预设频率的信号;在通过所述深度神经网络对所述低频信号进行噪声消除处理的过程中,通过注意力机制基于注意力权重对所述深度神经网络提取的低频信号特征进行加权处理,所述低频信号特征与去噪后的低频信号特征之间的相似度越高时所述注意力权重越大,所述注意力机制用于对深度神经网络提取的特征进行加权处理;
56.对所述麦克风信号中的高频信号采用预设的非神经网络算法进行噪声消除处理得到第二处理信号,其中,所述高频信号是频率大于所述预设频率的信号;
57.对所述第一处理信号和所述第二处理信号进行融合得到风噪抑制结果。
58.进一步地,所述深度神经网络包括编码器、循环神经网络模块、注意力机制模块、解码器和全连接层,所述对所述麦克风信号中的低频信号采用结合注意力机制的预设深度
神经网络进行噪声消除处理,得到第一处理信号的操作包括:
59.将所述麦克风信号中的低频信号输入所述编码器进行处理,得到第一处理结果;
60.将所述第一处理结果输入至所述循环神经网络模块进行处理得到第二处理结果,其中,在通过所述循环神经网络模块对所述第一处理结果进行处理时,使用所述循环神经网络模块对前一帧处理结果进行处理得到的结果,所述前一帧处理结果为所述编码器对所述麦克风信号的前一帧信号进行处理得到的结果;
61.将所述第二处理结果输入至所述解码器进行处理得到第三处理结果;
62.将所述第一处理结果和所述第三处理结果输入至所述注意力机制模块进行处理得到第四处理结果;
63.连接所述第三处理结果和所述第四处理结果,将连接得到的结果输入至所述全连接层进行处理得到第一处理信号。
64.进一步地,所述注意力机制模块包括权重计算块和加权处理块,所述将所述第一处理结果和所述第三处理结果输入至所述注意力机制模块进行处理得到第四处理结果的操作包括:
65.将所述第一处理结果和所述第三处理结果输入至所述权重计算块进行处理,得到注意力权重矩阵;
66.将所述注意力权重矩阵和所述第一处理结果输入所述加权处理块进行处理得到第四处理结果。
67.进一步地,所述权重计算块包括三层卷积层、一层点积层和两层激活函数,所述将所述第一处理结果和所述第三处理结果输入至所述权重计算块进行处理,得到注意力权重矩阵的操作包括:
68.将所述第一处理结果输入至第一卷积层进行卷积操作得到第一卷积结果,并将所述第三处理结果输入至第二卷积层进行卷积操作得到第二卷积结果;
69.将所述第一卷积结果和所述第二卷积结果输入至第一点积层计算得到第一点积结果,将所述第一点积结果输入至第一激活函数进行处理得到第一激活结果;
70.将所述第一激活结果输入至第三卷积层进行卷积操作得到第三卷积结果,将所述第三卷积结果输入至第二激活函数进行处理得到注意力权重矩阵。
71.进一步地,所述加权处理块包括一层卷积层和一层点积层,所述将所述注意力权重矩阵和所述第一处理结果输入所述加权处理块进行处理得到第四处理结果的操作包括:
72.将所述第一处理结果输入至第四卷积层进行卷积操作得到第四卷积结果;
73.将所述第四卷积结果和所述注意力权重矩阵输入至第二点积层计算得到第四处理结果。
74.进一步地,所述在确定麦克风信号中存在风噪时,对所述麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号的操作之前,处理器1001还可以用于调用存储器1005中存储的风噪抑制程序,执行以下操作:
75.对麦克风信号进行风噪分析,根据风噪分析结果确定所述麦克风信号中是否存在风噪;
76.所述对麦克风信号进行风噪分析,根据风噪分析结果确定所述麦克风信号中是否存在风噪的操作之后,还包括:
77.当根据所述风噪分析结果确定所述麦克风信号中不存在风噪时,对所述麦克风信号采用所述非神经网络算法进行噪声消除处理,得到抑制风噪后的麦克风信号。
78.进一步地,所述对麦克风信号进行风噪分析,根据风噪分析结果确定所述麦克风信号中是否存在风噪的操作包括:
79.当有两路或两路以上的麦克风信号时,计算各路所述麦克风信号之间的目标相关度;
80.根据所述目标相关度以及预设的相关度与风速之间的对应关系,匹配得到风噪分析结果;
81.或,计算任意一路所述麦克风信号中频率小于第二预设频率的信号的目标低频能量;
82.根据所述目标低频能量以及预设的低频能量与风速之间的对应关系,匹配得到风噪分析结果。
83.参照图2,图2为本发明风噪抑制方法一实施例的流程示意图。
84.本发明实施例提供了风噪抑制方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。在本实施例中,风噪抑制方法的执行主体可以是耳机、智能手机、个人电脑、服务器等设备,在本实施例中并不做限制。在本实施例中,为便于表述,以风噪抑制设备为执行主体进行各实施例阐述。在本实施例中,所述风噪抑制方法包括以下步骤:
85.步骤s10,在确定麦克风信号中存在风噪时,对所述麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号,其中,所述低频信号是频率小于或者等于预设频率的信号;在通过所述深度神经网络对所述低频信号进行噪声消除处理的过程中,通过注意力机制基于注意力权重对所述深度神经网络提取的低频信号特征进行加权处理,所述低频信号特征与去噪后的低频信号特征之间的相似度越高时所述注意力权重越大;
86.风噪抑制设备可以获取一路或一路以上的麦克风信号,对获取到的麦克风信号进行风噪分析,以确定麦克风信号中是否存在风噪或者确定麦克风信号中风噪的强度。
87.本实施例中,在确定麦克风信号中存在风噪时,对麦克风信号进行噪声消除以抑制风噪。通过对带有风噪的音频信号的频谱图进行分析,发现风噪主要影响低频段,因此,在对麦克风信号进行噪声消除处理时,可以根据预设频率将麦克风信号分成低频信号和高频信号,对低频信号采用结合注意力机制的深度神经网络进行噪声消除处理,得到的结果称为第一信号以示区分。本实施例,通过注意力机制基于注意力权重对深度神经网络提取的低频信号特征进行加权处理,低频信号特征与去噪后的低频信号特征之间的相似度越高时注意力权重越大,使得深度神经网络在对低频信号的处理过程中可以通过注意力机制的加权处理关注低频信号中的重要信息,也即语音信号和语音信号中的重要频段,从而使得深度神经网络对低频信号的噪声消除更准确。
88.具体地,本实施例中,低频信号可以是麦克风信号中小于或者等于预设频率的信号,高频信号可以是麦克风信号中高于预设频率的麦克风信号,预设频率可以根据需要进行设置,在本实施例中并不做限制。
89.在具体实施方式中,风噪抑制设备可以对获取到的麦克风信号进行分帧处理,按
照帧序依次对各帧麦克风信号进行风噪抑制处理,本实施方式中,将当前处理的一帧麦克风信号作为麦克风信号。需要说明的是,在具体实施方式中,风噪抑制设备可以对获取的离线的麦克风信号进行风噪抑制处理,也可以是对获取的麦克风实时采集的麦克风信号进行风噪抑制处理。例如,在一可行实施方式中,风噪抑制设备可以是耳机设备,耳机设备中设置至少一个麦克风,通过麦克风采集麦克风信号,风噪抑制设备获取麦克风实时采集的麦克风信号,对麦克风信号进行风噪抑制处理,再将处理结果通过耳机设备中的扬声器输出或发送到其他设备。
90.步骤s20,对所述麦克风信号中的高频信号采用预设的非神经网络算法进行噪声消除处理得到第二处理信号,其中,所述高频信号是频率大于所述预设频率的信号;
91.由于风噪主要影响低频段,本实施例中,对麦克风信号中的高频信号采用预设的非神经网络算法进行噪声消除处理,得到的结果称为第二处理信号以示区分。
92.本实施例中,通过非神经网络算法对高频信号进行处理,可以降低降低风噪抑制设备进行风噪抑制处理时的整体运算量,从而降低对风噪抑制设备硬件算力的要求。
93.步骤s30,对所述第一处理信号和所述第二处理信号进行融合得到风噪抑制结果。
94.在对麦克风信号进行分别处理得到第一处理信号和第二处理信号后,风噪抑制设备可以对第一处理信号和第二处理信号进行融合,得到风噪抑制结果。融合具体可以采用叠加或加权融合的方式,加权融合的权重可以根据需要进行设置,在本实施例中并不做限制。
95.在具体实施方式中,风噪抑制设备可以对时域的第一处理信号和第二处理信号进行融合,得到时域的融合后的信号,该信号即对麦克风信号进行风噪抑制后的信号,风噪抑制设备将该信号作为风噪抑制结果。风噪抑制设备可以将时域的抑制风噪后的信号输出,或者对该信号进行进一步的处理后再输出,例如,可对该信号进行动态范围控制(drc)后输出。
96.在具体实施方式中,当麦克风信号有多路时,风噪抑制设备可以将多路麦克风信号处理为一路信号,再对该路信号中进行噪声消除处理。例如,风噪抑制设备可以对多路麦克风信号进行波束形成处理,基于波束形成的结果对各路麦克风信号进行预设方向的噪声抑制,得到一路指向性噪声抑制信号,再对该指向性噪声抑制信号进行噪声消除处理。
97.在具体实施方式中,风噪抑制设备可以是将一路信号(一路麦克风信号或多路麦克风信号经过处理后得到的一路信号)复制为两路,以下称为信号1和信号2。在一可行实施方式中,风噪抑制设备可以对信号1采用深度神经网络进行全频段的噪声消除处理,再对噪声消除处理后的结果进行低通滤波,低通滤波的上截止频率为预设频率,将滤波后的信号作为第一处理信号;对信号2采用非神经网络算法进行噪声消除处理,再对噪声消除处理后的结果进行高通滤波,高通滤波的下截止频率为预设频率,将滤波后的信号作为第二处理信号。在另一可行实施方式中,风噪抑制设备可以对信号1进行低通滤波,低通滤波的上截止频率为预设频率,对滤波后的信号采用深度神经网络进行全频段的噪声消除处理,将处理得到的信号作为第一处理信号;对信号2进行高通滤波,高通滤波的下截止频率为预设频率,对滤波后的信号采用非神经网络算法进行全频段的噪声消除处理,将处理得到的信号作为第二处理信号。在具体实施方式中,高通滤波和低通滤波可以分别采用5个biquad(双二阶滤波器)串联而成的高通滤波器和低通滤波器来实现。
98.进一步地,在一可行实施方式中,当有两路或两路以上所述麦克风信号时,所述步骤s20之前,还包括:
99.对各路所述麦克风信号分别采用远端信号进行回声消除,得到回声消除信号;例如,有两路麦克风信号分别表示为麦克风信号1和麦克风信号2,风噪抑制设备采用远端信号对麦克风信号1进行回声消除,得到回声消除信号1,采用远端信号对麦克风信号2进行回声消除,得到回声消除信号2。
100.对各路所述回声消除信号进行波束形成,基于波束形成的结果对各路所述回声消除信号进行预设方向的噪声抑制,得到一路指向性噪声抑制信号;
101.本实施方式中,对指向性噪声抑制信号中低频信号采用预设的深度神经网络进行噪声消除处理,得到第一处理信号,以及,对指向性噪声抑制信号中高频信号采用预设的非神经网络算法进行噪声消除处理,得到第二处理信号。
102.风噪抑制设备对麦克风信号进行回声消除和波束形成可以采用成熟的算法来实现,在本实施方式中对不做限制。
103.进一步地,在一可行实施方式中,所述步骤s10:在确定麦克风信号中存在风噪时,对所述麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号之前,还包括:
104.步骤s40,对麦克风信号进行风噪分析,根据风噪分析结果确定所述麦克风信号中是否存在风噪;
105.本实施方式中,通过对麦克风信号进行风噪分析,根据风噪分析结果确定麦克风信号中是否存在风噪。本实施方式中,风噪分析的具体方法在此不做限制。
106.本实施方式中,步骤s40:对麦克风信号进行风噪分析,根据风噪分析结果确定所述麦克风信号中是否存在风噪之前,还包括:
107.步骤s50,当根据所述风噪分析结果确定所述麦克风信号中不存在风噪时,对所述麦克风信号采用所述非神经网络算法进行噪声消除处理,得到抑制风噪后的麦克风信号。
108.在根据风噪分析结果确定麦克风信号中不存在风噪的情况下,对麦克风信号采用非神经网络算法进行噪声消除处理,可以降低风噪抑制设备的运算量,从而降低对风噪抑制设备硬件算力的要求。
109.进一步地,在一可行实施方式中,所述步骤s40:对麦克风信号进行风噪分析,包括:
110.步骤s401,当有两路或两路以上的所述麦克风信号时,计算各路所述麦克风信号之间的目标相关度;
111.当有两路或两路以上的麦克风信号时,风噪抑制设备可以利用各路麦克风信号之间的相关度来进行风噪分析。在具体实施方式中,当有两路麦克风信号时,风噪抑制设备可以直接计算该两路麦克风信号之间的相关度,将该相关度作为目标相关度。当有两路以上的麦克风信号时,风噪抑制设备可以计算两两麦克风信号之间的相关度,将各个相关度计算平均(也可以采用其他融合方式,例如相加)得到目标相关度,或也可以直接将各个相关度均作为目标相关度。
112.具体地,在一可行实施方式中,计算两路麦克风信号之间的相关度的过程可以是:可以对两路时域的麦克风信号进行傅里叶变换,例如经过傅里叶变换计算后将8khz带宽分
为128个子带,y1(k)和y2(k)分别表示麦克风信号1和麦克风信号2的傅里叶变换。计算指定带宽内的相干系数,采用该相干系数作为麦克风信号1和麦克风信号2之间的相关度,相干系数的计算公式具体可以是:
[0113][0114]
在另一可行实施方式中,计算两路麦克风信号之间的相关度的过程可以是:分别计算两路麦克风信号中信号为负值的采样点个数;根据采样点个数计算得到两路麦克风信号之间的目标相关度。例如,在一可行实施方式中,定义基于x2的相关度函数:
[0115][0116]
其中,o
12
、o
22
是下列矩阵的元素:
[0117][0118]
其中,表示麦克风信号1在时间0~k上的信号为正值的采样点的个数,表示麦克风信号2在时间0~k上的信号为负值的点的个数,k是一帧麦克风信号的帧长,n=2k。
[0119]
步骤s402,根据所述目标相关度以及预设的相关度与风速之间的对应关系,匹配得到风噪分析结果;
[0120]
预先可以根据实验测试结果,在风噪抑制设备中设置麦克风信号之间的相关度与风速(可表现风噪强度)之间的对应关系,该对应关系表现为当麦克风信号中存在风噪,或风速越大时,各路麦克风信号之间的相关度越小。风噪抑制设备在计算得到目标相关度后,可以根据预设的相关度与风速之间的对应关系,匹配得到风噪分析结果。例如,当风噪分析结果是表征麦克风信号中是否存在风噪的结果时,风噪抑制设备可以根据对应关系,匹配目标相关度所对应的风速,当风速大于一定风速时,得到麦克风信号中存在风噪的结果。
[0121]
在一可行实施方式中,当有两路以上的麦克风信号,目标相关度有多个时,风噪抑制设备也可以分别匹配各个目标相关度对应的风速,再将各个风速计算平均,再根据计算结果得到风噪分析结果。
[0122]
在本实施方式中,提出另一种可行的风噪分析实施方式,所述步骤s40:对麦克风信号进行风噪分析,包括:
[0123]
步骤s403,计算任意一路所述麦克风信号中频率小于第二预设频率的信号的目标低频能量;
[0124]
在本实施方式中,当麦克风信号有一路时,风噪抑制设备基于该路麦克风信号进行风噪分析,当麦克风信号有两路或两路以上时,风噪抑制设备可以从各路麦克风信号中任选一路麦克风信号进行风噪分析。
[0125]
对于一路麦克风信号,风噪抑制设备计算该麦克风信号中频率小于预设的频率
(以下称为第二频率以示区分)的信号的低频能量(以下称为目标低频能量以示区分)。其中,第二频率可以根据需要预先设置,例如设置为1500hz。计算目标低频能量的方式有很多种,在本实施方式中并不做限制,例如,在一可行实施方式中,风噪抑制设备可以先将该路麦克风信号进行低通滤波,低通滤波的上截止频率为第二频率,低通滤波可以采用但不限于采用iir(infinite impulse response)滤波器实现。设经过滤波后的一帧信号为x1
lp
,目标低频能量p
low
可以采用如下方式计算:
[0126][0127]
其中k表示一帧麦克风信号的帧长。
[0128]
步骤s404,根据所述目标低频能量以及预设的低频能量与风速之间的对应关系,匹配得到风噪分析结果。
[0129]
预先可以根据实验测试结果,在风噪抑制设备中设置低频能量与风速(可表现风噪强度)之间的对应关系,该对应关系表现为当麦克风信号中存在风噪,或风速越大时,麦克风信号中频率小于第二预设频率的信号的低频能量越大。风噪抑制设备在计算得到目标低频能量后,可以根据预设的低频能量与风速之间的对应关系,匹配得到风噪分析结果。例如,当风噪分析结果是表征麦克风信号中是否存在风噪的结果时,风噪抑制设备可以根据对应关系,匹配目标低频能量所对应的风速,当风速大于一定风速时,得到麦克风信号中存在风噪的结果。
[0130]
本实施例中,通过在确定麦克风信号中存在风噪时,对麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号,其中,低频信号是频率小于或者等于预设频率的信号,注意力机制用于对深度神经网络提取的特征进行加权处理;对麦克风信号中的高频信号采用预设的非神经网络算法进行噪声消除处理,得到第二处理信号,其中,高频信号是频率大于预设频率的信号;对第一处理信号和第二处理信号进行融合得到风噪抑制结果。
[0131]
本实施例在深度神经网络中引入注意力机制,通过注意力机制基于注意力权重对深度神经网络提取的低频信号特征进行加权处理,低频信号特征与去噪后的低频信号特征之间的相似度越高时注意力权重越大,使得深度神经网络在对低频信号的处理过程中可以通过注意力机制的加权处理关注低频信号中的重要信息,也即语音信号和语音信号中的重要频段,从而使得深度神经网络对低频信号的噪声消除更准确,从而实现不增加设备的硬件成本和设计难度的情况下提高设备的风噪抑制效果。
[0132]
进一步地,基于上述第一实施例,提出本发明风噪抑制方法第二实施例,在本实施例中,所述深度神经网络包括编码器、循环神经网络模块、注意力机制模块、解码器和全连接层,所述步骤s20:的步骤包括:
[0133]
步骤s201,将所述麦克风信号中的低频信号输入所述编码器进行处理,得到第一处理结果;
[0134]
本实施例中,预设的深度神经网络可以包括编码器、循环神经网络模块、注意力机制模块、解码器和全连接层。其中,编码器层用于对输入的麦克风信号进行数据特征提取和下采样;循环神经网络模块用于对编码器层输出的结果进行处理,在处理过程中会利用到对上一帧麦克风信号进行处理时的结果,从而利用历史帧的信息来对当前帧进行噪声消
除,提高风噪抑制效果;注意力机制模块用于关注麦克风信号中的重点信号,也即语音信号,以及关注语音信号中的重点频段;解码器用于对循环神经网络输出的结果进行上采样;全连接层用于对解码器输出的结果进行处理后输出消除噪声后的信号。该深度神经网络可以预先通过训练数据集进行训练得到,训练方法可以采用常规的神经网络训练方法,在此不做赘述。
[0135]
在一可行实施方式中,编码器和解码器可以借鉴u-net网络中的编解码器结构,也即,解码器用于实现数据特征的跨接和上采样。
[0136]
风噪抑制设备将麦克风信号中低频信号输入编码器进行处理,得到目标麦克风信号对应的处理结果(以下称为第一处理结果以示区分)。
[0137]
步骤s202,将所述第一处理结果输入至所述循环神经网络模块进行处理得到第二处理结果,其中,在通过所述循环神经网络模块对所述第一处理结果进行处理时,使用所述循环神经网络模块对前一帧处理结果进行处理得到的结果,所述前一帧处理结果为所述编码器对所述麦克风信号的前一帧信号进行处理得到的结果;
[0138]
风噪抑制设备在进行噪声消除的时候,按照时序对接收到麦克风信号进行处理,本实施例中,将当前处理的麦克风信号的前一帧信号称为前一帧信号,将编码器对前一帧信号的处理结果称为前一帧处理结果。
[0139]
本实施例中,将第一处理结果输入至循环神经网络模块进行处理得到第二处理结果,可以理解的是,在通过循环神经网络模块对第一处理结果进行处理时,使用循环神经网络模块对前一帧处理结果进行处理得到的结果。
[0140]
步骤s203,将所述第二处理结果输入至所述解码器进行处理得到第三处理结果;
[0141]
将第二处理结果输入至解码器进行处理,得到的结果称为第三处理结果以示区分。
[0142]
步骤s204,将所述第一处理结果和所述第三处理结果输入至所述注意力机制模块进行处理得到第四处理结果;
[0143]
将第一处理结果和第三处理结果输入至注意力机制模块进行处理,得到的结果称为第四处理结果以示区分。
[0144]
在具体实施方式中,可以是基于第一处理结果和第三处理结果计算得到表征对第一处理结果中信息的关注度的注意力权重矩阵,通过注意力权重矩阵对第一处理结果进行加权处理得到第四处理结果。
[0145]
注意力机制模块对第一处理结果进行加权处理,实现对第一处理结果中的特征进行权重分配,从而实现筛选第一处理结果中的重要信息并增强重要信息,使深度神经网络在解码过程中关注重点信息,也即语音信号和语音信号的重点频段,从而提高噪声消除的准确度。
[0146]
步骤s205,连接所述第三处理结果和所述第四处理结果,将连接得到的结果输入至所述全连接层进行处理得到第一处理信号。
[0147]
连接第三处理结果和第四处理结果,将连接得到的结果输入至全连接层进行处理得到第一处理信号。
[0148]
本实施例中,引入注意力机制模块对第一处理结果进行加权处理,实现对第一处理结果中的特征进行权重分配,从而实现筛选第一处理结果中的重要信息并增强重要信
息,使深度神经网络在解码过程中关注重点信息,也即语音信号和语音信号的重点频段,从而提高噪声消除的准确度。
[0149]
进一步地,在一可行实施方式中,将麦克风信号输入深度神经网络之前,对麦克风信号进行时频变换后得到频域信号,频域信号包括实部信号(也即图3所示的real)和虚部信号(也即图3所示的image);分别将实部信号和虚部信号输入各自对应的深度神经网络,需要说明的是,实部信号对应的深度神经网络和虚部信号对应的深度神经网络结构相同。经过深度神经网络处理后的实部信号和经过深度网络处理后的虚部信号经过时频反变换,将时频反变换后的实部信号和时频反变换后的虚部信号结合得到复数信号,该复数信号即为风噪抑制后的麦克风信号,也即风噪抑制结果。
[0150]
如图3所示,示意性地画出了本实施方式中深度神经网络的结构图,图中r_rnn表示循环神经网络,编码器(enconde)可以包括多个编码层(如图3中所示的3层编码层),解码器(decode)可以包括多个解码层(图3中画出了3层解码层),解码层可以用于进行反卷积(deconv),注意力机制模块的数量与编码器层数(也即解码器层数)相同,编码器和解码器的各层分别与注意力机制模块连接,注意力机制模块的输出数据与解码器的输出数据连接,作为下一层的输入数据。
[0151]
其中,编码层可以采用一维卷积(1d-conv,也即图3中所示的conv) 下采样 激活函数实现,下采样可以采用2*2的池化层,激活函数可以使用leakyrelu,定义如下:
[0152][0153]
在具体实施方式中,循环神经网络可以采用带有门结构的lstm、gru等模型来实现,以对梯度消失问题有更强的抑制能力,能够更有效地对数据中在时间上间隔较远的因果关系进行学习。
[0154]
进一步地,在一可行实施方式中,所述注意力机制模块包括权重计算块和加权处理块,所述步骤s204:将所述第一处理结果和所述第三处理结果输入至所述注意力机制模块进行处理得到第四处理结果,包括:
[0155]
步骤s2041,将所述第一处理结果和所述第三处理结果输入至所述权重计算块进行处理,得到注意力权重矩阵;
[0156]
本实施方式中,将第一处理结果和第三处理结果输入至权重计算块进行处理,得到注意力权重矩阵。计算注意力权重矩阵的具体方式,在本实施方式中不进行限制。
[0157]
步骤s2042,将所述注意力权重矩阵和所述第一处理结果输入所述加权处理块进行处理得到第四处理结果。
[0158]
将注意力权重矩阵和第一处理结果输入加权处理块进行处理,得到第四处理结果。
[0159]
进一步地,在一可行实施方式中,所述权重计算块包括三层卷积层、一层点积层和两层激活函数,所述步骤s2041:将所述第一处理结果和所述第三处理结果输入至所述权重计算块进行处理,得到注意力权重矩阵,包括:
[0160]
步骤s20411,将所述第一处理结果输入至第一卷积层进行卷积操作得到第一卷积结果,并将所述第三处理结果输入至第二卷积层进行卷积操作得到第二卷积结果;
[0161]
本实施方式中,将第一处理结果输入至第一卷积层,基于第一卷积权重进行卷积操作,得到的结果称为第一卷积结果以示区分。
[0162]
将第三处理结果输入至第二卷积层,基于第二卷积权重进行卷积操作,得到的结果称为第二卷积结果以示区分。
[0163]
步骤s20412,将所述第一卷积结果和所述第二卷积结果输入至第一点积层计算得到第一点积结果,将所述第一点积结果输入至第一激活函数进行处理得到第一激活结果;
[0164]
将第一卷积结果和第二卷积结果输入至点积层(以下称为第一点积层以示区分)进行计算,得到的结果称为第一点积结果以示区分。将第一点积结果输入至第一激活函数进行处理,得到的结果称为第一激活结果以示区分。
[0165]
步骤s20413,将所述第一激活结果输入至第三卷积层进行卷积操作得到第三卷积结果,将所述第三卷积结果输入至第二激活函数进行处理得到注意力权重矩阵。
[0166]
将第一激活结果输入至第三卷积层,基于第三卷积权重进行卷积操作,得到的结果称为第三卷积结果以示区分。将第三卷积结果输入至第二激活函数进行处理得到注意力权重矩阵。
[0167]
需要说明的是,第一卷积权重、第二卷积权重和第三卷积权重可以在模型训练阶段得到,训练过程在此不做赘述。本实施方式中,通过卷积操作进行特征增强,通过激活函数加入非线性因素,提高深度神经网络对模型的表达能力。
[0168]
进一步地,在一可行实施方式中,所述加权处理块包括一层卷积层和一层点积层,所述步骤s2042:将所述注意力权重矩阵和所述第一处理结果输入所述加权处理块进行处理得到第四处理结果,包括:
[0169]
步骤s20421,将所述第一处理结果输入至第四卷积层进行卷积操作得到第四卷积结果;
[0170]
本实施方式中,将第一处理结果输入至第四卷积层,基于第四卷积权重进行卷积操作,得到的结果称为第四卷积结果以示区分。第四卷积权重可以在模型训练阶段得到,训练过程在此不做赘述。
[0171]
步骤s20422,将所述第四卷积结果和所述注意力权重矩阵输入至第二点积层计算得到第四处理结果。
[0172]
将第四卷积结果和注意力权重矩阵输入至点积层(以下称为第二卷积层以示区分)计算得到第四处理结果。
[0173]
进一步地,在一可行实施方式中,注意力机制模块的处理过程可以参照图4,如图4所示,本实施方式中,基于第一卷积权重w2对第一处理结果e1进行卷积操作得到第一卷积结果,基于第二卷积权重w2对第三处理结果d1进行卷积操作得到第二卷积结果;计算第一卷积结果和第二卷积结果的点积得到第一点积结果;通过第一激活函数sigmoid函数(也即图4中所示的s)对第一点积结果进行处理得到第一激活结果;基于第三卷积权重w4对第一激活结果进行卷积操作得到第三卷积结果;通过第二激活函数relu函数对第三卷积结果进行处理得到注意力权重矩阵;基于第四卷积权重w3对第一处理结果e1进行卷积操作得到第四卷积结果;计算注意力权重矩阵和第四卷积结果的点积,得到注意力机制模块的输出数据out1,也即第四处理结果。
[0174]
注意力机制模块的处理过程的具体公式为:
[0175][0176]
其中,表示卷积,

表示点积,w1、w2、w3和w4均是卷积权重,由训练得到。
[0177]
进一步地,在一可行实施方式中,所述循环神经网络模块包括串联的至少一个循环神经网络层,所述循环神经网络层包括复位门和新记忆门,本实施方式中,将当前处理的麦克风信号的前一帧信号对应的解码器处理结果称为上一帧处理结果。本实施方式中,步骤s202:将所述第一处理结果输入至所述循环神经网络模块进行处理得到第二处理结果,包括:
[0178]
将所述第一信号处理结果输入至所述循环神经网络模块,经过各层所述循环神经网络层的串联处理后得到所述第一信号处理结果对应的第二信号处理结果。本实施方式中,循环神经网络模块包括串联的至少一个循环神经网络层,例如,包括两个循环神经网络层,那么风噪抑制设备将第一信号处理结果输入到第一个循环神经网络层进行处理,第一个循环神经网络层输出的结果在输入到第二个循环神经网络层进行处理,得到第一信号处理结果对应的第二信号处理结果。
[0179]
需要说明的是,在各层循环神经网络层中,第一层循环神经网络层的输入数据是第一信号处理结果;除第一层循环神经网络层之外的循环神经网络层的输入数据是,上一层循环神经网络层的输出数据。本实施方式中,用“第一信号处理结果在循环神经网络层所对应的输入数据”表示在风噪抑制设备采用循环神经网络模块对第一信号处理结果进行处理时,该循环神经网络层的输入数据。例如,假设循环神经网络模块包括两个循环神经网络层,那么第一信号处理结果在第一个循环神经网络层所对应的输入数据就是该第一信号处理结果,第一信号处理结果在第二个循环神经网络层所对应的输入数据就是通过第一个循环神经网络层对第一信号处理结果进行处理所得到的结果。同理,在本实施方式中,用“第一信号处理结果在循环神经网络层所对应的输出数据”表示在风噪抑制设备采用循环神经网络模块对第一信号处理结果进行处理时,该循环神经网络层的输出数据。
[0180]
以下以一层循环神经网络的处理过程为例进行说明,并将该层循环神经网络称为目标循环神经网络层以示区分,将第一信号处理结果在所述目标循环神经网络层所对应的输入数据称为目标输入数据以示区分。
[0181]
在经过各层所述循环神经网络层串联处理所述第一信号处理结果的过程中,将所述第一信号处理结果在所述目标循环神经网络层所对应的目标输入数据输入至所述目标循环神经网络层进行处理,得到所述第一信号处理结果在所述目标循环神经网络层所对应的目标输出数据的步骤包括:
[0182]
将所述目标输入数据,以及所述上一帧处理结果在所述目标循环神经网络层所对应的输出数据,输入所述目标循环神经网络层的所述复位门,得到所述目标输入数据对应的复位门处理结果。在一可行实施方式中,在采用如图5所示的循环神经网络层时,复位门的表达式可以为:
[0183]
a1(t)=sigmoid(x(t)*w1 y(t-1)*v1 b1)。
[0184]
其中,符号*表示矩阵乘法,a1(t)表示目标输入数据对应的复位门处理结果,x(t)表示目标输入数据,y(t-1)表示上一帧处理结果在目标循环神经网络层所对应的输出数据,w1、v1和b1是复位门中的参数,可在模型训练阶段得到。
[0185]
将所述目标输入数据和所述目标输入数据对应的所述复位门处理结果,以及上一帧处理结果在所述目标循环神经网络层所对应的输出数据,输入所述目标循环神经网络层的所述新记忆门,得到所述目标输入数据对应的新记忆门处理结果。在一可行实施方式中,在采用如图5所示的循环神经网络层时,新记忆门的表达式可以为:
[0186][0187]
其中,符号表示对应元素相乘,w2、v2和b2是新记忆门中的参数,可在模型训练阶段得到。
[0188]
根据所述目标输入数据对应的所述新记忆门处理结果和所述复位门处理结果,以及所述上一帧处理结果在所述目标循环神经网络层所对应的输出数据,计算得到所述目标输出数据。在一可行实施方式中,在采用如图5所示的循环神经网络层时,目标输出结果表示为y(t),可以采用以下表达式计算:
[0189]
y(t)=(1-a1(t))*y(t-1) a1(t)*a2(t)。
[0190]
在一可行实施方式中,在对采用如图5所示的循环神经网络层的深度神经网络进行训练的过程中,可以采用反向传播计算各个参数的梯度,根据梯度来更新各个参数。可以采用如下方式来计算各个参数的梯度。
[0191]
1)对于新记忆门:
[0192][0193][0194][0195]
这里对w
2,k
做梯度计算
[0196][0197]
同理
[0198][0199][0200]
其中
[0201][0202]
2)对于复位门:
[0203][0204][0205][0206]
这里对w
1,k
做梯度计算
[0207][0208]
同理
[0209][0210][0211]
其中
[0212][0213]
本实施例中,引入注意力机制模块对第一处理结果进行加权处理,实现对第一处理结果中的特征进行权重分配,从而实现筛选第一处理结果中的重要信息并增强重要信息,使深度神经网络在解码过程中关注重点信息,也即语音信号和语音信号的重点频段,从而提高噪声消除的准确度。
[0214]
在一可行实施方式中,风噪抑制设备可以按照如图6所示的流程进行风噪抑制。
[0215]
1.输入信号分别为时域麦克信号1(y1)、时域麦克信号2(y2)、麦克信号可以为一路也可以是多路,此处以两路信号为例;
[0216]
2.对输入的时域麦克信号做时频变换,此处采用fft快速傅里叶变换,得到频域信号分别为y1(k)、y2(k),根据远端信号(喇叭信号),分别对两路信号做回声消除处理;
[0217]
3.对两路麦克信号做波束形成,抑制指向性以外的噪声;
[0218]
4.通过两路麦克信号判断当前处理的信号帧是含有风噪还是不含有风噪;
[0219]
5.如果判断当前帧是非风噪帧,则对麦克信号做传统的噪声消除处理;
[0220]
6.如果判断当前帧是风噪帧,则对低频信号做基于dnn的噪声消除,对高频信号做传统的噪声处理;
[0221]
7.对传统的噪声处理后的时域麦克信号高通滤波得到输出信号out1;
[0222]
8.对dnn的噪声处理后的信号低通滤波得到输出信号out2;
[0223]
9.融合后的信号out=k1*out1 k2*out2,k1和k2是根据需要预先设置的权重;
[0224]
10.风噪和非风噪条件下的信号均进行动态范围控制(drc);
[0225]
11.输出最终时域信号out。
[0226]
此外,本发明实施例还提出一种风噪抑制装置,所述装置包括:
[0227]
噪声消除模块,用于在确定麦克风信号中存在风噪时,对所述麦克风信号中的低频信号采用结合注意力机制的预设深度神经网络进行噪声消除处理,得到第一处理信号,其中,所述低频信号是频率小于或者等于预设频率的信号;在通过所述深度神经网络对所述低频信号进行噪声消除处理的过程中,通过注意力机制基于注意力权重对所述深度神经网络提取的低频信号特征进行加权处理,所述低频信号特征与去噪后的低频信号特征之间的相似度越高时所述注意力权重越大;
[0228]
所述噪声消除模块,还用于对所述麦克风信号中的高频信号采用预设的非神经网络算法进行噪声消除处理得到第二处理信号,其中,所述高频信号是频率大于所述预设频率的信号;
[0229]
融合模块,用于对所述第一处理信号和所述第二处理信号进行融合得到风噪抑制结果。
[0230]
进一步地,所述深度神经网络包括编码器、循环神经网络模块、注意力机制模块、解码器和全连接层,所述噪声消除模块还用于:
[0231]
将所述麦克风信号中的低频信号输入所述编码器进行处理,得到第一处理结果;
[0232]
将所述第一处理结果输入至所述循环神经网络模块进行处理得到第二处理结果,其中,在通过所述循环神经网络模块对所述第一处理结果进行处理时,使用所述循环神经网络模块对前一帧处理结果进行处理得到的结果,所述前一帧处理结果为所述编码器对所述麦克风信号的前一帧信号进行处理得到的结果;
[0233]
将所述第二处理结果输入至所述解码器进行处理得到第三处理结果;
[0234]
将所述第一处理结果和所述第三处理结果输入至所述注意力机制模块进行处理得到第四处理结果;
[0235]
连接所述第三处理结果和所述第四处理结果,将连接得到的结果输入至所述全连接层进行处理得到第一处理信号。
[0236]
进一步地,所述注意力机制模块包括权重计算块和加权处理块,所述噪声消除模块还用于:
[0237]
将所述第一处理结果和所述第三处理结果输入至所述权重计算块进行处理,得到注意力权重矩阵;
[0238]
将所述注意力权重矩阵和所述第一处理结果输入所述加权处理块进行处理得到
第四处理结果。
[0239]
进一步地,所述权重计算块包括三层卷积层、一层点积层和两层激活函数,所述噪声消除模块还用于:
[0240]
将所述第一处理结果输入至第一卷积层进行卷积操作得到第一卷积结果,并将所述第三处理结果输入至第二卷积层进行卷积操作得到第二卷积结果;
[0241]
将所述第一卷积结果和所述第二卷积结果输入至第一点积层计算得到第一点积结果,将所述第一点积结果输入至第一激活函数进行处理得到第一激活结果;
[0242]
将所述第一激活结果输入至第三卷积层进行卷积操作得到第三卷积结果,将所述第三卷积结果输入至第二激活函数进行处理得到注意力权重矩阵。
[0243]
进一步地,所述加权处理块包括一层卷积层和一层点积层,所述噪声消除模块还用于:
[0244]
将所述第一处理结果输入至第四卷积层进行卷积操作得到第四卷积结果;
[0245]
将所述第四卷积结果和所述注意力权重矩阵输入至第二点积层计算得到第四处理结果。
[0246]
进一步地,所述风噪抑制模块还包括风噪分析模块,所述风噪分析模块用于:
[0247]
对麦克风信号进行风噪分析,根据风噪分析结果确定所述麦克风信号中是否存在风噪;
[0248]
所述噪声消除模块还用于:
[0249]
当根据所述风噪分析结果确定所述麦克风信号中不存在风噪时,对所述麦克风信号采用所述非神经网络算法进行噪声消除处理,得到抑制风噪后的麦克风信号。
[0250]
进一步地,所述风噪分析模块还用于:
[0251]
当有两路或两路以上的麦克风信号时,计算各路所述麦克风信号之间的目标相关度;
[0252]
根据所述目标相关度以及预设的相关度与风速之间的对应关系,匹配得到风噪分析结果;
[0253]
或,计算任意一路所述麦克风信号中频率小于第二预设频率的信号的目标低频能量;
[0254]
根据所述目标低频能量以及预设的低频能量与风速之间的对应关系,匹配得到风噪分析结果。
[0255]
本发明风噪抑制装置的各实施例,均可参照本方明风噪抑制方法各个实施例,此处不再赘述。
[0256]
此外,本发明实施例还提出一种计算机可读存储介质,所述存储介质上存储有风噪抑制程序,所述风噪抑制程序被处理器执行时实现如下所述的风噪抑制方法的步骤。
[0257]
本发明风噪抑制设备和计算机可读存储介质各实施例,均可参照本发明风噪抑制方法各个实施例,此处不再赘述。
[0258]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该
要素的过程、方法、物品或者装置中还存在另外的相同要素。
[0259]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0260]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
[0261]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
当前第1页1  
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图