1.本发明涉及语音合成技术领域,具体涉及一种语音合成方法、模型训练方法、装置、设备和存储介质。
背景技术:2.语音合成技术提供了一种将仅可读的文字转化为可听的声音的能力,在众多领域中得到了广泛的应用。目前,在众多需要将文字转换为语音的目标文本中,存在多种不同的语言。在相关技术中,对于需要将包括不同语言的目标文本需要将不同语言分开合成,即针对不同的语言需要训练不同的语音合成模型,然后再将针对不同语音合成模型得到的语音进行拼接,从而耗费了大量的资源,且拼接后的语音在听感上不自然。
技术实现要素:3.有鉴于此,本发明实施方式提供了一种语音合成方法、模型训练方法、装置、设备和存储介质,在一定程度上能够降低多语言混合的目标文本在语音合成过程中的计算量。
4.本发明一方面提供了一种语音合成方法,所述方法包括:获取包括多种语言的目标文本和所述目标文本的韵律信息;对所述目标文本中不同语言的文字进行音素标记,得到所述目标文本中不同语言的文字的音素标记信息;所述音素标记信息包括不同语言文字的音素信息和语言标识;基于所述音素标记信息和所述韵律信息生成所述目标文本的目标音素向量;将所述目标音素向量输入语音合成模型,得到所述目标文本的目标语音。
5.结合第一方面,在一个实施方式中,对所述目标文本中不同语言的文字进行音素标记,得到所述目标文本中不同语言的文字的音素标记信息,包括:提取所述目标文本中不同语言文字的音素信息;对所述不同语言文字的音素信息分别添加语言标识,得到所述目标文本中不同语言的文字的音素标记信息。
6.结合第一方面和其它对应的实施方式,在一个实施方式中,基于所述音素标记信息和所述韵律信息生成所述目标文本的目标音素向量,包括:对不同语言的音素分别进行编码,得到各个音素对应的音素编码;将所述音素标记信息按照所述音素编码转换为对应的音素编码信息;基于所述音素编码信息和所述韵律信息生成所述目标文本的目标音素向量。
7.结合第一方面,在一个实施方式中,获取包括多种语言的目标文本和所述目标文本的韵律信息,包括:获取包括多种语言的目标文本;将所述目标文本输入韵律预测模型,得到所述目标文本的韵律信息。
8.结合第一方面和其它对应的实施方式,在一个实施方式中,语音合成方法还可以包括:将所述待转换文本进行规范化处理,得到目标文本;所述规范化处理至少包括以下之一:标点符号处理、数字处理、单位处理、分数处理、比分处理。
9.结合第一方面,在一个实施方式中,所述语音合成模型包括声学特征提取模型和声码器,将所述目标音素向量输入语音合成模型,得到所述目标文本的目标语音,包括:将
所述目标音素向量输入所述声学特征提取模型,得到所述目标文本的声学特征;将所述声学特征输入所述声码器中,得到所述目标文本的目标语音。
10.本发明第二方面还提供了一种语音合成模型的训练方法,所述语音合成模型的训练方法包括:获取若干个多语言混合的目标训练文本,与所述目标训练文本对应的目标训练语音;将所述目标训练文本输入韵律预测模型,得到所述目标训练文本的目标韵律信息;对所述目标训练文本中不同语言的文字进行音素标记,得到所述目标训练文本中不同语言的文字的音素标记信息;所述音素标记信息包括不同语言文字的音素信息和语言标识;基于所述音素标记信息和所述韵律信息生成所述目标训练文本的目标音素向量;将所述目标音素向量作为语音合成模型的输入,以及将与所述目标音素向量对应的目标训练语音作为语音合成模型的输出,训练语音合成模型;训练好的语音合成模型用于实现上述任一实施方式中所述的语音合成方法。
11.本发明第三方面还提供了一种语音合成装置,所述语音合成装置包括:数据获取单元,用于获取包括多种语言的目标文本和所述目标文本的韵律信息;音素标记单元,用于对所述目标文本中不同语言的文字进行音素标记,得到所述目标文本中不同语言的文字的音素标记信息;所述音素标记信息包括不同语言文字的音素信息和语言标识;向量生成单元,用于基于所述音素标记信息和所述韵律信息生成所述目标文本的目标音素向量;语音合成单元,用于将所述目标音素向量输入语音合成模型,得到所述目标文本的目标语音。
12.本发明第四方面还提供了一种语音合成模型的训练装置,所述语音合成模型的训练装置包括:训练样本构建单元,用于获取若干个多语言混合的目标训练文本,与所述目标训练文本对应的目标训练语音;韵律预测单元,用于将所述目标训练文本输入韵律预测模型,得到所述目标训练文本的目标韵律信息;音素标记单元,用于对所述目标训练文本中不同语言的文字进行音素标记,得到所述目标训练文本中不同语言的文字的音素标记信息;所述音素标记信息包括不同语言文字的音素信息和语言标识;向量生成单元,用于基于所述音素标记信息和所述韵律信息生成所述目标训练文本的目标音素向量;模型训练单元,用于将所述目标音素向量作为语音合成模型的输入,以及将与所述目标音素向量对应的目标训练语音作为语音合成模型的输出,训练语音合成模型;训练好的语音合成模型用于实现上述任一实施方式中所述的语音合成方法。
13.本发明另一方面还提供了一种电子设备,所述电子设备装置包括处理器和存储器,所述存储器用于存储计算机程序,所述计算机程序被所述处理器执行时,实现上述的语音合成方法和/或语音合成模型的训练方法。
14.本发明另一方面还提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行时,实现上述的语音合成方法和/或语音合成模型的训练方法。
15.通过获取包括多种语言的目标文本及其对应的韵律信息,然后将目标文本中不同语言的文字按照语言标识和音素信息这样的结构进行标记,得到目标文本的音素标记信息,然后将音素标记信息结合目标文本的韵律信息,得到目标文本的目标音素向量,最终将目标音素向量输入语音合成模型,得到目标文本的目标语音,避免了多语言的目标文本中,不同的语言需要使用不同的语音合成模型合成对应的语音,从而在一定程度上降低多语言混合的目标文本在语音合成过程中的计算量。
附图说明
16.通过参考附图会更加清楚的理解本发明的特征和优点,附图是示意性的而不应理解为对本发明进行任何限制,在附图中:
17.图1示出了本公开一个实施方式中语音合成方法的步骤示意图;
18.图2示出了本公开一个实施方式中语音合成模型的训练方法的步骤示意图;
19.图3示出了本公开一个实施方式中语音合成装置示意图;
20.图4示出了本公开一个实施方式中语音合成模型的训练装置示意图;
21.图5示出了本公开一个实施方式中电子设备的结构示意图。
具体实施方式
22.为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本公开实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本公开一部分实施方式,而不是全部的实施方式。基于本公开中的实施方式,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本公开保护的范围。
23.语音合成技术提供了一种将仅可读的文字转化为可听的声音的能力,在众多领域中得到了广泛的应用。近年来语音合成技术被广泛应用于智能客服,智能播报,虚拟直播等各个领域。目前,在众多需要将文字转换为语音的目标文本中,存在多种不同的语言,例如双语播报、虚拟直播等场景。在相关技术中,对于需要将包括不同语言的目标文本需要将不同语言分开合成,即针对不同的语言需要训练不同的语音合成模型,然后再将针对不同语音合成模型得到的语音进行拼接,从而耗费了大量的资源,且拼接后的语音在听感上不自然。
24.因此,需要提出一种语音合成方法,将这种不同语言的发音单元进行统一,通过该方法针对不同的语言只需要训练一个语音合成模型,无需针对不同的语言分别训练多个语音合成模型,从而能够节约对包括多种语言的目标文本进行语音合成的算力。
25.请参阅图1,本公开一个实施方式提供的语音合成方法,该方法可以包括以下多个步骤。
26.s110:获取包括多种语言的目标文本和所述目标文本的韵律信息。
27.在本实施方式中,在对目标文本进行语音合成之前,首先要获取目标文本以及目标文本对应的韵律信息。
28.在本实施方式中,语言的韵律是指人们说话时“轻重缓急,抑扬顿挫”的特点,在声学上表现为停顿、音高、音长、音强等,也被称为超音段特征。语音合成系统如果对韵律处理不当,就会导致合成语音听起来枯燥、呆板。因此高质量的韵律预测是合成高自然度语音的关键。语音合成系统的韵律实现通常可以归纳为两个步骤:1)从输入文本得到其韵律的符号描述(包括节奏层级和边界位置、重音等级和位置、语调类型等),即文本分析中的韵律预测;2)将韵律的符号描述转化为韵律的声学参数(包括静音、基频、时长、能量等)。因此,可以通过韵律预测模型,得到目标文本的韵律信息。
29.在本实施方式中,韵律预测模型可以使用bilstm crf,或者预训练模型bert,后者泛化性更强、效果更好,前者模型更轻量、推理速度更快。当然,还可以用其它的模型,在此
不做限定。损失函数设为预测标签与真实标签之间的交叉熵,优化器可以选择常用的adam。然后,在韵律模型训练好之后,可以将目标文本输入该韵律预测模型,得到目标文本的韵律信息。
30.在本实施方式中,所述目标文本可以是用户手动输入的文本,也可以是小说、演讲稿、讲解词等。当然,目标文本还是可以是通过人机交互,对于用户问题的回答生成的文本。所述目标文本中至少包括了两种不同语言的文字,如目标文本中可以包括中文和英文,也可以包括中文和日文;也可以包括中文、英文、日文、韩文等各种不同的语言。当然,目标文本还可以是同一语言的不同发音方式,如英语中的英式英语和美式英语的发音不同,虽然其中只包括了英语这一种语言,但是如果要将目标文本通过英式英语和美式英语的方式进行语音合成的话,其也需要两个不同的语音合成模型进行语音合成。因此,在本说明书中,所述目标文本中的不同语言可以是同一文字表达的不同发音方式。
31.s120:对所述目标文本中不同语言的文字进行音素标记,得到所述目标文本中不同语言的文字的音素标记信息;所述音素标记信息包括不同语言文字的音素信息和语言标识。
32.在本实施方式中,在对目标文本进行韵律预测之后,还需要对目标文本中的文字进行音素标记。
33.在本实施方式中,对所述目标文本中不同语言的文字进行音素标记可以先按照普通的音素标记方法对各个语言的文字或者单词进行标记,然后再为各个音素添加语言标识,从而在后续识别的过程中,可以识别该音素表征的语言信息。
34.在相关技术中,对于中英文掺杂的目标文本来说,对于目标文本中的中文使用一个向量进行存储,对于目标文本中的英文使用一个向量进行存储,然后再对这两个向量中的文字或者单词进行标记,从而得到目标文本的音素标记信息。
35.在本实施方式中,对于中英文掺杂的目标文本来说,对于目标文本中的中文文字的音素可以添加一个中文的语言标识,对于目标文本中英文单词的音素标记可以添加一个英文的语言标识。具体的,例如,目标文本中“安”这个字的音素标记信息可以表示为“zh_an”。其中“zh”表征中文的语言标识,“_”表示中文语言标识和音素之间的分隔符。再比如,“anxiety”这个英文单词的中可以包括“an”这个音素,那么这个音素的音素标记信息可以表示为“en_an”。其中,“en”表征英文的语言标识,“_”表示英文语言标识和音素之间的分隔符。
36.s130:基于所述音素标记信息和所述韵律信息生成所述目标文本的目标音素向量。
37.在本实施方式中,由于机器学习模型并不能直接识别音素标记信息,因此,还需要将其音素标记信息转换成机器可以识别的样式进行表示,然后再结合目标文本的韵律信息,将多种语言的发音单元进行统一,生成一个用于输入语音合成模型的目标音素向量。
38.在本实施方式中,所述目标音素向量为按照目标文本中文字的发音顺序构成的发音空间单元。具体的,例如,目标文本为“你好!hello”,则将其进行音素转换后,得到的音素标记信息可以表示为“zh_ni,zh_hao,en_hello”。然后将其转换为向量表示,如英文字母a~z分别用0~25进行表示,中文拼音a~z分别用26~51表示,则转换后的目标音素向量可以表示为[39,34,33,26,40,sp2,7,4,11,11,14]。其中,sp2表示在“你好”和“hello”之间的
停顿。
[0039]
s140:将所述目标音素向量输入语音合成模型,得到所述目标文本的目标语音。
[0040]
在本实施方式中,在得到目标音素向量之后,可以将目标音素向量输入训练好的语音合成模型,得到目标文本的目标语音。
[0041]
在本实施方式中,语音合成模型包括声学特征提取模型和声码器。其中,声学特征提取模型可以是“编码器-解码器”模型,用于提取目标文本的声学特征。声学特征可以是梅尔频谱的形式。然后,将声学特征输入声码器模型,得到目标文本的目标语音。在本实施方式中,所述声学特征提取模型还可以是fastspeech、fastspeech2、durlan、merlin模型等,在此不作限定。所述声码器模型可以是hifi-gan模型,当然,也可以是lpcnet、straight等模型。
[0042]
在一个具体的实施例中,首先获取包括中英文混合的目标文本,并提取目标文本的韵律信息。然后提取目标文本中中英文的音素信息,并为各个音素信息添加上对应的语言标识,得到目标文本的音素标记信息。然后,基于韵律信息,将目标文本的音素标记信息映射至同一发音单元,得到目标文本的目标音素向量。然后,使用文本转换的发音单元预测待合成语音的梅尔频谱图,最后将语音的梅尔频谱转换为脉冲编码调制(pulse code modulation,pcm)的语音数据。
[0043]
通过对目标文本中音素信息的统一处理,可以处理任意文本,可以方便后续声学模型的训练,然后通过统一中英文发音单元,使得不需要训练多个声学模型,单个声学模型即可支持中英文混合语音合成的梅尔频谱生成。在对发音单元进行统一之后,在语音合成模型部署到的时候不需要部署多个模型,节省约50%语音合成部署内存。如之前需要中文语音合成模型和英文语音合成模型,现在只需要一个模型即可合成中英文混合语音。因此,该语音合成方法能够减少语音合成时计算量,如“你好hello”,之前需要分别通过中文语音合成模型和英文语音合成模型,现在只需要通过一个中英文混合模型,有效的减少了语音合成的计算量。
[0044]
在一个实施方式中,对所述目标文本中不同语言的文字进行音素标记,得到所述目标文本中不同语言的文字的音素标记信息,可以包括:提取所述目标文本中不同语言文字的音素信息;对所述不同语言文字的音素信息分别添加语言标识,得到所述目标文本中不同语言的文字的音素标记信息。
[0045]
在本实施方式中,对所述目标文本中不同语言的文字进行音素标记可以先按照普通的音素标记方法对各个语言的文字或者单词进行标记,然后再为各个音素添加语言标识,从而在后续识别的过程中,可以识别该音素表征的语言信息。
[0046]
在相关技术中,对于中英文掺杂的目标文本来说,对于目标文本中的中文使用一个向量进行存储,对于目标文本中的英文使用一个向量进行存储,然后再对这两个向量中的文字或者单词进行标记,从而得到目标文本的音素标记信息。
[0047]
在本实施方式中,对于中英文掺杂的目标文本来说,对于目标文本中的中文文字的音素可以添加一个中文的语言标识,对于目标文本中英文单词的音素标记可以添加一个英文的语言标识。具体的,例如,目标文本中“安”这个字的音素标记信息可以表示为“zh_an”。其中“zh”表征中文的语言标识,“_”表示中文语言标识和音素之间的分隔符。再比如,“anxiety”这个英文单词的中可以包括“an”这个音素,那么这个音素的音素标记信息可以
表示为“en_an”。其中,“en”表征英文的语言标识,“_”表示英文语言标识和音素之间的分隔符。
[0048]
在一个实施方式中,基于所述音素标记信息和所述韵律信息生成所述目标文本的目标音素向量,可以包括:对不同语言的音素分别进行编码,得到各个音素对应的音素编码;将所述音素标记信息按照所述音素编码转换为对应的音素编码信息;基于所述音素编码信息和所述韵律信息生成所述目标文本的目标音素向量。
[0049]
在本实施方式中,对不同语言的音素分别进行编码可以是对该语言内的所有的发音单元进行编码。具体的,例如,对于英文的发音单元,英文字母a~z分别用0~25进行表示;对于中文的发音单元,中文拼音a~z分别用26~51表示。则英文字母“a”对应的音素编码信息为“0”,中文拼音“a”对应的音素编码信息为“26”,中文拼音“z”对应的音素编码信息为“51”。然后,再基于该音素编码信息和目标文本的韵律信息,生成目标文本的音素向量。具体的,例如,目标文本“你好!hello”的韵律信息为[你好,sp2,hello]。其中,“sp2”表征在“你好”和“hello”之间有一定的停顿。“你好!hello”的音素编码信息可以表示为[39,34,33,26,40,7,4,11,11,14]。然后,可以将音素编码信息和韵律信息进行组合,得到目标文本的目标音素向量为[39,34,33,26,40,sp2,7,4,11,11,14]。
[0050]
在一个实施方式中,获取包括多种语言的目标文本和所述目标文本的韵律信息,可以包括:获取包括多种语言的目标文本;将所述目标文本输入韵律预测模型,得到所述目标文本的韵律信息。
[0051]
在本实施方式中,语言的韵律是指人们说话时“轻重缓急,抑扬顿挫”的特点,在声学上表现为停顿、音高、音长、音强等,也被称为超音段特征。语音合成系统如果对韵律处理不当,就会导致合成语音听起来枯燥、呆板。因此高质量的韵律预测是合成高自然度语音的关键。语音合成系统的韵律实现通常可以归纳为两个步骤:1)从输入文本得到其韵律的符号描述(包括节奏层级和边界位置、重音等级和位置、语调类型等),即文本分析中的韵律预测;2)将韵律的符号描述转化为韵律的声学参数(包括静音、基频、时长、能量等)。因此,可以通过韵律预测模型,得到目标文本的韵律信息。
[0052]
在本实施方式中,韵律预测模型可以使用bilstm crf,或者预训练模型bert,后者泛化性更强、效果更好,前者模型更轻量、推理速度更快。当然,还可以用其它的模型,在此不做限定。损失函数设为预测标签与真实标签之间的交叉熵,优化器可以选择常用的adam。然后,在韵律模型训练好之后,可以将目标文本输入该韵律预测模型,得到目标文本的韵律信息。
[0053]
在一个实施方式中,语音合成方法还可以包括:将所述待转换文本进行规范化处理,得到目标文本;所述规范化处理至少包括以下之一:标点符号处理、数字处理、单位处理、分数处理、比分处理。
[0054]
在本实施方式中,在对目标文本进行韵律预测之前要将不规则的文本转化为规则的文本的过程,例如,特殊标点符号的处理,数字处理,以及单位,分数,比分的处理等。本说明书实施方式中所述的规范化处理要根据音频如何读取来正则化文本,期间可以借助asr来辅助处理,具体不做具体阐述。
[0055]
在本实施方式中,所述规范化处理可以是歧义消除的过程,比如数字1234,可以读一二三四,幺二三四,或者一千两百三十四等,但是如果有音频,则读法是固定的,可以将其
转化为具体音频读取的中文读法,避免后续处理出错。在对待处理文本进行规范化处理后得到的文本信息即为目标文本。
[0056]
在一个实施方式中,所述语音合成模型包括声学特征提取模型和声码器,将所述目标音素向量输入语音合成模型,得到所述目标文本的目标语音,可以包括:将所述目标音素向量输入所述声学特征提取模型,得到所述目标文本的声学特征;将所述声学特征输入所述声码器中,得到所述目标文本的目标语音。
[0057]
在本实施方式中,语音合成模型包括声学特征提取模型和声码器,首先需要通过声学特征提取模型生成目标文本的声学特征,然后基于声码器将声学特征转换为目标文本对应的语音。
[0058]
在本实施方式中,声学特征用于表示待转换文本的语音声学特性,如可以用于表示音色的能量集中区、共振峰频率、共振峰强度和带宽,以及表示语音韵律特性的时长、基频、平均语声功率等。所述声学特征可以用梅尔频谱(mel-spectrum)进行表示。当然,声学特征还可以用fft、pitch、mfcc、fbank、pcen等进行表示。
[0059]
在本实施方式中,所述声学特征提取模型可以是encoder-decode模型fastspeech模型、fastspeech2模型、durlan模型、merlin模型等,在此不作限定。首先需要对声学特征提取模型进行训练。在训练之前,需要准备训练样本,其可以是中英文的混合预料,需要录制同一个说话人的中英文混合语料(也可以通过单独说中文和单独说英文的语音拼接),并标注对应语料对应的文本。然后,将文本转换为发音音素单元,将发音音素单元作为声学特征提取模型的输入,以及文本对应的语音转换的梅尔频谱作为声学特征提取模型的输出,训练该声学特征提取模型。在声学特征提取模型训练完成之后,可以将基于目标文本提取的目标音素向量输入训练好的声学特征提取模型,得到目标文本的声学特征。
[0060]
在得到目标文本的声学特征之后,还需要将声学特征转换为语音信号。因此,可以通过声码器将声学特征转换为语音信号。具体的,例如,目标声学特征为梅尔频谱,将梅尔频谱输入到hifi-gan这个声码器中,从而得到表征该待处理文本的目标声音信号。
[0061]
因此,本说明书一个或多个实施方式公开的语音合成方法,能够有效的合成混合语种的语音,同时能够有效的降低语音合成部署的内存需求,同时能有效降低计算量,提升语音合成上线后的语音合成效率。
[0062]
请参阅图2,本公开的一个实施方式还提供一种语音合成模型的训练方法,所述语音合成模型的训练方法可以包括以下步骤。
[0063]
s210:获取若干个多语言混合的目标训练文本,与所述目标训练文本对应的目标训练语音。
[0064]
s220:将所述目标训练文本输入韵律预测模型,得到所述目标训练文本的目标韵律信息。
[0065]
s230:对所述目标训练文本中不同语言的文字进行音素标记,得到所述目标训练文本中不同语言的文字的音素标记信息;所述音素标记信息包括不同语言文字的音素信息和语言标识。
[0066]
s240:基于所述音素标记信息和所述韵律信息生成所述目标训练文本的目标音素向量。
[0067]
s250:将所述目标音素向量作为语音合成模型的输入,以及将与所述目标音素向
programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
[0083]
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及模块,如本发明实施方式中的方法对应的程序指令/模块。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及数据处理,即实现上述方法实施方式中的方法。
[0084]
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施方式中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0085]
本公开一个实施方式还提供一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序被处理器执行时,实现上述的语音合成方法和/或语音合成模型的训练方法。
[0086]
本领域普通技术人员可以理解实现所述实施方式方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如所述各方法的实施方式的流程。其中,本说明书所提供的各实施方式中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。
[0087]
应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0088]
本说明书多个实施方式之间,采用递进的方式进行描述。不同的实施方式着重于描述相较于其它实施方式不相同的部分。所属领域技术人员在阅读本说明书之后,可以获知本说明书中的多个实施方式,以及实施方式揭示的多个技术特征,可以进行更多种的组合,为使描述简洁,未对所述实施方式中的各个技术特征所有可能的组合都进行描述。然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0089]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0090]
本说明书中的多个实施方式本身均着重于强调与其他实施方式不同的部分,各实施方式之间可以相互对照解释。所属领域技术人员基于一般的技术常识对本说明书中的多个实施方式的任意组合均涵盖于本说明书的揭示范围内。
[0091]
以上所述仅为本案的实施方式而已,并不用以限制本案的权利要求保护范围。对于本领域技术人员来说,本案可以有各种更改和变化。凡在本案的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本案的权利要求范围之内。