1.本发明涉及语音控制技术领域,尤其涉及一种语音唤醒方法、一种语音唤醒装置、一种计算机可读存储介质、一种语音设备和一种语音唤醒系统。
背景技术:
2.智能家居系统中,语音控制是一种通过语音指令控制智能家居设备的功能,用户通过与智能家居系统中的语音助手对话或发出特定的声音指令,实现对智能设备的控制和操作。
3.智能家居系统通常会配备多个语音设备,这样可以让用户在不同的房间或位置方便地与系统进行交互,为了确保用户能够就近唤醒系统,智能家居系统通常会使用一种叫做“就近唤醒”的技术。在识别到唤醒词时,每个语音设备开始对唤醒词进行解析识别,然后将各自的识别结果发给局域网内的其他语音设备,以确定最近的语音设备,这就造成唤醒响应速度慢的问题。
技术实现要素:
4.本发明旨在至少在一定程度上解决相关技术中的技术问题之一。为此,本发明的第一个目的在于提出一种语音唤醒方法,在识别到预唤醒语音关键词时,根据预唤醒语音关键词确定局域网内每个语音设备的预唤醒参数,并根据每个语音设备的预唤醒参数确定预唤醒结果,在识别到唤醒语音关键词的情况下,根据预唤醒结果确定目标语音设备,通过拆分唤醒语音关键词,在识别到唤醒语音关键词的前部分时,就开始执行就近唤醒决策,获取预唤醒结果,在识别到唤醒语音关键词时,可以直接确定目标语音设备,减少了语音设备唤醒的响应时间。
5.本发明的第二个目的在于提出一种语音唤醒装置。
6.本发明的第三个目的在于提出一种计算机可读存储介质。
7.本发明的第四个目的在于提出一种语音设备。
8.本发明的第五个目的在于提出一种语音唤醒系统。
9.为达到上述目的,本发明第一方面实施例提出了一种语音唤醒方法,方法包括:识别预唤醒语音关键词;根据预唤醒语音关键词确定局域网内每个语音设备的预唤醒参数;根据每个语音设备的预唤醒参数确定预唤醒结果;在识别到唤醒语音关键词的情况下,根据预唤醒结果确定目标语音设备,其中,预唤醒语音关键词为唤醒语音关键词的前部分。
10.根据本发明实施例的语音唤醒方法,识别预唤醒语音关键词,根据预唤醒语音关键词确定局域网内每个语音设备的预唤醒参数,根据每个语音设备的预唤醒参数确定预唤醒结果,在识别到唤醒语音关键词的情况下,根据预唤醒结果确定目标语音设备,其中,预唤醒语音关键词为唤醒语音关键词的前部分。由此,该方法通过拆分唤醒语音关键词,在识别到唤醒语音关键词的前部分时,就开始执行就近唤醒决策,获取预唤醒结果,在识别到唤醒语音关键词时,可以直接确定目标语音设备,减少了语音设备唤醒的响应时间。
11.另外,根据本发明上述实施例的语音唤醒方法还可以具有如下的附加技术特征:
12.根据本发明的一些实施例,预唤醒结果可包括每个语音设备的预唤醒结果标记信息,根据预唤醒结果确定目标语音设备,包括:在当前语音设备的预唤醒结果标记信息为预设标记信息的情况下,将该语音设备作为目标语音设备,并响应唤醒语音关键词;在当前语音设备的预唤醒结果标记信息不为预设标记信息的情况下,该语音设备处于待机状态。
13.根据本发明的一些实施例,预唤醒参数可包括语音能量值,根据每个语音设备的预唤醒参数确定预唤醒结果,包括:每个语音设备的能量值均与其他语音设备的能量值进行比较;根据能量值比较结果确定预唤醒结果。
14.根据本发明的一些实施例,预唤醒参数可包括语音角度,根据每个语音设备的预唤醒参数确定预唤醒结果,包括:每个语音设备的语音角度均与其他语音设备的语音角度进行比较;根据语音角度比较结果确定预唤醒结果。
15.根据本发明的一些实施例,预唤醒参数可包括参数生成时刻,根据每个语音设备的预唤醒参数确定预唤醒结果,包括:每个语音设备的参数生成时刻均与其他语音设备的参数生成时刻进行比较;根据参数生成时刻比较结果确定预唤醒结果。
16.根据本发明的一些实施例,在确定局域网内每个语音设备的预唤醒参数之后,上述语音唤醒方法还包括:采用广播的方式,将预唤醒参数发送至其他语音设备。
17.根据本发明的一些实施例,上述语音唤醒方法还包括:在预设时间内,若当前语音设备未接收到局域网内所有语音设备的预唤醒参数,则根据当前设备接收到的每个语音设备的预唤醒参数确定预唤醒结果。
18.为达到上述目的,本发明第二方面实施例提出了一种语音唤醒装置,包括:识别模块,用于识别预唤醒语音关键词;第一确定模块,用于根据预唤醒语音关键词确定局域网内每个语音设备的预唤醒参数;第二确定模块,用于根据每个语音设备的预唤醒参数确定预唤醒结果;第三确定模块,用于在识别模块识别到唤醒语音关键词的情况下,根据预唤醒结果确定目标语音设备,其中,预唤醒语音关键词为唤醒语音关键词的前部分。
19.根据本发明实施例的语音唤醒装置,识别模块识别预唤醒语音关键词,第一确定模块根据预唤醒语音关键词确定局域网内每个语音设备的预唤醒参数,第二确定模块根据每个语音设备的预唤醒参数确定预唤醒结果,在识别模块识别到唤醒语音关键词的情况下,第三确定模块根据预唤醒结果确定目标语音设备,其中,预唤醒语音关键词为唤醒语音关键词的前部分。由此,该装置通过拆分唤醒语音关键词,在识别到唤醒语音关键词的前部分时,就开始执行就近唤醒决策,获取预唤醒结果,在识别到唤醒语音关键词时,可以直接确定目标语音设备,减少了语音设备唤醒的响应时间。
20.为达到上述目的,本发明第三方面实施例提出了一种计算机可读存储介质,其上存储有语音唤醒程序,该语音唤醒程序被处理器执行时实现上述的语音唤醒方法。
21.本发明实施例的计算机可读存储介质,通过执行上述的语音唤醒方法,减少了语音设备唤醒的响应时间。
22.为达到上述目的,本发明第四方面实施例提出了一种语音设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的语音唤醒程序,处理器执行语音唤醒程序时,实现上述的语音唤醒方法。
23.根据本发明实施例的语音设备,通过执行上述的语音唤醒方法,减少了语音设备
唤醒的响应时间。
24.为达到上述目的,本发明第五方面实施例提出了一种语音唤醒系统,所述系统包括多个语音设备,所述多个语音设备中的每一个语音设备执行上述的语音唤醒方法。
25.根据本发明实施例的语音唤醒系统,通过执行上述的语音唤醒方法,减少了语音设备唤醒的响应时间。
26.本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
27.图1为根据本发明一些实施例的语音唤醒方法的流程图;
28.图2为根据本发明一些实施例的语音唤醒方法的流程图;
29.图3为根据本发明一些实施例的语音唤醒装置的方框示意图;
30.图4为根据本发明一些实施例的语音设备的方框示意图;
31.图5为根据本发明一些实施例的语音唤醒系统的方框示意图。
具体实施方式
32.下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
33.下面参考附图描述本发明实施例提出的语音唤醒方法、语音唤醒装置、计算机可读存储介质、语音设备和语音唤醒系统。
34.智能家居系统中,语音控制是一种通过语音指令控制智能家居设备的功能,用户可以通过与智能家居系统中的语音助手进行对话或者发出特定的声音指令,实现对各种智能设备的控制和操作。语音控制功能,智能家居语音控制需要唤醒词语触发,如:“小度小度”,“小美小美”去唤醒设备进入语音控制状态。当唤醒词被识别后,设备开始进行语音指令的录音和解析操作,以避免设备在无关环境声音中误解用户指令,提高语音控制的准确性和用户体验。
35.智能家居系统通常会配备多个语音设备,这样可以让用户在不同的房间或位置方便地与系统进行交互,为了确保用户能够就近唤醒系统,智能家居系统通常会使用一种“就近唤醒”的技术。智能家居系统的“就近唤醒”功能通常是通过嵌入式的声音传感器或麦克风阵列来实现的,这些传感器或麦克风阵列会不断地监听周围的声音,并根据声音的方向和强度来确定用户的位置。当用户说出唤醒词时,系统会自动通过计算确定距离最近的语音设备,并让该设备接收和处理用户的命令。为了实现“就近唤醒”功能,智能家居系统需要在多个语音设备之间建立通信连接,当用户进行语音唤醒时,语音设备会同步/广播自身的语音识别结果给其他语音设备,在一个时间窗口中,每个独立的语音设备将获取所有接收到唤醒指令的语音设备传送的唤醒信息,通过分析声音的方向和强度来确定用户所在的位置,然后最近的语音设备会来响应用户的命令,不是最近的语音设备就会自动进入待机状态。
36.从就近唤醒的实现方式来看,语音设备需要同步唤醒识别结果发送给其他语音设
备。当用户说完“唤醒词”之后,会有一个时间周期,等待语音设备接收其他语音设备的识别结果,以此来决策哪个语音设备才是“最近的唤醒设备”。这样容易导致用户说完唤醒词之后,要等待这一个就近唤醒决策周期,造成唤醒响应慢的情况。
37.为了解决上述问题,本发明提出了一种语音唤醒方法,通过拆分唤醒语音关键词,在识别到唤醒语音关键词的前部分时,就开始执行就近唤醒决策,获取预唤醒结果,在识别到唤醒语音关键词时,可以直接确定目标语音设备,减少了语音设备唤醒的响应时间。
38.图1为根据本发明一些实施例的语音唤醒方法的流程图。
39.如图1所示,本发明实施例的语音唤醒方法可包括以下步骤:
40.s1,识别预唤醒语音关键词。
41.s2,根据预唤醒语音关键词确定局域网内每个语音设备的预唤醒参数。
42.s3,根据每个语音设备的预唤醒参数确定预唤醒结果。
43.s4,在识别到唤醒语音关键词的情况下,根据预唤醒结果确定目标语音设备,其中,预唤醒语音关键词为唤醒语音关键词的前部分。
44.具体而言,预唤醒语音关键词为唤醒语音关键词的前部分,例如,当唤醒语音关键词为“小美,小美”时,预唤醒语音关键词可以为“小美”;又如,当唤醒语音关键词为“天猫精灵”时,预唤醒语音关键词可以为“天猫”。每个语音设备在局域网内查找具有相同唤醒协议的语音设备列表,记为n个设备(总共支持语音唤醒功能的语音设备为n 1个),每个语音设备都处于等待唤醒状态。
45.在每个语音设备识别到预唤醒语音关键词时,确定每个语音设备的预唤醒参数,每个语音设备会将自身的预唤醒参数同步给其他n个语音设备,每个语音设备根据接收到的其他n个语音设备的预唤醒参数可以确定预唤醒结果,每个语音设备都会根据预唤醒结果对自身进行标记,其中,预唤醒结果可以为“最近的唤醒设备”。在每个语音设备识别到预唤醒语音关键词时,会根据自身标记的预唤醒结果来确定自身是否为目标语音设备,例如,当语音设备自身标记为“不是最近的唤醒设备”时,那该语音设备不是目标语音设备;当语音设备标记为“最近的唤醒设备”时,那该语音设备为目标语音设备。
46.示例性地,局域网内的语音设备包括语音设备a、语音设备b、语音设备c和语音设备d,当用户站在语音设备a附近发出唤醒语音关键词“小美,小美”时,语音设备a、语音设备b、语音设备c和语音设备d在识别到预唤醒语音关键词“小美”时,根据用户说出预唤醒语音关键词“小美”的位置,可以确定每个语音设备的预唤醒参数(例如,语音强度、接收到预唤醒语音关键词的时间等),每个语音设备会将自身的预唤醒参数发送到其他语音设备,每个语音设备通过比较自身的预唤醒参数和其他语音设备的预唤醒参数确定预唤醒结果,此处语音设备a会将自身标记为“最近的唤醒设备”,语音设备b、语音设备c和语音设备d会将自身标记为“不是最近的唤醒设备”。在语音设备a、语音设备b、语音设备c和语音设备d接收到预唤醒语音关键词“小美,小美”时,每个语音设备会根据自身标记的预唤醒结果,确定目标预设设备为语音设别a。
47.需要解释说明的是,预唤醒语音关键词可以是由用户发出的,也可以是由特定的设备发出的,在本技术实施例中对预唤醒语音关键词是如何产生的不做限定。
48.在一些实施例中,预唤醒语音关键词发出方和语音设备之间的关系是在语音设备接收到的预唤醒语音关键词得到的,因此,预唤醒参数是基于预唤醒语音关键词得到的,作
用是使得预唤醒参数包含语音设备和预唤醒语音关键词发出方之间的关系。当多个语音设备识别到预唤醒语音关键词,多个语音设备的每一个语音设备均对应有自己的预唤醒参数,而语音设备和预唤醒参数之间的对应关系采用何种方式实现,本技术实施例不做限定。上述多个语音设备可以为同类型语音设备,或者同型号语音设备,多个语音设备可以为局域网内的语音设备中的任意语音设备。由于预唤醒参数是基于预唤醒语音关键词生成的,并且和语音设备之间有对应关系,预唤醒参数可以包含预唤醒语音关键词/预唤醒语音关键词发出方和语音设备的信息,或者包含预唤醒语音关键词/预唤醒语音关键词发出方和语音设备之间关系的信息等。每一个语音设备的预唤醒参数可以相同,也可以不同。当前语音设备并非特指是哪一个语音设备,而是接收到预唤醒语音关键词的语音设备中的任意一个语音设备,若多个语音设备接收预唤醒语音关键词,多个语音设备中的每一个语音设备所执行的操作可以包括当前语音设备所执行的上述操作。
49.对于当前语音设备的预唤醒参数的确定,可以是当前语音设备基于预唤醒语音关键词,通过在当前语音设备中配置预唤醒参数生成算法或者利用算法库来实现。在当前语音设备接收预唤醒语音关键词后,以预唤醒语音关键词,或对预唤醒语音关键词进行预处理之后的结果作为输入,执行该语音设备中的算法或者通过该语音设备中的算法库得到预唤醒参数。可以理解地是,以何种方式确定当前语音设备的预唤醒参数,不影响本技术实施例的实现。
50.下面详细描述本发明实施例的语音唤醒方法。
51.在本发明的一些实施例中,预唤醒结果可包括每个语音设备的预唤醒结果标记信息,根据预唤醒结果确定目标语音设备,包括:在当前语音设备的预唤醒结果标记信息为预设标记信息的情况下,将该语音设备作为目标语音设备,并响应唤醒语音关键词;在当前语音设备的预唤醒结果标记信息不为预设标记信息的情况下,该语音设备处于待机状态。
52.具体而言,在同一个局域网中,其他语音设备可以得到当前语音设备的预唤醒参数,当前语音设备也可以得到其他语音设备的预唤醒参数,让当前语音设备和其他语音设备各自的预唤醒参数在当前语音设备和其他语音设备中实现共享。每个语音设备对应有自己的预唤醒参数,对于接收到预唤醒参数的语音设备来说,不仅接收到预唤醒参数,而且能够得知预唤醒参数所对应的语音设备是哪个语音设备。在接收到预唤醒语音关键词后,每个语音设备根据其他语音设备的预唤醒参数确定自身的预唤醒结果标记信息,例如,局域网内的语音设备包括语音设备a、语音设备b和语音设备c,当语音设备a的标记信息为“最近的语音设备”时,语音设备b的标记信息为“不是最近的语音设备”,语音设备c的标记信息为“不是最近的语音设备”。在识别到唤醒语音关键词时,每个语音设备根据自身标记信息进行判断,判断自身的标记信息是否为预设标记信息,若与预设标记信息一致,则将该语音设备作为目标语音设备;若与预设标记信息不一致,则将该语音设备不作为目标语音设备。此时,目标语音设备响应唤醒语音关键词,处于唤醒状态;不是目标语音设备的语音设备,不响应唤醒语音关键词,处于待机状态。也就是说,当语音设备接收到唤醒语音关键词时,根据预唤醒结果可以直接判断自身是否为“最近的语音设备”,相比较于传统的就近唤醒方案,提升了语音设备的唤醒响应速度,缩短了唤醒响应时间。
53.在本发明的一些实施例中,预唤醒参数可包括语音能量值,根据每个语音设备的预唤醒参数确定预唤醒结果,包括:每个语音设备的能量值均与其他语音设备的能量值进
行比较;根据能量值比较结果确定预唤醒结果。
54.具体而言,以预唤醒参数包括语音能量值为例,当前语音设备会接收到其他语音设备语音能量值,然后,对比当前语音设备和其他语音设备的语音能量值,根据语音能量值的大小确定预唤醒结果,例如,将语音能量值的最大值对应的语音设备作为最近的语音设备,将语音能量值最大的语音设备标记为“最近的语音设备”,其他的语音设备标记为“不是最近的语音设备”。由预唤醒语音关键词发出方发出的语音,能量会随着距离的增加而衰减,语音能量值能够表征语音设备与预唤醒语音关键词发出方之间的距离,从而为语音设备响应唤醒语音关键词提供依据。对于当前语音设备来说,语音能量值为当前语音设备接收到的预唤醒语音关键词的语音能量值。若多个语音设备接收预唤醒语音关键词,每个语音设备基于预唤醒语音关键词,能够得到各自的语音能量值,每个语音设备的语音能量值可以相同,也可以不同。由于语音能量会随着距离的增加而衰减,语音能量值大,则表明语音设备距离预唤醒语音关键词发出方近,语音能量值小,则表明语音设备距离预唤醒语音关键词发出方远。
55.在本发明的一些实施例中,预唤醒参数可包括语音角度,根据每个语音设备的预唤醒参数确定预唤醒结果,包括:每个语音设备的语音角度均与其他语音设备的语音角度进行比较;根据语音角度比较结果确定预唤醒结果。
56.具体而言,语音角度为预唤醒语音关键词发出方的朝向和由预唤醒语音关键词发出方指向当前语音设备的方向之间的夹角,每个语音设备的语音角度均与其他语音设备的语音角度进行比较,根据语音角度大小确定预唤醒结果。例如,当预唤醒语音关键词发出方为用户时,预唤醒语音关键词发出方的朝向就是该用户站立时脸部朝向的方向。语音角度可以表征预唤醒语音关键词发出方朝向设备的程度,语音角度越大,意味着预唤醒语音关键词发出方朝向语音设备的程度越大。语音角度的取值范围可以为[0,180]
°
,当语音角度为0
°
时,预唤醒语音关键词发出方完全朝向语音设备;语音角度为180
°
时,预唤醒语音关键词发出方完全背向语音设备。
[0057]
举例而言,用户想要唤醒多个语音设备中的一个语音设备,此时可能会存在多个语音能量值相同的语音设备,基于用户会朝向自己想要唤醒的那个语音设备的这种可能性,将语音角度作为辅助参数,生成多维度的预唤醒参数。利用语音设备的语音能量值确定出第一个唤醒设备,当第一个唤醒设备的数量大于一个时,表明利用语音设备的语音能量值确定出的语音设备不止一个,此时,通常考虑用户想要唤醒多个语音设备中的一个语音设备,在得到第一个语音唤醒设备后,利用语音设备的语音角度确定出最终的预唤醒结果。可以理解地是,是否以语音能量值和语音角度作为预唤醒参数,以及当预唤醒参数包括语音能量值和语音角度时,是否采取上述方式判断是否执行预唤醒语音关键词,均不影响本实施例的实现。
[0058]
在本发明的一些实施例中,预唤醒参数可包括参数生成时刻,根据每个语音设备的预唤醒参数确定预唤醒结果,包括:每个语音设备的参数生成时刻均与其他语音设备的参数生成时刻进行比较;根据参数生成时刻比较结果确定预唤醒结果。
[0059]
具体而言,根据参数生成时刻大小确定预唤醒结果,参数生成时刻为当前语音设备基于预唤醒语音关键词得到唤醒参数的时刻。若多个语音设备接收预唤醒语音关键词,每个语音设备的参数生成时刻均与其他语音设备的参数生成时刻进行比较,参数生成时刻
越小的语音设备,越早地接收到唤醒语音关键词。根据语音能量值确定的目标语音设备的数量可能大于一个,多个目标语音设备的出现,可能不是因为多个目标语音设备与预唤醒语音关键词发出方的距离完全相同,而是由于多个目标语音设备与预唤醒语音关键词发出方的距离差异过小,不能通过语音能量值体现出来。而预唤醒语音关键词被语音设备接收,以及语音设备基于预唤醒语音关键词生成预唤醒参数,所用时间很短,上述不能通过语音能量值体现出来的距离差异,却存在能够通过语音设备基于预唤醒语音关键词得到当前设备的参数生成时刻的不同来体现。因此,可以将语音设备的参数生成时刻作为辅助参数,满足用户的需求,并且通过利用多维度的预唤醒参数,为目标语音设备的确定提供更加可靠的依据,从而提高语音设备预唤醒结果的准确性。
[0060]
在本发明的一些实施例中,在确定局域网内每个语音设备的预唤醒参数之后,上述方法还包括:采用广播的方式,将预唤醒参数发送至其他语音设备。
[0061]
具体而言,为了使每个语音设备接收到其他语音设备的预唤醒参数,其他语音设备可以采用广播的方式得到当前语音设备的预唤醒参数,当前语音设备也可以采用广播的方式得到其他语音设备的预唤醒参数,让当前语音设备和其他语音设备各自的预唤醒参数在当前语音设备和其他语音设备中实现共享。每个语音设备对应有自己的预唤醒参数,对于接收到预唤醒参数的语音设备来说,不仅接收到预唤醒参数,而且能够得知预唤醒参数所对应的语音设备是哪个语音设备。为了实现语音设备的就近唤醒,根据各个语音设备的预唤醒参数确定出目标语音设备,目标语音设备即为响应于唤醒语音关键词而实现唤醒的语音设备。采用广播的方式,可以包括在局域网内采用广播的方式。此时,预唤醒语音关键词发出方对于局域网内的语音设备发出预唤醒语音关键词,若接收预唤醒语音关键词的是多个语音设备,多个语音设备连接于同一个局域网,局域网内多个语音设备的预唤醒参数在多个设备之间实现共享。
[0062]
在本发明的一些实施例中,上述语音唤醒方法还包括:在预设时间内,若当前语音设备未接收到局域网内所有语音设备的预唤醒参数的情况下,根据当前设备接收到的每个语音设备的预唤醒参数确定预唤醒结果。其中,预设时间可根据实际情况进行标定。
[0063]
具体而言,在一段时间(预设时间)内,当前语音设备接收其他语音设备发送的预唤醒参数,若当前语音设备未接收到局域网内所有语音设备的预唤醒参数的情况下,根据当前语音设备的预唤醒参数和接收的其他语音设备的预唤醒参数确定预唤醒结果。在预设时间内接收其他语音设备发送的预唤醒参数的作用,是降低由于语音设备故障无法接收到其他语音设备的预唤醒参数,以至于语音设备一直处于接收消息的状态,而无法对目标语音设备进行确定,从而增加语音设备唤醒延迟。预设时间可以是预设的固定值,也可以是根据实际场景或实际需求所确定的;预设时间可以由人为设定,也可以由语音设备自动设定,能够降低语音设备唤醒延迟。
[0064]
作为一个具体示例,如图2所示,本发明的语音唤醒方法可包括以下步骤:
[0065]
s201,发现局域网中支持“就近唤醒”的语音设备。
[0066]
s202,语音设备识别到预唤醒语音关键词“小美”。
[0067]
s203,根据预唤醒关键词确定预唤醒参数。
[0068]
s204,同步预唤醒参数至局域网中其他语音设备。
[0069]
s205,当前语音设备未接收到局域网内所有语音设备的预唤醒参数。
[0070]
s206,根据当前设备接收到的每个语音设备的预唤醒参数确定预唤醒结果。
[0071]
s207,语音设备识别到唤醒语音关键词“小美,小美”。
[0072]
s208,判断当前语音设备的预唤醒结果标记信息为预设语音设备是否成立。如果是,执行步骤s209;如果否,执行步骤s210。
[0073]
s209,将该语音设备作为目标语音设备,并响应唤醒语音关键词。
[0074]
s210,该语音设备处于待机状态。
[0075]
综上,本技术在识别到预唤醒语音关键词时,就开始进行语音决策,确定预唤醒结果,在识别到唤醒语音关键词时,就已经有了预唤醒结果,可以直接确定目标语音设备。传统的就近唤醒方案,用户在说出完整的唤醒语音关键词后,通常会有500ms的就近唤醒决策时间窗口,本技术在识别到唤醒语音关键词时,就已经有了预唤醒结果,可以节省500ms的唤醒响应时间。
[0076]
综上所述,根据本发明实施例的语音唤醒方法,识别预唤醒语音关键词,根据预唤醒语音关键词确定局域网内每个语音设备的预唤醒参数,根据每个语音设备的预唤醒参数确定预唤醒结果,在识别到唤醒语音关键词的情况下,根据预唤醒结果确定目标语音设备,其中,预唤醒语音关键词为唤醒语音关键词的前部分。由此,该方法通过拆分唤醒语音关键词,在识别到唤醒语音关键词的前部分时,就开始执行就近唤醒决策,获取预唤醒结果,在识别到唤醒语音关键词时,可以直接确定目标语音设备,减少了语音设备唤醒的响应时间。
[0077]
对应上述实施例,本发明还提出了一种语音唤醒装置。
[0078]
如图3所示,本发明实施例的语音唤醒装置100可包括:识别模块110、第一确定模块120、第二确定模块130和第三确定模块140。
[0079]
其中,识别模块110用于识别预唤醒语音关键词。第一确定模块120用于根据预唤醒语音关键词确定局域网内每个语音设备的预唤醒参数。第二确定模块130用于根据每个语音设备的预唤醒参数确定预唤醒结果。第三确定模块140用于在识别模块识别到唤醒语音关键词的情况下,根据预唤醒结果确定目标语音设备,其中,预唤醒语音关键词为唤醒语音关键词的前部分。
[0080]
在本发明的一些实施例中,预唤醒结果可包括每个语音设备的预唤醒结果标记信息,第三确定模块140根据预唤醒结果确定目标语音设备,具体用于:在当前语音设备的预唤醒结果标记信息为预设标记信息的情况下,将该语音设备作为目标语音设备,并响应唤醒语音关键词;在当前语音设备的预唤醒结果标记信息不为预设标记信息的情况下,该语音设备处于待机状态。
[0081]
在本发明的一些实施例中,预唤醒参数可包括语音能量值,第二确定模块130根据每个语音设备的预唤醒参数确定预唤醒结果,具体用于:每个语音设备的能量值均与其他语音设备的能量值进行比较;根据能量值比较结果确定预唤醒结果。
[0082]
在本发明的一些实施例中,预唤醒参数可包括语音角度,第二确定模块130根据每个语音设备的预唤醒参数确定预唤醒结果,具体用于:每个语音设备的语音角度均与其他语音设备的语音角度进行比较;根据语音角度比较结果确定预唤醒结果。
[0083]
在本发明的一些实施例中,预唤醒参数可包括参数生成时刻,第二确定模块130根据每个语音设备的预唤醒参数确定预唤醒结果,具体用于:每个语音设备的参数生成时刻均与其他语音设备的参数生成时刻进行比较;根据参数生成时刻比较结果确定预唤醒结
果。
[0084]
在本发明的一些实施例中,在确定局域网内每个语音设备的预唤醒参数之后,第一确定模块120还用于:采用广播的方式,将预唤醒参数发送至其他语音设备。
[0085]
在本发明的一些实施例中,第二确定模块130还用于:在预设时间内,若当前语音设备未接收到局域网内所有语音设备的预唤醒参数,则根据当前设备接收到的每个语音设备的预唤醒参数确定预唤醒结果。
[0086]
需要说明的是,本发明实施例的语音唤醒装置中未披露的细节,请参照本发明实施例的语音唤醒方法中所披露的细节,具体不再赘述。
[0087]
根据本发明实施例的语音唤醒装置,识别模块识别预唤醒语音关键词,第一确定模块根据预唤醒语音关键词确定局域网内每个语音设备的预唤醒参数,第二确定模块根据每个语音设备的预唤醒参数确定预唤醒结果,在识别模块识别到唤醒语音关键词的情况下,第三确定模块根据预唤醒结果确定目标语音设备,其中,预唤醒语音关键词为唤醒语音关键词的前部分。由此,该装置通过拆分唤醒语音关键词,在识别到唤醒语音关键词的前部分时,就开始执行就近唤醒决策,获取预唤醒结果,在识别到唤醒语音关键词时,可以直接确定目标语音设备,减少了语音设备唤醒的响应时间。
[0088]
对应上述实施例,本发明还提出了一种计算机可读存储介质。
[0089]
本发明的计算机可读存储介质,其上存储有语音唤醒程序,该语音唤醒程序被处理器执行时实现上述的语音唤醒方法。
[0090]
本发明实施例的计算机可读存储介质,通过执行上述的语音唤醒方法,减少了语音设备唤醒的响应时间。
[0091]
对应上述实施例,本发明还提出了一种语音设备。
[0092]
如图4所示,本发明实施例的语音设备200,包括存储器210、处理器220及存储在存储器210上并可在处理器220上运行的语音唤醒程序,处理器220执行语音唤醒程序时,实现上述的语音唤醒方法。
[0093]
根据本发明实施例的语音设备,通过执行上述的语音唤醒方法,减少了语音设备唤醒的响应时间。
[0094]
对应上述实施例,本发明还提出了一种语音唤醒系统。
[0095]
如图5所示,本发明实施例的语音唤醒系统300,包括多个语音设备200,多个语音设备200中的每一个语音设备200执行上述的语音唤醒方法。
[0096]
根据本发明实施例的语音唤醒系统,通过执行上述的语音唤醒方法,减少了语音设备唤醒的响应时间。
[0097]
需要说明的是,在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只
读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式光盘只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
[0098]
应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。
[0099]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0100]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
[0101]
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
[0102]
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。