应急广播终端音频处理方法、装置、应急广播终端和介质与流程-j9九游会真人

文档序号:35695914发布日期:2023-10-11 19:00阅读:6来源:国知局


1.本技术涉及数据处理的技术领域,尤其是涉及一种应急广播终端音频处理方法、装置、应急广播终端和介质。


背景技术:

2.为保证人们及时知晓灾害来临的情况,常应用应急广播终端对上述灾害来临情况进行广播。但,在无灾害来临时,应急广播终端常处于闲置状态,存在资源浪费。
3.为减少对于应急广播终端这一资源的浪费情况,一般会应用应急广播终端提供便民服务,上述便民服务可以为回复人们提问问题的相关服务。在人们提出问题时,应急广播终端会采集上述问题的相关音频,然后在相关音频中提取出有效信息,再针对有效信息进行回复。但是,由于上述相关音频中可能存在噪音,故,提取出的有效信息可能出现不准确的问题。
4.目前,常通过去除相关音频中的环境噪音来提升有效信息的准确性。但是,当多人同时说话时,应急广播终端可能将多人同时说的多个语句串联为一个语句,导致有效信息错误。
5.由此可知,如何通过在多人说话时更加准确地提取有效信息,来提升应急广播终端回复信息的准确性,是本领域技术人员亟待解决的技术问题。


技术实现要素:

6.为了提升应急广播终端回复信息的准确性,本技术提供一种应急广播终端音频处理方法、装置、应急广播终端和介质。
7.第一方面,本技术提供一种应急广播终端音频处理方法,采用如下的技术方案:一种应急广播终端音频处理方法,包括:当接收到咨询信号时,获取实时音频;对所述实时音频进行音频分析,得到多个说话者各自对应的音频信息;从全部所述音频信息中筛选出目标音频信息,其中,所述目标音频信息对应的内容为咨询语气的内容;确定各个所述目标音频信息对应的音频优先级;依次生成每一目标音频信息对应的回复信息;按所述音频优先级,将各个所述回复信息播报。
8.本技术在一较佳示例中可以进一步配置为:所述对所述实时音频进行音频分析,得到多个说话者各自对应的音频信息,包括:消除所述实时音频中的环境噪音,得到人声初始音频;从所述人声初始音频中分离出不同说话者对应的所述音频信息。
9.本技术在一较佳示例中可以进一步配置为:所述确定各个所述目标音频信息对应的音频优先级,包括:
根据所述实时音频,确定每一所述目标音频信息在全部所述目标音频信息中的发声顺序,其中,所述发声顺序为所述音频优先级。
10.本技术在一较佳示例中可以进一步配置为:所述依次生成每一目标音频信息对应的回复信息,包括:依次识别每一目标音频信息对应的咨询信息;提取每一所述咨询信息中的关键词序列;获取每一所述关键词序列对应的回复信息。
11.本技术在一较佳示例中可以进一步配置为:所述获取每一所述关键词序列对应的回复信息,包括:针对每一所述关键词序列,判断本地数据库中是否存在所述关键词序列对应的数据;若是,则根据所述关键词序列,在所述本地数据库中,获取所述关键词序列对应的所述回复信息;若否,则将所述关键词序列发送至云端服务器,以获取所述云端服务器得到的所述关键词序列对应的所述回复信息。
12.本技术在一较佳示例中可以进一步配置为:所述依次识别每一目标音频信息对应的咨询信息,包括:识别每一目标音频信息对应的初始咨询信息;在所述实时音频中提取声音叠加部分;在所述声音叠加部分中提取至少两个声纹特征,并根据所述至少两个声纹特征,确定所述至少两个声纹特征各自对应的叠加目标音频信息;获取所述声音叠加部分对应的词语组合,其中,所述词语组合包括全部所述叠加目标音频信息各自对应的词语;针对每一所述叠加目标音频信息,根据叠加目标音频信息对应的所述词语,更改所述叠加目标音频信息对应的初始咨询信息,得到所述咨询信息。
13.本技术在一较佳示例中可以进一步配置为:所述获取所述声音叠加部分对应的词语组合,包括:获取所述声音叠加部分对应的多个初始词语组合;针对每一所述叠加目标音频信息,利用每一所述初始词语组合,更改叠加目标音频信息对应的初始咨询信息,得到每一初始词语对应的待分析咨询信息;对每一所述待分析咨询信息进行语义分析,得到每一语义分析结果;针对每一所述叠加目标音频信息,将所述语义分析结果为正常的待分析咨询信息对应的初始词语组合作为所述词语组合。
14.第二方面,本技术提供一种应急广播终端音频处理装置,采用如下的技术方案:一种应急广播终端音频处理装置,包括:实时音频获取模块,用于当接收到咨询信号时,获取实时音频;音频信息提取模块,用于对所述实时音频进行音频分析,得到多个说话者各自对应的音频信息;目标音频信息筛选模块,用于从全部所述音频信息中筛选出目标音频信息,其中,
所述目标音频信息对应的内容为咨询语气的内容;音频优先级确定模块,用于确定各个所述目标音频信息对应的音频优先级;回复信息生成模块,用于依次生成每一目标音频信息对应的回复信息;回复信息播报模块,用于按所述音频优先级,将各个所述回复信息播报。
15.第三方面,本技术提供一种应急广播终端,采用如下的技术方案:至少一个处理器;存储器;至少一个应用程序,其中至少一个应用程序被存储在存储器中并被配置为由至少一个处理器执行,所述至少一个应用程序配置用于:执行如第一方面任一项所述的应急广播终端音频处理方法。
16.第四方面,本技术提供一种计算机可读存储介质,采用如下的技术方案:一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令所述计算机执行如第一方面任一项所述的应急广播终端音频处理方法。
17.综上所述,本技术至少包括以下有益技术效果:相较于相关技术在多人同时说话时可能将多人分别说的语句作为有效信息,导致有效信息准确性较低,从而出现由有效信息确定的回复信息的准确度低的问题;本方案通过识别实时音频中每人的音频信息,以分离每一说话者所说语句,提升应急广播终端分析的有效信息的准确性;再从全部音频信息中筛取带有咨询语气的目标音频信息,可以进一步提升有效信息的准确性;通过为每一目标音频信息确定回复优先级,可以在目标音频信息数量较大时缓解应急广播终端处理过程的负荷,提升处理过程的稳定性;故,依次确定回复信息可以使每一回复信息的确定过程更加稳定,以提升应急广播终端回复信息的准确性;按音频优先级,将各个回复信息播报,以实现应急广播终端的音频处理。
附图说明
18.图1为本技术实施例提供的一种应急广播终端的应用场景示意图。
19.图2为本技术实施例提供的一种应急广播终端音频处理方法的流程示意图。
20.图3为本技术实施例提供的一种应急广播终端音频处理装置的结构示意图。
21.图4为本技术实施例提供的一种应急广播终端的结构示意图。
具体实施方式
22.以下结合附图1至附图4对本技术作进一步详细说明。
23.本具体实施例仅仅是对本技术的解释,其并不是对本技术的限制,本领域技术人员在阅读完本说明书后可以根据需要对本实施例做出没有创造性贡献的修改,但只要在本技术的范围内都受到专利法的保护。
24.为使本技术实施例的目的、技术方案和优点更加清楚,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
25.另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在
三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,如无特殊说明,一般表示前后关联对象是一种“或”的关系。
26.下面结合说明书附图对本技术实施例作进一步详细描述。
27.本技术实施例提供了一种应急广播终端音频处理方法,由应急广播终端执行,该应急广播终端至少可以包括分析设备、喇叭和音频采集设备。音频采集设备可以为任一能够采集音频的设备,本技术实施例不再进行限定。该音频采集设备、喇叭以及分析设备之间可以通过有线或无线通信方式进行直接或间接地连接,本技术实施例在此不做限制。
28.如图1,说话者触发应急广播终端的咨询信号后,以说话形式提出咨询内容;应急广播终端的处理器控制音频采集设备对上述咨询内容进行采集,以获取音频形式的咨询内容;分析设备对上述咨询内容进行处理,得到咨询内容对应回复内容;分析设备控制喇叭播放上述回复内容,完成应急广播终端对于音频的处理。
29.如图2所示,该方法包括步骤s101至步骤s106,其中:步骤s101:当接收到咨询信号时,获取实时音频。
30.具体的,咨询信号可由硬件触发或预设咨询词语触发。其中,实时音频为在接收到询问信号后应急广播终端的音频采集设备采集到的多个说话者的说话音频。
31.在一种可实现方式中,由硬件触发咨询信号具体可以包括:应急广播装置设置一触发装置,上述触发装置在工作过程中可以产生有效咨询信号,当有人触发上述触发装置时触发装置产生上述咨询信号。
32.在另一种可实现方式中,由预设咨询词语触发咨询信号,具体可以包括:当音频采集设备监测到有人说话时,判断说话内容中是否存在任一预设咨询词语,若是,则采集实时音频。步骤s102:对实时音频进行音频分析,得到多个说话者各自对应的音频信息。
33.可以理解的是,多人同时说话时,上述实时音频中包括多个说话者各自的说话内容对应的音频,通过将实时音频处理得到多个说话者各自对应的音频信息,可以避免应急广播终端对实时音频直接进行说话内容提取,得到多个说话者各自的说话内容混合的咨询信息。
34.步骤s103:从全部音频信息中筛选出目标音频信息,其中,目标音频信息对应的内容为咨询语气的内容。
35.具体的,对每一音频信息进行语义分析,得到每一音频信息对应的语境情况,上述语境情况包括咨询状态和非咨询状态,询问咨询状态对应语气为询问语气、请求语气等,用户可根据实际情况设置;将语境情况为咨询状态的音频信息作为目标音频信息。
36.可以理解的是,实时音频中可能不仅包括向应急广播终端咨询的说话者的说话内容对应的音频,还可能包括在应急广播终端周围的其他说话者的说话内容对应的音频,其他说话者可以为除向应急广播终端进行咨询行为之外的说话者;筛选出目标音频信息,以减少应急广播终端对其他说话者的说话内容对应的音频进行不必要的处理。
37.步骤s104:确定各个目标音频信息对应的音频优先级。
38.可以基于目标音频信息的有效时长确定音频优先级,或,可以基于目标音频信息对应说话者的说话次序确定音频优先级。
39.在一种可实现方式中,基于目标音频信息的有效时长确定音频优先级,具体可以包括:获取每一目标音频信息的有效时长,并根据上述有效时长确定音频优先级,其中,有
效时长越长,音频优先级越低。
40.可以理解的是,有效时长越长表明说话者提问的问题越长,在应急广播终端中被处理得到咨询信息的时间较长的概率越大,也会影响匹配对应的答复内容的时间,故,有效时长越长,音频优先级越低可以在一定程度上提升应急广播终端回复多人同时提问问题的速度。
41.在另一种可实现方式中,基于目标音频信息对应说话者的说话次序确定音频优先级,具体可以包括:根据实时音频,确定每一目标音频信息在全部目标音频信息中的发声顺序,其中,发声顺序为音频优先级。
42.具体的,针对每一目标音频信息,识别首次发声的音频帧,并提取首次发声的音频帧对应的时间标签,其中,每一音频帧存在对应时间标签,目标音频信息中的时间标签与实时音频中的时间标签一一对应;根据全部首次发声的音频帧各自对应的时间标签,确定音频优先级,其中,时间标签对应时间节点越早,音频优先级越高,即,发声顺序越早音频优先级越高。
43.在本技术实施例中,通过设定发声顺序越早的目标音频信息音频优先级越高,可以减少优先提问的说话者的等待回复的时间。步骤s105:依次生成每一目标音频信息对应的回复信息。
44.其中,生成回复信息的顺序可以基于音频优先级决定,音频优先级越高生成回复信息的顺序越早,或,按照随机的顺序生成每一目标音频信息对应的回复信息。
45.回复信息为目标音频信息对应的说话者的带有咨询语气的说话内容的答案。
46.具体的,确定回复信息的生成顺序;基于上述回复信息的生成顺序,依次生成每一目标音频信息对应的回复信息。
47.在一种可能的实现方式中,上述确定回复信息的生成顺序,具体可以包括:将音频优先级作为回复信息的生成顺序。
48.在另一种可能的实现方式中,上述确定回复信息的生成顺序,具体可以包括:在全部目标音频信息中确定任一目标音频信息为生成顺序第一的目标音频信息;将已经被确定生成顺序的目标音频信息作为已确定音频信息;在全部目标音频信息中除以确定音频信息之外的目标音频信息中确定任一目标音频信息为生成顺序第二的目标音频信息,直至全部目标音频信息均为以确定音频信息。
49.步骤s106:按音频优先级,将各个回复信息播报。
50.具体的,处理器按音频优先级依次将回复信息转化为喇叭可利用的电信号后发送至喇叭,喇叭依次播放回复信息对应可利用电信号。
51.在本技术实施例中,相较于相关技术在多人同时说话时可能将多人分别说的语句作为有效信息,导致有效信息准确性较低,从而出现由有效信息确定的回复信息的准确度低的问题;本方案通过识别实时音频中每人的音频信息,以分离每一说话者所说语句,提升的应急广播终端分析的有效信息的准确性;再从全部音频信息中筛取带有咨询语气的目标音频信息,可以进一步提升有效信息的准确性;通过为每一目标音频信息确定回复优先级,可以在目标音频信息数量较大时缓解的应急广播终端处理过程的负荷,提升处理过程的稳定性;故,依次确定回复信息可以使每一回复信息的确定过程更加稳定,以提升应急广播终
端回复信息的准确性;按音频优先级,将各个回复信息播报,以实现应急广播终端的音频处理。
52.在本技术实施例的一种可实现方式中,步骤s102,对实时音频进行音频分析,得到多个说话者各自对应的音频信息,具体可以包括步骤s1021至步骤s1023(图中未示出),其中:步骤s1021:消除实时音频中的环境噪音,得到人声初始音频。
53.其中,环境噪音至少可以包括工业噪音、交通噪音和无法被识别的人声噪音等噪音。
54.可以理解的是,通过消除实时音频中的环境噪音,可以使实时音频中说话者的说话内容更加容易被准确识别。
55.步骤s1022:从人声初始音频中分离出不同说话者对应的音频信息。
56.具体的,可以通过独立成分分析(ica)和盲源分离(bss),或者使用基于深度学习的声源分离模型,如深度神经网络(dnn),从人声初始音频进行信号分离。
57.在本技术实施例中,通过消除实时音频中的环境噪音,进而从除噪后的音频中进行音频分离,保证了分离的准确性。
58.在本技术实施例的一种可实现方式中,步骤s105,依次生成每一目标音频信息对应的回复信息,具体可以包括步骤sa1至步骤sa3(图中未示出),其中:步骤sa1:依次识别每一目标音频信息对应的咨询信息。
59.具体的,可以利用任一语音转文本技术,将每一目标音频信息中的语音转化为包括多个字符的咨询信息。
60.步骤sa2:提取每一咨询信息中的关键词序列。
61.其中,关键词序列包括有序排列的多个关键词,排列顺序与上述多个关键词在咨询信息中排列的先后顺序相同。
62.可以理解的是,当存在多个词语构成的句子时,上述多个词语的排列顺序不同,得到的句子的含义也存在不同,故,基于咨询信息中的先后顺序排列上述多个关键词,可以最大程度的保留咨询信息的含义。
63.步骤sa3:获取每一关键词序列对应的回复信息。
64.在本技术实施例中,在识别每一目标音频信息对应的咨询信息后,提取每一咨询信息中的关键词序列,以在最大程度还原咨询信息含义的程度下提取关键词;获取每一关键词序列对应的回复信息,以得到与咨询信息相关程度较大的回复信息,可以提升回复信息对于对应咨询信息的精准度。
65.具体的,步骤sa3,获取每一关键词序列对应的回复信息,具体可以包括:针对每一关键词序列,判断本地数据库中是否存在关键词序列对应的数据;若是,则根据关键词序列,在本地数据库中,获取关键词序列对应的回复信息;若否,则将关键词序列发送至云端服务器,以获取云端服务器得到的关键词序列对应的回复信息。
66.针对每一关键词序列,判断本地数据库中是否存在关键词序列对应的数据,具体可以包括:获取每一关键词对应的至少一个近义词;针对每一关键词序列,在关键词序列包括的每一关键词各自对应的至少一个关键词中抽取一个替代关键词,并利用替代关键词替
换关键词序列中的关键词,得到近义关键词序列;利用全部近义词序列在本地数据库中的标识库中进行标识检索,得到标识检索结果,其中,本地数据库中设有标识库和回复信息库,标识库包括多个标识信息,每一标识信息包括多个预设关键词序列,回复信息库包括全部标识信息各自对应的回复信息;若标识检索结果为空,则确定本地数据库中不存在关键词序列对应的数据。
67.云端服务器得到关键词序列对应回复信息,并回传至应急广播终端的过程,具体可以包括:云端服务器的接口获取关键词序列,根据关键词序列进行搜索,得到对应的回复信息,并回传至应急广播终端。进一步的,云端服务器由分布式节点构成,主节点接收到关键词序列后,根据关键词序列确定咨询信息对应搜索类型;将上述关键词序列发送至搜索类型对应节点,并利用上述节点得到回复信息。
68.可以理解的是,本实施例优先选择使用本地资源进行回复信息的搜索,不需要与其他服务器通信,所以在进行数据检索时,速度相比于云端检索较快。在采用云端检索时,需要传输数据以及请求到云端服务器进行处理,以及结果回传,通信时间使得过程耗时长存在时间延迟。具体的,本地数据库中存储有问题对应的回复信息,并且为每一问题设置有关键词序列。本地数据库中存储的是小规模的常见的问题以及对应的回复信息。
69.在本技术实施例中,本实施例设置两种检索方式,优先使用本地资源进行检索,不需要与其他服务器通信,能够在一定程度上提高检索速度。
70.本技术实施例的一种可能的实现方式,步骤sa1,依次识别每一目标音频信息对应的咨询信息,具体可以包括步骤sc1至步骤sc7(图中未示出),其中:步骤sc1:识别每一目标音频信息对应的初始咨询信息。
71.具体的,初始咨询信息由目标音频信息经过语音识别直接得到。
72.步骤sc2:在实时音频中提取声音叠加部分。
73.具体的,可以将实时音频转换成波形或者频谱的形式,进而基于波形和频谱的分布信息确定音频中的叠加部分。
74.步骤sc3:在声音叠加部分中提取至少两个声纹特征,并根据至少两个声纹特征,确定至少两个声纹特征各自对应的叠加目标音频信息。
75.其中,叠加目标音频信息为声音叠加部分包括的声纹特征对应的说话者对应的目标音频信息。
76.根据至少两个声纹特征,确定至少两个声纹特征各自对应的叠加目标音频信息,具体可以包括:对每一目标音频信息进行声纹特征提取,得到每一目标音频信息对应的声纹特征;将上述至少两个声纹特征叠加后与每一目标音频信息的声纹特征进行匹配,得到每一声纹相似度,并根据上述声纹相似度对目标音频信息进行排名,得到声纹相似度排名;确定上述至少两个声纹特征的声纹数量;将声纹相似度排名不小于上述声纹数量的目标音频信息,作为叠加目标音频信息。
77.步骤sc4:获取声音叠加部分对应的词语组合,其中,词语组合包括全部叠加目标音频信息各自对应的词语。
78.具体的,可以包括步骤sc4-1至步骤sc4-5(图中未示出),其中:步骤sc4-1:获取声音叠加部分对应的初始词语组合。
79.具体的,对声音叠加部分进行语音识别,得到多种初始词语组合,其中,每一种初
始词语组合包括多个初始词语,每一初始词语对应一个说话者。
80.步骤sc4-2:针对每一叠加目标音频信息,利用叠加目标音频信息对应的初始词语,更改叠加目标音频信息对应的初始咨询信息,得到待分析咨询信息。
81.步骤sc4-3:对每一待分析咨询信息进行语义分析,得到每一语义分析结果。
82.其中,语义分析结果包括正常和异常,当语义通顺时,语义分析结果正常,当语义不通顺时,语义分析结果异常。
83.步骤sc4-4:针对每一叠加目标音频信息,将语义分析结果为正常的待分析咨询信息对应的初始词语组合作为词语组合。
84.在本技术实施例中,通过获取声音叠加部分对应的多个初始词语组合,以确定声音叠加部分可能对应的多种词语情况;针对每一叠加目标音频信息,利用每一初始词语组合,更改叠加目标音频信息对应的初始咨询信息,得到每一初始词语对应的待分析咨询信息,以确定每一种词语情况对应的待分析咨询信息;对每一待分析咨询信息进行语义分析,得到每一语义分析结果,以确定每一待分析咨询信息是否语义通顺;针对每一叠加目标音频信息,将语义分析结果为正常的待分析咨询信息对应的初始词语组合作为词语组合,以实现词语的准确度的提升。
85.步骤sc5:针对每一叠加目标音频信息,根据叠加目标音频信息对应的词语,更改叠加目标音频信息对应的初始咨询信息,得到咨询信息。
86.步骤sc6:针对每一非叠加目标音频信息,将初始咨询信息作为咨询信息。
87.在本技术实施例中,通过为每一声音叠加部分中的确定的词语组合,以为每一存在声音叠加情况的目标音频信息中的声音叠加部分确定词语;再将上述存在声音叠加情况的目标音频信息中的声音叠加部分的内容,对应替换为词语,得到咨询信息,以提升咨询信息的准确度,上述内容为初始咨询信息对应的内容。
88.上述实施例从方法流程的角度介绍一种应急广播终端音频处理方法,下述实施例从虚拟模块或者虚拟单元的角度介绍了一种应急广播终端音频处理装置,具体详见下述实施例。
89.本技术实施例提供一种应急广播终端音频处理装置,如图3所示,该应急广播终端音频处理装置具体可以包括:实时音频获取模块201,用于当接收到咨询信号时,获取实时音频;音频信息提取模块202,用于对实时音频进行音频分析,得到多个说话者各自对应的音频信息;目标音频信息筛选模块203,用于从全部音频信息中筛选出目标音频信息,其中,目标音频信息对应的内容为咨询语气的内容;音频优先级确定模块204,用于确定各个目标音频信息对应的音频优先级;回复信息生成模块205,用于依次生成每一目标音频信息对应的回复信息;回复信息播报模块206,用于按音频优先级,将各个回复信息播报。
90.本技术实施例的一种可能的实现方式,音频信息提取模块202,在执行对实时音频进行音频分析,得到多个说话者各自对应的音频信息时,具体用于:消除实时音频中的环境噪音,得到人声初始音频;从人声初始音频中分离出不同说话者对应的音频信息。
91.本技术实施例的一种可能的实现方式,音频优先级确定模块204,在执行确定各个目标音频信息对应的音频优先级时,具体用于:根据实时音频,确定每一目标音频信息在全部目标音频信息中的发声顺序,其中,发声顺序为音频优先级。
92.本技术实施例的一种可能的实现方式,回复信息生成模块205,在执行依次生成每一目标音频信息对应的回复信息时,具体用于:依次识别每一目标音频信息对应的咨询信息;提取每一咨询信息中的关键词序列;获取每一关键词序列对应的回复信息。
93.本技术实施例的一种可能的实现方式,回复信息生成模块205,在执行获取每一关键词序列对应的回复信息时,具体用于:针对每一关键词序列,判断本地数据库中是否存在关键词序列对应的数据;若是,则根据关键词序列,在本地数据库中,获取关键词序列对应的回复信息;若否,则将关键词序列发送至云端服务器,以获取云端服务器得到的关键词序列对应的回复信息。
94.本技术实施例的一种可能的实现方式,回复信息生成模块205,在执行基于实时音频,依次识别每一目标音频信息对应的咨询信息时,具体用于:识别每一目标音频信息对应的初始咨询信息;在实时音频中提取声音叠加部分;在声音叠加部分中提取至少两个声纹特征,并根据至少两个声纹特征,确定至少两个声纹特征各自对应的叠加目标音频信息;获取声音叠加部分对应的词语组合,其中,词语组合包括全部叠加目标音频信息各自对应的词语;针对每一叠加目标音频信息,根据叠加目标音频信息对应的词语,更改叠加目标音频信息对应的初始咨询信息,得到咨询信息。
95.本技术实施例的一种可能的实现方式,回复信息生成模块205,在执行获取声音叠加部分对应的词语组合时,具体用于:获取声音叠加部分对应的多个初始词语组合;针对每一叠加目标音频信息,利用每一初始词语组合,更改叠加目标音频信息对应的初始咨询信息,得到每一初始词语对应的待分析咨询信息;对每一待分析咨询信息进行语义分析,得到每一语义分析结果;针对每一叠加目标音频信息,将语义分析结果为正常的待分析咨询信息对应的初始词语组合作为词语组合。
96.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的一种应急广播终端音频处理装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
97.本技术实施例中提供了一种应急广播终端,如图4所示,图4所示应急广播终端包括:处理器301和存储器303。其中,处理器301和存储器303相连,如通过总线302相连。可选地,应急广播终端还可以包括收发器304。需要说明的是,实际应用中收发器304不限于一
个,该应急广播终端的结构并不构成对本技术实施例的限定。
98.处理器301可以是cpu(central processing unit,中央处理器),通用处理器,dsp(digital signal processor,数据信号处理器),asic(application specific integrated circuit,专用集成电路),fpga(field programmable gate array,现场可编程门阵列)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本技术公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器301也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,dsp和微处理器的组合等。
99.总线302可包括一通路,在上述组件之间传送信息。总线302可以是pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。总线302可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一条粗线表示,但并不表示仅有一根总线或一型的总线。
100.存储器303可以是rom(read only memory,只读存储器)或可存储静态信息和指令的其他类型的静态存储设备,ram(random access memory,随机存取存储器)或者可存储信息和指令的其他类型的动态存储设备,也可以是eeprom(electrically erasable programmable read only memory,电可擦可编程只读存储器)、cd-rom(compact disc read only memory,只读光盘)或其他光盘存储、光碟存储(包括压缩光碟、激光碟、光碟、数字通用光碟、蓝光光碟等)、磁盘存储介质或者其他磁存储设备、或者能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质,但不限于此。
101.存储器303用于存储执行本技术方案的应用程序代码,并由处理器301来控制执行。处理器301用于执行存储器303中存储的应用程序代码,以实现前述方法实施例所示的内容。
102.图4示出的应急广播终端仅仅是一个示例,不应对本技术实施例的功能和使用范围带来任何限制。
103.本技术实施例提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,当其在计算机上运行时,使得计算机可以执行前述方法实施例中相应内容。与相关技术相比,本技术实施例相较于相关技术在多人同时说话时可能将多人分别说的语句作为有效信息,导致有效信息准确性较低,从而出现由有效信息确定的回复信息的准确度低的问题;本方案通过识别实时音频中每人的音频信息,以分离每一说话者所说语句,提升应急广播终端分析的有效信息的准确性;再从全部音频信息中筛取带有咨询语气的目标音频信息,可以进一步提升有效信息的准确性;通过为每一目标音频信息确定回复优先级,可以在目标音频信息数量较大时缓解应急广播终端处理过程的负荷,提升处理过程的稳定性;故,依次确定回复信息可以使每一回复信息的确定过程更加稳定,以提升应急广播终端回复信息的准确性;按音频优先级,将各个回复信息播报,以实现应急广播终端的音频处理。
104.应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤
的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
105.以上仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
当前第1页1  
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
网站地图