一种智能语音识别服务系统的制作方法-j9九游会真人

文档序号：34946293发布日期：2023-07-29 02:48阅读：22来源：国知局

1.本发明涉及语音识别相关技术领域，特别是一种智能语音识别服务系统。

背景技术：

2.近年来，现代科学技术呈现出高速发展的态势，特别是人工智能技术得到了前所未有的发展，该技术让人类充分体验到了现代科学技术带来的便利优势。随着便利优势的体现，人们开始了对更高生活质量的追求，为了使生活和工作更加便利，智能语音识别技术得到了迅速发展。近年来，智能语音识别技术在人类生活和工作中已经应用得越来越广泛；例如智能交互系统智能交互系统，该系统支持大容量的电话呼入/呼出处理、电话转接、来电弹屏、智能ivr、智能acd、通话记录、呼叫坐席管理、工单管理、数据报表和绩效统计等专业呼叫中心系统功能，支持部署版、云saas版呼叫中心，通话稳定、音质清晰，多级ivr语音、vip专线等功能优势，领略一呼百应的呼叫体验。
3.目前，通过识别用户的语音输入信息，自动完成和用户的交互带来了新的问题，语音识别的识别率并不高，用户体验效果不佳。

技术实现要素：

4.本发明的目的是为了解决上述问题，设计了一种智能语音识别服务系统。
5.实现上述目的本发明的技术方案为，进一步，在智能语音识别服务系统中，该智能语音识别服务系统包括信号采集模块、预处理模块、特征提取模块、语义解析模块和结果输出模块，其中，信号采集模块，用于通过接入接口采集初始语音信号，对所述初始语音信号进行语音识别，得到初始语音识别数据；预处理模块，用于对所述初始语音识别数据进行预处理；特征提取模块，用于将经过预处理的初始语音识别数据输入预先训练得到的语音识别模型中，输出目标语音识别结果；语义解析模块，用于对所述目标语音识别结果进行语义解析，得到所述目标语音识别结果对应的语义解析结果；结果输出模块，用于判断所述语义解析结果是否完整，若是，则通过输出接口输出所述语义解析结果。
6.进一步，在上述智能语音识别服务系统中，所述信号采集模块包括声音输入单元、语音转换单元、特征提取单元和归一化处理单元，其中，声音输入单元，用于接收通过语音设备采集到的用户声音数据；语音转换单元，用于将所述用户声音数据转换成初始语音信号；特征提取单元，用于将所述初始语音信号分成多个通道信息，对每个通道信号分别提取时域特征；归一化处理单元，用于进行归一化处理，得到特征向量，并基于特征向量，得到初
始语音识别数据。
7.进一步，在上述智能语音识别服务系统中，所述预处理模块包括滤波处理单元、加权处理单元、分帧处理单元和分割处理单元，其中，滤波处理单元，用于对所述初始语音识别数据利用谱减法进行滤波处理，得到第一语音电信号；加权处理单元，用于采用预加权方法对所述第一语音电信号中高频阶段的语言进行加权处理，得到第二语音电信号；分帧处理单元，用于对所述第二语音电信号进行信号分帧处理，得到含有多个小段的第三语音电信号；分割处理单元，用于通过端点检测方法实现对所述第三语音电信号的词汇信号和噪声信号的分割，得到经过预处理的初始语音识别数据。
8.进一步，在上述智能语音识别服务系统中，所述语音识别模型的训练过程包括以下步骤：获取包含大量词汇的语音特征，对词汇进行编号，得到样本训练集；将所述样本训练集输入神经网络模型中，输出结果数据；将语音特征对应的词汇编号作为参考数据，对比所述结果数据和参考数据，并计算数据误差；当所述结果数据和参考数据的数据误差低于预先设置的阈值时，停止对所述神经网络模型的训练，得到语音识别模型。
9.进一步，在上述智能语音识别服务系统中，所述神经网络由输入层、隐层和输出层构成，基本单元为神经元，输入层的神经元为所提取的语音特征，隐层的神经元通过样本训练构建，输出层的神经元为语音识别词汇。
10.进一步，在上述智能语音识别服务系统中，所述语义解析模块包括词汇分析单元、排序处理单元、扩展处理单元和语义识别单元，其中，词汇分析单元，用于获取所述目标语音识别结果中的语音识别词汇，对所述语音识别词汇依次进行词法分析处理和语法分析处理，得到多个候选语义表征；排序处理单元，用于对多个候选语义表征按照从高到低进行排序，根据预设范围筛选出高分候选语义表征；扩展处理单元，用于对所述高分候选语义表征进行扩展，得到语义表征数据；语义识别单元，用于对所述语义表征数据进行语义角色标注和词义消歧处理，输出目标语音识别结果对应的语义解析结果。
11.进一步，在上述智能语音识别服务系统中，所述所述词法分析处理方式包括分词处理、词性标注处理，所述语法分析处理包括依存句法分析处理和依存关系分析处理。
12.进一步，在上述智能语音识别服务系统中，该智能语音识别服务系统还包括处理器、计算机储存存储器，其中该计算机储存存储器存储数据并且具有存储于其上的计算机可执行指令，该计算机可执行指令在由所述处理器执行时将实现存储。
13.其有益效果在于，该智能语音识别服务系统包括信号采集模块、预处理模块、特征提取模块、语义解析模块和结果输出模块，通过预处理模块降低噪音对语音识别的影响，通过特征提取模块采用神经网络模型进行学习，通过语义解析模块和结果输出模块对语音识
别结果进行语义解析，提高语音识别准确度，从而增强用户体验感。
附图说明
14.通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。
15.图1为本发明实施例中智能语音识别服务系统的实施例示意图；图2为本发明实施例中智能语音识别服务系统操作方法示意图。
具体实施方式
16.为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。
17.本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
18.下面结合附图对本发明进行具体描述，如图1所示，一种智能语音识别服务系统，该智能语音识别服务系统包括信号采集模块、预处理模块、特征提取模块、语义解析模块和结果输出模块，其中，信号采集模块，用于通过接入接口采集初始语音信号，对初始语音信号进行语音识别，得到初始语音识别数据；预处理模块，用于对初始语音识别数据进行预处理；特征提取模块，用于将经过预处理的初始语音识别数据输入预先训练得到的语音识别模型中，输出目标语音识别结果；语义解析模块，用于对目标语音识别结果进行语义解析，得到目标语音识别结果对应的语义解析结果；结果输出模块，用于判断语义解析结果是否完整，若是，则通过输出接口输出语义解析结果。
19.本实施例中，信号采集模块包括声音输入单元、语音转换单元、特征提取单元和归一化处理单元，其中，声音输入单元，用于接收通过语音设备采集到的用户声音数据；语音转换单元，用于将用户声音数据转换成初始语音信号；特征提取单元，用于将初始语音信号分成多个通道信息，对每个通道信号分别提取时域特征；归一化处理单元，用于进行归一化处理，得到特征向量，并基于特征向量，得到初始语音识别数据。
20.本实施例中，预处理模块包括滤波处理单元、加权处理单元、分帧处理单元和分割处理单元，其中，
滤波处理单元，用于对初始语音识别数据利用谱减法进行滤波处理，得到第一语音电信号；加权处理单元，用于采用预加权方法对第一语音电信号中高频阶段的语言进行加权处理，得到第二语音电信号；分帧处理单元，用于对第二语音电信号进行信号分帧处理，得到含有多个小段的第三语音电信号；分割处理单元，用于通过端点检测方法实现对第三语音电信号的词汇信号和噪声信号的分割，得到经过预处理的初始语音识别数据。
21.本实施例中，语音识别模型的训练过程包括以下步骤：获取包含大量词汇的语音特征，对词汇进行编号，得到样本训练集；将样本训练集输入神经网络模型中，输出结果数据；将语音特征对应的词汇编号作为参考数据，对比结果数据和参考数据，并计算数据误差；当结果数据和参考数据的数据误差低于预先设置的阈值时，停止对神经网络模型的训练，得到语音识别模型。
22.本实施例中，神经网络由输入层、隐层和输出层构成，基本单元为神经元，输入层的神经元为所提取的语音特征，隐层的神经元通过样本训练构建，输出层的神经元为语音识别词汇。
23.本实施例中，语义解析模块包括词汇分析单元、排序处理单元、扩展处理单元和语义识别单元，其中，词汇分析单元，用于获取目标语音识别结果中的语音识别词汇，对语音识别词汇依次进行词法分析处理和语法分析处理，得到多个候选语义表征；排序处理单元，用于对多个候选语义表征按照从高到低进行排序，根据预设范围筛选出高分候选语义表征；扩展处理单元，用于对高分候选语义表征进行扩展，得到语义表征数据；语义识别单元，用于对语义表征数据进行语义角色标注和词义消歧处理，输出目标语音识别结果对应的语义解析结果。
24.本实施例中，该智能语音识别服务系统还包括处理器、计算机储存存储器，其中该计算机储存存储器存储数据并且具有存储于其上的计算机可执行指令，该计算机可执行指令在由处理器执行时将实现存储。
25.本发明实施例中，该智能语音识别服务系统包括信号采集模块、预处理模块、特征提取模块、语义解析模块和结果输出模块，通过预处理模块降低噪音对语音识别的影响，通过特征提取模块采用神经网络模型进行学习，通过语义解析模块和结果输出模块对语音识别结果进行语义解析，提高语音识别准确度，从而增强用户体验感。
26.下面对本发明实施例中智能语音识别服务系统操作方法进行描述，如图2所示，该操作方法包括以下步骤：步骤201、通过接入接口采集初始语音信号，对初始语音信号进行语音识别，得到初始语音识别数据；步骤202、对初始语音识别数据进行预处理；
步骤203、将经过预处理的初始语音识别数据输入预先训练得到的语音识别模型中，输出目标语音识别结果；步骤204、对目标语音识别结果进行语义解析，得到目标语音识别结果对应的语义解析结果；步骤205、判断语义解析结果是否完整，若是，则通过输出接口输出语义解析结果。
27.本发明实施例中，通过接入接口采集初始语音信号，对初始语音信号进行语音识别，得到初始语音识别数据；对初始语音识别数据进行预处理；将经过预处理的初始语音识别数据输入预先训练得到的语音识别模型中，输出目标语音识别结果；对目标语音识别结果进行语义解析，得到目标语音识别结果对应的语义解析结果；判断语义解析结果是否完整，若是，则通过输出接口输出语义解析结果；本发明提高语音识别准确度，从而增强用户体验感。
28.以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的仅为本发明的优选例，并不用来限制本发明，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

当前第1页1