PatViewer专利搜索
中国 发明 在审

【中文】一种基于语音的应用内交互方法及系统
【EN】The interior exchange method of the voice-based application of one kind and system

申请(专利)号:CN201910127253.8国省代码:上海 31
申请(专利权)人:【中文】上海昊沧系统控制技术有限责任公司【EN】Shanghai HC System Control Technology Co., Ltd.
温馨提示:Ctrl+D 请注意收藏,详细著录项请首页检索查看。 Please note the collection. For details, please search the home page.

摘要:
【中文】本发明提供了一种基于语音的应用内交互方法及系统,包括:语音识别步骤:将采集到的语音转换为文字;本地识别步骤:在本地从转换得到的文字中识别命令,并提取关键词;云转换步骤:在云端将提取到的关键词进行名词转换,并根据转换结果进行模糊匹配数据;匹配数据反馈步骤:对匹配得到的数据进行反馈或处理。本发明包括了本地识别以及云转换功能,可以有效提供语音识别的准确率,对于行业特殊专业词汇识别准确,可实现应用内页面快速切换。
【EN】Paragraph:The present invention provides the interior exchange method of the voice-based application of one kind and systems, comprising: collected voice speech recognition steps: is converted to text;Local identification step: in local from the text being converted to recognition command, and extract keyword;Cloud switch process: the keyword extracted is subjected to noun conversion beyond the clouds, and fuzzy matching data are carried out according to transformation result;Matched data feedback step: the data that matching obtains are fed back or is handled.Present invention comprises local identification and cloud conversion functions, can effectively provide the accuracy rate of speech recognition, and specialized vocabulary identification special for industry is accurate, it can be achieved that being switched fast using the interior page.

主权项:
【中文】1.一种基于语音的应用内交互方法,其特征在于,包括:语音识别步骤:将采集到的语音转换为文字;本地识别步骤:在本地从转换得到的文字中识别命令,并提取关键词;云转换步骤:在云端将提取到的关键词进行名词转换,并根据转换结果进行模糊匹配数据;匹配数据反馈步骤:对匹配得到的数据进行反馈或处理。【EN】1. a kind of voice-based interior exchange method of application characterized by comprising


相似专利
说明书

一种基于语音的应用内交互方法及系统

技术领域

本发明涉及数据处理技术领域,具体地,涉及一种基于语音的应用内交互方法及

系统。

背景技术

智能语音交互是基于语音输入的新一代交互模式,用户可以通过说话就可以得到

反馈结果。典型的应用场景--语音助手,自从iPhone推出SIRI后,智能语音交互应用得到飞

速发展。

公开号为CN 108766429A,以及公开号为CN 109036404A的两篇发明专利分别公开

了语音交互方法及装置,这两种方案的缺陷在于:未涉及行业特殊专业词汇识别不准问题;

未涉及识别结果结合发音人身份信息进行数据权限控制;未涉及应用内页面快速切换问

题。

发明内容

针对现有技术中的缺陷,本发明的目的是提供一种基于语音的应用内交互方法及

系统。

根据本发明提供的一种基于语音的应用内交互方法,包括:

语音识别步骤:将采集到的语音转换为文字;

本地识别步骤:在本地从转换得到的文字中识别命令,并提取关键词;

云转换步骤:在云端将提取到的关键词进行名词转换,并根据转换结果进行模糊

匹配数据;

匹配数据反馈步骤:对匹配得到的数据进行反馈或处理。

较佳的,所述本地识别步骤包括:

去除文字中的助词;

去除助词后只包含命令的情况下,直接进入对应的功能页面;

去除助词后包含命令和关键词的情况下,根据命令确定访问的后台数据;

命令中包含非常用语的情况下,进行本地转换成正确命令。

较佳的,所述云转换步骤包括:

将关键词进行专业名词转换、同义词转换,形成一组新关键词,利用新关键词进行

全文检索匹配,所述全文检索匹配在云端只匹配自身权限内的数据。

较佳的,所述匹配数据反馈步骤包括:

命令为语音反馈时,通过语音播放方式反馈匹配的数据;

匹配的数据为单条数据时,直接进入数据详情,并语音提示;

匹配的数据为多条数据时,跳转数据列表,并语音提示;

根据当前页面信息,对匹配的数据进行处理利用。

较佳的,在所述语音识别步骤之前还包唤醒步骤:

通过摇一摇或者预定语音命令唤醒语音识别功能。

根据本发明提供的一种基于语音的应用内交互系统,包括:

语音识别模块:将采集到的语音转换为文字;

本地识别模块:在本地从转换得到的文字中识别命令,并提取关键词;

云转换模块:在云端将提取到的关键词进行名词转换,并根据转换结果进行模糊

匹配数据;

匹配数据反馈模块:对匹配得到的数据进行反馈或处理。

较佳的,所述本地识别模块包括:

去除文字中的助词;

去除助词后只包含命令的情况下,直接进入对应的功能页面;

去除助词后包含命令和关键词的情况下,根据命令确定访问的后台数据;

命令中包含非常用语的情况下,进行本地转换成正确命令。

较佳的,所述云转换模块包括:

将关键词进行专业名词转换、同义词转换,形成一组新关键词,利用新关键词进行

全文检索匹配,所述全文检索匹配在云端只匹配自身权限内的数据。

较佳的,所述匹配数据反馈模块包括:

命令为语音反馈时,通过语音播放方式反馈匹配的数据;

匹配的数据为单条数据时,直接进入数据详情,并语音提示;

匹配的数据为多条数据时,跳转数据列表,并语音提示;

根据当前页面信息,对匹配的数据进行处理利用。

较佳的,在所述语音识别模块之前还包唤醒模块:

通过摇一摇或者预定语音命令唤醒语音识别功能。

与现有技术相比,本发明具有如下的有益效果:

本发明包括了本地识别以及云转换功能,可以有效提供语音识别的准确率,对于

行业特殊专业词汇识别准确,可实现应用内页面快速切换。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、

目的和优点将会变得更明显:

图1为本发明的工作流程图;

图2为本发明实施例中语音录入页面数据示意图;

图3为本发明实施例中根据命令和匹配数据跳转目标页面示意图;

图4为本发明实施例中语音识别数据播报提示用户示意图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术

人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术

人员来说,在不脱离本发明构思的前提下,还可以做出若干变化和改进。这些都属于本发明

的保护范围。

如图1所示,根据本发明提供的一种基于语音的应用内交互方法,包括:

唤醒步骤:通过摇一摇或者预定语音命令等方式唤醒语音识别功能。解决了用户

在一个功能的深度页面中快速跳转另外一个功能,并能快速返回上一功能的需求,提高了

用户使用APP的效率。

语音识别步骤:将采集到的语音转换为文字。如图2所示,对于本步骤,本发明不做

限制,本领域技术人员可采用现有技术进行实现。

本地识别步骤:在本地从转换得到的文字中识别命令,并提取关键词。可以避免一

些用户由于发音不准,导致进入不了功能页面的问题。

(1)去除助词,去除说话时使用的助词,如“打开”,“看”,“的”等与匹配无关助词;

(2)解析后只包含命令,直接进入相应功能页面;

(3)解析后包含命令和关键词,根据命令确定访问的后台数据;

应用中会包含许多功能(功能较多时,在最外层放不了所有功能,多个功能会组织

在一个大功能里面,大功能里面的子功能也会包含更小的子功能,依次类推),进入功能页

面或获取功能中数据称为命令,如果是只包含命令,直接跳转功能页面(比如AR功能,数据

列表),进入页面再查询数据;如果包含关键词时,不先进行跳转,如果无相关数据时,提示

用户无相关数据,还停留在当前页面,有数据时才跳转对应功能页面(不同功能获取数据接

口不同,所以需要根据命令确定访问数据)。

(4)命令中不是常用语的,识别容易发生错误,进行本地转换,转换成正确命令。

云转换步骤:如图3所示,在云端将提取到的关键词进行名词转换,并根据转换结

果进行模糊匹配数据。

搭建全文检索系统(现有开源的比如lucence和solr),比如搜索一个工艺名称“进

水泵房和粗各删”,能够从数据中优先匹配我们想要的数据,“粗格栅及进水泵房”,其中词

组位置置换了,出现部分错别字,都能进行一定程度上的匹配(模糊匹配是相对于全匹配来

讲的)。

(1)常用专业名词转换,由于地域不同导致发音不准,进行常用词转换;解决语音

识别不准的专业词汇,可匹配正确数据。

(2)同义词转换,如发音氨氮可匹配NH3-N,发音一号可匹配1#;解决中文中一个发

音匹配多个词汇的问题,从多个词汇中能匹配用户真正需要的数据。

(3)语音识别工具优先识别常用语,行业专业词汇识别结果误差大,进行特殊转

换,得到一组关键词;

(4)全文检索系统(小型搜索引擎),对于该组关键词,会包含多个词组,单个词组

或者词组顺序换一下就能匹配到数据,通过全文检索系统可匹配用户最想要的数据;

(5)全文检索系统和自身系统间权限控制,全文检索系统不带权限功能,云服务中

会有多个客户数据,在全文检索系统中只匹配自己权限内数据。通过全文检索引擎与系统

本身权限系统结合,解决了使用全文系统时数据的权限问题。

(6)终端未识别命令时,在全文检索系统中匹配所有数据,将所有数据打上不同功

能数据标记返回终端。

当无确定命令(功能)时,查询出来的数据可能会包含多个功能数据,在展示时,需

要对不同功能数据做显示区分,单条数据在跳转时也要能区分出要跳转的功能。

匹配数据反馈步骤:如图4所示,对匹配得到的数据进行反馈或处理。

(1)命令类型是语音反馈,通过语音播报方式在终端将所述匹配数据反馈给用户;

(2)云服务返回单条数据时,直接进入数据详情,并语音提示用户;

(3)云数据返回多条数据时,跳转数据列表,并语音提示用户;

(4)根据当前页面信息,对所述匹配数据进行处理利用。

在上述一种基于语音的应用内交互方法的基础上,本发明还提供一种基于语音的

应用内交互系统,包括:

语音识别模块:将采集到的语音转换为文字;

本地识别模块:在本地从转换得到的文字中识别命令,并提取关键词;

云转换模块:在云端将提取到的关键词进行名词转换,并根据转换结果进行模糊

匹配数据;

匹配数据反馈模块:对匹配得到的数据进行反馈或处理。

本领域技术人员知道,除了以纯计算机可读程序代码方式实现本发明提供的系统

及其各个装置、模块、单元以外,完全可以通过将方法步骤进行逻辑编程来使得本发明提供

的系统及其各个装置、模块、单元以逻辑门、开关、专用集成电路、可编程逻辑控制器以及嵌

入式微控制器等的形式来实现相同功能。所以,本发明提供的系统及其各项装置、模块、单

元可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置、模块、单元也可

以视为硬件部件内的结构;也可以将用于实现各种功能的装置、模块、单元视为既可以是实

现方法...

=>>详细说明书全文请进入首页检索查看

图1
©2018 IPPH.cn   PatViewer·专利搜索
主办单位:知识产权出版社有限责任公司  咨询热线:01082000860-8588
浏览器:IE9及以上、火狐等  京ICP备09007110号 京公网安备 11010802026659号