自动结束录音识别方法、装置、电子设备及存储介质与流程

专利检索2025-01-16 47

本公开涉及信号处理，具体涉及语音识别、结束信号识别、人机交互等，尤其涉及一种自动结束录音识别方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

背景技术：

1、自动结束录音识别是一种语音识别技术，它能自动检测语音输入的结束，并在录音时进行识别和转录。在自动结束录音识别中，系统会根据语音信号的特征和语音活动检测算法来判断语音输入的结束。通常，系统会分析语音信号中的静音段或停顿来确定录音的结束位置。一旦系统检测到适当的停顿或静音，它会自动停止录音，并对录音进行识别和转录。这种技术广泛应用于语音转写、语音识别软件和语音记录应用等领域。它可以实现自动化的录音识别过程，提高工作效率和准确性。用户无需手动停止录音，系统可以自动识别录音的结束并生成相应的文本结果。

技术实现思路

1、本公开实施例提出了一种自动结束录音识别方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

2、第一方面，本公开实施例提出了一种自动结束录音识别方法，包括：获取持续接收到的音频信号流；确定当前的网络状况、音频信号流对应的语言种类以及备选的各语音识别引擎分别对应的选择优先级；其中，选择优先级基于历史识别速度和历史识别准确率确定得到；根据网络状况、语言种类和各语音识别引擎的选择优先级，确定与音频信号流适配的目标语音识别引擎；利用目标语音识别引擎持续识别音频信号流的音频信号直至识别到结束信号，并将位于结束信号之前的音频信号确定为待识别语音信息。

3、第二方面，本公开实施例提出了一种自动结束录音识别装置，包括：音频信号流持续接收单元，被配置成获取持续接收到的音频信号流；参数确定单元，被配置成确定当前的网络状况、音频信号流对应的语言种类以及备选的各语音识别引擎分别对应的选择优先级；其中，选择优先级基于历史识别速度和历史识别准确率确定得到；目标语音识别引擎确定单元，被配置成根据网络状况、语言种类和各语音识别引擎的选择优先级，确定与音频信号流适配的目标语音识别引擎；结束信号识别及待识别语音信息确定单元，被配置成利用目标语音识别引擎持续识别音频信号流的音频信号直至识别到结束信号，并将位于结束信号之前的音频信号确定为待识别语音信息。

4、第三方面，本公开实施例提供了一种电子设备，该电子设备包括：至少一个处理器；以及与至少一个处理器通信连接的存储器；其中，存储器存储有可被至少一个处理器执行的指令，该指令被至少一个处理器执行，以使至少一个处理器执行时能够实现如第一方面中任一实现方式描述的自动结束录音识别方法。

5、第四方面，本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质，该计算机指令用于使计算机执行时能够实现如第一方面中任一实现方式描述的自动结束录音识别方法。

6、第五方面，本公开实施例提供了一种包括计算机程序的计算机程序产品，该计算机程序在被处理器执行时能够实现如第一方面中任一实现方式描述的自动结束录音识别方法的步骤。

7、本实施例所提供的自动结束录音识别方案，针对持续接收到的音频信号流，通过确定用于影响在多个备选的语音识别引擎中进行选择的网络状况参数、语言种类参数以及选择优先级参数，从而得以根据这些参数确定与当前接收到的音频信号流适配的目标语音识别引擎，进而利用该目标语音识别引擎持续识别接收到的音频信号直至识别到结束信号，以便将位于结束信号之前的所有音频信号确定为完整的待识别语音信息。即通过基于多种参数来准确选择与当前场景下接收到的音频信号流适配的目标语音识别引擎，从而得到更快速、更准确的完成自动结束录音识别，更快识别得到更准确的语音内容，提升了人机交互体验。

8、应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种自动结束录音识别方法，包括：

2.根据权利要求1所述的方法，其中，所述选择优先级的确定过程包括：

3.根据权利要求2所述的方法，其中，所述根据各所述语音识别引擎的速度优先级和准确度优先级，分别确定各所述语音识别引擎的选择优先级，包括：

4.根据权利要求1所述的方法，其中，所述根据所述网络状况、所述语言种类和各所述语音识别引擎的选择优先级，确定与所述音频信号流适配的目标语音识别引擎，包括：

5.根据权利要求1所述的方法，其中，所述根据所述网络状况、所述语言种类和各所述语音识别引擎的选择优先级，确定与所述音频信号流适配的目标语音识别引擎，包括：

6.根据权利要求1所述的方法，其中，所述根据所述网络状况、所述语言种类和各所述语音识别引擎的选择优先级，确定与所述音频信号流适配的目标语音识别引擎，包括：

7.根据权利要求1所述的方法，其中，所述根据所述网络状况、所述语言种类和各所述语音识别引擎的选择优先级，确定与所述音频信号流适配的目标语音识别引擎，包括：

8.根据权利要求1所述的方法，其中，所述利用所述目标语音识别引擎持续识别所述音频信号流的音频信号，包括：

9.根据权利要求1-8任一项所述的方法，还包括：

10.一种自动结束录音识别装置，包括：

11.根据权利要求10所述的装置，还包括：选择优先级确定单元，所述选择优先级确定单元进一步包括：

12.根据权利要求11所述的装置，其中，所述选择优先级确定子单元被进一步配置成：

13.根据权利要求10所述的装置，其中，所述目标语音识别引擎确定单元被进一步配置成：

14.根据权利要求10所述的装置，其中，所述目标语音识别引擎确定单元：

15.根据权利要求10所述的装置，其中，所述目标语音识别引擎确定单元：

16.根据权利要求10所述的装置，其中，所述目标语音识别引擎确定单元：

17.根据权利要求10所述的装置，其中，所述结束信号识别及待识别语音信息确定单元包括被配置成利用所述目标语音识别引擎持续识别所述音频信号流的音频信号的结束信号识别子单元，所述结束信号识别子单元被进一步配置成：

18.根据权利要求10-17任一项所述的装置，还包括：

19.一种电子设备，包括：

20.一种存储有计算机指令的非瞬时计算机可读存储介质，所述计算机指令用于使所述计算机执行权利要求1-9中任一项所述的自动结束录音识别方法。

21.一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现根据权利要求1-9中任一项所述自动结束录音识别方法的步骤。

技术总结
本公开提供了一种自动结束录音识别方法、装置、电子设备及可读存储介质，涉及语音识别、结束信号识别、人机交互等技术领域。该方法包括：获取持续接收到的音频信号流；确定当前的网络状况、音频信号流对应的语言种类以及备选的各语音识别引擎分别对应的选择优先级；其中，选择优先级基于历史识别速度和历史识别准确率确定得到；根据网络状况、语言种类和各语音识别引擎的选择优先级，确定与音频信号流适配的目标语音识别引擎；利用目标语音识别引擎持续识别音频信号流的音频信号直至识别到结束信号，并将位于结束信号之前的音频信号确定为待识别语音信息。该方法可为当前场景下接收到的音频信号流选择最合适的语音识别引擎进行自动结束录音识别。

技术研发人员：李祥锐,陈志波,李晓敏
受保护的技术使用者：北京百度网讯科技有限公司
技术研发日：
技术公布日：2024/5/29

转载请注明原文地址:https://win.8miu.com/read-1148755.html

专利

最新回复(0)