本技术涉及一种基于jetson开发板的语音降噪盒,属于语音增强。
背景技术:
1、语音增强技术是指当语音信号被噪声干扰、甚至淹没时,需要从噪声背景中提取出干净的原始语音信号,同时抑制、降低噪声干扰的一种语音处理技术,其目的是提高语音的质量和可懂度。单通道语音增强技术的发展经历了从信号处理方法到机器学习方法再到深度学习方法的发展过程,随着深度学习相关技术的迅速发展,各类网络结构和模型的提出,目前已逐步应用于语音增强技术领域,使得单通道语音增强技术随着深度学习的发展取得了很大的进步。但在具体到实际应用场景中时,相关的语音增强方法仍然需要根据场景特点和需求进行改进和优化。
2、在专利号为202020429343.0的中国实用新型中,公开了一种基于自适应语音增强的声纹识别装置。该声纹识别装置包括拾音模块、语音增强处理模块、音频接口以及配置有声纹识别软件的pc电脑,拾音模块、语音增强处理模块、音频接口以及pc电脑依次相连;语音信号通过拾音模块传输至语音增强处理模块,经过语音增强处理模块处理后的语音信号经过音频接口传输至pc电脑进行声纹识别。其中,语音增强处理模块首先对语音信号进行预处理,其根据背景噪声和语音信号特征的差异,进行降噪以及语音增强处理,同时降低了环境混响的影响,提高了语音信号的信噪比,因而改善了语音信号的特征矢量,有利于提高声纹识别的识别率。
技术实现思路
1、本实用新型要解决的技术问题在于提供一种基于jetson开发板的语音降噪盒。
2、为了实现上述目的,本实用新型采用以下的技术方案:
3、一种基于jetson开发板的语音降噪盒,包括语音输入单元、语音预处理单元、语音增强单元、参数控制单元和语音输出单元;其中,
4、所述语音输入单元用于接收原始语音信号的输入,其输出端与所述语音预处理单元连接;
5、所述语音预处理单元用于对输入的原始语音信号进行预先滤波和分帧等处理,其输出端与所述语音增强单元连接;
6、所述语音增强单元采用深度学习中的dcctn网络模型结构,用于将输入的语音信号进行降噪和增强处理,其输出端与所述语音输出单元连接;
7、所述参数控制单元用于调节语音增强的强度大小,其控制端与所述语音增强单元连接;
8、所述语音输出单元用于输出增强处理后的语音信号。
9、其中较优地,所述语音降噪盒采用jetson开发板实现各个功能单元的组装连接;其中,所述语音预处理单元和所述语音增强单元由所述jetson开发板上的处理器实现。
10、其中较优地,所述语音输入单元由jetson开发板上的麦克风音频接口实现;所述语音输出单元由jetson开发板上的耳机接口实现。
11、其中较优地,所述参数控制单元的控制旋钮和参数显示器分别通过gpio接口与所述jetson开发板连接。
12、与现有技术相比较,本实用新型提供的语音降噪盒通过jetson开发板实现各个功能单元的组装连接,不仅能够满足深度学习方面的算力要求,并且jetson开发板自带的丰富接口与扩展还能够支持从技术到产品的快速转化,实现了低成本、高效率的有益效果。
1.一种基于jetson开发板的语音降噪盒,其特征在于包括语音输入单元、语音预处理单元、语音增强单元、参数控制单元和语音输出单元;其中,
2.如权利要求1所述的基于jetson开发板的语音降噪盒,其特征在于:
3.如权利要求2所述的基于jetson开发板的语音降噪盒,其特征在于:
4.如权利要求2所述的基于jetson开发板的语音降噪盒,其特征在于:
