首页    语音识别模组    语音识别模组

语音识别模组

 

语音识别模组是我司自主研发的一套基于云和端的通用智能语音解决方案。该模组可以为客户提供从从语音检测(VAD)、语音识别(ASR)、通话降噪(ENC)、主动降噪(ANC)、音效、以及软硬件系统集成在内的全套语音物联网解决方案,具有开发周期短、低功耗、低成本、和通过云端应用服务及软件版本升级实现产品服务和产品快速升级迭代的特点。

 

应用

 

● 智能音
● 智能穿戴
● 智能玩具
● 智能车载
● 智能健康
● 智能家居
● 手机、电脑

 

方案特点

 

● 支持语音前端处理功能:降噪(NS)处理、回声消除(AEC)、语音端点检测(VAD)、波束形成(Beam forming )、自动增益控制(AGC)
● 支持特征提取功能:采用梅尔频率倒谱系数(MFCC)
● 支持语音识别功能:采用基于神经网络模型(DNN)的端到端(end to end)的语音识别模式, 具有语音识别率高(识别率>95%)、Memory占用资源相对较少(可在MCU嵌入式系统中工作)、语料准备简单、训练周期短的特点;支持唤醒词条和命令词条,不限语言类型,可以中文+外语、普通话+方言。
● 支持远场语音识别,语音增强技术让识别效果更好,唤醒环境无需安静,说话不用靠近
● 通过麦克风阵列实现复杂噪声环境下的拾音
● 独立唤醒模块,支持UART等常用通信接口,当模块唤醒或识别到命令时,通过接口告知客户的设备
● 支持算法定制和调整
● 可根据客户硬件资源以及应用场景定制lib库
● 内存开销小,可通用于各种MCU/DSP平台
● 超低功耗,待机时CPU无需做语音降噪和激活
● 客户支持完善

自主算法

ALGORITHM