语音芯片识别技术对于实现人机交互来说是非常重要的,但是比起一次性语音芯片,语音识别技术在发展上显然还存在一些难点,大致分为以下几个方面:
一、说话差异
不同的人说话在发音器官还有口音以及说话风格上不同,同一个人说话不同的时间和状态又不同,还有噪声、背景噪声的音箱,以及传输信道麦克风频响等都会影响识别。更深入一些的有鲁棒性技术的不成熟,区分性训练的不稳定,还有特征补偿和模型补偿和语音识别的具体应用。
二、智能交互系统
对用户要求较为宽松,需要识别和其他领域技术的结合;呼叫路由,POI语音模糊查询,关键词检出;大词汇量连续语音识别系统;海量词条,覆盖面广,保证正确率的同时实时性较差。
三、命令词系统和音频转写
识别语法网络相对受限,对用户要求较严格。菜单导航,语音拨号,车载导航,数字字母识别等等;结合互联网的语音搜索,实现语音到文本,语音到语音的搜索。