智能机器人语音识别技术

发布时间:2024-12-15 18:54

智能手机通过AI技术实现语音助手和人脸识别功能。 #生活知识# #科技生活# #科技改变生活# #科技创新成果#

【Word版本下载可任意编辑】 PAGE 1 - / NUMPAGES 1 智能机器人语音识别技术 语音控制的根底就是语音识别技术,可以是特定人或者非特定人的。非特定人的应用更为广泛,对于用户而言不用训练,因此也更加方便。语音识别可以分为孤立词识别,连接词识别,以及大词汇量的连续词识别。对于智能机器人这类嵌入式应用而言,语音可以提供直接可靠的交互方式,语音识别技术的应用价值也就不言而喻。 1 语音识别概述 语音识别技术早可以追溯到20世纪50年代,是试图使机器能“听懂”人类语音的技术。按照目前主流的研究方法,连续语音识别和孤立词语音识别采用的声学模型一般不同。孤立词语音识别一般采用DTW动态时间规整算法。连续语音识别一般采用HMM模型或者HMM与人工神经网络ANN相结合。 语音的能量于正常呼气时肺部呼出的稳定气流,喉部的声带既是阀门,又是振动部件。语音信号可以看作是一个时间序列,可以由隐马尔可夫模型(HMM)开展表征。语音信号经过数字化及滤噪处理之后,开展端点检测得到语音段。对语音段数据开展特征提取,语音信号就被转换成为了一个向量序列,作为观察值。在训练过程中,观察值用于估计HMM的参数。这些参数包括观察值的概率密度函数,及其对应的状态,状态转移概率等。当参数估计完成后,估计出的参数即用于识别。此时经过特征提取后的观察值作为测试数据开展识别,由此开展识别准确率的结果统计。训练及识别的构造框图如图1所示。 图1 语音识别系统构造框图 1. 1 端点检测 找到语音信号的起止点,从而减小语音信号处理过程中的计算量,是语音识别过程中一个基本而且重要的问题。端点作为语音分割的重要特征,其准确性在很大程度上影响系统识别的性能。 能零积定义:一帧时间范围内的信号能量与该段时间内信号过零率的乘积。 能零积门限检测算法可以在不丢失语音信息的情况下,对语音开展准确的端点检测,经过450个孤立词(数字“0~9”)测试准确率为98%以上,经该方法开展语音分割后的语音,在进入识别模块时识别正确率达95%。 图2 检测结果的效果示意图 当话者带有呼吸噪声,或周围环境出现持续时间较短能量较高的噪声,或者持续时间长而能量较弱的噪声时,能零积门限检测算法就不能对这些噪声开展滤除,进而被判作语音进入识别模块,导致误识。图2(a)所示为室内环境,正常情况下采集到的带有呼气噪声的数字“0~9”的语音信号,利用能零积门限检测算法得到的效果示意图。前面一段信号为呼气噪声,之后为数字“0~9”的语音。 从图2(a)直观的显示出能零积算法在对付能量较弱,但持续时间长的噪音无能为力。由此引出了双门限能零积检测算法。 所谓的双门限能零积算法指的是开展两次门限判断。门限采用能零积,第二门限为单词能零积平均值。也即在前面介绍的能零积检测算法的根底上再开展能零积平均值的判决。其中,第二门限的设定依据取决于所有实验样本中呼气噪声的平均能零积及的语音单词能零积之间的一个常数。如图2(b)所示,即为图2(a)中所示的语音文件经过双门限能零积检测算法得到的检测结果。可以明显看到,前一段信号,即呼气噪声已经被视为噪音滤除。 1.2 隐马尔可夫模型HMM 隐马尔可夫模型,即HMM是一种基于概率方法的模式匹配方法。它的应用是20世纪80年代以来语音识别领域取得的重要成果。 一个HMM模型可以表示为: 式中:π为初始状态概率分布,πi=P(q1=θi),1≤i≤N,表示初始状态处于θi的概率;A为状态转移概率矩阵,(aij)N×N,aij=P(qt+1 =θj|qt=θi),1≤i,j≤N;B为观察值概率矩阵,B={bj(ot)},j=1,2,…,N,表示观察值输出概率分布,也就是观察值ot处于状态j的概率。 1.3 模型训练 HMM有多种构造类型,并且有不同的分类方法。根据状态转移矩阵(A参数)和观察值输出矩阵(B参数)的不同有不同类型的HMM。 对于CHMM模型,当有多个观察值序列时,其重估公式由参考文档给出,此处不再赘述。 1.4 概率计算 利用HMM的定义可以得出P(O|λ)的直接求取公式: 式(2)计算量巨大,是不能承受的。Rabiner提出了前向后向算法,计算量大大减小。定义前向概率: 那么有 (1)初始化 (2)递推 (3)终止 式(2)表示的是初始前向概率,bi(o1)为观察值序列处于t=1 时刻在状态i时的输出概率,由于它服从连续高斯混合分布,故此值往往极小。根据大量实验观察,

网址:智能机器人语音识别技术 https://www.yuejiaxmz.com/news/view/482822

相关内容

智能机器人语音识别技术详细解析
智能语音功能人工智能语音识别技术
电销机器人=AI人工智能+语音识别技术+语音知识库+话术逻辑+智能学习
人工智能:语音识别技术介绍
智能语音识别技术详解
人工智能应用:语音识别技术科普
智能人机交互:语音识别技术与智能助理的未来
语音识别技术
人工智能语音识别技术,改变了我们的生活
智能语音识别技术普及:全场景智能语音时代有望来临

随便看看