关注·IT热点探趋势④·语音技术:语音,人机交互新热门【2】

发布时间:2025-04-29 17:37

了解当前IT行业热门技术趋势,提升技能竞争力 #生活知识# #生活指南# #职场建议# #行业趋势分析#

2.语音技术大爆发是技术与需求的双重作用

从接受语音到识别语音,再到理解判断,最后反馈服务结果,在我们与机器的交流过程中,机器真的能像人一样思维吗?

刘庆峰介绍说,普通人容易理解的,人机交互的过程中主要包括两类语音技术,一类是语音合成,就是让机器“说话”,产生人造语音。另一类是语音识别,就是让机器听懂人说话。

“语音识别的目的,是让人说的话能被机器听清楚,之后还要听明白。语音合成,目的是要让机器能够用最自然、最清晰的方式说话。”微软亚洲研究院语音专家宋謌平说。

机器要能够准确识别语音并像人一样通过理解判断做出回应,需要基于大量的“学习”,通过学习,与人一样根据过去的经验进行判断预测。这种“学习”有两种方法:通过在数据中找寻类似事例来提供解决方案,或是通过归纳出许多数据样本的共性来对这件事情做出判断。这也是语音技术发展的难点。

余凯介绍,传统的语音识别中的语言模型是通过概率来“识别”,比如用户说“中”字,“国”字紧随其后的可能性很大,其他字出现概率相对就会小很多。利用不同的概率及数据建立的语言模型能够帮助机器识别语音。但是如果在口语化的环境下,用户语序不同或者有方言口音,就会大大干扰语音的解码识别过程,降低识别准确率。 

“语音技术是一门交叉学科,它的突飞猛进还得仰仗着数字信号处理、人工智能、大数据合成等各种领域技术的突破。” 刘庆峰说。

余凯分析说,大数据和云计算为语音技术的发展立了大功,大大提高了机器对数据的处理能力,为机器学习提供了大量“素材”,并且提高了它的学习速度,“以前学术界做语音识别通常是几十小时,而互联网公司有大量的服务器集群并行计算,可以处理成千上万小时的训练语料。”

目前,国际上研究正热的机器深度学习网络的发展,可能将攻克“南腔北调”给语音技术带来的困境。机器的深度学习模仿人脑,分很多层对信息进行处理,逐级抽象。机器正获得更“深度”的学习能力,能将语音技术向前推进一大步。百度CEO李彦宏也透露,今年将建立百度历史上首个研究院,初期就将专注于深度学习技术。

“语音技术可能在今年还会有爆发式的发展。”余凯预测。在他看来,经过了漫长蛰伏期的语音技术近几年迎来爆发式增长,除了技术发展的功劳,主要还是市场需求爆发的结果。

“主要是移动互联网带来了爆发式需求,企业看到了巨大的市场愿意投入资金发展。”余凯说。在移动互联网时代,用户需要更为方便自然的人机交互方式。当互联网从个人电脑向移动终端迁移的过程中,意味着人们在走路、开车、吃饭时都可以通过互联网获取信息、完成任务,语音解放了双手,成为了最快捷方便的方式。

以语音搜索为例,2002年初时,百度语音搜索占移动搜索的流量大概是1%,到2012年底升至8%,预计今年的流量大概能达到20%,“去年国庆元旦长假期间,语音流量增长得非常快,我们本来预期长假过后流量会有下降,事实证明没有,说明用户有长期使用的需求。”余凯说。

网址:关注·IT热点探趋势④·语音技术:语音,人机交互新热门【2】 https://www.yuejiaxmz.com/news/view/894593

相关内容

关注·IT热点探趋势④·语音技术:语音,人机交互新热门【3】
汽车语音交互技术发展趋势综述
关于语音交互技术的探讨
智能语音交互技术
探析语音识别技术的发展及趋势
语音交互
语音技术与人工智能:智能语音交互的多场景应用探索
轻语音交互技术:智能设备语音助手时代来临
智能家电的语音和手势交互技术
语音交互的痛点

随便看看