网言网语

发布时间:2024-12-24 00:10

确保你的网络语言清晰,避免地域性的网络用语差异。 #生活技巧# #职场沟通技巧# #网络沟通策略#

栏目主持人:王向鹏 丁小伟

  编者按 2016年,AlphaGo 打败了世界围棋冠军李世石,人工智能接受了人类的顶礼膜拜。这一年,“硅谷精神之父”、“科技商业预言家”——凯文·凯利预测人工智能将成为日用品,听起来仿佛很科幻,实现得却很快。2020年,在我们毫无意识的情况下,人工智能就已经渗透到我们的日常生活了,今天,小编就为你盘点人工智能在当下的四大热门应用,看机器学习、计算机视觉、语音交互、自然语言处理等技术是如何在生活中落地的。

  小时候看《名侦探柯南》,除了每集精彩的推理之外,柯南的「变声蝴蝶结」也成为了许多人梦寐以求的动漫同款,那是很多人第一次见识到声音的魅力。

  如今,我们再回头来看柯南的「变声蝴蝶结」,已经不仅仅是被表面的魔力所着迷,而是逐渐开始明白这背后所隐藏的语音技术,这也是我们今天要讲的语音合成。

  语音合成就是让机器模仿人类说话。即输入一段文字,最终输出一段语音。

  做个比较,当机器的“脑子”里想到了一段内容时,或者是看到了一段话时,知道哪些字应该怎么读:

  和人类学说话一样,机器也需要通过大量的语音片段作为“听力材料”,才能学会发音技巧。以及还得学会一些语言规则,比如语法和韵律,才能像人类一样,说话语气、语境,能表达出字面之外的表意。不然,机器只会说出生硬、没有情感、不连贯的话(就像一些动漫或游戏作品中机器人角色的对话)

  语音合成可以说是同时运用语言学和心理学的杰出之作,它的背后是文本转语音(Text To Speech,简称TTS)技术。这个技术我们都很熟悉了,不管是越来越俏皮的Siri,或是可以定制语言导航的百度地图,都是依靠的TTS技术。

  语音合成最简单粗暴的方法是拼接法,缺陷是拼接出来的语音听起来就不像正常人,比如我们最常听的“支付宝到账X元”用的就是拼接法。

  早期语音合成还需要大量的语料和训练,现在训练成本已经大大降低了。在GitHub一个开源项目里,你只需要一个人5秒的音源,就能克隆他的声音,连语气和情绪都能模仿。谷歌实验室旗下的Lyrebird公司宣称,只需要1分钟的声音样本,就可以模仿任何人说话。

  Lyrebird靠的是神经网络和机器学习。神经网络把文本智能转换为自然语言,转换时间之短可以秒计算;同时,智能语音控制器能做到让人根本意识不到是机器在说话。除了Lyrebird外,谷歌的 WaveNet,百度的 Deep Voice以及科大讯飞和腾讯等等都提供了开源的语音合成应用。

  关于语音合成的未来之路必将和具体领域进行深度结合。比如近两年很火的机器翻译领域,未来语音进一步渗透其中,可能每个人都能用自己的声音通译世界;还比如声乐领域,有了声音,更需要音乐,融合歌唱合成技术将为未来虚拟IP打造提供助力。

  2019全国两会期间,科大讯飞推出了首个多语种AI虚拟主播,效果非常惊艳。视频里的形象和声音都是用人工智能输出的,未来音视频一体是一个巨大的趋势,语音的传播广且不需要特殊的媒介,而视频可以聚拢用户的注意力,音视频的结合会更好地帮助我们在人机交互的场景下有做更有价值的事情。

  智能音箱和iPad、特斯拉ModelS等一起,被《时代周刊》列为十年来最具影响力的科技产品。那么,下一期小编将带你走进语音交互——智能音箱终于能听懂人话了。

版权与免责声明

① 凡本网注明“来源:东营日报、黄河口晚刊、东营网”的所有文字、图片和音视频稿件,版权均属东营日报社所有,东营网拥有东营日报社所属《东营日报》、《黄河口晚刊》、《东营网》的电子信息网络发布、出售与转载权利。任何媒体、网站或个人未经本网书面授权不得转载、链接、转贴或以其他方式复制发表。已经经本网书面授权的媒体、网站,在下载使用时必须注明“来源:东营网”,违者本网将依法追究责任。

② 本网未注明“来源:东营日报、黄河口晚刊、东营网”的文字、图片和音视频等稿件均为转载稿,本网转载出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的“来源”,并自负版权等法律责任。如擅自篡改为“来源:东营网”,本网将依法追究责任。如对稿件内容有疑议,请及时联系我们处理。

③ 如本网转载稿涉及版权等问题,请作者及时联系我们处理。

网址:网言网语 https://www.yuejiaxmz.com/news/view/549273

相关内容

网络用语与语言规范
网络语言的使用与规范
网络语言:情感与文化的表达
十大好用的语文学习网站 语文老师常用的网站 语文教学资源网推荐
网言网语:废旧手机如何处置?(2)
【打击整治网络谣言】网络谣言之“网络食品及产品安全”谣言
英语学习网络资源.doc
百度网讯获专利:基于大语言模型的智能出行助手来袭
网络安全提示标语(80句)
网络安全温馨的提示语

随便看看