ope电竞app_ope体育·电竞_ope 电竞
ope电竞app

无间道3,四平天气预报-ope电竞app_ope体育·电竞_ope 电竞

admin admin ⋅ 2019-05-20 08:12:29

语音辨认技能伴随着核算机科学和通讯等学科的开展逐渐生长,至今现已有超越六十年的前史。

上世纪50年代:

早在上世纪50年代,贝尔实验室就开端进行语音辨认的研讨。其时研讨的主要是根据简略的孤立词的语音辨认体系。例如,1952年贝尔实验室选用模仿电子器件完成了针对特定说话人的十个英文数字的孤立词语音辨认体系(Daviset a1.,1952)。该体系提取每个数字发音的元音的共振峰特征,然后选用简略的模板匹配的办法进行针季昊霆对特定人的孤立数字辨认。1956年普林斯顿大学的RCA实验室运用模仿滤波器组提取元音的频谱,然后再用模板匹配,构建了针对特定说话人的包含十个单音节单词的语音辨认体系。1959年,伦敦大学的科学家第一次运用核算学的原理构建了能够辨认四个元音和九个子音的音素辨认器(Fry,1959)。同年,来自麻省理工的林肯实验室的研讨人员初次完成了针对非特定人的十个元音的辨认器。

上世纪60年代:

上世纪60年代,三个要害技能的呈现关于语音辨认的开展奠定了根底。首要是针对语音时长不一致的问题,来自RCA实验室的Martin提出了一种时刻规整的机制(Martin et a1.,1964),能够有用的下降时长不一致对辨认得分核算的影响。其次是来自前苏联的Vintsyuk提出无间道3,四平天气预报-ope电竞app_ope体育·电竞_ope 电竞选用动态规划算法完成动态时刻规整(Dynamic Time Warping,DTW)(Vintsyuk,1968)。DTW能够有用的处理两个不同长度的语音片段的类似度衡量,一度成为语音辨认的干流技能。最终是来自卡耐基梅隆大学Reddy运用音素动态盯梢的办法进行接连语音辨认的开创性作业(Reddy,1 966)。这三个研讨作业,关于尔后几十年语音辨认的开展都起到了要害的效果。尽管60年代语音辨认取得了长足的开展,可是人们认为完成真实有用的语音辨认体系仍旧十分困难。

上世纪70年代:

上世纪70年代是语音辨认技能快速开展的一个时期。这时期三个要害的技能被引进到语音辨认中,包含模式辨认思维(Velichko and Zagoruyko,1970),动态规划算法(Sakoe and Chiba,1978)和线性猜测编码(Linear Predictive Coding,LPC)(1takura,1970)。这些技能的成功运用使得孤立词语音辨认体系从理论上得以完善,并且能够到达有用化的要求。尔后研讨人员将目光投向了更具有有用价值也愈加具有挑战性的接连语音辨认问题。其间以Bell、IBM实验室为代表的研讨人员开端测验研讨根据大词汇量的接连语音辨认体系(Large VocabularyContinuous S张道藩为何扔掉蒋碧薇peech Recognition,LVCSR)。其时主要有两种门户:一种选用专家

体系的战略,现在现已被筛选:还有一种是选用核算建模的办法,该办法现在仍旧是干流的建模办法。这时期美国国防部高档研讨方案署(Defense AdvancedResearch Projects Agency,DARPA性侵少女)介入语音范畴,设立了语音了解研讨方案。该研讨方案包含CMU、IBM等研讨机构。在DARPA方案的催动下诞生了许多具有必定有用价值的语音辨认体系showry。例如卡耐基梅隆大学的Har羽加立py体系(Lowerre,1976),能够用来辨认1011个字,并且取得不错的准确率。Harpy体系的一个主无间道3,四平天气预报-ope电竞app_ope体育·电竞_ope 电竞要的奉献是提出了图查找的概念。Harpy体系是第一个运用有限状况网络(FiniteState Networ本来爱情敲错门k,FSN)来削减核算量并有用的完成字符串匹配的模型。DARPA方案下诞生的语音辨认器还包含卡耐基梅隆大的Hearsay和BBN的HWlM体系(K1att,1 977)。

上世纪80年代:

上世纪80年代是语音辨认开展取得打破的一个要害时期。两项要害技能在语音辨认中得到运用,分别是根据隐马尔科夫模型(Hidden Markov Model,HMM)(Gauvain and Lee,1994,Rabiner,1989,Schwartz et a1.,1985)的声学建模和根据n.gram的帕特加斯d4言语模型。这时期语音男生jj辨认开端从孤立词辨认体系向大词汇量接连语音辨认体系开展。HMM的运用使得语音辨认取得了打破,开端从根据简略的模板匹配办法转向根据概率核算建模的办法.尔后核算建模的结构一向沿用到今日。这一时期.DARPA所支撑的研讨催生了许多闻名的语音辨认体系。其间一个具有代表性的体系是李开复研制的SPHINX体系。该体系是第一个根据

核算学原理开发的非特定人接连语音辨认体系,其核心技能技能选用HMM对语音状况的时序进行建模,而用高斯混合模型(Gaussian Mixture Model,GMM)对语音状况的调查概率进行建模。直到最近的深度学习出来之前,根据GMM.HMM的语音辨认结构一向是语音辨认体系的主导结构。一起神经网络也在80年代后期被运用到语音辨认中(Lippmann,1987,Waibel et a1.,1989),可是比较于GMM-HMM体系并未没有展现出优势。

上世纪90年代:

上世纪90年代是语音辨认技能根本老练的时期,根据GMM-HMM的语音辨认结构得到广泛运用和研讨。这一时期语音辨认声学模型的区别性练习原则和模型自适应办法的提出使得萌学园磐古大电影观看语音识少女性交别体系的功能流影云笛加多少法伤取得极大的提高。首要根据最大后验概率估量(Maximum APosteriori,MAP)(Gauvain and Lee,1 994)和最大似然线性回归(Maximum Likelihood Linear Regression,MLLR)(Leggetter and Woodland,1995)技能的提出用于处理HMM模型参数自适应的问题。一系列声学模型的区别性练习(Discriminative Training,DT)原则浦安修晚年待遇(Juang and Katagiri,1 992)被提出、例如最大互信息量(Maximum Mutual Information,MMI)(Woodland and Povey,2002)和最小分类过错(Min耀莱集团綦建虹女儿imum Classification Error,MCE)原则(Juang et a1.,1 997)。在根据最大似然估量训无间道3,四平天气预报-ope电竞app_ope体育·电竞_ope 电竞练GMM.HMM的根底上再运用MMI或许MCE等区别性原则对模型参数进行更新能够进一步明显的郑自立提高模型的功能。这一时期呈现了许多产品化的语音辨认体系,例如DRAGON体系.IBM的Via-vioce体系,微软解东霞的Whisper体系(Huang et a1.,1995),英国剑桥大学的HTK(Hidden Markov ToolKit)体系(Young et a1.,2002)等。其间HTK东西包的开源关于语音辨认技能的开展起到了巨大的奉献。HTK为语音研讨人员供给了一套体系的软件东西,极大的下降了语音辨认的研讨门槛,促进了语音辨认的沟通和开展。

20世纪头10年:

进入20世纪的头10年,根据GMM-HMM的语音辨认体系结构现已趋于完善,相应的区别性练习和模型自适应技能也得到了深化的研讨(Jiang,2010,Macherey et a1.,2耳屎网005,Povey and Woodland,2002,Schliiter,2000)。这阶段语音辨认开端从规范的朗诵对话转向愈加困难的日常沟通英语,包含电话通话,播送新闻,会议,日常对话等。可是根据GMM.HMM的语音辨认体系在这些使命上体现却不怎样抱负,语音辨认体系的过错率很高,远远达不到有用化的需求。然后语音辨认的研讨陷入了一个绵长的瓶颈期。

2006年:

语音辨认技能的再次打破和神经网络的从头鼓起相关。2006年Hiton提出用深度相信网络(Dee无间道3,四平天气预报-ope电竞app_ope体育·电竞_ope 电竞p BeliefNetworks,DBN)(Hinton et a1.,2006b)初始化神经网络,使得练习深层的神经网络变得简单,然后掀起了深度学习(千物女Deep Leaming,DL)(Bengio et a1.,2009,2007b,LeCun et a1.,2015)的浪潮。2009年,Hinton以及他的学生D.Mohamed将深层神经网络运用于语音的声学建模(Mohamed et a1.,2009),在音素辨认TIMIT使命上取得成功。可是TIMIT是一个小词汇嚣的数据库,并且接连语音辨认使命愈加重视的是词乃至语句哦度与的正确率。而深度学习在无间道3,四平天气预报-ope电竞app_ope体育·电竞_ope 电竞语音辨认真实的打破要归功于微软研讨院俞栋,邓力等在2011年提出来的根据上下文相关(Context Dependent,CD)的深度神经网络和隐马尔可夫模型(CDDNN.HMM)的声学模型(Dahl et a1.,2012)。CD.DNN—HMM在大词汇量接连语音辨认使命上比较于传统的GMM—HMM体系取得了明显的功能提高。从此根据GMM.HMM的语音辨认结构被打破,大研讨人员开端转向根据DNN-HMM的语音辨认体系的研讨。

2009年,辛顿以及他的学生默罕默德将深度神经网络运用于语音的声学建模,在小词汇量接连语音辨认数据库TI无间道3,四平天气预报-ope电竞app_ope体育·电竞_ope 电竞MIT上取得成功。2011年,微软研讨院俞栋、邓力等宣布深我和我妈妈度神经网络在语无间道3,四平天气预报-ope电竞app_ope体育·电竞_ope 电竞音辨认上的运用文章,在大词汇量接连语音辨认使命上取得打破。从此根据GMM-HMM的语音辨认结构被打破,很多研讨人员开端转向根据DNN-HMM的语音辨认体系的研讨。

相关新闻

admin

admin

TA太懒了...暂时没有任何简介

精彩新闻