DTW算法是什么
时间:2021-06-02

本文给大伙儿共享的是相关DTW算法是什么的內容。我感觉挺好用的,因而共享给大伙儿做一个参照。一起追随我回来瞧瞧吧。

dtw优化算法是根据动态规划DP的观念,解决了音标发音长短不一的模板匹配难题,是语音识别技术中发生较早、比较經典的一种优化算法,用以独立词鉴别,DTW优化算法依然获得普遍的运用。

时间序列分析数据信息存有多种多样类似或间距涵数,在其中最突显的是DTW。 在独立词语音识别技术中,更为简易合理的方式是选用DTW(Dynamic Time Warping,动态性時间整理)优化算法,该优化算法根据动态规划(DP)的观念,解决了音标发音长短不一的模板匹配难题,是语音识别技术中发生较早、比较經典的一种优化算法,用以独立词鉴别。HMM优化算法在训炼环节必须给予很多的视频语音数据信息,根据反复计算才可以获得实体模型主要参数,而DTW优化算法的训炼中基本上不用附加的测算。因此 在独立词语音识别技术中,DTW优化算法依然获得普遍的运用。

不管在训炼和建立模板环节或是在鉴别环节,都先选用节点优化算法明确视频语音的起始点和终点站。以存进标准库的每个关键词称之为参照模版,一个参照模版可表明为R={R(1),R(2),……,R(m),……,R(M)},m为训炼视频语音帧的时钟频率型号,m=1为起始点视频语音帧,m=M为终点站视频语音帧,因而M为该模版所包括的视频语音帧数量,R(m)为第m帧的视频语音特点矢量素材。所要鉴别的一个键入关键词视频语音称之为检测模版,可表明为T={T(1),T(2),……,T(n),……,T(N)},n为检测视频语音帧的时钟频率型号,n=1为起始点视频语音帧,n=N为终点站视频语音帧,因而N为该模版所包括的视频语音帧数量,T(n)为第n帧的视频语音特点矢量素材。参照模版与检测模版一般选用同样种类的特点矢量素材(如MFCC,LPC指数)、同样的帧长、同样的窗函数和同样的帧移。

假定检测和参照模版各自用T和R表明,为了更好地较为他们中间的相似性,能够 测算他们中间的间距 D[T,R],间距越小则类似值越高。为了更好地测算这一失帧间距,需从T和R中每个相匹配帧中间的间距算起。设n和m分别是T和R中随意挑选的帧号,d[T(n),R(m)]表明这两帧特点矢量素材中间的间距。间距涵数在于具体选用的间距衡量,在DTW优化算法中一般选用欧式距离。

若N=M则能够 立即测算,不然要考虑到将T(n)和R(m)两端对齐。两端对齐能够 选用线形扩大的方式,假如NM能够 将T线性映射为一个M帧的编码序列,再测算它与{R(1),R(2),……,R(M)}中间的间距。可是那样的测算沒有充分考虑视频语音中每个段在不一样状况下的延迟时间会造成或长或短的转变,因而鉴别实际效果不太可能最好。因而大量的是选用动态规划(DP)的方式。

若把检测模版的每个帧号n=1~N在一个二维直角坐标中的横坐标上标明,把参照模版的各帧号m=1~M在纵坐标上标明,根据这种表明帧号的整数金额座标绘制一些纵横线就可以产生一个互联网,互联网中的每一个交接点(n,m)表明测试模式中某一帧的交汇处。DP优化算法能够 归纳为找寻一条根据此互联网中多个格点的途径,途径根据的格点即是检测和参照模版中开展测算的帧号。途径并不是随便挑选的,最先一切一种视频语音的音标发音速度都是有很有可能转变,可是其各一部分的依次顺序不太可能更改,因而选定的途径必然是以左下方考虑,在右上方完毕

为了更好地叙述这条途径,假定途径根据的所有格点先后为(n1 ,m1 ),……,(ni ,mj ),……,(nN ,mM ),在其中(n1 ,m1 )=(1,1),(nN ,mM )=(N,M)。途径可以用涵数m = Oslash;(n )叙述,在其中n =i,i=1,2,……,N,Oslash;(1)=1,Oslash;(N)=M。为了更好地使途径不会过歪斜,能够 管束切线斜率在0.5~2的范畴内,假如途径早已根据了格点(n ,m ),那麼下一个根据的格点(n ,m )只可能是以下三种状况之一:

(n ,m )=(n 1,m)

(n ,m )=(n 1,m 1)

(n ,m )=(n ,m 1 )

用r表明以上三个约束。求最好途径的难题能够 归纳为达到约束r时,求最好途径涵数m =Oslash;(n ),促使沿途径的累积间距做到极小值,即:

检索该途径的方式以下:检索从(n, m)点考虑,能够 进行若干条达到ŋ的途径,假定可测算每条途径做到(n, m)点时的总的累积间距,具备最少积累间距者即是最好途径。便于证实,限制范畴的任一格点(n, m)只很有可能有一条检索途径根据。针对(n, m),其可做到该格点的前一个格点只可能是(n-1, m)、(n-1, m -1)和(n, m-1),那麼(n, m)一定挑选这3个间距之途径拓宽而根据(n, m),这时候此途径的累积间距为:

D[(n, m)]=d[T(n),R(m)] min{D(n-1,m),D(n-1,m-1),D(n,m-1)}

那样能够 从(n ,m )=(1,1)考虑检索(n ,m ),对每一个(n ,m )都储存相对应的间距,这一间距是当今格点的配对间距与前一个总计间距最少的格点(依照设置的切线斜率在三个格点到开展较为)。检索到(n ,m )时,只保存一条最好途径。假如必须得话,根据逐点向前寻找就可以求取成条途径。这套DP优化算法就是DTW优化算法。

DTW优化算法能够 立即按上边叙述来完成,即分派2个N×M的引流矩阵,各自为累积间距引流矩阵D和帧配对间距引流矩阵d,在其中帧配对间距引流矩阵d(i,j)的数值检测模版的第i帧与参照模版的第j帧间的间距。D(N,M)即是最好配对途径所相匹配的配对间距

谢谢诸位的阅读文章!有关DTW算法是什么就发送到这儿了,期待以上内容能够 对大伙儿有一定的协助,让大伙儿能够 学得大量专业知识。假如感觉文章内容非常好,能够 把它共享出来让大量的人见到吧!