时间序列分类问题的算法比较被引量：42

A Comparative Study on Time Series Classification

下载PDF

导出

摘要时间序列分类是时间序列数据分析中的重要任务之一.不同于时间序列分析中常用的算法与问题,时间序列分类是要把整个时间序列当作输入,其目的是要赋予这个序列某个离散标记.它比一般分类问题困难,主要在于要分类的时间序列数据不等长,这使得一般的分类算法不能直接应用.即使是等长的时间序列,由于不同序列在相同位置的数值一般不可直接比较,一般的分类算法依然还是不适合直接应用.为了解决这些难点,通常有两种方法:第一,定义合适的距离度量(这里,最常用的距离度量是DTW距离),使得在此度量意义下相近的序列有相同的分类标签,这类方法属于领域无关的方法;第二,首先对时间序列建模(利用序列中前后数据的依赖关系建立模型),再用模型参数组成等长向量来表示每条序列,最后用一般的分类算法进行训练和分类,这类方法属于领域相关的方法.长期以来,研究者往往只倾向于使用其中一种算法,而这两类算法的比较却比较缺乏.文中深入分析了这两类方法,并且分别在不同的合成数据集和实际数据集上比较了两类方法.作者观测到了两类算法在不同因素影响下的性能表现,从而为今后发展新的算法提供了有力依据. Time series classification or categorization is an important task in time-series analysis. Unlike traditional methods and problem formulations in time-series analysis, time series classification aims to take whole time sequences as input, and produce discrete labels that are assigned to each sequence. Compared to traditional classification problems, time series classification poses additional difficulties. A major difficulty is due to the fact that the time sequences are variable in length, making many traditional classification methods unable to apply directly. Even for sequences of uniform lengths, many methods can still not be applied directly because often the data located at different parts of the sequences are incomparable. Two methods have been tried separately in the past, including distance based methods such as DTW, and model based methods such as Markov models. Using either of these methods as preprocessing steps, a uniform length vector space can be built to enable the classification methods to be applied. In the past, there has been a lack of comparison between these two methods. This paper compares distance and model based methods on several data sets including synthetic and real data sets, to explicate the relative advantages and disadvantages of these methods. This paper presents several key observations on the relative merits of these two methods, and paves the way for further research in developing new methods for time series classification.

作者杨一鸣潘嵘潘嘉林杨强李磊

机构地区中山大学软件研究所香港科技大学计算机科学与工程系

出处《计算机学报》 EI CSCD 北大核心 2007年第8期1259-1266,共8页 Chinese Journal of Computers

关键词分类时间序列基于模型聚类马尔可夫模型统计学习 classification time series model based clustering Markov model statistical learning

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献21

1Itakura F.Minimum prediction residual principle applied to speech recognition.IEEE Transactions on Acoustics Speech Signal Process(ASSP),1975,23(1):52-72
2Kruskall J B,Liberman M.The symmetric time warping algorithm:From continuous to discrete//Time Warps,String Edits and Macromolecules.Addison,1983
3Myers C,Rabiner L,Roseneberg A.Performance tradeoffs in dynamic time warping algorithms for isolated word recognition.IEEE Transactions on Acoustics Speech Signal Process(ASSP),1980,28(6):623-635
4Berndt D,Clifford J.Using dynamic time warping to find patterns in time series//Proceedings of the AAAI-94 Workshop on Knowledge Discovery in Databases.Seattle,WA,USA,1994:229-248
5Aach J,Church G.Aligning gene expression time geries with time warping algorithms.Bioinformatics,2001,17:495-508
6Caiani E G,Porta A,Baselli G,Turiel M,Muzzupappa S,Pieruzzi F,Crema C,Malliani A,Cerutti S.Warped-average template technique to track on a cycle-by-cycle basis the cardiac filling phases on left ventricular volume.IEEE Computers in Cardiology,1998,25:73-76
7Gollmer K,Posten C.Detection of distorted pattern using dynamic time warping algorithm and application for supervision of bioprocesses//Proceedings of the IFAC Workshop on On-Line Fault Detection and Supervision in Chemical Process Industries,1995
8Abou-Moustafa K T,Cheriet M,Suen C Y.A generativediscriminative hybrid for sequential data classification//Proceedings of the IEEE International Conference on Acoustics and Signal Processing.Montreal,2004i 805-808
9Vapnik Vladimir.The Nature of Statistical Learning Theory.New York:Spnnger-Verlag,1999
10Dasarathy Belur V.Nearest Neighbor (NN) Norms:NN Pattern Classification Techniques.Los Alamitos:IEEE Computer Society Press,1990

同被引文献402

1彭银香,何小东,朱志勇.基于免疫算法的多维关联规则挖掘方法[J].微计算机信息,2007,23(3):171-173. 被引量：4
2汤礼东,宋保维,李正,郑珂.基于信息熵理论的小子样模糊可靠性评定方法[J].弹箭与制导学报,2005,25(S1):214-216. 被引量：7
3蔡自兴,李枚毅.多示例学习及其研究现状[J].控制与决策,2004,19(6):607-610. 被引量：12
4许少华,刘扬,何新贵.基于过程神经网络的水淹层自动识别系统[J].石油学报,2004,25(4):54-57. 被引量：25
5朱益民,杨修群.太平洋年代际振荡与中国气候变率的联系[J].测绘科技动态,2003,61(6):641-654. 被引量：219
6李爱国,覃征.在线分割时间序列数据[J].软件学报,2004,15(11):1671-1679. 被引量：27
7金涛,胡志改.移动通信客户流失分析[J].移动通信,2005,29(2):114-117. 被引量：1
8张存杰,李栋梁,王小平.东北亚近100年降水变化及未来10～15年预测研究[J].高原气象,2004,23(6):919-929. 被引量：35
9黄小红.基于RCS序列的空间目标形状估计[J].航天电子对抗,2005,21(4):44-46. 被引量：5
10郭晓光,刘来君.应用AR（P）刊模型预报桥梁施工水位[J].西安公路交通大学学报,1996,16(2):53-55. 被引量：1

引证文献42

1李新雨.离散信号的模糊平滑算法[J].电子技术（上海）,2011,38(2):70-72.
2刘栋,宋国杰.面向多维时间序列的过程决策树模型[J].计算机应用,2011,31(5):1374-1377. 被引量：2
3毛红保,张凤鸣,冯卉,吕慧刚.多元飞行数据相似模式查询[J].计算机工程与应用,2011,47(16):151-155. 被引量：6
4尹锐,李雄飞,李军,彭宏.基于线性分段与HMM的时间序列分类算法[J].模式识别与人工智能,2011,24(4):574-581. 被引量：4
5李小斌,李世银.时间序列早期分类的多分类器集成方法[J].山东大学学报（工学版）,2011,41(4):73-78.
6张静静,何振峰.基于排序的周期自动检测算法[J].计算机工程与设计,2011,32(12):4100-4103.
7葛利,印桂生.竞争型径向基过程神经网络时序分类器[J].哈尔滨工程大学学报,2012,33(6):741-744. 被引量：3
8曹丹阳,孙宁,马楠,刘永彬.面向噪声数据的时间序列相似性搜索研究[J].计算机工程与设计,2012,33(9):3442-3446. 被引量：5
9翟婷婷,何振峰.基于Hubness的类别均衡的时间序列实例选择算法[J].计算机应用,2012,32(11):3034-3037. 被引量：2
10韩忠明,陈妮,乐嘉锦,段大高,孙践知.面向热点话题时间序列的有效聚类算法研究[J].计算机学报,2012,35(11):2337-2347. 被引量：31

二级引证文献180

1曹晓莉,刘斌,王淑荣,万学娟,张廷廷,张海新.综合动量法和可变学习速度的BP神经网络地震初至拾取[J].石油地球物理勘探,2020,55(1):71-79. 被引量：7
2吴云章,周锐,吴勇.基于深度置信网络的直升机飞行动作识别[J].飞机设计,2022,42(6):18-21.
3李守仁,贾偌.图书馆管理信息系统中数据挖掘技术的应用研究[J].产业科技创新,2019,1(5):82-83. 被引量：2
4曹万林,张永山,庞国新,王绍英,卢立炜.沿高变刚度设支撑高层大开间异型柱框架抗震性能试验研究[J].地震工程与工程振动,2000,20(2):68-75. 被引量：4
5张武强,穆瑞辉.基于Dirichlet过程的层次话题模型研究[J].科学技术与工程,2013,21(27):8192-8196.
6邱梅.城市大气污染预测模型的建立与应用研究[J].科技通报,2013,29(10):136-138. 被引量：5
7赵一丁,苗凤君,王洪利,郑秋生,楚纪正.过程仿真中稳态模型的动态补偿方法[J].计算机工程与设计,2013,34(11):3982-3987.
8程习锋,万定生,王亚明.水文时间序列相似性查询优化算法[J].计算机工程与设计,2013,34(11):4046-4050. 被引量：3
9吴虎胜,张凤鸣,吴虎胜.多元时间序列相似性研究综述[J].统计与决策,2014,30(7):77-81. 被引量：4
10吴虎胜,张凤鸣,钟斌.基于二维奇异值分解的多元时间序列相似匹配方法[J].电子与信息学报,2014,36(4):847-854. 被引量：13

1周鹏.管道流量泄漏时间序列分类的算法研究[J].计算机工程与应用,2009,45(13):166-169.
2陈平华,王旭彬,洪英汉.基于多项式有限混合模型的Slope One算法改进[J].计算机工程与科学,2016,38(4):761-767. 被引量：1
3马飒飒,陈自力,赵守伟.软件可靠性及可靠性多模型综合研究[J].微计算机信息,2006,22(06X):263-265. 被引量：11
4闫德勤,迟忠先.关于Vague集相似度量的一个注记[J].计算机科学,2005,32(10):170-171. 被引量：2
5张正本,翟海庆.基于组合模型的网络流量预测[J].河南机电高等专科学校学报,2008,16(6):31-33. 被引量：1
6闫德勤.Vague集的相似度量[J].计算机科学,2006,33(5):195-196. 被引量：12
7原继东,王志海,韩萌.基于Shapelet剪枝和覆盖的时间序列分类算法[J].软件学报,2015,26(9):2311-2325. 被引量：17
8王树英,王志海.基于增量式决策树的时间序列分类算法研究[J].现代计算机（中旬刊）,2015(3):26-30. 被引量：1
9李存华.l_∞度量意义下的离群点检测[J].淮海工学院学报（自然科学版）,2008,17(2):27-30.
10李志敏,徐馨,李存华.基于身份的公开验证签密方案[J].计算机应用,2012,32(1):99-103. 被引量：4

计算机学报

2007年第8期

浏览历史

内容加载中请稍等...

时间序列分类问题的算法比较被引量：42

参考文献21

同被引文献402

引证文献42

二级引证文献180

相关作者

相关机构

相关主题

浏览历史

时间序列分类问题的算法比较 被引量：42

参考文献21

同被引文献402

引证文献42

二级引证文献180

相关作者

相关机构

相关主题

浏览历史

时间序列分类问题的算法比较被引量：42