基于MLER的语音/音乐分类方法被引量：6

Speech/music discrimination based on a modified low energy ratio

导出

摘要音频分类是音频信号处理中一项重要的预处理工作。该文描述了一种基于能量的分类方法,将音频信号分为语音和音乐2种类型。分类的过程分为3个阶段,首先计算优化低能量率MLER(modified low energy ratio)作为特征,然后利用初级分类器得到初步分类的结果,最后利用音频类别的前后相关性,使用上下文分类器修正初始分类得到最终分类的结果。该文重点对MLER中参数的合理选取范围进行了讨论,并对传统的初始分类器作了改进,用非参数分类器和参数分类器代替原有的Bayes硬判决的方法,避免了由于门限选择不当所带来的分类错误。实验表明,使用参数分类器时,对纯语音和纯音乐分类效果很好,正确率达99%以上。 Audio classification is an important pretreatment for audio signal processing.This paper presents a speech/music discrimination method based on the energy of the audio signal.The first step extracts the modified low energy ratio.A junior classifier then gives a primary speech/music discrimination result with a context-based classifier then used to refine the primary result based on the class correlation between adjacent audio frames.This paper focuses on selection of the most appropriate parameters and impr...

作者胡艳芳吴及刘慧星

机构地区清华大学电子工程系

出处《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2008年第S1期720-724,共5页 Journal of Tsinghua University(Science and Technology)

关键词 MLER(modified LOW ENERGY ratio) 音频分类非参数分类器参数分类器 MLER（modified low energy ratio） audio classification nonparametric classifier parametric classifier

分类号 TP391.42 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1LIN Rueishiang,CHEN Linghwei.A new approach for audioclassification and segmentation using gabor wavelets andfisher linear discriminator[].International Journal ofPattern Recognition and Artif icial Intelligence.2005
2Ajmera J,McCowan I,Bourlard H.Speech/musicsegmentation using entropy and dynamism features in aHMM classification framework[].Speech Communication.2003
3Saunder J.Real-time discrimination of broadcastspeech/music[].ICASSP’.1996
4Scheirer E,Slaney M.Construction and evaluation of arobust multifeature speech/music discrimination[].ICASSP’.1997
5Wang W Q,Gao W,Ying D W.A fast and robustspeech/music discrimination approach[].ICICS-PCM.2003
6Lu L,Zhang H J,Jiang H.Content Analysis for Audio Classification and Segmentation[].IEEE Transactions on Speech and Audio Processing.2002

同被引文献48

1陈功,王振力,张建兵.基于短时能量的语音/音乐快速分类[J].电子技术应用,2006,32(1):53-55. 被引量：3
2董婧,赵晓晖,应娜.基于二进小波变换的基音检测算法[J].吉林大学学报（工学版）,2006,36(6):978-982. 被引量：2
3陈功,张雄伟.一种基于灰关联分析的语音/音乐分类方法[J].声学技术,2007,26(2):262-267. 被引量：8
4SAUNDERS J. Real-time discrimination of broadcast speech/music [ C]//Proceedings of the IEEE Conference on Acoustics, Speech, and Signal Processing: ICASSP 96. Washington, DC: IEEE Computer Society, 1996, 2:993 -996.
5SCHEIRER E, SLANEY M. Construction and evaluation of a robust multifeature music/speech discriminator [ C ]// Proceedings of the IEEE International Conference on Acoustics, Speech, and Signal Processing: ICASSP97. Washington, DC: IEEE Computer Society, 1997,2: 1331.
6WOLD E, BLUM T, KEISLAR D, et al. Content-based classification search and retrieval of audio[ J]. IEEE Multimedia Magazine, 1996,3(3): 27 -36.
7CORTIZO E, ZURERA M, FERRERAS F. Application of Fisher linear discriminant analysis to speech/music classification [ C]// International Conference on Computer as a Tool: EUROCON 2005. Wash- ington, DC: IEEE Press, 2005:21-24.
8QURESHI A F, KIRANYAZ S, GABBOUJ M. A genetic audio classification and segmentation approach for multimedia indexing and retrieval[ J]. IEEE Transactions on Speech and Audio Processing, 2006, 9(3) : 517 - 523.
9SARIKAYA R, PELLOM B L, HANSEN J H L. Wavelet packet transform features with application to speaker identification [ C]// IEEE Nordic Signal Processing Symposium: NORSIG 98. Washington, DC: IEEE Press, 1998:81-84.
10GROFTT S, LAVNER Y. Time-scale modification of audio signals using enhanced WSOLA with management of transients[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2008, 16(1): 106-115.

引证文献6

1颜景斌,吴石,伊戈尔·艾杜阿尔达维奇.基于单类支持向量机的音频分类[J].计算机应用,2009,29(5):1419-1422. 被引量：4
2许雪琼,余小清,李昌莲,万旺根.改进波形相似叠加算法的音频时长调整[J].应用科学学报,2009,27(5):514-519. 被引量：2
3陈红红,刘加.基于MLER和GMM的语音音乐分类[J].电声技术,2011,35(10):47-50. 被引量：2
4李策,李智.粒子群优化算法和支持向量机的电子音乐信号分类研究[J].现代电子技术,2020,43(21):51-54. 被引量：11
5郑清杰,龙华,邵玉斌,杜庆治.基于节拍谱的语音音乐分类模型[J].通信技术,2020,53(11):2675-2679. 被引量：1
6郑晔,欧智坚,杨艇.福建省广播电视节目智能语音分析系统研究与应用[J].数字通信世界,2021(1):39-40.

二级引证文献20

1王红丽,崔荣一.基于SVM的说话声实时检测[J].延边大学学报（自然科学版）,2010,36(3):257-262.
2陈红红,刘加.基于MLER和GMM的语音音乐分类[J].电声技术,2011,35(10):47-50. 被引量：2
3张大宝,彭天强.基于音视频模板匹配的新闻视频识别方法[J].电视技术,2013,37(23):238-240. 被引量：1
4周宇,孟庆浩,亓培锋,井雅琪,曾明.基于单类支持向量机的电子鼻在白酒真假识别中的应用[J].传感技术学报,2015,28(12):1741-1746. 被引量：10
5梅铁民,吴丽君,张景.一种有效的语音变调算法研究[J].沈阳理工大学学报,2016,35(4):16-20.
6孟令红.复杂噪声环境中的音乐分类和检测模型[J].微型电脑应用,2020,36(10):107-109.
7郑清杰,龙华,邵玉斌,杜庆治.基于节拍谱的语音音乐分类模型[J].通信技术,2020,53(11):2675-2679. 被引量：1
8张杜娟,王震.基于PSO-ELM的疾病诊断方法研究[J].国外电子测量技术,2021,40(8):82-86. 被引量：7
9周涛.基于支持向量机与LASSO的双模态音乐分类与评价[J].科技创新导报,2021,18(19):75-78.
10罗为检.应用最大信息系数和支持向量机估测森林蓄积量[J].东北林业大学学报,2022,50(1):40-45. 被引量：3

1朱爽,张锦水.样本特征对参数/非参数分类器分类精度的影响分析[J].遥感技术与应用,2016,31(4):748-755. 被引量：2
2有一说一[J].商业故事（数字通讯）,2012(9):124-125.
3俞玉莲,郭世杰.音频分类中的特征分析[J].信息技术,2009,33(6):31-33. 被引量：1
4一啸倾城.Easy! 高质MTV搬回家[J].网友世界,2011(1):16-17.
5一笑.给Windows Media Player装个托盘遥控器[J].电脑迷,2007,0(16):75-75.
6WF.飞利浦GoGear Mix——廉价也有好音质[J].数字化用户（数字通讯）,2009(8):68-69.
7俞玉莲,郭世杰.基于支持向量机的多类音频分类[J].计算机应用与软件,2010,27(4):98-101. 被引量：4
8利业鞑,林伟伟.一种Hadoop数据复制优化方法[J].计算机工程与应用,2012,48(21):58-61. 被引量：3
9杨秀朋.FIR滤波在嵌入式系统中的实现与优化[J].重庆科技学院学报（自然科学版）,2012,14(5):154-157.
10孙红娜.借云计算优化IT成本[J].网络运维与管理,2014(9):18-18.

清华大学学报（自然科学版）

2008年第S1期

浏览历史

内容加载中请稍等...

基于MLER的语音/音乐分类方法被引量：6

参考文献6

同被引文献48

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于MLER的语音/音乐分类方法 被引量：6

参考文献6

同被引文献48

引证文献6

二级引证文献20

相关作者

相关机构

相关主题

浏览历史

基于MLER的语音/音乐分类方法被引量：6