摘要
音频分类是音频信号处理中一项重要的预处理工作。该文描述了一种基于能量的分类方法,将音频信号分为语音和音乐2种类型。分类的过程分为3个阶段,首先计算优化低能量率MLER(modified low energy ratio)作为特征,然后利用初级分类器得到初步分类的结果,最后利用音频类别的前后相关性,使用上下文分类器修正初始分类得到最终分类的结果。该文重点对MLER中参数的合理选取范围进行了讨论,并对传统的初始分类器作了改进,用非参数分类器和参数分类器代替原有的Bayes硬判决的方法,避免了由于门限选择不当所带来的分类错误。实验表明,使用参数分类器时,对纯语音和纯音乐分类效果很好,正确率达99%以上。
Audio classification is an important pretreatment for audio signal processing.This paper presents a speech/music discrimination method based on the energy of the audio signal.The first step extracts the modified low energy ratio.A junior classifier then gives a primary speech/music discrimination result with a context-based classifier then used to refine the primary result based on the class correlation between adjacent audio frames.This paper focuses on selection of the most appropriate parameters and impr...
出处
《清华大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2008年第S1期720-724,共5页
Journal of Tsinghua University(Science and Technology)