期刊文献+
共找到76篇文章
< 1 2 4 >
每页显示 20 50 100
美尔谱系数与卷积神经网络相组合的环境声音识别方法 被引量:10
1
作者 刘亚荣 黄昕哲 +1 位作者 谢晓兰 刘鑫 《信号处理》 CSCD 北大核心 2020年第6期1020-1028,共9页
通过对复杂环境下声音识别技术进行研究,本文提出了美尔谱系数(MFSC)与卷积神经网络(CNN)相组合的环境声音识别方法。对声音事件提取其MFSC特征,将特征参数作为输入送入设计好的CNN模型中对声音事件进行分类。实验数据集采用ESC-10,将... 通过对复杂环境下声音识别技术进行研究,本文提出了美尔谱系数(MFSC)与卷积神经网络(CNN)相组合的环境声音识别方法。对声音事件提取其MFSC特征,将特征参数作为输入送入设计好的CNN模型中对声音事件进行分类。实验数据集采用ESC-10,将构建的卷积神经网络模型与随机森林、支持向量机(SVM)、深度神经网络(DNN)及DCASE比赛中常用的三种识别模型进行对比实验。实验结果表明,在相同数据集下,本文所设计的美尔谱系数与卷积神经网络相组合的环境声音识别方法相较传统的声音识别方法在识别率上分别有13.1%,18.3%,15.7%的提升,相较于DCASE比赛中的三种常用识别模型,本文所设计识别模型识别率及识别效率均有明显的优势。 展开更多
关键词 卷积神经网络 美尔谱系数 环境声音识别
在线阅读 下载PDF
改进的美尔倒谱系数用于说话人识别研究 被引量:3
2
作者 刘宏 刘立群 《计算机工程与应用》 CSCD 2012年第8期155-157,共3页
基于人耳听觉感知的MFCC较其他说话人特征具有强抗噪性、高识别率特点。考虑美尔滤波器组的结构,其只在低频区具有较高的分辨率,在高频区分辨率却较低,这样势必会遗失一些包含在高频区域的重要信息。利用反美尔域下的特征R-MFCC与MFCC... 基于人耳听觉感知的MFCC较其他说话人特征具有强抗噪性、高识别率特点。考虑美尔滤波器组的结构,其只在低频区具有较高的分辨率,在高频区分辨率却较低,这样势必会遗失一些包含在高频区域的重要信息。利用反美尔域下的特征R-MFCC与MFCC的各自优点,将R-MFCC与MFCC结合,形成优势互补,并给出了衡量各种特征参数识别能力的Fisher准则,结合Fisher准则构造出一种新的混合特征参数。采用支持向量机分别以MFCC、R-MFCC以及新构造的混合特征为参数进行说话人的识别,实验证明基于Fisher准则的优选混合特征作为说话人识别特征是可行的。 展开更多
关键词 说话人识别 美尔谱系 FISHER准则 支持向量机
在线阅读 下载PDF
基于美尔倒谱系数和复杂性的说话人识别 被引量:2
3
作者 毛大伟 曹华 +1 位作者 木拉提.哈米提 童勤业 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2006年第4期882-886,共5页
目前在说话人识别中常用的特征是线性预测编码(LPC)参数和美尔倒谱系数(M FCC)等。在说话人识别系统中我们首先使用美尔倒谱系数作为参数,然后将美尔倒谱系数和L em pe l-Z iv复杂性相结合。实验结果显示,在50个人的文本相关说话人识别... 目前在说话人识别中常用的特征是线性预测编码(LPC)参数和美尔倒谱系数(M FCC)等。在说话人识别系统中我们首先使用美尔倒谱系数作为参数,然后将美尔倒谱系数和L em pe l-Z iv复杂性相结合。实验结果显示,在50个人的文本相关说话人识别实验中,识别率从42%提高到80%;在50个人的文本无关说话人识别中,识别率从60%提高到72%。提示L em pe l-Z iv复杂性作为一种新的特征参数可以应用于说话人识别。 展开更多
关键词 说话人识别 复杂性 美尔谱系
在线阅读 下载PDF
一种声纹美尔频率倒谱系数干扰消除算法研究 被引量:2
4
作者 蒋琳琼 贺建飚 《计算机仿真》 CSCD 北大核心 2013年第4期382-385,共4页
在伴随着外部噪声的情况下,待识别的声纹美尔频率倒谱系数特征各项属性很容易受到外部噪声的干扰发生改变,造成声纹特征的识别的精度不高。为提高精度,提出了一种用支持向量机的美尔频率倒谱系数特征干扰去除算法。确定分类决策函数时... 在伴随着外部噪声的情况下,待识别的声纹美尔频率倒谱系数特征各项属性很容易受到外部噪声的干扰发生改变,造成声纹特征的识别的精度不高。为提高精度,提出了一种用支持向量机的美尔频率倒谱系数特征干扰去除算法。确定分类决策函数时充分考虑美尔频率倒谱系数与声纹中心以及噪声之间的关系,并且将声纹特征引入核函数,将原空间样本数据通过非线性变换映射到高维特征空间,在高维空间中求最优或广义最优分类面,实现对语音特征的干扰消除。实验表明,利用改进算法实现了声纹特征中过零率,倒谱特征、矩形窗和汉明窗长的短时能量函数特征的优化。 展开更多
关键词 声音参 美尔频率倒谱系 支持向量机
在线阅读 下载PDF
基于美尔倒谱系数及隐马尔可夫模型的说话人识别系统研究 被引量:1
5
作者 夏晶 《黑龙江科技信息》 2012年第30期4-6,共3页
为了适应强噪声环境下的语音识别,进行了基于美尔倒谱系数特征及隐马尔可夫模型的识别算法研究,主要对提取语音信号的线性预测系数、端点检测、语音特征参数提取、语音算法识别流程等进行了初步研究,并进行了说话人识别系统的仿真验证。
关键词 美尔谱系 隐马尔可夫模型 说话人识别 强噪声环境
在线阅读 下载PDF
听觉模型倒谱系数及其在声目标识别中的应用 被引量:1
6
作者 刘辉 杨俊安 周志增 《应用科学学报》 EI CAS CSCD 北大核心 2011年第1期51-55,共5页
针对目前广泛采用的美尔倒谱系数(MFCC)鲁棒性不足的问题,基于人类听觉模型提出了一种可用于战场声目标识别的倒谱系数.用小波包变换代替了传统的傅里叶变换,克服了傅里叶变换在频域上单分辨率的缺陷和对噪声的敏感性.用指数压缩替换固... 针对目前广泛采用的美尔倒谱系数(MFCC)鲁棒性不足的问题,基于人类听觉模型提出了一种可用于战场声目标识别的倒谱系数.用小波包变换代替了传统的傅里叶变换,克服了傅里叶变换在频域上单分辨率的缺陷和对噪声的敏感性.用指数压缩替换固定的对数压缩,较好地模拟了人耳处理信号的非线性能力.在SensIT实验数据和外场实际采集的低空目标数据上的实验结果表明:相对于经典的美尔倒谱系数,本文提出的倒谱系数在识别准确性和抗噪声能力方面都有较明显的提高. 展开更多
关键词 声目标识别 美尔谱系 听觉模型
在线阅读 下载PDF
MFSC系数特征局部有限权重共享CNN语音识别 被引量:9
7
作者 黄玉蕾 罗晓霞 刘笃仁 《控制工程》 CSCD 北大核心 2017年第7期1507-1513,共7页
针对传统语音识别应用中识别效果不理想的问题,提出一种基于美尔谱系数(MFSC)特征的有限局部权重共享卷积神经网络(CNN)语音识别。首先,借鉴图像处理中对输入图像信息的处理方式,构建语音信号的二维阵列特征映射输入形式,每个映射表示... 针对传统语音识别应用中识别效果不理想的问题,提出一种基于美尔谱系数(MFSC)特征的有限局部权重共享卷积神经网络(CNN)语音识别。首先,借鉴图像处理中对输入图像信息的处理方式,构建语音信号的二维阵列特征映射输入形式,每个映射表示为含静态数据、一阶导数、二阶导数的MFSC系数特征,便于应用图像处理方式进行识别;其次,引入图像处理的卷积神经网络,并且针对语音信号特征的局部特性,构建有限局部权重共享卷积神经网络学习算法,提高语音信号辨识度并降低算法复杂度;最后,通过实验对所提算法进行验证,并且给出算法参数变化影响实验,为具体应用提供依据。 展开更多
关键词 卷积神经网络 局部权重共享 语音识别 特征映射 美尔谱系数
在线阅读 下载PDF
基于感知模型的美尔谱失真测度 被引量:4
8
作者 陈华伟 靳蕃 《西南交通大学学报》 EI CSCD 北大核心 2006年第6期723-728,共6页
为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特... 为了有效评价通信系统中的语音质量,基于语音感知分析,提出了M el域上一种新的语音信号特征表示方法———MFSC(美尔谱系数).MFSC既考虑人耳对频率的非线性感知特性,又结合了声音强度-响度非线性变换特性,符合语音感知分析.基于MFSC特征参数的提取,提出了用于语音质量客观评价的美尔谱失真测度(M el-SD),并将其应用于干扰条件下的无线通信系统语音质量评价.实验结果表明,M el-SD的平均相关值为0.942,分别比M el-CD和PESQ(语音质量感知评价)提高了0.089和0.031. 展开更多
关键词 语音质量 客观评价 美尔谱系数 Mel谱失真测度 Mel倒谱距离测度
在线阅读 下载PDF
融合LPC与MFCC的特征参数 被引量:8
9
作者 张学锋 王芳 夏萍 《计算机工程》 CAS CSCD 北大核心 2011年第4期216-217,229,共3页
在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一... 在线性预测系数(LPC)的基础上,借鉴美尔倒谱系数(MFCC)计算方法,对LPC进行美尔倒谱计算,得到一种新的特征参数:线性预测美尔倒谱系数(LPMFCC)。在Matlab7.0平台上实现一个基于隐马尔可夫模型(HMM)的说话人识别系统,分别用LPMFCC及其一阶差分、MFCC及其一阶差分和基于小波包分析的特征参数(WPDC)及其一阶差分作为识别参数进行对比实验。结果表明,以LPMFCC作为特征参数的系统具有较高的识别率。 展开更多
关键词 线性预测 美尔谱系 说话人识别
在线阅读 下载PDF
话者识别系统中语音特征参数的研究与仿真 被引量:17
10
作者 王金明 张雄伟 《系统仿真学报》 CAS CSCD 2003年第9期1276-1278,共3页
在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用... 在说话者识别系统中,提取反映说话者个性的语音信号特征参数是系统的关键问题之一。研究并提取了几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、语音动态参数等,对这些参数进行了分析和比较,并研究了将多种参数组合使用对识别系统性能的影响。通过仿真和实验,证明混合参数识别方法能使话者识别系统的正确识别率有明显的提高。 展开更多
关键词 说话者识别 动态特征 线性预测倒谱系 美尔谱系 仿真
在线阅读 下载PDF
基于LPCMCC的音频数据检索方法 被引量:5
11
作者 江星华 李应 《计算机工程》 CAS CSCD 北大核心 2009年第11期246-247,253,共3页
LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法... LPC美尔倒频谱系数(LPCMCC)根据人耳听觉特性将LPC倒谱系数(LPCC)用非线性美尔尺度进行变换,从而更接近人耳的听觉系统。基于此提出一种采用LPCMCC为特征参数,通过动态时间规整算法进行音频数据的分类与检索方法。实验结果表明,该方法的检索精度高于LPCC,检索效率高于美尔倒谱系数(MFCC)。 展开更多
关键词 LPC倒谱系 LPC美尔谱系 音频检索 美尔谱系
在线阅读 下载PDF
基于径向基神经网络的数字“0”~“9”语音识别 被引量:3
12
作者 余华 李海洋 李启元 《江西师范大学学报(自然科学版)》 CAS 北大核心 2009年第6期701-705,共5页
介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较... 介绍了语音信号分析方法中的线性预测编码技术和滤波器组分析方法,并推导了MFCC系数.分析并讨论了语音识别研究中径向基神经网络的设计原则,以及特征参数等对语音识别结果的影响.实验结果表明:基于径向基神经网络的语音识别方法有着较好的识别性能和应用效果,针对非特定人的孤立词识别,识别率可以达到90%以上. 展开更多
关键词 语音识别 特征提取 美尔谱系 径向基神经网络
在线阅读 下载PDF
一种改进动态特征参数的话者语音识别系统 被引量:4
13
作者 申小虎 万荣春 张新野 《计算机仿真》 CSCD 北大核心 2015年第4期154-158,共5页
研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种... 研究语音动态特征参数提取问题,在话者语音识别过程中,动态特征参数可以有效提高识别率。但是传统算法在其提取过程中存在大量干扰冗余信息,造成了识别率降低并带来运算速度的降低。为解决上述副作用,提出在说话人识别系统中,使用一种动态时频倒谱系数参数的方法。上述方法在不减少反应话者个体特征分布特性的前提下,可消除冗余信息并降低样本特征的维度。利用上述方法提取语音特征参数并输入混合高斯-通用背景模型进行说话人语音分类。在Matlab上仿真结果表明,动态时频倒谱系数可有效改进话者语音识别系统的识别正确率。 展开更多
关键词 话者语音识别系统 美尔频率倒谱系 滑动差分倒谱特征 动态时频倒谱系 混合高斯-通用背景模型
在线阅读 下载PDF
语音识别系统及其特征参数的提取研究 被引量:5
14
作者 魏星 周萍 《计算机与现代化》 2009年第9期167-168,172,共3页
在语音识别系统中,特征参数的选择对系统的识别性能有关键性的影响,本文主要研究几种重要的语音特征参数,包括线性预测倒谱系数、美尔倒谱系数、基于小波分析的参数等,并对这些参数进行了分析和比较,最后对语音识别的研究未来进行了展望。
关键词 语音识别 线性预测倒谱系 美尔谱系 小波分析
在线阅读 下载PDF
说话人识别中语音特征参数研究 被引量:5
15
作者 杨建华 于小宁 《大理学院学报(综合版)》 CAS 2009年第8期32-35,共4页
在说话人识别系统中,特征参数的选择和提取对系统的识别性能有关键性的影响。研究了两种重要的语音特征参数,线性预测倒谱系数和美尔倒谱系数,在此基础上提出改进的相位自相关系数,通过实验对几种参数进行了对比,结果表明改进的相位自... 在说话人识别系统中,特征参数的选择和提取对系统的识别性能有关键性的影响。研究了两种重要的语音特征参数,线性预测倒谱系数和美尔倒谱系数,在此基础上提出改进的相位自相关系数,通过实验对几种参数进行了对比,结果表明改进的相位自相关系数能够使系统的误识率明显下降。 展开更多
关键词 说话人识别 特征参 线性预测倒谱系 美尔谱系
在线阅读 下载PDF
基于小波包变换的说话人语言特征参数及其在说话识别中的应用
16
作者 屈百达 蒋纯纲 +1 位作者 王月 徐保国 《中国新通信》 2008年第1期40-44,共5页
在说话人识别系统中,能够反映说话人个性的语音特征参数是系统的关键问题之一。本文提出了一种新的说话人识别方法:在小波变换的基础上,借鉴MFCC特征参数的提取,基于GMM模型,用小波包变换代替傅立叶变换,提取新的特征参数DWPTMFCC,实验... 在说话人识别系统中,能够反映说话人个性的语音特征参数是系统的关键问题之一。本文提出了一种新的说话人识别方法:在小波变换的基础上,借鉴MFCC特征参数的提取,基于GMM模型,用小波包变换代替傅立叶变换,提取新的特征参数DWPTMFCC,实验结果表明,该方法简单可靠,有效可行,具有较高的识别率,与已有方法相比,具有广泛的实用性。 展开更多
关键词 说话人识别 特征参 小波包变换 美尔谱系
在线阅读 下载PDF
基于小波包分析的特征参数提取 被引量:3
17
作者 胡文吉 王让定 《宁波大学学报(理工版)》 CAS 2007年第1期51-54,共4页
在分析MFCC提取原理的基础上,结合小波包分析理论,得到新的特征参数.提出了一种新的特征参数提取方法,用动态时间规整法,分别测试了MFCC的识别率和新的特征参数的识别率.研究证明新的特征参数不仅具有较高的识别率,而且有一定的抗噪声能力.
关键词 小波包 美尔谱系 特征参 动态时间规整
在线阅读 下载PDF
多位朝鲜语数字语音识别方法的研究 被引量:1
18
作者 朴明姬 芦世丹 崔荣一 《延边大学学报(自然科学版)》 CAS 2011年第4期337-341,共5页
针对朝鲜语数字串语音识别中单位符号容易被误判为数字的问题,提出了基于朝鲜语数字串结构特点的识别方法。首先,对事先采集好的语音样本提取特征并存储成数字模板和单位符模板;其次,将数字串测试样本切分成孤立的数字或单位符并提取特... 针对朝鲜语数字串语音识别中单位符号容易被误判为数字的问题,提出了基于朝鲜语数字串结构特点的识别方法。首先,对事先采集好的语音样本提取特征并存储成数字模板和单位符模板;其次,将数字串测试样本切分成孤立的数字或单位符并提取特征参数;最后,根据朝鲜语数字串发音特点,即若前1个孤立词已被识别为数字,那么后1个被默认为单位符并且只与存储单位符号的模板进行匹配。实验结果表明,该方法不仅可以获得较高的正确识别率,同时提高了识别效率。 展开更多
关键词 语音识别 朝鲜语字语音 美尔频率倒谱系 动态时间规整
在线阅读 下载PDF
基于小波包分解和噪声分析的抗噪说话人识别特征参数
19
作者 吴峰燕 李志华 《计算机与现代化》 2009年第1期113-115,122,共4页
为提高说话人识别中语音特征参数对噪声的鲁棒性,本文提出在对语音进行小波包分解基础上,分析噪声的特性,在不同子带内进行谱减并设立权重,提出了一种新的语音特征参数多层美尔倒谱系数。仿真实验表明,与MFCC特征参数相比,ML-MFCC在噪... 为提高说话人识别中语音特征参数对噪声的鲁棒性,本文提出在对语音进行小波包分解基础上,分析噪声的特性,在不同子带内进行谱减并设立权重,提出了一种新的语音特征参数多层美尔倒谱系数。仿真实验表明,与MFCC特征参数相比,ML-MFCC在噪声环境下具有更好的抗噪性能和说话人识别率。 展开更多
关键词 多层美尔谱系 小波包分解 说话人识别
在线阅读 下载PDF
基于Matlab的藏语语音频域特征参数提取分析 被引量:2
20
作者 高杨 《西藏科技》 2020年第2期38-43,共6页
藏语作为藏族人民的基本日常语言,具有很好的应用市场,同时也有越来越多的人们愿意学习藏语,更深入的了解藏族人民的生活及藏族的传统名族习俗。这使得研究藏语语音成为一种很重要的任务,首先要分析藏语的基本特征,及各相关参数。频域... 藏语作为藏族人民的基本日常语言,具有很好的应用市场,同时也有越来越多的人们愿意学习藏语,更深入的了解藏族人民的生活及藏族的传统名族习俗。这使得研究藏语语音成为一种很重要的任务,首先要分析藏语的基本特征,及各相关参数。频域分析在语音技术研究中具有重要的意义,而藏语语音研究在国内正处于发展的良好契机,对藏语的频域分析自然是比较重要的。藏语语音识别目前正处于不断完善阶段,通过分析其他语言的语音识别技术可知,藏语的语音识别必定会产生很可观的社会效益和经济效益,也将是藏文信息化道路上不能缺少的一步。文章选取藏文辅音字母和简短的拉萨日常用语,主要做了以下的研究:先是研究藏语语音的的基本特征,其次使用MATLAB作为工具对特定语音进行的频域分析来获取基本的藏语音频特征。 展开更多
关键词 藏语 语音识别 特征值提取 线性预测系 美尔谱系
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部