期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于音频事件检测和分类的音频监控系统背景模型自适应方法研究 被引量:1
1
作者 张爱英 倪崇嘉 《计算机科学》 CSCD 北大核心 2016年第9期310-314,共5页
随着监控系统中音频传感器应用的与日俱增,音频事件检测与分类已成为一个重要的研究课题。音频系统所处的音频环境(不同场所、不同噪声)非常复杂,以致检测与分类音频事件异常困难。因此,进行背景模型自适应从而适应不断变化的音频环境... 随着监控系统中音频传感器应用的与日俱增,音频事件检测与分类已成为一个重要的研究课题。音频系统所处的音频环境(不同场所、不同噪声)非常复杂,以致检测与分类音频事件异常困难。因此,进行背景模型自适应从而适应不断变化的音频环境变得十分重要。提出了利用受限的最大似然线性回归方法对背景模型进行自适应。采用实际监控场景中的音频数据和模拟录制数据,研究了背景模型自适应方法以及如何有效地进行背景模型自适应。实验结果表明背景模型自适应可以提高目标声音事件的检测性能,减少系统误报。 展开更多
关键词 音频事件检测与分类 背景模型自适应 受限的最大似然线性回归 监控系统
在线阅读 下载PDF
基于多层次注意力机制一维DenseNet音频事件检测 被引量:2
2
作者 杨吕祥 胡燕 《计算机应用研究》 CSCD 北大核心 2020年第6期1642-1646,共5页
在音频事件检测任务中,目标音频易受背景噪声等因素的干扰,并且其在音频信号流中存在的比例不高,针对这些问题,提出一种多层次注意力机制一维DenseNet(dense convolutional network)音频事件检测模型。使用一维DenseNet模型进行帧级检... 在音频事件检测任务中,目标音频易受背景噪声等因素的干扰,并且其在音频信号流中存在的比例不高,针对这些问题,提出一种多层次注意力机制一维DenseNet(dense convolutional network)音频事件检测模型。使用一维DenseNet模型进行帧级检测能有效地检测音频事件发生的开始和结束时间;在一维DenseNet模型中引入多层次注意力机制,使得不同模块的感知特性随着网络层数的加深而自适应地变化,因此模型可以在不同的网络层次自动选择和关注重要的目标帧而抑制不相关的背景帧。在DCASE 2017任务2的开发数据集上的实验表明,该方法的整体性能较传统的深度学习方法有进一步提高。 展开更多
关键词 音频事件检测 深度学习 DenseNet 多层次注意力机制
在线阅读 下载PDF
基于多状态跳转模型的场景独立音频事件检测方法
3
作者 王健飞 张卫强 刘加 《中国科学院大学学报(中英文)》 CSCD 北大核心 2019年第2期218-225,共8页
针对不同类型事件设计多状态跳转模型,结合两种深度神经网络实现对传统音频事件检测框架的改进。实验表明,在DCASE2017任务2的开发集数据上,改进后的DNN-HMM系统相比于基线系统取得F值8.9%的相对提升和错误率19%的绝对下降;基于多状态... 针对不同类型事件设计多状态跳转模型,结合两种深度神经网络实现对传统音频事件检测框架的改进。实验表明,在DCASE2017任务2的开发集数据上,改进后的DNN-HMM系统相比于基线系统取得F值8.9%的相对提升和错误率19%的绝对下降;基于多状态跳转模型聚类的卷积神经网络模型(SC-CNN),相比于基线系统取得F值18%的相对提升和错误率30%的绝对下降。 展开更多
关键词 音频事件检测 多状态跳转模型 深度神经网络 迁移学习 多任务学习
在线阅读 下载PDF
基于多尺度时长音频特征的暴力音频事件检测
4
作者 徐战苍 李海峰 《智能计算机与应用》 2014年第5期72-75,共4页
暴力镜头检测是近年来的研究热点之一。早期的暴力镜头检测主要依赖视频特征,由于音频信息具有良好的稳定性和在不同文化和人群之间的一致性,现在人们越来越多地关注音频信息的使用。为此研究使用音频特征对电影镜头中的暴力音频事件进... 暴力镜头检测是近年来的研究热点之一。早期的暴力镜头检测主要依赖视频特征,由于音频信息具有良好的稳定性和在不同文化和人群之间的一致性,现在人们越来越多地关注音频信息的使用。为此研究使用音频特征对电影镜头中的暴力音频事件进行检测。为此提出了一种基于多尺度时长的特征提取方法。提取了除MFCC、LPC、能量等短时特征以外,还提取了能量均值方差、子带能量均值和方差、帧间差分等长时特征。暴力镜头中出现较多且具有代表性的音频事件有爆炸、尖叫、枪击三种。本文以电影的镜头为识别单位,使用支持向量机分类算法实现了一个检测系统。通过在15部好莱坞电影上的实验,表明本文基于多尺度时长的音频特征在暴力音频事件检测工作中,能够取得较好的结果。 展开更多
关键词 暴力镜头检测 多尺度时长特征 音频事件检测 支持向量机
在线阅读 下载PDF
用于安全监控系统的音频事件检测研究
5
作者 夏亦佳 《河南科技》 2017年第11期15-18,共4页
针对视频监控过于依赖图像信息,在黑暗条件下或视线盲区无法进行及时、有效监控的问题,本文提出一种可以用于辅助安全监控的音频事件检测系统,以枪击声和尖叫声为关键事件,把过零率、短时能量、子带能量比和Mel倒谱系数作为音频特征,基... 针对视频监控过于依赖图像信息,在黑暗条件下或视线盲区无法进行及时、有效监控的问题,本文提出一种可以用于辅助安全监控的音频事件检测系统,以枪击声和尖叫声为关键事件,把过零率、短时能量、子带能量比和Mel倒谱系数作为音频特征,基于SVM分类器设计实现了一种多级分类系统。结果表明,该系统可以有效地检测出两种关键事件,最优识别率达90%。 展开更多
关键词 音频事件检测 安全监控视频 支持向量机 MFCC
在线阅读 下载PDF
尖叫声识别装置的研制 被引量:1
6
作者 毛峡 张旭东 陈立江 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2018年第3期393-400,共8页
尖叫声识别技术相对于传统的视频监控技术不受夜晚、大雾等环境影响,同时能大大减轻监控人员的工作量,且不存在视频盲区的问题.在此背景下,基于ARM9设计了一个尖叫声自动识别系统.在算法层面上,提出了一种与尖叫声相关的声学特征(梅尔... 尖叫声识别技术相对于传统的视频监控技术不受夜晚、大雾等环境影响,同时能大大减轻监控人员的工作量,且不存在视频盲区的问题.在此背景下,基于ARM9设计了一个尖叫声自动识别系统.在算法层面上,提出了一种与尖叫声相关的声学特征(梅尔频率倒谱系数变化率)并以此改进了识别算法的ROC曲线.此外,将所提特征和其他传统特征作为特征集合,在不同信噪比环境中对基于HMM和SVM的几种尖叫声识别算法进行了比较和分析.在硬件层面上,采用了IIS和DMA在ARM9平台上实现了尖叫声识别算法.经测试,系统符合检测概率大于95%,虚警概率小于5%,应答时间小于2s的要求. 展开更多
关键词 音频事件检测 梅尔频率倒谱系数 隐马尔可夫模型 支持向量机 ARM9
在线阅读 下载PDF
面向多场景的环境异常声音识别 被引量:11
7
作者 郑文宾 何蔚 《科学技术与工程》 北大核心 2023年第17期7444-7449,共6页
随着人工智能和大数据的发展,各种场景中对异常声音识别的需求日益增长,基于人工智能的声音识别技术正在兴起并被高度重视。现行主流的异常声音识别算法多为浅层机器学习模型结构,对异常声音的识别率较低,且识别的声音类型单一。为了有... 随着人工智能和大数据的发展,各种场景中对异常声音识别的需求日益增长,基于人工智能的声音识别技术正在兴起并被高度重视。现行主流的异常声音识别算法多为浅层机器学习模型结构,对异常声音的识别率较低,且识别的声音类型单一。为了有效识别异常声音,提出一种基于梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)和卷积神经网络(convolution neural network,CNN)的环境声音识别算法,对各类异常声音进行采集和有效识别,并及时反馈声音状态,为各类声识别应用场景提供精细化管理技术手段。结果表明:提出的算法对5类场景下环境异常声音的识别率得到极大提高,适用于更广泛的声学场景,具有明显的优势。 展开更多
关键词 异常声音 梅尔频率倒谱系数 卷积神经网络 音频事件检测
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部