题名 Internet音频检索技术综述
被引量:1
1
作者
柯育强
康耀红
机构
海南大学信息科学技术学院
出处
《海南大学学报(自然科学版)》
CAS
2008年第1期102-106,共5页
基金
教育部重点基金项目(03144)
文摘
对Internet音频检索的现状和发展趋势进行了全面的综述,对几种流行的音频检索技术进行了深入的讨论.通过广泛收集资料,对几种技术进行了比较性研究.最后,提出了若干值得深入研究的方向.
关键词
音频检索
基于内容的音频检索
模糊聚类
关联规则挖掘
Keywords
Audio retrieval
Content-based audio retrieval
Fuzzy clustering
Association rule mining
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 基于内容音频检索综述
被引量:2
2
作者
张建华
汪鑫
机构
上海大学通信与信息工程学院
上海电机学院
出处
《商情》
2012年第2期215-217,共3页
文摘
音频是一种重要的媒体,它包含丰富的听觉特征。根据基于内容的音频检索的研究现状,本文总结出基于内容音频检索系统的概念,给出音频检索的基本结构,综述了音频检索的关键技术,并展望基于内容音频检索领域的发展前景。
关键词
基于内容的音频检索
音频 特征提取
音频 分类
音频检索
分类号
G354.47
[文化科学—情报学]
题名 音频检索综述
被引量:8
3
作者
续鸿飞
肖明
机构
北京师范大学管理学院
出处
《晋图学刊》
2005年第6期15-19,共5页
基金
国家社会科学基金资助项目(02CTQ002)
文摘
本文根据音频检索的研究现状,综述音频检索方法,讨论了一些音频检索关键技术:音频特征提取、音频分割和分类、基于内容的音频检索和音乐检索方法等。最后指出音频检索的不足并展望了音频检索技术的发展前景。
关键词
音频检索
音频 分割
基于内容的音频检索
音乐检索
Keywords
audio retrieval
audio segmentation
content- based audio retrieval
music retrieval
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于内容的音频检索:概念和方法
被引量:53
4
作者
李国辉
李恒峰
机构
国防科技大学管理科学与工程系多媒体实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2000年第11期1173-1177,共5页
文摘
F过去对视觉媒体的检索 ,如图象和视频 ,进行了大量的研究 .但是我们注意到音频也是多媒体中的一种典型媒体 ,是信息的一种常用载体 .常规的处理是把数字音频当成非结构化流媒体 .然而音频是语音的载体、包含丰富的听觉特征 ,并且具有结构信息 .因此需要并且可以基于这些内容对音频进行存取 .本文根据当前相关研究的进展 ,综述基于内容的音频检索方法 ,包括面向语音、音乐和音频分析的检索、音频分割等 ;分析并总结出音频内容及其检索的概念 ,给出音频检索的系统结构 ;
关键词
音频检索
多媒体
信息检索
内容
概念
方法
Keywords
Audio retrieval
Content based retrieval
Multimedia information retriev0
分类号
TP37
[自动化与计算机技术—计算机系统结构]
题名 一种基于倒排索引的音频检索方法
被引量:8
5
作者
张雪源
贺前华
李艳雄
叶婉玲
机构
华南理工大学电子与信息学院
出处
《电子与信息学报》
EI
CSCD
北大核心
2012年第11期2561-2567,共7页
基金
国家自然科学基金(60972132
61101160)资助课题
文摘
传统的基于实例的音频检索算法采用顺序索引,检索时需遍历数据库并导致难以忍受的等待时间。针对传统的顺序的索引方法,该文提出基于倒排索引的音频检索算法。该方法首先利用多种音频特征构成的超向量,通过多层音频分割方法将连续音频流分割为特征数值波动幅度小的短时音频段;然后利用事先训练好的音频字典,将短时音频段序列转换为可以表征音频内容的音频字序列,并建立倒排索引;检索时,将用户提交的查询转换为音频字后利用倒排索引无须遍历数据库即可直接定位候选段落,并根据候选段落与查询的内容相似度大小对候选段落进行排序,将排好序的列表作为检索结果。仿真实验以匹配项排名、同类检索结果比例、定位准确性和检索用时4个方面作为评价指标,实验结果显示,该算法能够在平均1.101 s时间内实现92.58%的检索准确率。
关键词
音频 信号处理
音频检索
内容相似度
倒排索引
Keywords
Audio signal processing
Audio retrieval
Content similarity
Inverted index
分类号
TN912.3
[电子电信—通信与信息系统]
题名 基于加权MFCC的音频检索
被引量:8
6
作者
华斌
张丽超
赵富强
机构
天津财经大学信息科学与技术系
出处
《计算机工程与应用》
CSCD
北大核心
2015年第8期200-204,共5页
基金
天津市高等学校科技发展基金计划项目(No.20140816)
文摘
通过研究音频特征值提取和特征匹配算法,给出了一个完整的音频数据检索系统框架。该系统框架主要分析了音频特征提取和特征匹配。在音频特征提取部分对经典的MFCC系数进行了分析,提出了基于熵值法加权的MFCC系数,提高了检索的识别率。音频匹配部分根据特征参数矩阵表征音频信息的性质,引入了矩阵相似度的匹配方法,提高了检索效率。实验结果表明系统识别效率提高1.2%,用时降低22%,系统的性能得到明显改善。
关键词
特征提取
音频检索
熵值法
矩阵相似度
Keywords
feature extraction
audio retrieval
entropy value method
matrix similarity
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 基于内容的音频检索与分类
被引量:15
7
作者
李恒峰
李国辉
机构
国防科技大学系统工程与数学系
出处
《计算机工程与应用》
CSCD
北大核心
2000年第7期54-56,134,共4页
文摘
音频信息检索技术是多媒体检索技术中的一个重要组成部分。该文在分析国内外现行的音频信息检索方法的基础上,总结出了基于内容的音频检索的一般方法,提出了一种基于内容的音频信息检索与分类方法,并通过已研制的ARS音频检索系统进行了性能测试。此方法具有较高的准确性和灵活性,可适用于不同的系统和应用。
关键词
多媒体
信息检索
音频检索
分类
Keywords
multimedia, audio, information retrieval,content based retrieval
分类号
G354.4
[文化科学—情报学]
题名 基于K-L距离的两步固定音频检索方法
被引量:8
8
作者
齐晓倩
陈鸿昶
黄海
机构
解放军信息工程大学信息工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2011年第19期160-162,共3页
基金
国家"863"计划基金资助项目(2008AA011002)
文摘
根据音频文件数据量大、数据间存在一定相关性的特点,提出一种基于K-L距离的两步固定音频检索方法。该方法采用基于可变门限的直方图检索方法快速筛选出相似度较高的语音文件,利用特征矩阵的K-L距离对剩余语音进行精确比较,取得较好的效果。实验结果证明,该方法能使检索准确率达到90%左右。
关键词
固定音频检索
过零率
直方图
美尔频率倒谱系数
K-L距离
Keywords
specific audio retrieval
Zero Crossing Rate(ZCR)
histogram
Mel Frequency Cepstral Coefficient(MFCC)
K-L distance
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 一种基于指纹因子的鲁棒音频检索方法
被引量:3
9
作者
林静
杨继臣
张雪源
李新超
机构
茂名职业技术学院机电信息系
华南理工大学电子与信息学院
出处
《数据采集与处理》
CSCD
北大核心
2016年第5期1020-1027,共8页
基金
国家自然科学基金(61301300)资助项目
文摘
针对基于内容的音频检索中由于噪声造成的查找失败问题,本文提出了一种对噪声鲁棒的基于音频指纹因子的音频特征提取算法和一种半监督的音频字典训练算法,以提高噪声下音频检索的精度。本文方法从Mel谱中提取音频指纹,利用非负矩阵分解算法将指纹分解为对噪声鲁棒的频率因子和时间因子作为特征。同时通过提出的半监督音频字典训练算法进行音频字典训练,本文方法使用音效集计算基本音效的分布空间作为初始字典,在量化数据的同时动态更新字典以实现对数据的准确描述。实验结果表明,在低信噪比条件下本文提出的算法的平均查询精度明显高于其他算法。
关键词
音频检索
音频 指纹
非负矩阵分解
音频 字典
倒排索引
Keywords
audio retrieval
audio fingerprint
non-negative matrix factorization
audio dictionary
inverted index
分类号
TN912.3
[电子电信—通信与信息系统]
题名 分段式音频检索算法
被引量:3
10
作者
郑贵滨
韩纪庆
李海峰
郑铁然
机构
哈尔滨工业大学
出处
《计算机科学》
CSCD
北大核心
2005年第3期73-75,共3页
基金
课题获教育部跨世纪优秀人才培养计划基金
哈尔滨市留学回国人员基金(2002AFLXJ005)
哈尔滨工业大学海外留学人员回国工作科研启动基金
文摘
本文提出了一种基于分段的快速音频检索算法。该算法将检索目标划分成多个较小的片段,每个片段可以独立进行检索;检索过程中使用检索窗控制参与检索的片段及数量。该算法的速度不随检索目标的长度变化,检索速度可调,且能获得良好的查全率和查准率,适用于从未知音频数据源中检索任意长度的特定音频数据及实时应用场合。
关键词
分段式
音频检索 算法
检索 窗
检索 速度
多媒体信息
Keywords
Audio retrieval
Segmentation
Retrieval window
分类号
TP37
[自动化与计算机技术—计算机系统结构]
TP301.6
[自动化与计算机技术—计算机系统结构]
题名 一种基于仿生模式识别思想的固定音频检索方法
被引量:6
11
作者
张卫强
刘加
陈恩庆
机构
清华大学电子工程系
郑州大学信息工程学院
出处
《自然科学进展》
北大核心
2008年第7期808-813,共6页
基金
国家自然科学基金(批准号:60572083)
国家高技术研究发展计划(批准号:2006AA010101
2007AA04Z223)资助项目
文摘
固定音频检索是指在待检音频中检测和定位与给定查询音频同源的音频片段,它是多媒体检索中的基本问题之一.根据仿生模式识别的基本思想,将查询段映射为高维特征空间中的点,然后考虑各种同源情况对其进行扰动,形成一个超立方体覆盖.通过逐一判断待检段是否位于该覆盖内,即可进行检索.除特征提取外,该方法不需要对待检音频进行额外的预处理.实验结果表明,在加性噪声以及压缩编码的情况下,所提算法均能够快速准确的检出目标.
关键词
音频检索
仿生模式识别
高维空间点覆盖
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TN912.3
[电子电信—通信与信息系统]
题名 基于分形特征的音频检索
被引量:2
12
作者
李坚
毛先领
文贵华
机构
华南理工大学计算机应用工程研究所
华南理工大学计算机学院
出处
《计算机工程》
CAS
CSCD
北大核心
2008年第11期211-213,共3页
文摘
提出利用分形几何抽取音频特征的全局化音频检索,将其学习阶段计算音频数据库中每个音频的分维作为特征向量,保存在音频特征数据库中,并建立索引。其检索阶段则首先计算查询音频的分维,然后从音频数据库中快速找出分维最相似的若干音频对象。分维刻画了音频的内在属性如自相似性,使其具有片段检索对匹配的起点不敏感、抗噪音、检索速度快等优点。用FRACTAL,MFCC和SOLAR3种方法对数据集分别检索,实验结果表明基于分维的音频检索在性能和时间复杂度上有显著优势。
关键词
音频检索
分形
音频 特征
Keywords
audio retrieval
fractal
audio feature
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 广播电台音频检索技术研究
被引量:4
13
作者
唐峰
刘玉贵
机构
中国科学院研究生院
出处
《计算机应用》
CSCD
北大核心
2007年第B06期364-366,共3页
文摘
系统研究了当前的音频检索技术,并对各种音频检索技术的优势和不足进行了剖析,对广播电台音频检索的未来进行了展望。
关键词
音频检索
都柏林核心(Dublin
Core
DC)
信息检索
内容检索
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 音频检索方法的研究
被引量:2
14
作者
钟宝荣
吴春辉
杜红
机构
长江大学计算机科学学院
长江大学电子信息学院
出处
《长江大学学报(自科版)(上旬)》
CAS
2008年第2期89-91,共3页
基金
湖北省教育厅优秀中青年科技创新团队计划项目(鄂教科2004-7-4)
文摘
音频检索技术是多媒体检索技术中的一个重要组成部分,但在多媒体流中基于内容的音频检索工作做得很少。将分析音频信号的特征,通过对基于内容的检索技术的讨论,提供一种通过声学特征的相似性来检索音频文件的方法。在检索过程中,把不同的音频文件组合成音频文件库,采用模糊统计的方法,对相似性进行分析,达到对不同内容的音频检索。
关键词
音频检索
CBR
模糊统计
音频
相似性
Keywords
audio retrieval
content based retrieval
fuzzy statistics
audio
similarity
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于响度主分量模糊直方图的音频检索方法
被引量:1
15
作者
郑贵滨
韩纪庆
李海峰
机构
哈尔滨工业大学计算机科学与技术学院
哈尔滨工程大学自动化学院
出处
《信号处理》
CSCD
北大核心
2006年第4期471-475,共5页
基金
本课题获国家自然科学基金(60173044)
教育部跨世纪优秀人才培养计划基金
+2 种基金
哈尔滨市贸学回国人员基金(2002AFLXJ005)
黑龙江省自然科学基金(LC03C10)
哈尔滨工为大学校基金(HIT.2002.70)
文摘
根据人耳听觉模型以归一化响度主分量为特征,采用模糊直方图检索音频信息,并根据响度数据的统计分布对直方图编码进行优化。实验结果表明,该方法在低信噪比下具有较好的性能,对噪音具有良好的顽健性(Robustness)。为噪音下的固定音频检索问题提供了有效的解决办法。
关键词
音频检索
响度
主分量
模糊直方图
Keywords
Audio Retrieval
Loudness
Principal Component
Fuzzy histogram
分类号
TN912.2
[电子电信—通信与信息系统]
题名 模糊粗糙集在音频检索中的应用
被引量:1
16
作者
李晓丽
杜振龙
机构
南京工业大学电子与信息工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2010年第15期124-126,共3页
基金
江苏省高校自然科学基金(No.09KJB520006)
南京大学软件新技术国家重点实验室开放基金(No.KFKT2008B15)
南京工业大学学科预研基金
文摘
音频具有数据量大、维数高等特点,直接进行音频检索会造成"特征维数灾难",因此有必要从音频提取最能表现音频特征的音频帧。提出一种基于模糊粗糙集模型(Fuzzy Rough Set Model,FRSM)的音频数据约简算法,根据隶属度对音频数据进行模糊离散,基于知识表达能力约简属性,以等价划分计算具有等同分类能力的知识核。实验结果表明,该算法能够得到最小约简,并且最大程度地保持音频特征,提高检索效率。
关键词
音频检索
模糊粗糙集
音频 特征
特征约简
Keywords
audio indexing
fuzzy rough set model
audio feature
feature reduction
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于内容的音频检索综述
被引量:11
17
作者
朱爱红
李连
机构
海军航空工程学院
出处
《微机发展》
2003年第12期58-60,64,共4页
文摘
传统的基于文本的音频检索技术存在主观性和不完整性等缺点,而且不支持实时音频检索。为此,基于内容的音频检索技术应运而生。文中根据音频检索的研究现状,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。
关键词
语音识别
音频检索
音频 特征提取
音频 信号处理
傅里叶变换
语音信号处理
音频 分类
Keywords
content-based audio retrieval
speech recognition
audio classification
分类号
TN912.3
[电子电信—通信与信息系统]
题名 基于内容的音频检索关键技术研究
被引量:7
18
作者
朱爱红
李连
机构
海军航空工程学院
出处
《现代计算机》
2003年第11期37-40,51,共5页
文摘
音频是一种重要的媒体,包含丰富的听觉特征。本文根据当前音频检索研究的进展,综述基于内容的音频检索方法,讨论了一些音频检索技术研究中的关键技术:音频特征提取、音频分类、语音识别技术等。最后展望了音频检索技术的发展前景。
关键词
音频检索
音频 索引
音频 信号
音频 特征提取
语音信号处理
语音识别
Keywords
Content-based Audio Retrieval
Speech Recognition
Audio Classification
分类号
TN912.3
[电子电信—通信与信息系统]
题名 基于模板的音频检索方法研究
被引量:2
19
作者
杜军
机构
山东师范大学传播学院
出处
《山东师范大学学报(自然科学版)》
CAS
2008年第2期139-140,151,共3页
文摘
随着多媒体信息的日益增多,如何对具有海量信息的多媒体数据进行有效的检索成为人们关注的问题.其中,音频信号检索技术成为热点研究问题.本文在总结分析已有研究结果的基础上,从音频内容的自动分析技术着手,最终实现了一种基于模板的音频检索算法.实验结果表明,该方法具有较高的分类检索能力,准确率高,检索速度快,是一种有效可行的音频检索方法.
关键词
基于模板
音频检索
矢量量化
特征提取
音频 分类
分类号
TN912.3
[电子电信—通信与信息系统]
G354.4
[文化科学—情报学]
题名 基于内容的音频检索算法
被引量:2
20
作者
尚永强
张琳梅
徐大伟
机构
信阳农业高等专科学校计算机科学系
出处
《河南科技学院学报》
2009年第3期69-72,共4页
文摘
介绍了基于内容的音频检索系统的基本结构,并在研究国内外相关文献的基础上,分析了音频检索算法的主要特点,划分为以下几种类型:近似字符串匹配算法、基于树结构的音频检索算法、基于动态时间规整的音频检索算法、基于隐马尔克夫模型的音频检索算法以及其它音频检索算法.
关键词
音频检索
近似字符串匹配
动态时间规整
隐马尔可夫模型
Keywords
content -based audio retrieval
approximate string matching
dynamic time warping
hidden markov model
分类号
TP391
[自动化与计算机技术—计算机应用技术]