汉语语音识别的平滑声韵基元HMM算法被引量：2

Smoothed-unit HMM Algorithm in Mandarin Speech Recognition

下载PDF

导出

摘要汉语语音识别的基本单元一般为音素、音节以及声韵母 .以声韵母为基元的识别系统由于HMM模型较少 ,计算量小 ,适合于实时实现 .但是由于模型比较孤立 ,对语音信号的声学特性描述得不够精确 ,因而识别率一般比音节基元的系统低 .而以音节、音素 (tri phone、di phone)为基元的系统则有HMM模型数量多、训练和识别过程中计算量大的缺点 ,影响到系统的实时性 .本文提出了一种折衷的方案 ,系统基元仍选择声韵母 ,而在HMM训练阶段 ,对整个音节序列的参数进行运算 ,使声韵过渡段的状态得到平滑 ,同时计算并保存每个音节声韵之间的转移概率 ,识别时动态组装为完整的音节HMM .该方法在保持少量HMM个数的同时 ,能够降低误试率 ,适合于以DSP为核心的实时连接词语音识别系统 . The base unit in mandarin speech recognition is phoneme, semi-syllable or syllable. Semi-syllable system has fewer HMM models and needs less computation, thus it is suitable for real-time systems. But due to poor description for the acoustic properties of the speech signal, it generally shows a low performance compared with syllable system. While the system based on syllable or phoneme (tri-phone or di-phone) has much more HMM models, and needs massive computation in training and recognition, which goes against to real-time implementation. The new scheme is a compromised one. The new system is based on semi-syllable system, but the parameters of the entire syllable are used in training phase, so smoothing between two semi-syllable units is introduced. The transition probability between semi-syllables is calculated, and the two semi-syllable HMMs are connected into a full syllable HMM in recognition phase. This can increase the system performance without increasing HMM models, and it is fit for real-time systems with DSP kernel.

作者何强毛士艺张有为

机构地区北京航空航天大学电子工程系五邑大学信息科学研究所

出处《北京航空航天大学学报》 EI CAS CSCD 北大核心 2001年第2期146-149,共4页 Journal of Beijing University of Aeronautics and Astronautics

基金广东省自然科学基金资助项目!(96 0 6 31)

关键词语音识别马尔柯夫过程 HMM 声韵基元平滑声韵基元算法汉语语音 Acoustic properties Learning algorithms Markov processes Mathematical models Probability Real time systems Speech processing

分类号 TN912.3 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献1

1杨浩荣,刘加,王作英,陆大.GMD-SDDBHMM语音识别模型和分类训练方法[J].通信学报,1998,19(4):35-42. 被引量：3

二级参考文献3

1Ji T Y，SSIPNN’94.2，1994年，730页
2王作英，第二届全国汉字语音识别会议，1989年
3Rabiner L R，AT T Tech J，1985年，64卷，6期，1251页

共引文献2

1吴治国,刘玉宇,王作英.基于段长分布的HMM的资源受限语音识别系统[J].计算机应用,2003,23(z2):316-318.
2刘玉宇,吴及,王作英.汉语三音子模型观测概率比较[J].中文信息学报,2003,17(3):47-52. 被引量：2

同被引文献10

1周楠,艾剑良.基于HMM和RNN的无人机语音控制方案与仿真研究[J].系统仿真学报,2020,32(3):464-471. 被引量：13
2李锦,何培宇.一种改进的基于小波去噪HMM非特定人语音识别算法[J].四川大学学报（自然科学版）,2007,44(1):69-72. 被引量：12
3GeorgeKoch KevinLoney.Oracle 8完全参考手册[M].北京：机械工业出版社,..
4GeorgeKoch KevinLoney.Oracle 8完全参考手册[M].北京:机械工业出版社,..
5赵明明,王洪春.一种用于语音识别的高效分帧函数的研究[J].重庆工商大学学报（自然科学版）,2012,29(5):68-72. 被引量：4
6许丽红,余小清,万旺根.基于HMM算法的语音识别系统设计及其混合编程实现[J].计算机工程,2002,28(5):139-140. 被引量：8
7高珍珍,鲍长春.能量匹配的MFS-HMM语音增强方法[J].信号处理,2016,32(8):937-944. 被引量：2
8李强,陈浩,陈丁当.基于隐马尔可夫模型的语音激活检测算法[J].计算机应用,2016,36(11):3212-3216. 被引量：4
9张起浩,将少国,赵鹏.HMM算法语音识别控制机械手的系统设计[J].单片机与嵌入式系统应用,2019,19(10):82-85. 被引量：4
10刘畅,魏忠诚,张春华,王巍,赵继军.基于隐马尔可夫模型的步态识别算法[J].计算机工程与设计,2019,40(12):3487-3493. 被引量：5

引证文献2

1黄清,方木云.一种基于HMM算法改进的语音识别系统[J].重庆工商大学学报（自然科学版）,2022,39(5):56-61. 被引量：13
2冯林,罗茂才,彭尉,严亮,孙涛.基于B/S模式的在线口语训练系统的设计与实现[J].计算机工程与应用,2003,39(29):228-230. 被引量：3

二级引证文献16

1谢异,左春.基于口语学习的语言平台设计与实现[J].计算机工程与设计,2006,27(9):1689-1690. 被引量：1
2刘伟,陈志刚.语音识别在G-TELP考试平台中的应用[J].电脑与信息技术,2007,15(1):43-45.
3纪培.“外语说长法”在自拍视频中运用的口语训练模式探究[J].湖北函授大学学报,2017,30(19):187-189.
4涂琼引,成南.基于语音识别的英语翻译终端设计[J].自动化与仪器仪表,2023(1):251-256. 被引量：1
5李丹.基于SpeechBrain的语音识别在语音问答中的应用探索[J].科技视界,2023(2):34-39. 被引量：1
6刘邦桂.基于人工智能的网络空间安全防御策略研究[J].软件工程,2023,26(4):52-56. 被引量：8
7王蕊.基于BP神经网络的机器翻译自动化评判模型设计[J].自动化与仪器仪表,2023(4):15-19. 被引量：1
8王雨佳.基于语音合成的机器翻译机器人设计[J].自动化与仪器仪表,2023(4):185-190. 被引量：2
9王泽雨,王国靖.基于改进卷积神经网络的声音事件分类模型[J].信息技术与信息化,2023(5):181-184. 被引量：1
10韩向阳.基于卷积神经网络的中文语音识别人机交互系统设计[J].自动化与仪器仪表,2023(7):201-204. 被引量：4

1聂飞.马尔柯夫过程与会议控制台的可靠性评估[J].电子产品可靠性与环境试验,1990(5):10-15.
2董远,胡光锐.语音识别的非线性方法[J].电路与系统学报,1998,3(1):52-58. 被引量：4
3用示波器对数字器件进行特性描述[J].世界电子元器件,1998(5):76-77.
4董梅琴,陆慧林.移动通信信道频率选择性衰落特性描述[J].电讯工程,1991(1):29-40.
5庄磊.数字功放中的低通滤波器[J].电声技术,2004,28(12):74-75. 被引量：3
6李新颖,陆科进.基于HMM模型的语音拨号系统设计[J].微型机与应用,2003,22(4):52-53.
7刘光亮,胡正名.最小化符号错误率译码的矩阵算法[J].通信学报,1998,19(8):1-6. 被引量：2
8吁宁,伍文峰.基于马尔柯夫过程的机动作战决策优化[J].四川兵工学报,2007,28(6):37-38.
9声韵：数字化[J].世界广播电视,2010,24(11):42-42.
10雅文.语音识别新天地[J].中国计算机用户,2000(5):29-29.

北京航空航天大学学报

2001年第2期

浏览历史

内容加载中请稍等...

汉语语音识别的平滑声韵基元HMM算法被引量：2

参考文献1

二级参考文献3

共引文献2

同被引文献10

引证文献2

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

汉语语音识别的平滑声韵基元HMM算法 被引量：2

参考文献1

二级参考文献3

共引文献2

同被引文献10

引证文献2

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

汉语语音识别的平滑声韵基元HMM算法被引量：2