期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
面向主动降噪验证的AD/DA测试平台设计
1
作者 郭振伟 周静雷 +1 位作者 付中华 李腾飞 《计算机测量与控制》 2025年第2期44-53,共10页
针对主动降噪算法程序调试难度大、相关滤波器结构可视化程度差、硬件平台底噪大的问题,设计了一款底噪小、程序可视化程度高、搭建模型简单的AD/DA硬件验证平台(AKM平台);相比较传统的ANC调试过程,AKM平台在降噪算法验证过程中不需要... 针对主动降噪算法程序调试难度大、相关滤波器结构可视化程度差、硬件平台底噪大的问题,设计了一款底噪小、程序可视化程度高、搭建模型简单的AD/DA硬件验证平台(AKM平台);相比较传统的ANC调试过程,AKM平台在降噪算法验证过程中不需要编写程序,仅需要基于Simulink HDL模块化工具搭建仿真模型,生成Bitstream文件,将其烧录到验证平台即可实现算法的验证,有效避免了开发者编写和调试程序过程的复杂性,最终实现了一款操作高效的ANC算法验证平台;实验结果表明,该系统在输入激励信号为1 kHz 100 mV,采样率为32 kHz 24 bit的条件下,测试输出信号的总谐波失真为0.005217%;信噪比为98.295 dB;在不输入任何激励信号的情况下,系统平台的底噪为5.360μVrms。 展开更多
关键词 ANC验证 ADDA平台 无需编程 总谐波失真小 低失真 底噪小
在线阅读 下载PDF
基于时域波形的半监督端到端虚假语音检测方法 被引量:2
2
作者 方昕 黄泽鑫 +6 位作者 张聿晗 高天 潘嘉 付中华 高建清 刘俊华 邹亮 《计算机应用》 CSCD 北大核心 2023年第1期227-231,共5页
现代语音合成和音色转换系统产生的虚假语音对自动说话人识别系统构成了严重威胁。大多数现有的虚假语音检测系统对在训练中已知的攻击类型表现良好,但对实际应用中的未知攻击类型检测效果显著降低。因此,结合最近提出的双路径Res2Net(D... 现代语音合成和音色转换系统产生的虚假语音对自动说话人识别系统构成了严重威胁。大多数现有的虚假语音检测系统对在训练中已知的攻击类型表现良好,但对实际应用中的未知攻击类型检测效果显著降低。因此,结合最近提出的双路径Res2Net(DP-Res2Net),提出一种基于时域波形的半监督端到端虚假语音检测方法。首先,为了解决训练数据集和测试数据集两者数据分布差异较大的问题,采用半监督学习进行领域迁移;然后,对于特征工程,直接将时域采样点输入DP-Res2Net中,增加局部的多尺度信息,并充分利用音频片段之间的依赖性;最后,输入特征经过浅层卷积模块、特征融合模块、全局平均池化模块得到嵌入张量,用来判别自然语音与虚假伪造语音。在公开可用的ASVspoof 2021 Speech Deep Fake评估集和VCC数据集上评估了所提出方法的性能,实验结果表明它的等错误率(EER)为19.97%,与官方最优基线系统相比降低了10.8%。基于时域波形的半监督端到端检测虚假语音检测方法面对未知攻击时是有效的,且具有更高的泛化能力。 展开更多
关键词 虚假语音检测 语音合成 音色转换 说话人识别 时域 半监督学习
在线阅读 下载PDF
基于交叉注意力机制的波束形成后置滤波网络
3
作者 刘卓 付中华 《计算机应用研究》 CSCD 北大核心 2022年第5期1444-1448,共5页
针对经典后置滤波器存在的对非平稳噪声抑制效果较差且存在目标语音失真的问题,提出一种基于交叉注意力机制的后置滤波网络,使用基于门控循环单元的编解码器作为网络框架,并在编解码器组之间添加残差连接;使用基于伽马通域的波束输出信... 针对经典后置滤波器存在的对非平稳噪声抑制效果较差且存在目标语音失真的问题,提出一种基于交叉注意力机制的后置滤波网络,使用基于门控循环单元的编解码器作为网络框架,并在编解码器组之间添加残差连接;使用基于伽马通域的波束输出信号与噪声参考信号功率谱的子带增益作为双特征输入;使用特征交叉的多头归一化点积注意力捕获序列输入的长距离依赖信息并进行特征融合。实验结果表明,该算法在不同信扰比和噪声条件下的语音质量和可懂度指标均优于基线系统,具有较强的鲁棒性;在对非平稳噪声具有较好抑制效果的同时,能最小化目标语音的失真;且相较端到端的深度学习方法,具有轻量化和低时延的特点,能满足实际工程应用的需求。 展开更多
关键词 波束形成 后置滤波 交叉注意力机制 编解码器 伽马通域 特征融合
在线阅读 下载PDF
鲁棒的特定人语音分离算法
4
作者 张新 付中华 《计算机应用研究》 CSCD 北大核心 2022年第6期1749-1752,1759,共5页
特定人语音分离算法是指从包含多种说话人同时讲话场景的混合语音中,通过一个特征向量的引导来分离出特定说话人的语音。特征向量的获取通常有两种方式,一种是使用一组自定义的正交独热(one-hot)向量,该方法可以在训练过程中达到更好的... 特定人语音分离算法是指从包含多种说话人同时讲话场景的混合语音中,通过一个特征向量的引导来分离出特定说话人的语音。特征向量的获取通常有两种方式,一种是使用一组自定义的正交独热(one-hot)向量,该方法可以在训练过程中达到更好的训练效果,但是无法处理训练过程中未见过的说话人;另一种方法是使用一个分类网络自适应地生成具有说话人特征的嵌入式向量(embedding),该做法会因为分类网络的误差而损失一部分训练效果,但是可以在集外说话人的样本上取得较好的泛化效果。为了解决在特定人语音分离算法用单独使用one-hot或embedding作为特征向量存在的不足之处,提出了一种鲁棒的特定人语音分离方法,通过在训练过程中交替地使用one-hot向量和embedding作为目标说话人的身份特征向量,将one-hot和embedding映射到公共空间中,可以在保证训练效果的同时,增强对集外说话人的泛化能力。实验结果表明,在使用了这种混合训练方法之后,对于测试集中的集外说话人分离效果上SDR提升超过了10 dB。 展开更多
关键词 语音分离 说话人识别 嵌入式向量 独热向量
在线阅读 下载PDF
基于韵律特征辅助的端到端语音识别方法
5
作者 刘聪 万根顺 +1 位作者 高建清 付中华 《计算机应用》 CSCD 北大核心 2023年第2期380-384,共5页
针对传统的语音识别系统采用数据驱动并利用语言模型来决策最优的解码路径,导致在部分场景下的解码结果存在明显的音对字错的问题,提出一种基于韵律特征辅助的端到端语音识别方法,利用语音中的韵律信息辅助增强正确汉字组合在语言模型... 针对传统的语音识别系统采用数据驱动并利用语言模型来决策最优的解码路径,导致在部分场景下的解码结果存在明显的音对字错的问题,提出一种基于韵律特征辅助的端到端语音识别方法,利用语音中的韵律信息辅助增强正确汉字组合在语言模型中的概率。在基于注意力机制的编码-解码语音识别框架的基础上,首先利用注意力机制的系数分布提取发音间隔、发音能量等韵律特征;然后将韵律特征与解码端结合,从而显著提升了发音相同或相近、语义歧义情况下的语音识别准确率。实验结果表明,该方法在1000 h及10000 h级别的语音识别任务上分别较端到端语音识别基线方法在准确率上相对提升了5.2%和5.0%,进一步改善了语音识别结果的可懂度。 展开更多
关键词 语音识别 端到端 语义歧义 注意力机制 韵律特征
在线阅读 下载PDF
头盔式主动降噪耳机前馈降噪设计
6
作者 李腾飞 万蕊 《电子测量技术》 北大核心 2023年第19期21-28,共8页
针对头盔式主动降噪耳机设计过程中所面临的前馈控制器目标传递函数影响因素复杂,人工头声学测试不准确的问题,提出了基于真人佩戴测试数据设计前馈控制器的方法。分析了主动降噪耳机的原理,弥补了现有理论的不足,设计实验验证了噪声源... 针对头盔式主动降噪耳机设计过程中所面临的前馈控制器目标传递函数影响因素复杂,人工头声学测试不准确的问题,提出了基于真人佩戴测试数据设计前馈控制器的方法。分析了主动降噪耳机的原理,弥补了现有理论的不足,设计实验验证了噪声源方向、耳垫弹性、反馈控制器、绷带弹性、头盔、测试装置对前馈控制器目标传递函数的影响,给出了设计建议。基于真人佩戴测试数据设计了前馈控制器,并测试了其与反馈控制器配合时的混合降噪效果,其中真人佩戴时测试平均降噪量可达21.3 dB,人工头佩戴时仅有10.7 dB,证明了基于真人佩戴测试设计的耳机降噪效果更好,人工头佩戴不能很好的反应真人佩戴的情况。 展开更多
关键词 头盔式主动降噪耳机 前馈控制器 主动降噪 真人佩戴测试 混合降噪
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部