期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
结合大语言模型的教科书语步识别及应用
1
作者 王润欣 李宁 《北京信息科技大学学报(自然科学版)》 2024年第4期71-80,共10页
为解决纸质图书存在的无法快速定位知识概念、从字面难以把握教科书写作的逻辑结构和难以建立知识间的关联等问题,提出了一种结合大语言模型的教科书语步识别方法。首先,设计教科书语步结构,构建教科书语步分类数据集;然后,利用生成式... 为解决纸质图书存在的无法快速定位知识概念、从字面难以把握教科书写作的逻辑结构和难以建立知识间的关联等问题,提出了一种结合大语言模型的教科书语步识别方法。首先,设计教科书语步结构,构建教科书语步分类数据集;然后,利用生成式大语言模型分别对稀缺语步和无明显特征语步进行语料生成和特征增强;最后,结合语步识别数据集和增强后语步数据,微调教科书语步识别初始模型,得到结合大语言模型的教科书语步识别模型。实验结果表明,与初始模型BERT-wwm-ext相比,经过大语言模型辅助的语步识别模型总体准确率提升5.06百分点,达到95.44%,Macro-F1值提升2.54百分点,达到93.51%。利用该语步识别模型自动构建了教科书知识图谱及书后索引,较清晰地展现了教科书写作的逻辑结构。 展开更多
关键词 数字教材 语步识别 言模型 知识图谱 书后索引
在线阅读 下载PDF
基金项目摘要的语步识别系统设计与实现 被引量:9
2
作者 赵旸 张智雄 +1 位作者 刘欢 李婕 《情报理论与实践》 CSSCI 北大核心 2022年第8期162-168,共7页
[目的/意义]设计中文基金项目摘要的语步识别系统,实现基金项目摘要的自动结构化输出。[方法/过程]重点解决语步识别系统建设中的3个关键技术难点:(1)基于规则和深度学习方法构建基金项目摘要语步识别训练数据集,为系统提供数据支撑;(2... [目的/意义]设计中文基金项目摘要的语步识别系统,实现基金项目摘要的自动结构化输出。[方法/过程]重点解决语步识别系统建设中的3个关键技术难点:(1)基于规则和深度学习方法构建基金项目摘要语步识别训练数据集,为系统提供数据支撑;(2)通过嵌入摘要中句子的位置信息来改进模型输入,实现语步结构的精准识别;(3)设计开放接口以实现系统的开放调用。[结果/结论]该系统已初步实现基金项目摘要的自动语步识别功能,并部署在多个平台网站上供科研人员试用。[局限]该系统目前只提供了基金项目申请摘要的语步识别服务,未来还将面向结题摘要进行语步分析与建设。 展开更多
关键词 语步识别 语步识别系统 基金项目摘要 嵌入位置特征 数据集构建
原文传递
面向学术检索系统的摘要语步识别效果测评与应用策略研究 被引量:1
3
作者 孟旭阳 白海燕 《情报杂志》 CSSCI 北大核心 2023年第11期161-167,共7页
[研究目的]面向科技论文摘要的语步自动识别研究成果越来越多,为推动该学术研究成果的加速应用,以更好的支撑知识化服务建设,以NSTL(国家科技图书文献中心)为例,开展模型效果测评与应用研究。[研究方法]针对NSTL实际应用条件、场景、数... [研究目的]面向科技论文摘要的语步自动识别研究成果越来越多,为推动该学术研究成果的加速应用,以更好的支撑知识化服务建设,以NSTL(国家科技图书文献中心)为例,开展模型效果测评与应用研究。[研究方法]针对NSTL实际应用条件、场景、数据特点等,制定多维度的测评方案,对目前较为先进的基于BERT深度学习模型的语步识别效果进行多维度测评和结果分析,并给出面向应用的策略和建议。[研究结论]测评分析结果表明,语步识别模型的准确率及在不同学科领域上的通用性有待进一步优化提升。在准确率上,不同语步的识别准确率存在较大差异,具体表现为方法和结论语步的识别效果较优,背景、目的和结果语步的识别效果较差。在面向学术检索系统的实际应用中,语步识别成果有较多的应用场景,可为学术搜索或知识化服务平台提供多层次的深度服务。 展开更多
关键词 学术检索系统 科技论文 摘要 语步识别 深度学习 国家科技图书文献中心
在线阅读 下载PDF
融合ChatGPT数据增强的学术论文语步识别方法研究 被引量:2
4
作者 许钦亚 薛秋红 +2 位作者 钱力 刘会洲 刘鲁静 《图书情报工作》 CSSCI 北大核心 2024年第17期84-94,共11页
[目的/意义]学术论文的语步结构对读者深入理解内容和快速定位关键信息具有重要作用,本文旨在研究全文语步识别方法,以快速获取学术论文的核心内容,推动智能化的语义检索。[方法/过程]在当前语步识别方法方面的相关研究的基础上,提出一... [目的/意义]学术论文的语步结构对读者深入理解内容和快速定位关键信息具有重要作用,本文旨在研究全文语步识别方法,以快速获取学术论文的核心内容,推动智能化的语义检索。[方法/过程]在当前语步识别方法方面的相关研究的基础上,提出一种融合ChatGPT数据增强和预训练语言模型的细粒度语步识别模型SciBERT-HAMI模型。该模型利用原始文本,通过ChatGPT大模型进行语料扩充,以增加训练数据的多样性和数量;使用分层神经网络模型学习论文的“词—句—章节”语义特征表示,以捕捉不同层次的语义信息;将SciBERT的词嵌入表示作为输入,并使用分层神经网络模型与FocalLoss损失函数进行细粒度语步识别模型训练。[结果/结论]结合ChatGPT数据增强策略,SciBERT-HAMI-DA模型在CoreSC和AZ数据集的F1值分别为0.731和0.741,对比实验表明,所提模型在论文全文细粒度语步识别任务上性能得到有效提升,并通过消融实验验证数据增强和模型组件的有效性。融合预训练语言模型与ChatGPT数据增强,全文语步识别模型的预测效果得到有效提升,有助于推动学术研究的自动化与智能化。 展开更多
关键词 语步识别 ChatGPT 数据增强 SciBERT
原文传递
中文学术论文全文语步识别研究 被引量:4
5
作者 杜新玉 李宁 《数据分析与知识发现》 EI CSSCI CSCD 北大核心 2024年第2期74-83,共10页
【目的】针对学术论文语步识别相关研究存在只能处理少量的语步、语步识别粒度较粗、缺少公开的语步分类数据集等问题,研究学术论文的全文语步识别,为机器自动理解论文内容提供基础。【方法】基于BERT模型,采用多阶段微调的方式构建学... 【目的】针对学术论文语步识别相关研究存在只能处理少量的语步、语步识别粒度较粗、缺少公开的语步分类数据集等问题,研究学术论文的全文语步识别,为机器自动理解论文内容提供基础。【方法】基于BERT模型,采用多阶段微调的方式构建学术论文语步分类数据集,并提出一种融入章节标题文本的语步识别方法,在细粒度层面实现中文学术论文全文语步的识别。【结果】实验结果表明,学术论文语步的22类别分类任务中,RoBERTa-wwm-ext模型总体准确率提升0.031,达到0.909,Micro-F1值提升0.022,达到0.837。【局限】所构建的学术论文语步分类数据集尚存在少量数据不平衡问题,所提方法受限于论文质量,这些问题得到改进后,模型对语步的识别能力应能得到进一步提高。【结论】所提方法取得了较高的语步识别准确率,研究成果可用于学术论文的自动理解、论文质量评价及论文语义检索等领域,对科技文献的有效利用具有重要作用。 展开更多
关键词 学术论文理解 语步识别 预训练模型
原文传递
基于语步识别的科技文献结构化自动综合工具构建 被引量:2
6
作者 刘熠 张智雄 +1 位作者 王宇飞 李雪思 《数据分析与知识发现》 EI CSSCI CSCD 北大核心 2024年第2期65-73,共9页
【目的】借鉴文献综合(Synthesis)的思想,利用人工智能技术构建科技文献结构化自动综合工具,以结构化的形式自动梳理文献集的研究脉络与研究骨架,揭示文献集的要点与看点。【方法】提出了一种基于语步识别的科技文献结构化自动综合工具... 【目的】借鉴文献综合(Synthesis)的思想,利用人工智能技术构建科技文献结构化自动综合工具,以结构化的形式自动梳理文献集的研究脉络与研究骨架,揭示文献集的要点与看点。【方法】提出了一种基于语步识别的科技文献结构化自动综合工具的建设思路,即通过语步识别与研究问题、研究方法、研究进展短语抽取,自动揭示单篇文献中的关键知识内容;通过层次聚类与类簇标签生成,实现多篇文献的知识整理归纳;通过设计树形综合结构,指导结构化综合结果输出。【结果】研发了结构化自动综合工具,能够自动综合文献集内容,并按照“研究问题-研究方法-研究进展”的树形结构揭示文献集的研究脉络与骨架。【局限】由于聚类技术的限制,目前还存在聚类准确率不足、聚类簇个数难以确定等问题,影响了自动综合效果。【结论】基于语步识别技术,构建面向实际应用的结构化自动综合工具,支持文献检索、自动综合、结果循证等功能,验证了基于语步识别实现结构化自动综合思路的可行性和有效性。 展开更多
关键词 科技文献 语步识别 结构化自动综合 抽取 层次聚类 类簇标签生成
原文传递
大语言模型在摘要结构功能识别上的应用研究
7
作者 翁梦娟 王晓光 +2 位作者 桂恒 刘文斌 石佛波 《现代情报》 北大核心 2025年第4期36-48,共13页
结构功能识别这一判别式任务上的可行性及应用潜力,为基于生成式大语言模型构建高质量结构化数据提供参考。[方法/过程]采用单轮、零样本提示的方式基于GPT 4.0、Qwen 1.5和ERNIE 4.0实现结构功能分类任务,根据领域、语种、时间划分构... 结构功能识别这一判别式任务上的可行性及应用潜力,为基于生成式大语言模型构建高质量结构化数据提供参考。[方法/过程]采用单轮、零样本提示的方式基于GPT 4.0、Qwen 1.5和ERNIE 4.0实现结构功能分类任务,根据领域、语种、时间划分构建不同的测试子集,以P、R、F1和准确率为评估指标,以单因素方差分析结果衡量不同测试子集间的性能差异程度。[结果/结论]大语言模型的输出不完全与提示中的约束一致,说明使用生成式模型解决判别式任务时,输出结果存在不可控风险,但符合提示的输出比例较高说明使用生成式模型解决判别式任务基本可用。不同大语言模型的性能表现不同,GPT 4.0和ERNIE 4.0在不同结构功能类别样本的所有指标、不同领域样本的R和准确率、不同语种样本的P和F1均表现出0.01水平显著性,其他则无显著差异。未来基于生成式大语言模型解决判别式任务时应着重关注输出结果的可控性、领域自适应等问题。 展开更多
关键词 结构功能识别 生成式大模型 言模型 结构化摘要 语步识别
在线阅读 下载PDF
不同深度学习模型的科技论文摘要语步识别效果对比研究 被引量:24
8
作者 张智雄 刘欢 +2 位作者 丁良萍 吴朋民 于改红 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第12期1-9,共9页
【目的】探究不同深度学习模型的科技论文摘要语步识别效果,并分析识别效果差异原因。【方法】构建大规模的科技论文结构化摘要语料库,选择10000和50000两种样本量的训练集,以传统机器学习方法SVM作为对比基准,引入多种深度学习方法(包... 【目的】探究不同深度学习模型的科技论文摘要语步识别效果,并分析识别效果差异原因。【方法】构建大规模的科技论文结构化摘要语料库,选择10000和50000两种样本量的训练集,以传统机器学习方法SVM作为对比基准,引入多种深度学习方法(包括DNN、LSTM、Attention-BiLSTM等神经网络模型),开展语步识别实验,并对实验结果进行对比分析。【结果】Attention-BiLSTM方法在两种样本量下的实验中都取得最好的识别效果,50000样本量下F1值达0.9375;SVM方法的识别效果意外好于DNN、LSTM两种深度学习方法;但是,样本量从10000增加到50000时,SVM方法的识别效果提升最小(F1值提升0.0125),LSTM方法效果提升最大(F1值提升0.1125)。【局限】由于该领域尚未有公开的通用语料,主要以笔者收集的结构化论文摘要作为训练和测试语料,因此本文的研究结果在与他人比较时有一定的局限性。【结论】双向LSTM网络结构和注意力机制能够显著提升深度学习模型的语步识别效果;深度学习方法在大规模训练集下更能体现其优越性。 展开更多
关键词 深度学习 神经网络 语步识别 支持向量机
原文传递
科学论文全文语步自动识别研究 被引量:10
9
作者 欧石燕 陈嘉文 《现代情报》 CSSCI 2021年第11期3-11,共9页
[目的/意义]科学论文的语步结构对于读者理解论文内容、快速定位特定信息具有重要作用。[方法/过程]本文对化学领域科学论文的语步自动识别方法进行了探索,比较了基于文本分类和序列标注两种解决模式以及机器学习和深度学习两种技术的... [目的/意义]科学论文的语步结构对于读者理解论文内容、快速定位特定信息具有重要作用。[方法/过程]本文对化学领域科学论文的语步自动识别方法进行了探索,比较了基于文本分类和序列标注两种解决模式以及机器学习和深度学习两种技术的多种语步识别模型的效果,并在此基础上提出了将深度学习预训练模型BERT与传统机器学习分类算法深度森林相结合的混合模型。[结果/结论]实验结果表明,文本分类模式的语步识别效果要优于序列标注模式;传统机器学习技术和深度学习技术的语步识别效果总体相近;通过将两者进行结合的混合模型可以获得更好的语步识别效果,在整篇论文7个语步类别上的宏平均F1值达到73%。 展开更多
关键词 科学论文 语步识别 机器学习 深度学习
在线阅读 下载PDF
项目申请书摘要文本的语步识别语料构建 被引量:2
10
作者 赵旸 张智雄 李婕 《图书情报工作》 CSSCI 北大核心 2022年第21期97-106,共10页
[目的/意义]自动识别项目申请书摘要中的科学要素,对于揭示科技项目中的科学知识具有重要的研究意义。这些科学要素的识别依赖于结构化项目摘要文本,然而目前结构化项目摘要语料资源匮乏,严重制约着相关研究的进一步发展。拟构建项目申... [目的/意义]自动识别项目申请书摘要中的科学要素,对于揭示科技项目中的科学知识具有重要的研究意义。这些科学要素的识别依赖于结构化项目摘要文本,然而目前结构化项目摘要语料资源匮乏,严重制约着相关研究的进一步发展。拟构建项目申请书摘要文本的语步语料集,为相关研究提供数据支撑。[方法/过程]首先将项目摘要内容归纳为背景及问题、目标及任务、方法内容、价值意义4种语步类型,总结每个语步结构中出现的标志性特征并制定语步标注规范;其次相继利用基于规则和基于深度学习的方法辅助人工进行项目摘要的语步结构标注,并对每轮标注后的语料进行质量评估。[结果/结论]两种方法共计标注近25000条语句,语料标注的一致性系数达到0.9839,表明该语料集基本能够区分项目摘要内的不同语步结构,初步达到了语料库建设的基本要求。 展开更多
关键词 语步识别 项目申请摘要文本 料集构建 迭代标注
原文传递
科技文献内容语义识别研究综述 被引量:8
11
作者 黄红 陈翀 张婧莹 《情报学报》 CSSCI CSCD 北大核心 2022年第9期991-1002,共12页
科技文献内容的语义识别是将蕴含在文本中的科研要素显式地揭示出来。它属于细粒度文本挖掘,是获取和利用知识的基础。本文梳理科技文献内容的语义识别相关研究,为后续研究提供参考。首先概括现有的文献内容语义标注模型,然后围绕章节... 科技文献内容的语义识别是将蕴含在文本中的科研要素显式地揭示出来。它属于细粒度文本挖掘,是获取和利用知识的基础。本文梳理科技文献内容的语义识别相关研究,为后续研究提供参考。首先概括现有的文献内容语义标注模型,然后围绕章节、句子、词汇三种识别粒度,梳理科技文献内容语义识别问题的研究发展,总结识别方法、评测手段以及典型应用,并据此提出现存问题及未来发展方向。本文探讨了五个方面的问题:(1)人们关注文献内容中哪些语义类型;(2)选取什么粒度的文本单元作为识别对象;(3)识别方法分为哪些类型;(4)如何评测识别结果;(5)语义识别有哪些典型应用。本文发现目前还存在语义类型标准不一、优质文献数据集欠缺、研究关注点不平衡、识别方法存在局限等问题,需要在后续研究中探寻解决方法。 展开更多
关键词 科技文献内容挖掘 义类型 章节结构功能识别 语步识别 词汇识别
在线阅读 下载PDF
多模态语步分析:以微信科普文为例
12
作者 周婷 《东莞理工学院学报》 2023年第4期78-87,共10页
本文采用Kress和van Leeuwen视觉语法中的组篇功能,以及Martinec和Salway的图文逻辑语义关系,提出了多模态语步分析方法,即自上而下的语步识别和自下而上的语步实现。本文具体研究了语篇语步结构如何由信息值、凸显性以及框架等多模态... 本文采用Kress和van Leeuwen视觉语法中的组篇功能,以及Martinec和Salway的图文逻辑语义关系,提出了多模态语步分析方法,即自上而下的语步识别和自下而上的语步实现。本文具体研究了语篇语步结构如何由信息值、凸显性以及框架等多模态资源识别;以及语言和其他模态资源如何通过详述、增强以及延伸关系共同实现语步。本文将信息值重新定义为宏主位/述位;宏主位构成语义信息的起始点,与上一语篇片段区分。宏主位/述位,凸显性以及框架三者共同区分不同的信息结构,揭示交流目的转变,帮助识别具有不同交际目的的语步。融媒体时代下,Martinec和Salway的图文逻辑语义关系可扩展为语言与非语言符号间的逻辑语义关系,这些关系具有复杂性和重叠性特征。最后,以微信公众号“丁香医生”发布的70篇新冠肺炎科普文为例,验证此多模态语步分析方法的实用性。 展开更多
关键词 语步识别 实现 视觉 逻辑义关系 科普
在线阅读 下载PDF
英汉双语富媒体知识图谱构建工程研究——以CNS英文期刊为例
13
作者 韦向峰 缪建明 +1 位作者 张全 袁毅 《情报工程》 2023年第5期84-96,共13页
[目的/意义]研究自动构建英汉双语富媒体知识图谱的方法和过程,为跨语言多模态知识图谱的自动构建提供借鉴参考,对及时获取最新英文科研成果、科技情报监测等具有重要意义。[方法/过程]采用自顶向下和自底向上相结合的方法,先从顶层设... [目的/意义]研究自动构建英汉双语富媒体知识图谱的方法和过程,为跨语言多模态知识图谱的自动构建提供借鉴参考,对及时获取最新英文科研成果、科技情报监测等具有重要意义。[方法/过程]采用自顶向下和自底向上相结合的方法,先从顶层设计要抽取的主要实体、属性和关系,从底层非结构化文本数据进行分析抽取细粒度的实体和属性,对有歧义实体和跨语言实体进行实体对齐,对跨媒体的实体进行实体链接,用图数据库实现知识图谱的存储及应用。[局限]未来需进一步提高细粒度实体的抽取正确率,对音视频媒体进行特征提取和内容自动识别。[结果/结论]以CNS(Cell、Nature、Science)等英文科技期刊网站为例,通过数据抓取、实体抽取、属性抽取、知识融合、跨媒体链接等过程,实现了英汉双语富媒体知识图谱的构建、存储和可视化展示。 展开更多
关键词 富媒体 知识图谱 实体抽取 实体对齐 语步识别
在线阅读 下载PDF
影响支持向量机模型语步自动识别效果的因素研究 被引量:13
14
作者 丁良萍 张智雄 刘欢 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第11期16-23,共8页
【目的】探讨在基于支持向量机(SVM)模型的科技论文摘要自动语步识别过程中,训练样本的规模、N元词(N-gram)的N取值、停用词以及词频加权方式等特征对识别效果的影响。【方法】从72万余篇科技论文结构化摘要中,抽取出总计110多万条已标... 【目的】探讨在基于支持向量机(SVM)模型的科技论文摘要自动语步识别过程中,训练样本的规模、N元词(N-gram)的N取值、停用词以及词频加权方式等特征对识别效果的影响。【方法】从72万余篇科技论文结构化摘要中,抽取出总计110多万条已标注好的语步为实验数据,构建SVM模型进行语步识别实验。采用控制变量方法,基于单一变量原则,通过改变训练样本量、N-gram的N取值、是否去除停用词、词频加权方式,对比分析这些特征变化对语步识别效果的影响。【结果】训练样本数量为60万条语步、N元词的N取值为[1,2]、不去除停用词、词频加权方式采用TF-IDF时模型识别效果最好,为93.50%。【局限】主要以笔者收集的结构化论文摘要为训练和测试语料,未与其他人的结果比较。【结论】训练样本规模以及一些精细的特征对传统机器学习模型的效果有重要影响,使用者在实践中需要根据具体情况进行精细的特征选取。 展开更多
关键词 语步识别 支持向量机 结构化摘要
原文传递
领域双语数据增强的学术文本摘要结构识别研究 被引量:6
15
作者 刘江峰 冯钰童 +2 位作者 刘浏 沈思 王东波 《数据分析与知识发现》 CSSCI CSCD 北大核心 2023年第8期105-118,共14页
【目的】准确把握社会科学学术文献的核心内容,提升文献摘要的语步结构识别效果。【方法】使用预训练语言模型在多种图书情报领域核心期刊的双语摘要数据上进行实验,提出一种分别在模型的预训练、微调、模型输出层使用领域数据进行增强... 【目的】准确把握社会科学学术文献的核心内容,提升文献摘要的语步结构识别效果。【方法】使用预训练语言模型在多种图书情报领域核心期刊的双语摘要数据上进行实验,提出一种分别在模型的预训练、微调、模型输出层使用领域数据进行增强学习的方法。【结果】充分利用领域双语数据进行增强预训练、微调以及融合双语句子分类概率能够在单期刊数据上将摘要结构识别的F1值提升约1~2、1、0.5~1个百分点。【局限】限于计算资源,未在跨语言预训练模型上进行领域数据的继续预训练并测试性能。【结论】研究充分利用学术文献中的双语资源,有效提升了摘要语步结构识别效果,对快速了解文献内容、促进科学交流具有一定意义。 展开更多
关键词 数据增强 预训练模型 语步识别 概率融合
原文传递
基于混合深度学习模型的科技文献自动综述模型构建研究 被引量:6
16
作者 马浩 崔运鹏 《情报理论与实践》 CSSCI 北大核心 2021年第9期176-182,168,共8页
[目的/意义]在大数据时代,如何高效地进行科技文献知识组织与服务已成为图情领域的研究热点。因此,开展科技文献综述自动生成模型研究具有重要意义。[方法/过程]文章中,综述的自动构建分为两步:首先基于语步理论对输入文本的句子按语步... [目的/意义]在大数据时代,如何高效地进行科技文献知识组织与服务已成为图情领域的研究热点。因此,开展科技文献综述自动生成模型研究具有重要意义。[方法/过程]文章中,综述的自动构建分为两步:首先基于语步理论对输入文本的句子按语步类别进行识别与抽取,然后以各类语步的句子集为输入通过生成模型进行综述生成。研究分别基于SciBERT深度学习模型和Transformer网络构建了语步识别模型和综述文本生成模型。[结果/结论]语步抽取模型整体识别效果评价F1值达到87.12%,生成模型的生成效果与TextRank模型和BiLSTM模型相比在ROUGE-1、ROUGE-2和ROUGE-L三项评价指标上分别提高了4.5%、2.9%和3.3%。研究完成了科研文献综述自动生成任务的整体模型构建与实现。 展开更多
关键词 科技文献 自动综述 语步识别 深度学习模型 SciBERT
原文传递
COMPARISON OFEMA-SYNCHRONIZED AND STAND-ALONE SPEECH BASED ON SPEECH RECOGNITION
17
作者 FANG Qiang 《中国语音学报》 2023年第2期167-176,共10页
Synchronized acoustic-articulatory data is the basis of various applications,such as exploring the fundamental mechanisms of speech production,acoustic to articulatory inversion(AAI),and articulatory to acoustic mappi... Synchronized acoustic-articulatory data is the basis of various applications,such as exploring the fundamental mechanisms of speech production,acoustic to articulatory inversion(AAI),and articulatory to acoustic mapping(AAM).Numerous studies have been conducted based on the synchronized ElectroMagnetic Articulograhy(EMA)data and acoustic data.Hence,it is necessary to make clear whether the EMA-synchronized speech and stand-alone speech are different,and if so,how it affects the performance of the applications that are based on synchronized acoustic-articulatory data.In this study,we compare the differences between EMA-synchronized speech and stand-alone speech from the aspect of speech recognition based on the data of a male speaker.It is found that:i)the general error rate of EMA-synchronized speech is much higher than that of stand-alone speech;ii)apical vowels and apical/blade consonants are more significantly affected by the presence of EMA coils;iii)parts of vowel and consonant tokens are confused with the sounds who use the same articulator or the articulators nearby,such as confusion among apical vowels and confusion among apical and blade consonants;iv)the confusion of labial tokens demonstrates a diverse pattern. 展开更多
关键词 EMA-synchronized speech Stand-alone speech Speech recognition Confusion matrix
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部