期刊文献+
共找到540篇文章
< 1 2 27 >
每页显示 20 50 100
基于卷积神经网络和多标签分类的复杂结构损伤诊断
1
作者 李书进 杨繁繁 张远进 《建筑科学与工程学报》 北大核心 2025年第1期101-111,共11页
为研究复杂空间框架节点损伤识别问题,利用多标签分类的优势,构建了多标签单输出和多标签多输出两种卷积神经网络模型,用于框架结构节点损伤位置的判断和损伤程度诊断。针对复杂结构损伤位置判断时工况多、识别准确率不高等问题,提出了... 为研究复杂空间框架节点损伤识别问题,利用多标签分类的优势,构建了多标签单输出和多标签多输出两种卷积神经网络模型,用于框架结构节点损伤位置的判断和损伤程度诊断。针对复杂结构损伤位置判断时工况多、识别准确率不高等问题,提出了一种能对结构进行分层(或分区)处理并同时完成损伤诊断的多标签多输出卷积神经网络模型。分别构建了适用于多标签分类的浅层、深层和深层残差多输出卷积神经网络模型,并对其泛化性能进行了研究。结果表明:提出的模型具有较高的损伤诊断准确率和一定的抗噪能力,特别是经过分层(分区)处理后的多标签多输出网络模型更具高效性,有更快的收敛速度和更高的诊断准确率;利用多标签多输出残差卷积神经网络模型可以从训练工况中提取到足够多的损伤信息,在面对未经过学习的工况时也能较准确判断各节点的损伤等级。 展开更多
关键词 损伤诊断 卷积神经网络 标签分类 框架结构 深度学习
在线阅读 下载PDF
面向长尾分布的民众诉求层次多标签分类模型
2
作者 刘昕 杨大伟 +3 位作者 邵长恒 王海文 庞铭江 李艳茹 《计算机应用》 北大核心 2025年第1期82-89,共8页
接诉即办是实现社会治理智能化、提高人民满意度的重要举措,其中精准分析民众诉求智能匹配工单处理部门,实现诉求的快速响应、高效办理尤为关键;然而,民众诉求数据中的诉求描述不清晰、类别混淆且比例失衡会导致诉求类别分析困难,影响... 接诉即办是实现社会治理智能化、提高人民满意度的重要举措,其中精准分析民众诉求智能匹配工单处理部门,实现诉求的快速响应、高效办理尤为关键;然而,民众诉求数据中的诉求描述不清晰、类别混淆且比例失衡会导致诉求类别分析困难,影响了智能派单的效率与准确性。针对上述问题,提出编解码器结构的诉求层次多标签分类模型(HMCHotline)。首先,在文本编码器中引入诉求领域中的细粒度关键词先验知识以抑制噪声干扰,并融合诉求的时空信息提高语义特征的判别力;其次,利用标签层次结构生成具有层次与语义感知的标签嵌入,并构建基于Transformer模型的标签解码器,利用诉求的语义特征和标签嵌入进行标签解码;同时,在标签的层级依赖关系基础上引入动态标签表策略限制标签的解码范围,以解决标签不一致问题;最后,采用Softmax分组策略将样本数量相近的标签类别分为同组进行Softmax操作,从而缓解由标签长尾分布导致的分类准确率低的问题。在Hotline、RCV1(Reuters Corpus VolumeⅠ)-v2和WOS(Web Of Science)数据集上的实验结果表明,相较于层次感知的标签语义匹配网络(HiMatch),所提模型的Micro-F1分别提高了1.65、2.06和0.43个百分点,验证了模型的有效性。 展开更多
关键词 接诉即办 智能派单 层次多标签分类 先验知识 长尾分布 编解码器
在线阅读 下载PDF
基于多模态的缺陷绝缘子图像的多标签分类
3
作者 周景 王满意 田兆星 《高电压技术》 北大核心 2025年第2期642-651,共10页
对巡检图像中绝缘子缺陷准确分类是输电线路自动巡检领域中的关键技术之一。针对传统深度学习的分类方法对文本信息利用不够充分以及绝缘子图像分类标签较为单一的问题,该文首次提出了一种基于多模态的缺陷绝缘子图像的多标签分类方法... 对巡检图像中绝缘子缺陷准确分类是输电线路自动巡检领域中的关键技术之一。针对传统深度学习的分类方法对文本信息利用不够充分以及绝缘子图像分类标签较为单一的问题,该文首次提出了一种基于多模态的缺陷绝缘子图像的多标签分类方法。首先,采用一种多模态联合数据增强方法,实现了绝缘子图像和标签文本间跨模态的数据增强。然后,使用Vision Transformer网络提取图像的特征信息和BERT网络提取标签文本的特征信息,充分利用图像和标签文本的特征信息,从不同模态获取全面的信息,提高了网络的分类能力。最后,通过对比学习的方式将图像和文本的特征信息关联,增强网络分类的可靠性的同时,又为分类结果提供了良好的可解释性。实验结果表明,该方法的分类总体准确率达到93.87%,在同一数据集中对比其他模型,分类性能具有明显优势,为多模态技术在电网领域的应用提供了较好的基础。 展开更多
关键词 绝缘子图像 标签分类 多模态 对比学习 数据增强
在线阅读 下载PDF
基于标签感知变分自编码器的多标签分类
4
作者 孙宏健 徐鹏宇 +2 位作者 刘冰 景丽萍 于剑 《计算机科学与探索》 北大核心 2025年第3期714-723,共10页
随着互联网的兴起,各式各样的数据急速增长,如何高效地利用这些样本数据成为数据挖掘领域的重要问题。多标签分类任务作为机器学习与数据挖掘领域的重要任务,旨在为样本标注多个标签类别。目前的方法大多仅对特征分支进行嵌入表示学习,... 随着互联网的兴起,各式各样的数据急速增长,如何高效地利用这些样本数据成为数据挖掘领域的重要问题。多标签分类任务作为机器学习与数据挖掘领域的重要任务,旨在为样本标注多个标签类别。目前的方法大多仅对特征分支进行嵌入表示学习,并未考虑到特征和标签之间的语义关联性,缺乏对特征嵌入空间的有效约束,从而导致学习到的特征嵌入针对性不足。在标签相关性学习方面,现有的大多数方法主要关注低阶标签相关性,在面对复杂的实际标签场景时,多个标签之间的高阶相关性学习不足的问题变得更为突出。为解决上述问题,从嵌入表示学习和标签相关性学习出发,提出了一种基于标签感知变分自编码器的多标签分类方法。针对嵌入表示学习,提出使用特征和标签双流变分自编码器同时学习和对齐特征和标签的嵌入空间,对特征嵌入空间添加标签引导来增强特征嵌入。采用基于标签语义的交叉注意力机制,将特定标签信息加入到特征嵌入中,最终获得标签感知后的判别性特征嵌入。针对标签相关性学习,采用共享解码器中的多层自注意力机制,充分融合多个标签的相似性信息,通过不同标签间的共现交互,学习到标签高阶相关性表示并用于交叉感知特征嵌入。在四个不同领域的数据集上得到的实验结果表明,提出的方法能够有效增强特征和标签嵌入,并充分捕获标签之间高阶相关性信息用于多标签分类任务,通过与多个最先进算法在多个评价指标上进行比较分析,验证了提出的方法在性能上的显著优越性。 展开更多
关键词 标签分类 嵌入空间学习 变分自动编码器 TRANSFORMER 标签相关性
在线阅读 下载PDF
探索信息资源管理的跨学科性:基于多标签分类的分析
5
作者 刘清民 王芳 《情报学报》 北大核心 2025年第1期75-92,共18页
当代社会面临着复杂、多元且相互关联的问题,传统学科的单一视角难以全面解决。跨学科研究通过整合多学科的知识、理论、方法和技术,为解决复杂问题提供了新的路径。为揭示信息资源管理研究的跨学科趋势和特点,本文以中图分类号为学科... 当代社会面临着复杂、多元且相互关联的问题,传统学科的单一视角难以全面解决。跨学科研究通过整合多学科的知识、理论、方法和技术,为解决复杂问题提供了新的路径。为揭示信息资源管理研究的跨学科趋势和特点,本文以中图分类号为学科分类依据,针对文献作者自标注存在的中图分类号不准确的问题,采用大语言模型进行数据增强优化,并基于BERT-CNN算法对中图分类号进行修正,对信息资源管理领域的文献进行系统分析。在跨学科多样性方面,构建了包容性与渗透性两个新指标,衡量学科间的知识吸纳能力与扩散影响力。利用中图分类号对高频持续性交叉研究主题和递增新兴热点主题进行挖掘分析,揭示了健康信息学、数字人文等新兴领域的快速发展以及学科间的持续交叉研究。研究结果表明,信息资源管理领域呈现丰富多元的学科格局,各学科之间联系紧密、相互影响,其发展是多学科交叉融合的结果。跨学科研究在信息资源管理领域发挥着重要作用并且呈现增长趋势,指导性二级学科的设置在理论基础、实践应用和跨学科合作方面都体现了一定的合理性和有效性。 展开更多
关键词 标签分类 跨学科 信息资源管理 中图分类
在线阅读 下载PDF
基于临床疗效评价的中医药论文多标签分类研究
6
作者 高曼 童元元 +5 位作者 刘扬 孙美玲 张雨琪 赵芳华 李彦文 李海燕 《中国数字医学》 2025年第2期14-20,共7页
目的:利用深度学习和多标签分类技术,对论文题录信息实施多学科分类,促进实现中医药领域文献自动分类。方法:选取《2022年度中医医院学科(专科)学术影响力评价研究报告》21万余条中文论文题录信息作为样本,采用BERT、CNN、BiLSTM、CNN-B... 目的:利用深度学习和多标签分类技术,对论文题录信息实施多学科分类,促进实现中医药领域文献自动分类。方法:选取《2022年度中医医院学科(专科)学术影响力评价研究报告》21万余条中文论文题录信息作为样本,采用BERT、CNN、BiLSTM、CNN-BiLSTM等深度学习方法,构建多标签分类模型进行实验,并对比不同模型和特征组合的实验效果。结果:中医药学术论文的多学科自动分类效果最好的模型为BiLSTM和CNN,最佳特征组合为题名+关键词+摘要,两个模型Macro-F1值分别达95.81%和95.06%。结论:当前深度学习模型多样,受到训练数据、任务特性等方面影响,不同模型在相同任务中表现效果会有所差异,因此实施文本分类时可采用多种不同类型的深度学习模型进行训练对比结果,从而筛选最佳模型与特征组合。 展开更多
关键词 中医药 临床疗效评价 标签分类 文本分类 深度学习
在线阅读 下载PDF
细粒度南海数字资源多标签分类算法的比较与应用
7
作者 彭玉芳 郑研 杨海平 《情报杂志》 北大核心 2025年第1期180-186,197,共8页
[研究目的]面对海量多模态的南海数字资源,数据分类在构建南海证据链关联模型中起着至关重要的作用。通过系统地分类和整理数据,可以揭示资源之间的潜在关联,为后续的数据处理和分析提供坚实依据。[研究方法]应用文献计量工具COOC,全面... [研究目的]面对海量多模态的南海数字资源,数据分类在构建南海证据链关联模型中起着至关重要的作用。通过系统地分类和整理数据,可以揭示资源之间的潜在关联,为后续的数据处理和分析提供坚实依据。[研究方法]应用文献计量工具COOC,全面描述南海数字资源和数据分类的研究现状。从409篇南海数字资料中抽取21174条细粒度南海数字资源,分别应用并比较RNN、CNN、DNN、LSTM、Bi-LSTM、Attention、BERT模型的细粒度多标签分类效果。最后,使用知识图谱技术实现细粒度南海数字资源的分类检索和可视化。[研究结果/结论]基于BERT的细粒度南海数字资源多标签分类效果最佳。同时,知识图谱能够直观展示南海数字资源的分类关系。该研究为后续的南海数字资源管理和多标签分类应用提供了坚实的理论支持和技术保障。 展开更多
关键词 南海数字资源 标签分类 细粒度 深度学习 知识图谱
在线阅读 下载PDF
基于XGBoost特征筛选和决策树多标签分类的配电网拓扑辨识方法
8
作者 张丽 王建 +3 位作者 许守东 张敏春 李邦源 唐一恒 《电网与清洁能源》 北大核心 2025年第2期10-21,共12页
针对配电网中开关状态遥信丢失或延迟导致配电网拓扑不准的问题,通过引入遥测信息进行开关状态的补全与校正,提出了一种基于极限梯度提升算法(extreme gradient boosting,XGBoost)的特征筛选和决策树多标签分类的配电网拓扑辨识方法。利... 针对配电网中开关状态遥信丢失或延迟导致配电网拓扑不准的问题,通过引入遥测信息进行开关状态的补全与校正,提出了一种基于极限梯度提升算法(extreme gradient boosting,XGBoost)的特征筛选和决策树多标签分类的配电网拓扑辨识方法。利用XGBoost筛选出最相关、最具信息量的量测数据,在保证拓扑辨识准确度的同时大幅度减轻模型计算负担;以筛选的遥测特征和原始遥信开关状态数据为输入变量,以配电网开关状态为输出,构造了基于决策树的多标签分类模型,用于配电网拓扑辨识。在改进的IEEE 34节点配电系统中进行了算例测试。仿真结果表明:所提方法适用于多分布式电源接入的配电网拓扑辨识,具有很好的抗遥测噪声干扰能力;相比其他同类算法,所提方法的辨识准确性更高、计算耗时更少。 展开更多
关键词 配电网 拓扑辨识 特征筛选 标签分类
在线阅读 下载PDF
基于沙漏阶梯残差模型的胸部影像多标签分类
9
作者 方俊泽 邢素霞 +2 位作者 郭正 李珂娴 王瑜 《中国医学物理学杂志》 2025年第3期360-368,共9页
提出一种基于沙漏阶梯残差模型(SLRN),用于胸部影像疾病的多标签分类,提高临床诊断的准确性。SLRN的设计包括3个关键模块,首先采用沙漏卷积模块同时提取通道间信息与空间信息;然后使用阶梯自注意力模块,通过移位操作实现不同窗口划分,... 提出一种基于沙漏阶梯残差模型(SLRN),用于胸部影像疾病的多标签分类,提高临床诊断的准确性。SLRN的设计包括3个关键模块,首先采用沙漏卷积模块同时提取通道间信息与空间信息;然后使用阶梯自注意力模块,通过移位操作实现不同窗口划分,扩大感受野,提取并融合多尺度特征;在多标签分类阶段,使用多头残差注意力,捕捉到不同标签之间的相关性和特征间的重要性,通过调整不同特征的权重实现更精准的分类。本研究在印第安纳大学收集的胸部X光数据集(IU X-Ray)和美国国立卫生研究院收集并公开的胸部X射线数据集(Chest X-Ray14)中进行验证,实验证明SLRN结合了卷积神经网络和视觉转换器的优点,可以捕捉影像中的局部特征和全局关联,更好地处理长距离依赖关系,辅助医生进行临床诊断。 展开更多
关键词 胸部影像 标签分类 卷积神经网络 视觉转换器 沙漏卷积
在线阅读 下载PDF
辅以大众分类法的多标签分类深度学习信息架构
10
作者 张静怡 王宇晓 《现代信息科技》 2025年第1期104-109,共6页
随着移动互联网的迅速发展,信息量和信息维度急速增长,如何组建起便于用户查找和理解信息的信息架构成为亟待优化的问题。文章重点探讨信息分类技术中的大众分类法对信息架构的积极作用,在此基础上,利用深度学习算法在处理多标签分类问... 随着移动互联网的迅速发展,信息量和信息维度急速增长,如何组建起便于用户查找和理解信息的信息架构成为亟待优化的问题。文章重点探讨信息分类技术中的大众分类法对信息架构的积极作用,在此基础上,利用深度学习算法在处理多标签分类问题时可对多标签间的相关性和依赖关系进行自动建模的特点,提出一种辅以大众分类算法的多标签分类深度学习信息架构,提高了信息分类关联的准确度和相关度,为用户提供了便利。 展开更多
关键词 大众分类 深度学习 信息架构 标签分类
在线阅读 下载PDF
RFID通信技术在电子标签分类识别系统设计中的应用研究
11
作者 王庭良 《长江信息通信》 2025年第1期142-145,共4页
无线射频识别(RFID)技术是一种利用无线电波进行识别和跟踪物体的技术。它由标签、读写器和中间件三部分组成。标签存储有关物体的信息;读写器用于读取和写入标签信息;中间件作为软件层,管理数据流和读写器之间的通信。在现代物流、零... 无线射频识别(RFID)技术是一种利用无线电波进行识别和跟踪物体的技术。它由标签、读写器和中间件三部分组成。标签存储有关物体的信息;读写器用于读取和写入标签信息;中间件作为软件层,管理数据流和读写器之间的通信。在现代物流、零售和安全等领域,电子标签的分类识别系统的设计变得尤为重要,设计需求包括高效的识别速度、广泛的读取范围和强大的数据安全性。文章围绕RFID通信技术在电子标签分类识别系统设计中的应用进行了深入研究,详细阐述了系统架构设计、核心模块设计、系统实现的技术细节,同时对系统测试结果进行了分析,为RFID技术在电子标签识别系统的应用提供了新的理论和实践依据。 展开更多
关键词 RFID通信技术 电子标签分类 识别系统 应用
在线阅读 下载PDF
基于灰色关联分析的火力发电企业电力营销信息多标签分类研究
12
作者 钟懿敏 《电气时代》 2025年第3期39-41,45,共4页
由于电力营销信息的变化频繁且数据维度高,难以捕捉到稳定的模式,其复杂性和多样性增加了分类难度,导致在进行分类时ROC曲线表现较差。因此,研究提出基于灰色关联分析的火力发电企业电力营销信息多标签分类方法。首先,确定包含多个关键... 由于电力营销信息的变化频繁且数据维度高,难以捕捉到稳定的模式,其复杂性和多样性增加了分类难度,导致在进行分类时ROC曲线表现较差。因此,研究提出基于灰色关联分析的火力发电企业电力营销信息多标签分类方法。首先,确定包含多个关键维度的电力营销信息参考数列,并对参数进行标准化处理。其次,在因电力营销信息变化频繁而导致数据样本有限的情况下,利用灰色关联分析方法对于小样本数据具有较好的适应性的特点,计算各企业电力营销信息与参考数列之间的关联程度。最后,基于计算结果,设定分类阈值并分配特定的分类标签,采用动态调整方法优化分类值,实现对火力发电企业电力营销信息的多标签分类。实验结果表明,该方法能够有效处理电力营销数据,ROC曲线更加贴近理想状态,说明该方法具有更高的分类准确度和更强的泛化能力。 展开更多
关键词 标签分类 灰色关联分析 ROC曲线 标准化处理 火力发电 小样本数据 电力营销 关键维度
在线阅读 下载PDF
电力系统营销客户标签分类方法优化
13
作者 李正仁 卢建生 +2 位作者 朱银龙 贾勇 李俊午 《中国新技术新产品》 2025年第3期130-132,共3页
本文对电力系统营销中客户标签分类方法的优化问题进行研究。在电力系统营销中,准确的客户标签分类对提高营销效果至关重要。然而,传统的分类方法面对较大范围面积和增加的节点数量时存在定位误差增加和管理成本上升的问题。为了解决这... 本文对电力系统营销中客户标签分类方法的优化问题进行研究。在电力系统营销中,准确的客户标签分类对提高营销效果至关重要。然而,传统的分类方法面对较大范围面积和增加的节点数量时存在定位误差增加和管理成本上升的问题。为了解决这些问题,本文提出了一种改进的算法,通过联合改进的蜘蛛猴算法和其他方法,实现了客户标签的准确定位和分类,同时降低了节点数量和管理成本。试验结果表明,本文的算法在不同范围面积下具有较低的定位误差,能够更好地满足电力系统营销的需求。 展开更多
关键词 DV-HOP算法 电力系统营销 客户标签分类
在线阅读 下载PDF
融合知识图谱的影视视频标签分类算法研究
14
作者 蒋洪迅 张琳 孙彩虹 《计算机科学与探索》 CSCD 北大核心 2024年第1期161-174,共14页
鉴于视频感知方式的多样性,视频标签层级分类算法均从视觉和文本模态入手,训练联合模型共同推断视频内容。但现有研究通常只适用于粗粒度的分类,针对影视剧名的分类,则需要更加细粒度的识别。提出了一个融合知识图谱的影视视频标签分类... 鉴于视频感知方式的多样性,视频标签层级分类算法均从视觉和文本模态入手,训练联合模型共同推断视频内容。但现有研究通常只适用于粗粒度的分类,针对影视剧名的分类,则需要更加细粒度的识别。提出了一个融合知识图谱的影视视频标签分类算法。首先,使用了基于大规模通用数据训练的多模态预训练模型提取了视觉和文本的特征,训练了一个多任务的视频标签预测模型,得到视频的类型、题材和实体三级标签;通过在多任务学习网络中引入相似性任务提高分类模型训练的难度,使得同类样本特征更加紧密,且更好地表达样本差异。其次,对于最细粒度的实体标签,提出了一个局部注意力头扩展的实体纠错模型,引入外部知识图谱的共现信息对前置模型的预测结果做修正,得到更准确的实体标签预测结果。采集豆瓣的半结构化数据构建了影视知识图谱并对影视视频标签分类模型进行了实证研究。视频标签分类的实验结果表明,首先,基于多任务网络结构,在训练分类任务时加入交叉熵损失函数和相似性损失函数对模型进行共同约束优化了特征表达,在类型、题材、实体标签的Top-1分类准确率上分别提升了3.70%、3.35%和16.57%;其次,针对前置模型的困难样本提出的全局-局部注意力机制模型,在引入了知识图谱信息之后,实体标签的Top-1分类准确率从38.7%提升到45.6%。该研究是使用图片-文本对数据在多模态视频标签分类问题上新的尝试,为少量数据样本情况下的短视频标签分类提供了新的研究思路。 展开更多
关键词 知识图谱 视频标签分类 多模态内容理解 实体纠错
在线阅读 下载PDF
基于稀疏正则化的加权叠加集成多标签分类
15
作者 肖建芳 刘缅芳 《计算机应用与软件》 北大核心 2024年第5期286-297,共12页
为了充分挖掘成对标签的相关性以及分类器权重与分类器选择之间的关系,提出一种基于稀疏正则化的加权叠加集成多标签分类方法。提出一个稀疏正则化的加权叠加集成模型,以便于多标签分类器的选择和集成成员的构建。利用分类器权值和标签... 为了充分挖掘成对标签的相关性以及分类器权重与分类器选择之间的关系,提出一种基于稀疏正则化的加权叠加集成多标签分类方法。提出一个稀疏正则化的加权叠加集成模型,以便于多标签分类器的选择和集成成员的构建。利用分类器权值和标签相关性来提高分类性能。进一步提出基于加速近端梯度和块坐标下降技术的优化算法来有效地获得最优解。在多个数据集上的实验结果表明,该方法能够有效实现较高精度的多标签分类。 展开更多
关键词 标签分类 相关性 稀疏正则化 权值
在线阅读 下载PDF
基于Stacking模型的学术论文多标签分类系统构建
16
作者 刘爱琴 郭少鹏 《国家图书馆学刊》 CSSCI 北大核心 2024年第2期96-104,共9页
学术论文高质量多标签自动分类是推动学术研究发展的关键程序之一。本研究利用Stacking模型将随机森林、支持向量机、极限树、极端梯度提升和神经网络五个分类器融合为一个异质集成分类器,并利用基于问题转换思想的多二分类模型将该分... 学术论文高质量多标签自动分类是推动学术研究发展的关键程序之一。本研究利用Stacking模型将随机森林、支持向量机、极限树、极端梯度提升和神经网络五个分类器融合为一个异质集成分类器,并利用基于问题转换思想的多二分类模型将该分类器应用于学术论文多标签分类。根据学术论文的特点,依次实现了与之配套的论文特征提取模块、TF-IDF加权模块、数据预处理模块,最终构建成一个面向学术论文的多标签分类系统。仿真实验验证了本研究构建的学术论文多标签分类系统在处理学术论文多标签分类问题时,较传统的单模型分类器或同质集成模型分类器在泛化能力、稳定性与准确率方面都有一定程度的提升。图9。参考文献21。 展开更多
关键词 论文分类 Stacking模型 标签分类 多二分类模型
在线阅读 下载PDF
基于深度学习的中文短文本多标签分类模型
17
作者 曹珍 郭攀峰 《计算机与数字工程》 2024年第6期1809-1814,共6页
目前,中文短文本因其长度短、结构多样和缺乏上下文等特点,常规多标签分类算法无法对其有效区分。针对以上问题,论文提出一种基于深度学习的中文短文本多标签分类模型CRC-MHA。CRC-MHA模型在文本表示层摒弃常规使用Word2vec进行静态词... 目前,中文短文本因其长度短、结构多样和缺乏上下文等特点,常规多标签分类算法无法对其有效区分。针对以上问题,论文提出一种基于深度学习的中文短文本多标签分类模型CRC-MHA。CRC-MHA模型在文本表示层摒弃常规使用Word2vec进行静态词嵌入的方式,采用BERT对输入句子进行动态词嵌入,借助海量预训练文本的优势更好地表征文本的上下文语义,同时在特征提取层设计了一种结合CNN、RCNN和多头自注意力机制的并行特征提取策略,加强捕捉文本内部的关键特征来提升多标签分类效果。实验结果表明,CRC-MHA模型在评价指标加权平均F1值上较BERT模型提高1.95%,较BERT-CNN模型提高0.42%,较BERT-RCNN模型提高0.34%,验证了模型的有效性。 展开更多
关键词 标签分类 中文短文本 动态词嵌入 特征提取
在线阅读 下载PDF
基于多模态语义增强的水下视频多标签分类网络
18
作者 卢振坤 王粟 李云 《现代计算机》 2024年第14期1-8,17,共9页
光线传播路径在水下环境受到水分子散射和吸收的影响,物体出现模糊、扭曲等现象,导致基于水下视觉的检测精度不高。为提高水下检测精度,利用水下视频包含的视觉模态和音频模态,提出一种基于多模态语义增强的水下视频多标签分类网络(MCNE... 光线传播路径在水下环境受到水分子散射和吸收的影响,物体出现模糊、扭曲等现象,导致基于水下视觉的检测精度不高。为提高水下检测精度,利用水下视频包含的视觉模态和音频模态,提出一种基于多模态语义增强的水下视频多标签分类网络(MCNEMS),通过基于注意力增强的多模态互补编解码生成增强标签的特征表示,引导多标签语义关联。具体而言,构建基于模态语义增强模块,完成多模态之间公共-独立的编解码,用来增强模态之间的共享信息和独立信息,并利用多头注意力机制生成多模态互补特征矩阵,获得增强的水下视频内容表示。为挖掘多标签隐性关联性,设计了基于动态图卷积的图关联学习模块,用于自适应地学习标签语义嵌入。在提出的水下视频多标签分类数据集(UVMCD)上进行实验,仿真结果表明所提模型均具有较好的性能指标。 展开更多
关键词 标签分类 多模态 图卷积 水下视频
在线阅读 下载PDF
类不平衡的公共和标签特定特征多标签分类 被引量:1
19
作者 张海翔 李培培 胡学钢 《计算机技术与发展》 2024年第2期46-52,共7页
多标签分类主要解决实例数据对应多个标签问题,现有多标签方法大多利用所有特征组成的相同数据表示来区分所有标签,由于每个标签自身特点不同,统一的特征不能完全区分标签,给模型训练带来负面作用和时间成本增加,如何利用对每个标签而... 多标签分类主要解决实例数据对应多个标签问题,现有多标签方法大多利用所有特征组成的相同数据表示来区分所有标签,由于每个标签自身特点不同,统一的特征不能完全区分标签,给模型训练带来负面作用和时间成本增加,如何利用对每个标签而言最具有辨别力的特征来提高模型分类性能成为一种难题,此外现实中类不平衡问题同样会导致多标签学习模型的性能下降。基于此,提出一种类不平衡的公共和标签特定特征多标签分类方法。首先,找到种子实例的最近邻居,然后通过插值技术得到合成实例的特征来解决类不平衡问题;其次,为了找出对每个标签最具代表性的特征,引入l1,l2,1正则化约束系数矩阵提取标签的特定特征和公共特征;最后,使用标签相关性实现关联标签的模型输出相似,实例相关性保证关联特征共享对应标签分布信息提高分类性能。实验表明所提方法与其他多标签分类方法相比获得了更好的分类精度。 展开更多
关键词 标签分类 类不平衡 公共特征 标签特定特征 标签相关性
在线阅读 下载PDF
面向投稿选刊的学术论文多标签分类研究 被引量:2
20
作者 江天明 郑国杰 +1 位作者 王晴 曹高辉 《现代情报》 CSSCI 北大核心 2024年第1期48-56,108,共10页
[目的/意义]学术论文投稿中面临期刊选择多样性和拒稿重投问题,研究利用深度学习和多标签分类技术,基于论文题录信息给出多标签的投稿选刊建议。[方法/过程]选取情报学领域8种CSSCI期刊近20年的论文作为样本,采用TextCNN、TextRNN等深... [目的/意义]学术论文投稿中面临期刊选择多样性和拒稿重投问题,研究利用深度学习和多标签分类技术,基于论文题录信息给出多标签的投稿选刊建议。[方法/过程]选取情报学领域8种CSSCI期刊近20年的论文作为样本,采用TextCNN、TextRNN等深度学习模型和预训练语言模型BERT构建多标签分类方法进行实验,并对比不同特征组合和多标签设置策略下的实验效果。[结果/结论]多标签分类能够反映学术论文对不同期刊的适合度,预训练语言模型BERT表现最佳,F1达到68.99%。 展开更多
关键词 投稿选刊 标签分类 深度学习 自然语言处理
在线阅读 下载PDF
上一页 1 2 27 下一页 到第
使用帮助 返回顶部