期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
融合AP聚类算法和宽度学习系统的分布外硬盘故障预测
1
作者 王屹阳 刘发贵 +1 位作者 彭玲霞 钟国祥 《计算机科学》 CSCD 北大核心 2024年第8期63-74,共12页
硬盘是云数据中心最主要的存储设备,硬盘故障预测是保障数据安全的重要手段。但是,硬盘的故障与健康样本之间存在着极端的数量不平衡问题,这会导致模型偏差;此外,不同型号的硬盘数据分布存在一定的差异,在特定硬盘数据上训练的模型往往... 硬盘是云数据中心最主要的存储设备,硬盘故障预测是保障数据安全的重要手段。但是,硬盘的故障与健康样本之间存在着极端的数量不平衡问题,这会导致模型偏差;此外,不同型号的硬盘数据分布存在一定的差异,在特定硬盘数据上训练的模型往往不适用于其他硬盘。对于这两个问题,文中提出了一种融合AP聚类算法和宽度学习系统的分布外硬盘故障预测方法。针对样本不平衡问题,文中使用AP聚类算法对硬盘故障出现前一阶段的样本集进行聚类,将与故障样本处于同一聚类簇的样本扩充为故障样本。针对不同型号硬盘分布存在差异的问题,文中结合流形正则化框架和宽度学习系统来学习硬盘数据的低维结构,提高模型对未知分布数据的泛化能力。实验结果表明,在AP聚类算法重采样的样本集上,相较于用于对比的重采样方法得到的样本集,多种故障预测方法的F1_Score取得了平均0.2的提升。此外,在分布外硬盘故障预测任务上,所提模型的F1_Score相比对比方法提升了0.1~0.2。 展开更多
关键词 硬盘故障预测 类不平衡 分布外泛化 AP聚类 宽度学习系统 流形学习
在线阅读 下载PDF
基于AE-LSTM的多目标硬盘故障预测方法
2
作者 王东清 张炳会 +5 位作者 彭继阳 艾山彬 王兵 姚藩益 芦飞 张凯 《计算机测量与控制》 2024年第5期66-71,79,共7页
硬盘故障预测是在故障发生前发出预警,避免数据丢失或服务中断,提高数据中心的可靠性和安全性;然而,大多数故障预测模型将硬盘故障问题转化为二分类任务,忽略了硬盘故障是渐变过程的,并且缺乏故障诊断功能;因此,提出了一种基于AE-LSTM... 硬盘故障预测是在故障发生前发出预警,避免数据丢失或服务中断,提高数据中心的可靠性和安全性;然而,大多数故障预测模型将硬盘故障问题转化为二分类任务,忽略了硬盘故障是渐变过程的,并且缺乏故障诊断功能;因此,提出了一种基于AE-LSTM的硬盘故障预测框架,实现多目标任务:硬盘健康状态分级、硬盘剩余使用寿命预测、硬盘故障诊断;采用回归决策树模型智能化对硬盘健康状态进行标记,并通过AE-LSTM模型提取鲁棒的隐藏变量,构建剩余使用寿命预测模型和硬盘健康状态分级模块,根据AE模块的输入输出差异进行硬盘故障诊断;在Backblaze公开数据集上,对比了RF、LSTM和AE-LSTM三种算法,实验结果证实了AE-LSTM算法在多目标硬盘故障预测中的有效性和优势。 展开更多
关键词 硬盘故障预测 硬盘故障诊断 剩余使用寿命 长短期记忆单元 自编码器
在线阅读 下载PDF
一种硬盘故障预测的非监督对抗学习方法 被引量:8
3
作者 姜少彬 杜春 +2 位作者 陈浩 李军 伍江江 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2020年第2期118-125,共8页
为解决传统监督学习方法在不均衡数据集异常检测上易出现过拟合的问题,提出一种非监督对抗学习方法用于硬盘故障预测。该方法使用长短期记忆神经网络和全连接层设计了一种可进行二次编码的自编码器,只需使用正常样本进行训练,通过减小... 为解决传统监督学习方法在不均衡数据集异常检测上易出现过拟合的问题,提出一种非监督对抗学习方法用于硬盘故障预测。该方法使用长短期记忆神经网络和全连接层设计了一种可进行二次编码的自编码器,只需使用正常样本进行训练,通过减小样本重构误差和潜在向量之间的距离,使模型学习正常样本的数据分布,从而提高了模型的泛化能力。模型中还引入生成式对抗网络增强非监督学习的效果。在多个数据集上的对比实验显示,该方法对异常样本的召回率和精确度都高于传统的监督学习和半监督学习分类器,泛化能力更强。所以,该非监督对抗学习方法在硬盘故障预测上是有效的。 展开更多
关键词 异常检测 硬盘故障预测 生成式对抗网络 非监督学习
在线阅读 下载PDF
基于改进XGBoost算法的硬盘故障预测 被引量:2
4
作者 陈守贤 陈梅 李晖 《计算机仿真》 北大核心 2022年第5期427-431,454,共6页
硬盘是数据中心故障频率最高的物理设备,针对硬盘故障预测中正负样本不平衡导致预测精度低的问题,提出了一种基于改进的XGBoost算法的硬盘故障预测模型。针对不平衡样本对模型损失函数添加了一个调制系数,使模型能够适应不平衡的数据集... 硬盘是数据中心故障频率最高的物理设备,针对硬盘故障预测中正负样本不平衡导致预测精度低的问题,提出了一种基于改进的XGBoost算法的硬盘故障预测模型。针对不平衡样本对模型损失函数添加了一个调制系数,使模型能够适应不平衡的数据集,通过减少易分类样本的权重,从而使模型在训练时更专注于难分类的样本;使用基于信息增益比率对硬盘数据进行特征选择,实现硬盘的故障预测。为了验证改进XGBoost算法的有效性,使用两个公开的真实数据集进行实验,结果表明,改进的XGBoost算法具有更高的预测精度和泛化能力。 展开更多
关键词 不平衡数据 硬盘故障预测 特征选择
在线阅读 下载PDF
硬盘故障预测模型在大型数据中心环境下的验证 被引量:7
5
作者 贾宇晗 李静 +4 位作者 贾润莹 李忠伟 王刚 刘晓光 肖康 《计算机研究与发展》 EI CSCD 北大核心 2015年第S2期54-61,共8页
随着互联网的发展、存储规模的骤增,大型数据中心硬盘频繁损坏导致的数据丢失给企业带来的损失已成为不可忽视的重大问题.以往基于硬盘SMART(self-monitoring,analysis and reporting technology)属性建立的包括应用统计学和机器学习等... 随着互联网的发展、存储规模的骤增,大型数据中心硬盘频繁损坏导致的数据丢失给企业带来的损失已成为不可忽视的重大问题.以往基于硬盘SMART(self-monitoring,analysis and reporting technology)属性建立的包括应用统计学和机器学习等方法在内的各种硬盘故障预测模型,虽然取得了较好的效果,但其数据采集及处理等方面均存在不足之处.基于某真实的互联网大型数据中心环境,提取SMART属性数据,并提出了一种基于神经网络权值矩阵的方法,结合Rank Sum秩和检验、RAT反向安排测试、Z-Score评分3种无参统计学方法,对属性进行选择,应用CART决策树及BP神经网络2种机器学习方法,建立硬盘故障预测模型.实验表明描述的2种硬盘故障预测模型均具有很好的性能,这是机器学习算法在实际应用场景下很好的实践.此外,通过实验以及对实验的分析和解释,得出一些有益的结论,这为下一步的研究工作奠定了基础. 展开更多
关键词 硬盘故障预测 决策树 BP神经网络 SMART 大型数据中心
在线阅读 下载PDF
基于XGBoost算法的硬盘故障预测 被引量:1
6
作者 王陶 吴鑫 +1 位作者 李君 李顺 《数字技术与应用》 2021年第2期123-126,共4页
随着网络化和信息化的发展,以及大数据的盛行,硬盘故障将对数据中心产生越来越大的影响,所以对硬盘剩余寿命进行预测显得尤为重要。硬盘剩余寿命预测能有效降低数据丢失率,有效弥补因硬盘故障带来的各种损失。本文把XGBoost算法引入到... 随着网络化和信息化的发展,以及大数据的盛行,硬盘故障将对数据中心产生越来越大的影响,所以对硬盘剩余寿命进行预测显得尤为重要。硬盘剩余寿命预测能有效降低数据丢失率,有效弥补因硬盘故障带来的各种损失。本文把XGBoost算法引入到硬盘故障预测中,分别在大样本和小样本下与决策树、随机森林、GBDT算法进行对比实验,得到XGBoost模型对硬盘故障的预测效果最好,有助于XGBoost算法在硬盘故障预测中的推广应用。 展开更多
关键词 决策树 随机森林 GBDT XGBoost 硬盘故障预测
在线阅读 下载PDF
不平衡数据集下基于时序和高阶特征的硬盘故障预测 被引量:1
7
作者 刘悦 《电子技术与软件工程》 2021年第19期152-156,共5页
本文针对数据中正负样本极度不平衡、不同指标数据的形态差异较大的问题,提出了不平衡数据集下基于时序和高阶特征的硬盘故障预测模型。从多个维度构建具备丰富表征能力的特征,包括在指标和指标之间做特征交叉,构建高阶特征;在时间维度... 本文针对数据中正负样本极度不平衡、不同指标数据的形态差异较大的问题,提出了不平衡数据集下基于时序和高阶特征的硬盘故障预测模型。从多个维度构建具备丰富表征能力的特征,包括在指标和指标之间做特征交叉,构建高阶特征;在时间维度上,构建多尺度的时序特征。针对正负样本不平衡问题,引入Focalloss和欠采样策略以提高正样本、难样本的权重。采用两阶段训练的策略,以避免因模型参数过多导致的过拟合问题。在公开的真实数据集上验证了模型的有效性。 展开更多
关键词 高阶特征 时序特征 欠采样 硬盘故障预测
在线阅读 下载PDF
基于Fcn-Attention的硬盘故障预测方法
8
作者 张佳惠 《现代信息科技》 2021年第24期48-50,共3页
保证大型数据中心服务的可靠性越来越重要,硬盘是大型数据中心中故障率最高的组件。如果能够预测硬盘的故障情况就可以提前对数据进行保护和隔离,避免造成重大损失。然而当前的预测器不能同时有效地提取时间序列的长短期依赖关系,学习... 保证大型数据中心服务的可靠性越来越重要,硬盘是大型数据中心中故障率最高的组件。如果能够预测硬盘的故障情况就可以提前对数据进行保护和隔离,避免造成重大损失。然而当前的预测器不能同时有效地提取时间序列的长短期依赖关系,学习样本的有效特征。文章提出了基于注意机制的全卷积注意力模型,该模型能够解决长短期依赖问题,有效识别故障模式。最后在采集的SMART日志的数据集中证明了模型的有效性。 展开更多
关键词 硬盘故障预测 异常检测 注意力机制 全卷积网络
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部