期刊文献+
共找到31篇文章
< 1 2 >
每页显示 20 50 100
基于XGBoost与SHAP模型的特征分析在PM_(2.5)浓度预测中的应用 被引量:2
1
作者 张士杰 窦燕 《赤峰学院学报(自然科学版)》 2022年第12期10-17,共8页
进一步提升PM_(2.5)浓度预测精度的同时增强模型的可解释性,对深化大气污染防治,助推区域经济高质量发展有一定的现实意义。以空气污染物和气象条件作为特征因子,提出一种基于XGBoost与SHAP的PM_(2.5)浓度预测模型。首先,利用Lasoo对原... 进一步提升PM_(2.5)浓度预测精度的同时增强模型的可解释性,对深化大气污染防治,助推区域经济高质量发展有一定的现实意义。以空气污染物和气象条件作为特征因子,提出一种基于XGBoost与SHAP的PM_(2.5)浓度预测模型。首先,利用Lasoo对原始特征变量数据集进行处理,将处理完的数据作为XGBoost模型的输入进行迭代训练实验,以此获得性能最佳的预测模型。然后,使用SHAP对模型特征进行解释。结果表明,基于XGBoost的PM_(2.5)浓度预测模型在RMSE,MAE和R2三组指标上优于对比模型;综合SHAP、XGBoost和随机森林的特征变量重要性分布结果,识别影响PM_(2.5)浓度的关键因素。 展开更多
关键词 XGBoost模型 PM_(2.5)浓度预测 shap模型 特征分析
在线阅读 下载PDF
融合随机森林与SHAP的恶意加密流量预测模型 被引量:1
2
作者 吴燕 《哈尔滨商业大学学报(自然科学版)》 CAS 2024年第2期167-178,共12页
加密流量保护用户隐私信息的同时也会隐藏恶意行为,尽早发现恶意加密流量是抵御不同网络攻击(如分布拒绝式攻击、窃听、注入攻击等)和保护网络免受入侵的关键手段.传统基于端口、深度包检测等恶意流量检测方法难以对抗代码混淆、重新包... 加密流量保护用户隐私信息的同时也会隐藏恶意行为,尽早发现恶意加密流量是抵御不同网络攻击(如分布拒绝式攻击、窃听、注入攻击等)和保护网络免受入侵的关键手段.传统基于端口、深度包检测等恶意流量检测方法难以对抗代码混淆、重新包装等复杂攻击,而基于机器学习的方法也存在误报率高和决策过程难以理解的问题.为此,提出一种恶意加密流量检测高可解释性模型EPMRS,以弥补现有研究在性能与可解释性上存在的局限性.在数据去重,重编码及特征筛选等数据预处理的基础上,基于随机森林构建恶意加密流量检测模型,并与逻辑回归、KNN、LGBM等10种主流机器学习模型进行5折交叉验证的实验对比;基于SHAP框架从整体模型、核心风险特征交互效应及样本决策过程三个不同的层面,全面增强恶意加密流量检测模型的可解释性.EPMRS在MCCCU数据集的实证结果表明,EPMRS对未知加密恶意流量的检测准确率达到99.996%、误识别率为0.0003%,与已有工作相比,性能指标平均提升了0.287175%~7.513175%;同时,通过可解释性分析识别出了session(会话)、flow_duration(流持续时间)、Goodput(有效吞吐量)等为影响恶意加密流量检测的核心风险因素. 展开更多
关键词 恶意加密流量 网络安全 随机森林 shap模型 可解释性
在线阅读 下载PDF
中国农业新质生产力发展水平测度与影响因素分析——基于XGBoost模型的经验证据
3
作者 吴展 瞿廷鸿 《上海管理科学》 2025年第1期59-66,共8页
发展农业新质生产力对于推动我国农业现代化和实现农业强国战略目标发挥重要作用。为客观量化影响农业新质生产力水平关键因素的非线性效应与重要性,提出一种基于机器学习方法的农业新质生产力发展水平测度和分析框架。利用极端梯度提升... 发展农业新质生产力对于推动我国农业现代化和实现农业强国战略目标发挥重要作用。为客观量化影响农业新质生产力水平关键因素的非线性效应与重要性,提出一种基于机器学习方法的农业新质生产力发展水平测度和分析框架。利用极端梯度提升(XGBoost)算法、SHAP机器学习解释方法和TOPSIS模型测度和分析2012年至2022年中国农业新质生产力发展水平。此外,应用五折交叉验证对机器学习回归模型结果进行稳健性检验。最后采用SHAP模型深入分析影响我国农业新质生产力水平的关键驱动因素,探索促进我国农业新质生产力发展路径。研究结果表明:我国农业新质生产力水平整体呈上升趋势,但总体水平较低;科技创新人才、高新技术产业发展规模和数字经济发展水平是影响我国农业新质生产力发展水平的关键驱动因素,且具有显著的正向效应和非线性特征。 展开更多
关键词 机器学习 shap模型 XGBoost算法 农业新质生产力 驱动因素
在线阅读 下载PDF
融合XGBoost与SHAP的冠心病预测及其特征分析模型 被引量:18
4
作者 陈小昆 左航旭 +1 位作者 廖彬 孙瑞娜 《计算机应用研究》 CSCD 北大核心 2022年第6期1796-1804,共9页
为了解决冠心病诊断模型中性能无法满足临床应用要求、缺乏可解释性的问题,提出一种融合XGBoost与SHAP的冠心病预测及其特征分析模型。在对数据集进行特征工程的基础上,将处理好的数据集输入XGBoost模型进行训练,并且对模型进行优化,进... 为了解决冠心病诊断模型中性能无法满足临床应用要求、缺乏可解释性的问题,提出一种融合XGBoost与SHAP的冠心病预测及其特征分析模型。在对数据集进行特征工程的基础上,将处理好的数据集输入XGBoost模型进行训练,并且对模型进行优化,进一步提高了模型的性能表现;其次,与基于SVM、朴素贝叶斯等六种机器学习模型以及八种主流机器学习模型进行实验对比,参数优化后的XGBoost模型在准确率、特异度、F_(1)值和AUC值四个指标上分别达到0.9942、0.9970、0.9941和0.9998,均优于已有模型;最后引入SHAP框架增强模型可解释性,综合四种模型特征重要性排序结果,识别出影响冠心病的重要因素,为医生作出正确的诊断提供决策参考。 展开更多
关键词 冠心病预测 XGBoost模型 shap模型 特征分析
在线阅读 下载PDF
基于机器学习和夏普利加法解释(SHAP)模型的饲料原料价格可解释预测 被引量:1
5
作者 吴展 王春晓 《饲料研究》 CAS 北大核心 2023年第23期178-181,共4页
文章旨在评估机器学习模型的性能,提出一种饲料原料价格可解释预测的框架。选取豆粕为饲料产品原材料的代表品种,基于2006年1月至2023年4月的豆粕期货月度结算价数据,采用反向传播(BP)神经网络、梯度提升决策树(GBDT)和极限梯度提升(XGB... 文章旨在评估机器学习模型的性能,提出一种饲料原料价格可解释预测的框架。选取豆粕为饲料产品原材料的代表品种,基于2006年1月至2023年4月的豆粕期货月度结算价数据,采用反向传播(BP)神经网络、梯度提升决策树(GBDT)和极限梯度提升(XGBoost)等3种机器学习算法进行训练测试,使用贝叶斯优化算法调整各模型参数,选择性能最优模型结合SHAP模型解析预测结果。结果显示,贝叶斯优化的极限梯度提升算法(BO-XGBoost)模型的预测性能显著优于其他基准模型,其测试集的平均绝对百分比误差(MAPE)和决定系数(R2)分别为0.03和0.892,模型精度较高;滞后一期豆油期货结算价对豆粕价格具有显著正向影响。研究表明,该模型具有良好的应用前景,可为饲料相关企业管理者决策和有关部门制定政策提供一定参考。 展开更多
关键词 机器学习 shap模型 贝叶斯优化 可解释预测 饲料原料价格
在线阅读 下载PDF
基于CatBoost模型与SHAP分析研究地理环境因子对健康人血尿酸参考值的影响
6
作者 梁向荣 葛淼 +1 位作者 王聪霞 何进伟 《西安交通大学学报(医学版)》 CAS CSCD 北大核心 2023年第4期601-607,共7页
目的探究可能对健康人血尿酸(uric acid,UA)产生影响的地理环境因子并探究全国尺度下UA参考值的变化趋势。方法收集全国565个位点的607905例健康人的UA参考值,运用相关分析法分析25项地理环境因素与UA参考值的相关性,构建CatBoost模型... 目的探究可能对健康人血尿酸(uric acid,UA)产生影响的地理环境因子并探究全国尺度下UA参考值的变化趋势。方法收集全国565个位点的607905例健康人的UA参考值,运用相关分析法分析25项地理环境因素与UA参考值的相关性,构建CatBoost模型并应用SHAP值解释模型,预测全国各县市级的健康人UA参考值,并采用普通克里金绘制全国健康人的UA参考值地理分布图。结果纬度、海拔高度、年平均气温、年平均相对湿度、年降水量、气温年较差、年平均风速、表土粉粒百分率、表土容重、表土石砾含量、表土有机质含量、表土pH、表土(粘土)阳离子交换量、表土(粉土)阳离子交换量、表土盐基饱和度、表土总可交换量、T-CaCO 3、T-CaSO 4、表土碱度、表土盐分这20项指标与全国健康人UA参考值呈现相关。全国健康人UA参考值的空间分布呈现差异性,表现为高海拔地区较高,沿海地区在相近海拔高度下高于内陆地区,中东部低、西南部高的变化趋势。结论本研究为后续近一步研究不同影响因子对UA参考值的作用机制奠定基础。建立CatBoost模型在不同地区使用UA参考值作为高尿酸血症及相关慢性疾病预后因子制定参考标准时提供依据。 展开更多
关键词 高尿酸血症 尿酸(UA) 地理环境 CatBoost shap模型 克里金
在线阅读 下载PDF
基于随机森林和XGBoost算法的2型糖尿病合并高血压分类预测模型应用与比较
7
作者 马勇 孔丹莉 +1 位作者 叶向阳 丁元林 《广东医科大学学报》 2024年第5期523-534,共12页
目的通过对2型糖尿病合并高血压的相关因素分析,构建预测模型。方法选取475例2型糖尿病合并高血压患者为病例组,以同期体检中心505例健康人群为对照组。将最小绝对值收缩和选择算子(LASSO)回归筛选出的特征变量作为随机森林(RF)、极端... 目的通过对2型糖尿病合并高血压的相关因素分析,构建预测模型。方法选取475例2型糖尿病合并高血压患者为病例组,以同期体检中心505例健康人群为对照组。将最小绝对值收缩和选择算子(LASSO)回归筛选出的特征变量作为随机森林(RF)、极端梯度提升(XGBoost)和逻辑回归(logistic regression)的输入,利用贝叶斯优化方法和交叉验证迭代训练获得最佳的预测模型,最后利用特征重要性排序和Shapley加性解释(SHAP)进行解释分析。结果特征选择结果显示尿糖(GLU)(OR=1.189,95%CI=1.170~1.208,P<0.05)、糖尿病遗传史(OR=1.341,95%CI=1.273~1.411,P<0.05)、年龄(OR=1.006,95%CI=1.004~1.009,P<0.05)、身体质量指数(BMI)(OR=1.017,95%CI=1.010~1.023,P<0.05)、心率(HR)(OR=1.004,95%CI=1.003~1.006,P<0.05)、文化程度(OR=0.954,95%CI=0.934~0.975,P<0.05)、居住地(OR=0.958,95%CI=0.931~0.985,P<0.05)为主要的特征变量。算法实验结果表明,经过参数调优后RF和XGBoost模型性能均优于逻辑回归模型,XGBoost准确率92.85%略高于RF准确率92.34%。特征重要性结果显示,2型糖尿病合并高血压的影响因素重要性排序依次为GLU、糖尿病遗传史、文化程度、居住地、年龄、BMI、HR,其中,GLU、糖尿病遗传史、年龄、BMI、HR为危险因素,文化程度、居住地为保护因素。结论基于XGBoost的2型糖尿病合并高血压预测模型具有更好的性能,通过利用SHAP模型增强模型的可解释性,能够识别出患病的危险因素,为2型糖尿病合并高血压的预防提供参考。 展开更多
关键词 糖尿病合并高血压 随机森林 极端梯度提升 分类预测 shap模型
在线阅读 下载PDF
基于SHAP分析的施工作业区通行能力影响要素研究
8
作者 韦红亮 章霞 +2 位作者 吴培佳 王益 周晨静 《交通工程》 2024年第8期23-30,37,共9页
融合微观仿真与机器学习技术,对施工作业区通行能力影响要素及取值进行系统性研究。采用标定后的微观仿真工具,搭建常见6类快速路施工作业区仿真场景,获得限速值、上游过渡段长度、大车比例等参数影响下的施工作业区通行能力。采用SHAP... 融合微观仿真与机器学习技术,对施工作业区通行能力影响要素及取值进行系统性研究。采用标定后的微观仿真工具,搭建常见6类快速路施工作业区仿真场景,获得限速值、上游过渡段长度、大车比例等参数影响下的施工作业区通行能力。采用SHAP模型可视化分析限速、大车比例、上游过渡区长度对施工区通行能力的作用机理,分析各个因素对施工作业区影响的具体过程,并选取BP神经网络建立6类施工区通行能力预测模型。 展开更多
关键词 施工作业区 通行能力 shap模型 BP神经网络 影响机理
在线阅读 下载PDF
基于学科交叉驱动的颠覆性技术预测研究
9
作者 王萌萌 吴艾晗 +1 位作者 邓琨升 郭晓彤 《情报杂志》 北大核心 2025年第3期72-80,138,共10页
[研究目的]新质生产力的发展极大程度上依赖于颠覆性技术的突破。准确识别颠覆性技术有助于推动生产能力现代化,增强国家实力和社会发展水平。[研究方法]以专利家族作为技术分析单元,融合专利数据和论文数据,从多样性、均衡性、差异性和... [研究目的]新质生产力的发展极大程度上依赖于颠覆性技术的突破。准确识别颠覆性技术有助于推动生产能力现代化,增强国家实力和社会发展水平。[研究方法]以专利家族作为技术分析单元,融合专利数据和论文数据,从多样性、均衡性、差异性和Rao-Stirling综合维度挖掘颠覆性技术所引证知识的学科交叉特征,并据此采用逻辑回归算法识别与技术颠覆性程度具有显著关联的候选特征;构建八类机器学习模型并优选颠覆性技术预测效果最佳的模型,通过SHAP模型揭示学科交叉特征在颠覆性技术预测中的相对贡献和特征关联机制。[研究结果/结论]人工智能领域研究结果表明,所引证专利和论文的多样性、均衡性和差异性特征均对颠覆性技术的产生具有显著影响,相较于其他八类机器学习模型,XGBoost模型在综合性能上取得了最佳表现,其中引证论文的差异性、专利的多样性和差异性等交叉驱动特征在颠覆性技术预测中贡献度最高。 展开更多
关键词 颠覆性技术 学科交叉 专利家族 专利数据 科学论文 人工智能 机器学习 shap模型
在线阅读 下载PDF
基于数据驱动的磁电复合材料性能研究
10
作者 王欢 文建彪 李瑨哲 《湘潭大学学报(自然科学版)》 2025年第1期97-107,共11页
如何准确且快速预测磁电系数是磁电多功能器件优化设计领域的一大难题.针对这一问题,该文提出了一种新的遗传算法(GA)优化的反向传播(BP)神经网络的预测磁电系数模型.该模型弥补了BP神经网络模型中经验化计算隐含层神经元个数与手动设... 如何准确且快速预测磁电系数是磁电多功能器件优化设计领域的一大难题.针对这一问题,该文提出了一种新的遗传算法(GA)优化的反向传播(BP)神经网络的预测磁电系数模型.该模型弥补了BP神经网络模型中经验化计算隐含层神经元个数与手动设定模型最佳训练轮次的不足,有效地提高了GA优化后的BP神经网络的预测精度.结果表明,GA优化后的BP神经网络模型的预测指标R 2高达98.49%,比普通BP模型的预测指标R 2高2.37%,同时该模型的误差更低,故GA优化后的BP预测模型在预测磁电系数上有显著的优越性与更高的精确度.另外在GA-BP模型的基础上引入SHAP模型,充分解释输入参数对磁电系数的影响程度.本研究为更快速、简洁地预测磁电系数,优化磁电复合材料设计提供了有效的支持. 展开更多
关键词 磁电系数 磁电复合材料 GA优化 BP神经网络 shap模型
在线阅读 下载PDF
融合LightGBM与SHAP的糖尿病预测及其特征分析方法 被引量:19
11
作者 王鑫 廖彬 +1 位作者 李敏 孙瑞娜 《小型微型计算机系统》 CSCD 北大核心 2022年第9期1877-1885,共9页
人工智能在辅助医疗诊断方面得到广泛关注,对糖尿病预测的相关研究是近年来关注的一个热点问题.以皮马印第安人糖尿病数据集为研究对象,首先,对原始数据进行缺失值填充、异常值分析、标准化处理等工作的基础上,将预处理后的数据作为Ligh... 人工智能在辅助医疗诊断方面得到广泛关注,对糖尿病预测的相关研究是近年来关注的一个热点问题.以皮马印第安人糖尿病数据集为研究对象,首先,对原始数据进行缺失值填充、异常值分析、标准化处理等工作的基础上,将预处理后的数据作为LightGBM训练模型的输入;其次,与已有工作中基于SVM、随机森林、决策树以及Xgboost等多种机器学习模型进行实验对比,结果表明本文模型在准确率、精确率、召回率、F1值、AUC值5项性能指标上均明显优于对比模型;最后,引入SHAP模型增强模型的可解释性,同时综合比较了LightGBM和Xgboost的特征重要性排序结果,识别出了影响糖尿病的主要因素,为糖尿病的疾病诊断提供决策参考. 展开更多
关键词 LightGBM模型 shap模型 糖尿病预测 特征分析
在线阅读 下载PDF
基于XGBoost的危重症患者住院时间分类预测模型和风险因素研究 被引量:3
12
作者 林之韵 程云章 耿晓斌 《生物医学工程研究》 2023年第1期36-42,共7页
为预测危重症患者在重症监护病房的住院时间(length of stay in intensive care unit, ICU LOS),并探索实验室指标对ICU LOS的影响,本研究基于危重症患者的25个临床指标构建XGBoost模型,对患者是否发生超过3 d的ICU LOS进行预测,并基于S... 为预测危重症患者在重症监护病房的住院时间(length of stay in intensive care unit, ICU LOS),并探索实验室指标对ICU LOS的影响,本研究基于危重症患者的25个临床指标构建XGBoost模型,对患者是否发生超过3 d的ICU LOS进行预测,并基于SHAP模型对最佳性能模型进行解释性评估。结果显示,XGBoost模型准确率为87.9%。相比于其他预测模型,XGBoost模型在准确率、敏感度和区分度上均有明显优势。同时,SHAP模型增加了集成模型的可解释性和可靠性。研究表明,XGBoost模型可有效识别ICU LOS较长的患者,辅助医生优化临床治疗方案,改善患者预后状况。 展开更多
关键词 重症监护室 机器学习 时间预测 shap模型 特征分析 临床决策支持
在线阅读 下载PDF
基于深度森林的心衰死亡率可解释预测模型 被引量:1
13
作者 张士杰 窦燕 +1 位作者 李旭东 马文博 《哈尔滨商业大学学报(自然科学版)》 CAS 2023年第2期154-163,共10页
在“大数据+健康中国”背景下,针对目前ICU患者心衰死亡率预测模型中性能无法满足临床应用的要求以及缺乏可解释性的问题,提出一种基于深度森林的ICU患者心衰死亡率的可解释预测模型.在数据预处理的前提下,对其建立深度森林预测模型;与... 在“大数据+健康中国”背景下,针对目前ICU患者心衰死亡率预测模型中性能无法满足临床应用的要求以及缺乏可解释性的问题,提出一种基于深度森林的ICU患者心衰死亡率的可解释预测模型.在数据预处理的前提下,对其建立深度森林预测模型;与已有研究中基于bp-SVM和AB-CNN-BiLSTM等多种机器学习模型进行综合对比实验,深度森林模型的各个评价指标分别达到0.9801、0.9851、0.9802和0.9938,其结果均优于所选的对比模型,证明了该模型的有效性;利用SHAP框架增强模型的可解释性,根据可视化结果获得了相关的重要影响因素排名,为有效降低其诊断费用以及协助医护人员作出及时精确的临床诊断策略提供决策参考. 展开更多
关键词 心力衰竭 死亡率预测 深度森林 随机森林 shap模型 特征分析
在线阅读 下载PDF
基于机器学习的中型城市居民出行方式选择行为研究 被引量:4
14
作者 李文权 邓安鑫 +2 位作者 郑炎 殷子娟 王白凡 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第2期13-23,共11页
为探索中型城市居民出行特征以及不同因素对出行方式选择行为的影响机制,本文以中国某中型城市居民出行数据为例,综合考虑传统离散选择模型和机器学习模型在预测精度和建模合理性上的优劣,以及机器学习模型超参数求解算法的特点和效率,... 为探索中型城市居民出行特征以及不同因素对出行方式选择行为的影响机制,本文以中国某中型城市居民出行数据为例,综合考虑传统离散选择模型和机器学习模型在预测精度和建模合理性上的优劣,以及机器学习模型超参数求解算法的特点和效率,引入变异程序,提出粒子群优化随机森林的中型城市居民出行方式选择预测模型,采用预测准确率、出行方式比例预测绝对误差和期望模拟误差这3项性能指标,量化对比粒子群优化随机森林模型与多种机器学习模型和多项Logit模型统计学上的预测性能差异,利用SHAP(SHapley Additive exPlanation)模型深入分析个人社会经济属性、出行属性及出行方式属性等相关因素与居民出行方式选择之间的非线性关系。结果表明:粒子群优化随机森林模型整体平均预测准确率最高,为0.856,出行方式比例预测平均绝对误差和期望模拟平均误差最低,分别为0.062和0.306,模型间指标差异在统计学检验下显著;距离对不同出行方式选择的影响最显著,步行和私家车出行对距离敏感性更高,不同距离下,两者选择概率变化超过35%;30岁以下群体不同出行方式选择概率差距大于其他年龄段;性别、是否拥有私家车或公交IC卡等因素显著改变公交车和私家车的选择概率。 展开更多
关键词 城市交通 出行方式选择 机器学习模型 中型城市 粒子群优化 shap模型
在线阅读 下载PDF
基于SHAP值的类重叠识别方法对FSVM的改进
15
作者 曹玉茹 高洋洋 李祈萱 《微电子学与计算机》 2023年第10期9-19,共11页
在分类问题中,类重叠现象会大大影响分类模型的效果,针对类重叠样本的识别问题,提出了一种基于SHAP值的类重叠识别新方法,基于SHAP值构造出样本在所属类中的分类作用能力隶属属性,对类间重叠样本进行有效识别,然后利用仿真实验验证了基... 在分类问题中,类重叠现象会大大影响分类模型的效果,针对类重叠样本的识别问题,提出了一种基于SHAP值的类重叠识别新方法,基于SHAP值构造出样本在所属类中的分类作用能力隶属属性,对类间重叠样本进行有效识别,然后利用仿真实验验证了基于SHAP的类重叠识别方法的适用性;将样本的分类作用能力归一化后构造出样本隶属度度量,并将该隶属度应用于模糊支持向量机(Fuzzy Support Vector Machine,FSVM)算法后得到FSVM_SHAP模型,通过在多个经典二分类数据集上实验得到了较好的效果,体现了该模型的有效性. 展开更多
关键词 二分类 类重叠 shap模型 隶属度 FSVM
在线阅读 下载PDF
基于GRNN模型的流域沉积物中有效态氮、磷含量预测研究 被引量:1
16
作者 曹文斌 袁旭音 +3 位作者 章海燕 唐黎 汪宜敏 朱宁远 《环境科技》 2023年第2期1-6,共6页
因沉积物中有效氮(AN)和有效磷(AP)的分布对流域水环境有重要影响,故研究其空间分布对评估和管理流域水环境质量有一定价值。基于GRNN模型和SHAP解释模型,选取多种土壤参数、自然环境与人类活动指标,以太湖流域数据集作为模型训练集,预... 因沉积物中有效氮(AN)和有效磷(AP)的分布对流域水环境有重要影响,故研究其空间分布对评估和管理流域水环境质量有一定价值。基于GRNN模型和SHAP解释模型,选取多种土壤参数、自然环境与人类活动指标,以太湖流域数据集作为模型训练集,预测洪泽湖流域和钱塘江流域沉积物中AN,AP的含量。结果表明:以耕地为主的洪泽湖流域沉积物中AN的含量相对较高;钱塘江下游因城镇密集而导致沉积物中AP的含量较高。SHAP解释模型分析表明:沉积物中AN的含量主要受农业活动影响(除滨岸带土壤氮含量指标外);而沉积物中除磷肥指标外,生活污水排放量是AP含量主要影响因素。 展开更多
关键词 沉积物 N P有效态 广义回归神经网络(GRNN) shap解释模型 流域
在线阅读 下载PDF
基于参数优化VMD与XGBoost算法的玉米蛋白粉价格预测 被引量:1
17
作者 吴展 王春晓 《饲料研究》 CAS 北大核心 2024年第13期178-183,共6页
玉米蛋白粉价格稳定对饲料工业可持续发展和国家粮食安全具有重要意义,但其价格序列具有非平稳、非线性特征,难以精确预测。试验旨在基于XGBoost算法,构建玉米蛋白粉价格预测模型。首先,利用鲸鱼算法(WOA)优化变模分解(VMD)的K值和惩罚... 玉米蛋白粉价格稳定对饲料工业可持续发展和国家粮食安全具有重要意义,但其价格序列具有非平稳、非线性特征,难以精确预测。试验旨在基于XGBoost算法,构建玉米蛋白粉价格预测模型。首先,利用鲸鱼算法(WOA)优化变模分解(VMD)的K值和惩罚参数,对原始价格序列进行自适应分解,降低数据噪声。其次,将Pearson特征筛选后的变量作为极限梯度提升树(XGBoost)模型的输入,进行训练和测试。最后,使用10折交叉验证和学习曲线检验模型性能,并结合SHAP模型分析关键影响因素的非线性效应。结果显示,上一期豆粕期货价格对本期玉米蛋白粉价格波动具有显著的正向影响。研究表明,贝叶斯算法(BO)优化的XGBoost模型具有较好的预测性能,优于基准模型。 展开更多
关键词 XGBoost算法 价格预测 玉米蛋白粉 变分模态分解 shap模型 贝叶斯优化
在线阅读 下载PDF
基于机器学习的农业水资源利用效率评价与分析 被引量:1
18
作者 吴展 王春晓 《中国农村水利水电》 北大核心 2024年第9期188-195,共8页
为提升我国北方农牧交错带农业水资源利用效率,研究旨在提出一种基于机器学习极限梯度提升(eXtreme Gradient Boosting,XGBoost)算法的农业水资源利用效率评价和分析框架。首先,利用熵权TOPSIS(Technique for Order Preference by Simil... 为提升我国北方农牧交错带农业水资源利用效率,研究旨在提出一种基于机器学习极限梯度提升(eXtreme Gradient Boosting,XGBoost)算法的农业水资源利用效率评价和分析框架。首先,利用熵权TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)模型对北方农牧交错带七省区2008年至2021年的农业水资源利用效率进行测度;其次,将效率值作为XGBoost回归预测算法的先验样本进行训练测试,并使用贝叶斯优化(Bayesian Optimization,BO)算法对极限梯度提升回归预测模型的超参数进行优化。此外,应用五折交叉验证对TOPSIS-XGBoost回归模型结果进行稳健性检验;最后采用SHAP(Shapley Additive Explanation)模型系统分析影响北方农牧交错带七省区农业水资源利用效率的关键驱动因素。研究结果表明:2008年至2021年的北方农牧交错带七省区农业水资源利用效率整体有所提高,平均效率值由2008年的0.328上升至2021年的0.437,但总体效率均值较低;2021年河北省、宁夏回族自治区、辽宁省、陕西省和内蒙古自治区的农业水资源利用效率相对较高,效率值分布在0.40至0.59之间;甘肃省和山西省的农业水资源综合利用效率较低,效率值分别为0.33和0.31;BO-XGBoost回归预测模型测试集的R2较基准XGBoost模型提高了2.63%,且五折交叉验证的R2均值为0.96,表明模型误差较小,具有良好的预测性能和稳健性;供水模数、有效灌溉率以及农业规模化程度是影响七省区农业水资源利用效率的关键驱动因素。TOPSIS-BO-XGBoost-SHAP模型可为我国农业可持续发展提供科学参考和技术支持。 展开更多
关键词 机器学习 农业水资源利用效率 北方农牧交错带 XGBoost回归算法 shap模型
在线阅读 下载PDF
云贵高原地区生态系统健康时空分布及其驱动因素影响
19
作者 张学鹏 曾铖 +1 位作者 勾鹏 黄莹双 《测绘通报》 CSCD 北大核心 2024年第8期37-41,共5页
针对云贵高原地区生态系统健康(EH)的时空分布及其驱动因素问题,本文首先建立了“活力-组织力-恢复力-服务力”的EH评估模型,分析2000—2020年EH时空分布,然后利用XGBoost模型和SHAP解释模型分析各驱动因子与EH间的具体函数关系。结果表... 针对云贵高原地区生态系统健康(EH)的时空分布及其驱动因素问题,本文首先建立了“活力-组织力-恢复力-服务力”的EH评估模型,分析2000—2020年EH时空分布,然后利用XGBoost模型和SHAP解释模型分析各驱动因子与EH间的具体函数关系。结果表明:①2000—2020年,云贵高原地区的EH西部区域较东部区域较好,弱健康县集中在东北地区;②弱健康和较弱健康县由2000年的40%降低至2020年的24%,总体呈现全域改善的趋势;③城市化水平、降水与EH间存在递减的三次函数关系,温度、归一化植被指数与EH间存在递增的三次函数关系,高程与EH间为波动的四次函数关系。本文旨在为区域EH监测提供新方案,为云贵地区生态保护与恢复提供参考。 展开更多
关键词 生态系统健康 时空分布 驱动因素 XGBoost模型 shap模型
在线阅读 下载PDF
家政服务员的顾客满意度预测及影响特征分析
20
作者 华霞 《服务科学和管理》 2024年第1期119-129,共11页
以数据和算法为基础对家政服务员的顾客满意度情况进行识别和预测,可以为提前甄别满意度欠佳的员工提供信息支撑。通过随机森林算法构建顾客满意度预测模型,并基于现实工作流程,将属性划分成不同类别,分析在服务前和服务后的不同阶段,... 以数据和算法为基础对家政服务员的顾客满意度情况进行识别和预测,可以为提前甄别满意度欠佳的员工提供信息支撑。通过随机森林算法构建顾客满意度预测模型,并基于现实工作流程,将属性划分成不同类别,分析在服务前和服务后的不同阶段,预测顾客满意度的关键特征,运用SHAP模型分析变量对模型的影响方向及特征之间的交互关系,归纳出特征变量的重要程度。结果表明融合心理行为属性的家政服务员顾客满意度预测模型效果更佳,在家政服务员接单前,技能数量是预测顾客满意度最重要的特征;而在接单后的阶段,做单量、合作费、星级、准时率是最关键的特征。本研究结合了机器学习算法与SHAP模型,改善了模型性能,为现代服务行业的满意度提升提供理论支持。 展开更多
关键词 顾客满意度 随机森林 shap模型 心理行为属性 家政服务
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部