为预测危重症患者在重症监护病房的住院时间(length of stay in intensive care unit, ICU LOS),并探索实验室指标对ICU LOS的影响,本研究基于危重症患者的25个临床指标构建XGBoost模型,对患者是否发生超过3 d的ICU LOS进行预测,并基于S...为预测危重症患者在重症监护病房的住院时间(length of stay in intensive care unit, ICU LOS),并探索实验室指标对ICU LOS的影响,本研究基于危重症患者的25个临床指标构建XGBoost模型,对患者是否发生超过3 d的ICU LOS进行预测,并基于SHAP模型对最佳性能模型进行解释性评估。结果显示,XGBoost模型准确率为87.9%。相比于其他预测模型,XGBoost模型在准确率、敏感度和区分度上均有明显优势。同时,SHAP模型增加了集成模型的可解释性和可靠性。研究表明,XGBoost模型可有效识别ICU LOS较长的患者,辅助医生优化临床治疗方案,改善患者预后状况。展开更多
在分类问题中,类重叠现象会大大影响分类模型的效果,针对类重叠样本的识别问题,提出了一种基于SHAP值的类重叠识别新方法,基于SHAP值构造出样本在所属类中的分类作用能力隶属属性,对类间重叠样本进行有效识别,然后利用仿真实验验证了基...在分类问题中,类重叠现象会大大影响分类模型的效果,针对类重叠样本的识别问题,提出了一种基于SHAP值的类重叠识别新方法,基于SHAP值构造出样本在所属类中的分类作用能力隶属属性,对类间重叠样本进行有效识别,然后利用仿真实验验证了基于SHAP的类重叠识别方法的适用性;将样本的分类作用能力归一化后构造出样本隶属度度量,并将该隶属度应用于模糊支持向量机(Fuzzy Support Vector Machine,FSVM)算法后得到FSVM_SHAP模型,通过在多个经典二分类数据集上实验得到了较好的效果,体现了该模型的有效性.展开更多
为提升我国北方农牧交错带农业水资源利用效率,研究旨在提出一种基于机器学习极限梯度提升(eXtreme Gradient Boosting,XGBoost)算法的农业水资源利用效率评价和分析框架。首先,利用熵权TOPSIS(Technique for Order Preference by Simil...为提升我国北方农牧交错带农业水资源利用效率,研究旨在提出一种基于机器学习极限梯度提升(eXtreme Gradient Boosting,XGBoost)算法的农业水资源利用效率评价和分析框架。首先,利用熵权TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)模型对北方农牧交错带七省区2008年至2021年的农业水资源利用效率进行测度;其次,将效率值作为XGBoost回归预测算法的先验样本进行训练测试,并使用贝叶斯优化(Bayesian Optimization,BO)算法对极限梯度提升回归预测模型的超参数进行优化。此外,应用五折交叉验证对TOPSIS-XGBoost回归模型结果进行稳健性检验;最后采用SHAP(Shapley Additive Explanation)模型系统分析影响北方农牧交错带七省区农业水资源利用效率的关键驱动因素。研究结果表明:2008年至2021年的北方农牧交错带七省区农业水资源利用效率整体有所提高,平均效率值由2008年的0.328上升至2021年的0.437,但总体效率均值较低;2021年河北省、宁夏回族自治区、辽宁省、陕西省和内蒙古自治区的农业水资源利用效率相对较高,效率值分布在0.40至0.59之间;甘肃省和山西省的农业水资源综合利用效率较低,效率值分别为0.33和0.31;BO-XGBoost回归预测模型测试集的R2较基准XGBoost模型提高了2.63%,且五折交叉验证的R2均值为0.96,表明模型误差较小,具有良好的预测性能和稳健性;供水模数、有效灌溉率以及农业规模化程度是影响七省区农业水资源利用效率的关键驱动因素。TOPSIS-BO-XGBoost-SHAP模型可为我国农业可持续发展提供科学参考和技术支持。展开更多
文摘为预测危重症患者在重症监护病房的住院时间(length of stay in intensive care unit, ICU LOS),并探索实验室指标对ICU LOS的影响,本研究基于危重症患者的25个临床指标构建XGBoost模型,对患者是否发生超过3 d的ICU LOS进行预测,并基于SHAP模型对最佳性能模型进行解释性评估。结果显示,XGBoost模型准确率为87.9%。相比于其他预测模型,XGBoost模型在准确率、敏感度和区分度上均有明显优势。同时,SHAP模型增加了集成模型的可解释性和可靠性。研究表明,XGBoost模型可有效识别ICU LOS较长的患者,辅助医生优化临床治疗方案,改善患者预后状况。
文摘在分类问题中,类重叠现象会大大影响分类模型的效果,针对类重叠样本的识别问题,提出了一种基于SHAP值的类重叠识别新方法,基于SHAP值构造出样本在所属类中的分类作用能力隶属属性,对类间重叠样本进行有效识别,然后利用仿真实验验证了基于SHAP的类重叠识别方法的适用性;将样本的分类作用能力归一化后构造出样本隶属度度量,并将该隶属度应用于模糊支持向量机(Fuzzy Support Vector Machine,FSVM)算法后得到FSVM_SHAP模型,通过在多个经典二分类数据集上实验得到了较好的效果,体现了该模型的有效性.
文摘为提升我国北方农牧交错带农业水资源利用效率,研究旨在提出一种基于机器学习极限梯度提升(eXtreme Gradient Boosting,XGBoost)算法的农业水资源利用效率评价和分析框架。首先,利用熵权TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)模型对北方农牧交错带七省区2008年至2021年的农业水资源利用效率进行测度;其次,将效率值作为XGBoost回归预测算法的先验样本进行训练测试,并使用贝叶斯优化(Bayesian Optimization,BO)算法对极限梯度提升回归预测模型的超参数进行优化。此外,应用五折交叉验证对TOPSIS-XGBoost回归模型结果进行稳健性检验;最后采用SHAP(Shapley Additive Explanation)模型系统分析影响北方农牧交错带七省区农业水资源利用效率的关键驱动因素。研究结果表明:2008年至2021年的北方农牧交错带七省区农业水资源利用效率整体有所提高,平均效率值由2008年的0.328上升至2021年的0.437,但总体效率均值较低;2021年河北省、宁夏回族自治区、辽宁省、陕西省和内蒙古自治区的农业水资源利用效率相对较高,效率值分布在0.40至0.59之间;甘肃省和山西省的农业水资源综合利用效率较低,效率值分别为0.33和0.31;BO-XGBoost回归预测模型测试集的R2较基准XGBoost模型提高了2.63%,且五折交叉验证的R2均值为0.96,表明模型误差较小,具有良好的预测性能和稳健性;供水模数、有效灌溉率以及农业规模化程度是影响七省区农业水资源利用效率的关键驱动因素。TOPSIS-BO-XGBoost-SHAP模型可为我国农业可持续发展提供科学参考和技术支持。