目的:如今机器学习算法逐渐被应用于预测脑卒中和心血管疾病方面。与传统回归模型相比,机器学习可以通过探索大量预测特征与结果变量之间的灵活关系,从数据中学习,以实现高预测准确性,为个体化治疗和康复方案的制定提供了新的方法。此...目的:如今机器学习算法逐渐被应用于预测脑卒中和心血管疾病方面。与传统回归模型相比,机器学习可以通过探索大量预测特征与结果变量之间的灵活关系,从数据中学习,以实现高预测准确性,为个体化治疗和康复方案的制定提供了新的方法。此文旨在系统评价基于机器学习脑卒中功能恢复及预后的预测模型,综合评估其预测性能及临床应用潜力,为相关预后预测模型的构建、应用及推广提供参考。方法:按照PRISMA指南进行系统评价。通过检索PubMed、EMbase、Web of Science核心数据库、中国知网、万方和中国生物医学文献数据库,筛选出使用机器学习方法进行脑卒中预后预测的相关文献,检索时限为2014-01-01/2024-07-01。由2名研究人员严格按照纳入与排除标准独立筛选文献、提取数据,使用预测模型偏倚风险评价工具评价模型质量。结果:①初步检索共获取3126篇文献,经过筛选和排除,最终纳入18篇研究,共运用13种机器学习方法构建了150个预测模型,其中应用次数最多的3种方法为逻辑回归、随机森林和极限梯度提升(XGBoost);仅有1项研究开展了外部验证;有8项研究报告了缺失数据的处理方法;②结局指标方面有8项研究采用了临床数据与影像学数据结合来构建模型,9项研究仅运用临床数据构建模型,1项研究仅用影像学数据构建模型;③18项研究均给出了研究中最重要的特征,其中被提及最多的是美国国立卫生研究院卒中量表和年龄;所有研究均报告了曲线下面积值,范围0.74-0.96,最高为0.96;所有模型的总体偏倚风险均为高偏倚风险,模型分析领域高偏倚风险是导致所有模型总体偏倚风险高的主要原因;④Meta分析结果显示年龄和美国国立卫生研究院卒中量表评分对脑卒中预后影响显著,年龄[MD=8.49,95%CI(6.24,10.75),P<0.01],美国国立卫生研究院卒中量表评分[MD=4.78,95%CI(2.56,7.00),P<0.01]。结论:此次研究系统评价了基于机器学习的脑卒中功能恢复及预后预测模型,模型均具有良好的预测潜力。但未来研究应增加纳入模型样本量,采用前瞻性研究,并且添加对模型的外部验证以提高模型的稳定性和预测准确性,控制偏倚风险,以帮助模型在实际临床应用中的验证和推广,同时应对缺失值的插补更透明和精准。虽然现有的机器学习模型显示出良好的预测性能,但也要注重模型的功能性和可用性,纳入特征多会降低易用性。应开发简便易用的模型接口和用户友好的临床工具,使医护人员能够更好地应用模型进行临床决策。展开更多
文摘目的:如今机器学习算法逐渐被应用于预测脑卒中和心血管疾病方面。与传统回归模型相比,机器学习可以通过探索大量预测特征与结果变量之间的灵活关系,从数据中学习,以实现高预测准确性,为个体化治疗和康复方案的制定提供了新的方法。此文旨在系统评价基于机器学习脑卒中功能恢复及预后的预测模型,综合评估其预测性能及临床应用潜力,为相关预后预测模型的构建、应用及推广提供参考。方法:按照PRISMA指南进行系统评价。通过检索PubMed、EMbase、Web of Science核心数据库、中国知网、万方和中国生物医学文献数据库,筛选出使用机器学习方法进行脑卒中预后预测的相关文献,检索时限为2014-01-01/2024-07-01。由2名研究人员严格按照纳入与排除标准独立筛选文献、提取数据,使用预测模型偏倚风险评价工具评价模型质量。结果:①初步检索共获取3126篇文献,经过筛选和排除,最终纳入18篇研究,共运用13种机器学习方法构建了150个预测模型,其中应用次数最多的3种方法为逻辑回归、随机森林和极限梯度提升(XGBoost);仅有1项研究开展了外部验证;有8项研究报告了缺失数据的处理方法;②结局指标方面有8项研究采用了临床数据与影像学数据结合来构建模型,9项研究仅运用临床数据构建模型,1项研究仅用影像学数据构建模型;③18项研究均给出了研究中最重要的特征,其中被提及最多的是美国国立卫生研究院卒中量表和年龄;所有研究均报告了曲线下面积值,范围0.74-0.96,最高为0.96;所有模型的总体偏倚风险均为高偏倚风险,模型分析领域高偏倚风险是导致所有模型总体偏倚风险高的主要原因;④Meta分析结果显示年龄和美国国立卫生研究院卒中量表评分对脑卒中预后影响显著,年龄[MD=8.49,95%CI(6.24,10.75),P<0.01],美国国立卫生研究院卒中量表评分[MD=4.78,95%CI(2.56,7.00),P<0.01]。结论:此次研究系统评价了基于机器学习的脑卒中功能恢复及预后预测模型,模型均具有良好的预测潜力。但未来研究应增加纳入模型样本量,采用前瞻性研究,并且添加对模型的外部验证以提高模型的稳定性和预测准确性,控制偏倚风险,以帮助模型在实际临床应用中的验证和推广,同时应对缺失值的插补更透明和精准。虽然现有的机器学习模型显示出良好的预测性能,但也要注重模型的功能性和可用性,纳入特征多会降低易用性。应开发简便易用的模型接口和用户友好的临床工具,使医护人员能够更好地应用模型进行临床决策。