目的:为实现对急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)患者疾病严重程度的连续监测,提出一种基于集成学习的ARDS患者疾病严重程度辨识算法。方法:首先,利用开源数据库MIMIC-Ⅳ(Medical Information Mart for Int...目的:为实现对急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)患者疾病严重程度的连续监测,提出一种基于集成学习的ARDS患者疾病严重程度辨识算法。方法:首先,利用开源数据库MIMIC-Ⅳ(Medical Information Mart for Intensive CareⅣ)提取患者的多种无创生理参数并进行初步预处理,采用多元特征选择算法对患者的多种无创生理参数进行特征排序并通过加权计算得出特征重要性评分;其次,根据特征重要性评分结果,采用子集搜索算法寻找在神经网络、逻辑回归、AdaBoost和XGBoost 4种机器学习算法下能够产生最佳性能的特征子集;最后,结合最优特征子集,使用广义线性回归模型设计软投票集成方法将单一机器学习算法结果进行集成,设计多元集成学习算法。基于MIMIC-Ⅳ数据库验证多元集成学习算法对ARDS患者疾病严重程度的辨识能力,并与传统算法进行比较。结果:多元集成算法的敏感度、特异度、准确率、AUC分别为87.15%、89.23%、88.34%、0.9234,均优于传统算法。结论:基于集成学习的ARDS患者疾病严重程度辨识算法能够实现对ARDS疾病严重程度的连续、实时监测,可为ARDS患者早期辨识预警提供有力支持。展开更多
2019年末我国武汉爆发了自2003年的SARS-CoV和2012年的中东呼吸综合症(MERS)以来又一次冠状病毒大规模爆发流行。截至2020年10月09日20时,世界卫生组织(World Health Organization, WHO)数据显示海外累计确诊病例36,725,069例,死亡病例1...2019年末我国武汉爆发了自2003年的SARS-CoV和2012年的中东呼吸综合症(MERS)以来又一次冠状病毒大规模爆发流行。截至2020年10月09日20时,世界卫生组织(World Health Organization, WHO)数据显示海外累计确诊病例36,725,069例,死亡病例1,062,153例,中国确诊人数达到了91,264例。此次疫情的严重性自然引起国人联想到2003年爆发的SARS病毒。且最新研究认为SARS-CoV-2是SARS-CoV的姊妹病毒,具有高度的同源性。因此我们将围绕SARS-CoV-2和SARS-CoV之间的联系以及SARS-CoV-2的最新诊疗方案进行简要综述。展开更多
目的运用免疫信息学技术预测严重急性呼吸综合征冠状病毒2(SARS-CoV-2)的B细胞、细胞毒性T淋巴细胞(CTL)和辅助T(Th)细胞的抗原表位.方法从NCBI数据库检索SARS-CoV-2蛋白序列,根据抗原性≥0.5和氨基酸数≥100进行筛选,最终的蛋白序列用...目的运用免疫信息学技术预测严重急性呼吸综合征冠状病毒2(SARS-CoV-2)的B细胞、细胞毒性T淋巴细胞(CTL)和辅助T(Th)细胞的抗原表位.方法从NCBI数据库检索SARS-CoV-2蛋白序列,根据抗原性≥0.5和氨基酸数≥100进行筛选,最终的蛋白序列用于后续的抗原肽的预测.用蛋白质结构预测软件Phyre2进行三维结构的预测、蛋白质模型结构的细化软件GalaxyRefine优化蛋白的三维结构,最后用蛋白质结构同源建模SWISS-MODEL系统对优化后的结构进行准确性评估.蛋白序列用于CTL、Th细胞和线性B细胞抗原肽预测,三维结构用于结构性B细胞抗原预测.免疫表位数据库和分析资源(IEDB)预测SARS-CoV-2的CTL和Th细胞抗原表位,B细胞线性抗原肽预测软件Bepipred Linear Epitope Prediction 2.0和B细胞结构抗原肽预测软件ElliPro-Epitope prediction based upon structural protrusion分别预测B细胞线性和结构抗原肽.结果从NCBI数据库获得了27个SARS-CoV-2的蛋白序列,去掉抗原性<0.5和氨基酸数<100的蛋白质后,最终选定9个蛋白进行后续抗原肽预测.最终获得了24个CTL、20个Th细胞、12个B细胞线性表位和16个B细胞结构表位.结论获得的抗原表位可用于后续多表位疫苗的设计,相较于只针对单种蛋白靶点的抗原表位而言,多靶点抗原表位具有更强的免疫原性,这些抗原表位对SARS-CoV-2疫苗而言,具有一定的参考价值.展开更多
文摘目的:为实现对急性呼吸窘迫综合征(acute respiratory distress syndrome,ARDS)患者疾病严重程度的连续监测,提出一种基于集成学习的ARDS患者疾病严重程度辨识算法。方法:首先,利用开源数据库MIMIC-Ⅳ(Medical Information Mart for Intensive CareⅣ)提取患者的多种无创生理参数并进行初步预处理,采用多元特征选择算法对患者的多种无创生理参数进行特征排序并通过加权计算得出特征重要性评分;其次,根据特征重要性评分结果,采用子集搜索算法寻找在神经网络、逻辑回归、AdaBoost和XGBoost 4种机器学习算法下能够产生最佳性能的特征子集;最后,结合最优特征子集,使用广义线性回归模型设计软投票集成方法将单一机器学习算法结果进行集成,设计多元集成学习算法。基于MIMIC-Ⅳ数据库验证多元集成学习算法对ARDS患者疾病严重程度的辨识能力,并与传统算法进行比较。结果:多元集成算法的敏感度、特异度、准确率、AUC分别为87.15%、89.23%、88.34%、0.9234,均优于传统算法。结论:基于集成学习的ARDS患者疾病严重程度辨识算法能够实现对ARDS疾病严重程度的连续、实时监测,可为ARDS患者早期辨识预警提供有力支持。
文摘2019年末我国武汉爆发了自2003年的SARS-CoV和2012年的中东呼吸综合症(MERS)以来又一次冠状病毒大规模爆发流行。截至2020年10月09日20时,世界卫生组织(World Health Organization, WHO)数据显示海外累计确诊病例36,725,069例,死亡病例1,062,153例,中国确诊人数达到了91,264例。此次疫情的严重性自然引起国人联想到2003年爆发的SARS病毒。且最新研究认为SARS-CoV-2是SARS-CoV的姊妹病毒,具有高度的同源性。因此我们将围绕SARS-CoV-2和SARS-CoV之间的联系以及SARS-CoV-2的最新诊疗方案进行简要综述。
文摘目的运用免疫信息学技术预测严重急性呼吸综合征冠状病毒2(SARS-CoV-2)的B细胞、细胞毒性T淋巴细胞(CTL)和辅助T(Th)细胞的抗原表位.方法从NCBI数据库检索SARS-CoV-2蛋白序列,根据抗原性≥0.5和氨基酸数≥100进行筛选,最终的蛋白序列用于后续的抗原肽的预测.用蛋白质结构预测软件Phyre2进行三维结构的预测、蛋白质模型结构的细化软件GalaxyRefine优化蛋白的三维结构,最后用蛋白质结构同源建模SWISS-MODEL系统对优化后的结构进行准确性评估.蛋白序列用于CTL、Th细胞和线性B细胞抗原肽预测,三维结构用于结构性B细胞抗原预测.免疫表位数据库和分析资源(IEDB)预测SARS-CoV-2的CTL和Th细胞抗原表位,B细胞线性抗原肽预测软件Bepipred Linear Epitope Prediction 2.0和B细胞结构抗原肽预测软件ElliPro-Epitope prediction based upon structural protrusion分别预测B细胞线性和结构抗原肽.结果从NCBI数据库获得了27个SARS-CoV-2的蛋白序列,去掉抗原性<0.5和氨基酸数<100的蛋白质后,最终选定9个蛋白进行后续抗原肽预测.最终获得了24个CTL、20个Th细胞、12个B细胞线性表位和16个B细胞结构表位.结论获得的抗原表位可用于后续多表位疫苗的设计,相较于只针对单种蛋白靶点的抗原表位而言,多靶点抗原表位具有更强的免疫原性,这些抗原表位对SARS-CoV-2疫苗而言,具有一定的参考价值.