期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
基于自相关系数和PseAAC的蛋白质结构类预测 被引量:4
1
作者 张燕平 查永亮 +1 位作者 赵姝 杜秀全 《计算机科学与探索》 CSCD 2014年第1期103-110,共8页
传统的预测方法在构造特征向量时只考虑了氨基酸的组成,而自相关系数不仅能够很好地反映序列中氨基酸的位置信息,而且考虑了序列内部不同位置的氨基酸间的相互影响。设计了一种将氨基酸组成和自相关系数相结合的方法来构造特征向量;在C... 传统的预测方法在构造特征向量时只考虑了氨基酸的组成,而自相关系数不仅能够很好地反映序列中氨基酸的位置信息,而且考虑了序列内部不同位置的氨基酸间的相互影响。设计了一种将氨基酸组成和自相关系数相结合的方法来构造特征向量;在Chou提出的伪氨基酸组成模型(pseudo-amino acid composition,PseAAC)的基础上,通过扩展信息重新构造了伪氨基酸组成模型,并将其与自相关系数组合在一起来构造特征向量。分别使用两种方法编码,选用支持向量机作为预测工具,在数据集Z277、Z498以及独立测试集D138上进行了若干实验,对比结果显示,新方法比传统的氨基酸组成方法的准确率分别平均提高了7.43%和8.53%,证明了新方法是有效的。 展开更多
关键词 蛋白质结构类预测 自相关系数 伪氨基酸组成(PseAAC) 支持向量机(SVM)
在线阅读 下载PDF
基于二叉树支持向量机的蛋白质结构类预测 被引量:1
2
作者 张同亮 丁永生 《生物医学工程学杂志》 EI CAS CSCD 北大核心 2008年第4期921-924,共4页
提出了一种基于二叉树支持向量机(BT-SVM)的蛋白质结构类多类预测新方法。采用26维的向量来表示蛋白质序列的特征。BT-SVM多类分类方法能消除SVM在多分类问题中存在的不可分数据问题。采用两个经典数据集作为测试数据,通过自身一致性和... 提出了一种基于二叉树支持向量机(BT-SVM)的蛋白质结构类多类预测新方法。采用26维的向量来表示蛋白质序列的特征。BT-SVM多类分类方法能消除SVM在多分类问题中存在的不可分数据问题。采用两个经典数据集作为测试数据,通过自身一致性和n折叠交叉验证方法测试了新方法的性能。预测结果表明新方法具有良好的预测能力,与使用同一数据集的已有结果相比较,新方法的Jackknife结果和目前最好的方法取得的结果相当,可作为蛋白质结构类预测的一个工具。 展开更多
关键词 蛋白质结构类预测 二叉树支持向量机 氨基酸对相互作用 疏水模式
在线阅读 下载PDF
基于多特征信息及Ma-Ada多分类器融合的蛋白质结构类预测 被引量:1
3
作者 郑斌 厉力华 《中国生物医学工程学报》 CAS CSCD 北大核心 2013年第5期580-587,共8页
蛋白质序列特征表示和机器学习算法是影响蛋白质结构类预测效果好坏的两个重要方面。本研究基于k-字统计频率和k-片段位置分布两种特征提取方法,将分别提取到的氨基酸序列信息和物理化学性质信息同蛋白质二级结构信息进行融合,建立17维... 蛋白质序列特征表示和机器学习算法是影响蛋白质结构类预测效果好坏的两个重要方面。本研究基于k-字统计频率和k-片段位置分布两种特征提取方法,将分别提取到的氨基酸序列信息和物理化学性质信息同蛋白质二级结构信息进行融合,建立17维和57维的特征信息集,并尝试在Adaboost.M1算法中引入Multi-Agent多智能体融合的思想,提出了一种Ma-Ada多分类器融合算法。该算法作为蛋白质结构类的预测工具,充分挖掘了单分类器度量层信息以及各个单分类器之间的交互融合信息。实验结果表明,Ma-Ada算法在Z277、Z498、1189和D640四个蛋白质数据集的57维特征信息集上的分类率分别达到了91.3%、96.8%、85.3%和87.2%,在17维特征信息集上的分类率也分别达到了90.6%、95.8%、84.8%和88.3%。与其它蛋白质结构类预测方法的结果相比,本方法能够获得较好的分类率。 展开更多
关键词 蛋白质结构类预测 特征信息集 Ma-Ada多分器融合
在线阅读 下载PDF
一种新的蛋白质结构类预测方法
4
作者 李楠 李春 《生物信息学》 2012年第4期238-240,共3页
基于氨基酸的16种分类模型,给出蛋白质序列的派生序列,进而结合加权拟熵和LZ复杂度构造出34维特征向量来表示蛋白质序列。借助于贝叶斯分类器对同源性不超过25%的640数据集进行蛋白质结构类预测,准确度达到71.28%。
关键词 蛋白质结构类预测 氨基酸 加权拟熵 LZ复杂度 贝叶斯分
在线阅读 下载PDF
使用伪氨基酸组成和模糊支持向量机预测蛋白质结构类 被引量:2
5
作者 姜小莹 朱俊东 +1 位作者 李晓波 张同亮 《生物物理学报》 CAS CSCD 北大核心 2008年第1期43-48,共6页
蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域。基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本。抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)... 蛋白质结构类预测是生物信息和蛋白质科学中重要的研究领域。基于Chou提出的伪氨基酸离散模型框架,从蛋白质序列出发,设计一种新的伪氨基酸组成方法表示蛋白质序列样本。抽取氨基酸组合(10-D)在序列中出现的频率和疏水氨基酸模式(6-D)表示蛋白质序列的附加特征,用和传统的氨基酸组成(20-D)一起构成的36维的伪氨基酸组成向量来表示蛋白质序列的特征。使用遗传算法来优化附加特征的权重系数。伪氨基酸组成向量作为输入数据,模糊支持向量机作为预测工具。使用三个常用的标准数据集来验证算法的性能。Jack-knife检验结果说明本方法具有较高的准确率,有望成为潜在的预测蛋白质功能的工具。 展开更多
关键词 蛋白质结构类预测 伪氨基酸组成 模糊支持向量机 遗传算法
在线阅读 下载PDF
新型核序列自相关函数用于非同源蛋白质结构类预测
6
作者 金宏 周鹏 商志才 《计算机与应用化学》 CAS CSCD 北大核心 2011年第1期61-68,共8页
从天然氨基酸的50个性质参数中经主成分分析得出1种新的氨基酸描述子:氨基酸特征性质得分。并在此基础上通过定义基于向量形式的自相关函数以及引入Mercer核技术将该函数运算空间进行非线性变换,最终提出了1种新的蛋白质序列表征方法:... 从天然氨基酸的50个性质参数中经主成分分析得出1种新的氨基酸描述子:氨基酸特征性质得分。并在此基础上通过定义基于向量形式的自相关函数以及引入Mercer核技术将该函数运算空间进行非线性变换,最终提出了1种新的蛋白质序列表征方法:核序列自相关函数。采用该函数对632个已知晶体结构的非同源蛋白分类研究结果表明:KSACF能够恰当提取蛋白质一级序列特征以及氨基酸残基之间隐含的内在联系,从而对不同蛋白质结构类进行准确预测。 展开更多
关键词 核序列自相关函数 氨基酸特征性质得分 蛋白质结构类预测
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部