谭泗桥,李钎,陈渊,彭剑.融合位置特征与序列进化信息的磷酸化位点预测[J].生物化学与生物物理进展(待发表)
融合位置特征与序列进化信息的磷酸化位点预测
Phosphorylation Site Prediction Integrating the Position Feature with the Sequence Evolution Information*
投稿时间:2016-11-07  修订日期:2017-08-20
中文关键词:  磷酸化,预测,卡方差表特征,伪氨基酸序列进化信息,支持向量机
英文关键词:phosphorylation  prediction  Chi-square table feature  PsePSSM  SVM
基金项目:融合位置特征与序列进化信息的磷酸化位点预测;其它
作者单位E-mail
谭泗桥 湖南农业大学信息科学技术学院湖南省农村农业信息化工程技术研究中心 545534721@qq.com 
李钎 湖南省长沙市芙蓉区湖南农业大学信息化建设与管理中心  
陈渊 湖南省长沙市芙蓉区湖南农业大学植物保护学院  
彭剑 湖南省长沙市芙蓉区湖南农业大学信息学院  
摘要点击次数: 833
全文下载次数: 
中文摘要:
      磷酸化是蛋白质翻译后的主要修饰,可分为激酶特异性和非激酶特异性两种类型。以非激酶特异性磷酸化位点Dou数据集为基础,本文发展了一种基于位置的卡方差表特征χ2-pos,融合伪氨基酸序列进化信息PsePSSM表征序列,构建正负样本均衡的支持向量机分类器,S,T,Y独立测试Matthew相关系数、ROC曲线下面积分及准确率分别达到了0.59,0.87,79.74%;0.55,0.85,77.68%;0.50,0.81,75.22%,明显优于文献报道结果. χ2-pos、PsePSSM两种特征的融合在蛋白质磷酸化位点预测中有广泛应用前景.
英文摘要:
      Phosphorylation is the major post-translation modification to proteins, and it can be classified as kinase-specific and non-kinase-specific. This paper focuses on the prediction methods of non-kinase-specificity and using Dou’s dataset of phosphorylation sites as the template, this paper develops a position-based chi-square table feature, χ2-pos, and then integrates this feature with the pseudo position-specific scoring matrix (PsePSSM). A Support Vector Machine (SVM) classifier with balanced positive and negative samples was created, and the S, T, Y independent testing results for the Matthew correlation coefficient, the inferior surface integral of the ROC curve and the precision were (0.59, 0.87, 79.74%), (0.55, 0.85, 77.68%) and (0.50, 0.81, 75.22%), respectively, which are significantly superior to the results reported previously. The integration of the χ2-pos and the PsePSSM offers a promising method to predict phosphorylation sites more accurately in proteins.
HTML  查看全文  查看/发表评论  下载PDF阅读器
  
京期出证字第0624号 版权所有:  您是本站第    位访问者
主管单位:中国科学院 主办单位:中国科学院生物物理研究所和中国生物物理学会 地址:北京市朝阳区大屯路15号
电话:010-64888459 电子邮件:prog@sun5.ibp.ac.cn
技术支持:北京勤云科技发展有限公司
京ICP备05023138号-1

京公网安备 11010502031771号