找回密码
 注册新帐号

QQ登录

只需一步,快速开始

[分子生物]

蛋白研究系列专题-3-蛋白质组全谱鉴定

梦见宾 发表于 2017-3-3 16:09  
查看: 63357|回复: 0|显示全部楼层 |阅读模式
本帖最后由 梦见宾 于 2017-3-29 11:35 编辑

  蛋白质组(Proteome)指由一个基因组或一个细胞、组织表达的所有蛋白质。蛋白质全谱分析目的在于鉴定样本中尽可能多的肽和蛋白质混合物的组分。基于质谱技术的全谱鉴定,可为蛋白高通量的定量和修饰分析提供参考信息。传统的方法如蛋白质微量测序、氨基酸组成分析(如Edman降解法)费时费力、通量低,存在不容易实现规模化和自动化,结果灵敏度差等问题。当前主流的基于软电离技术的液相色谱-质谱系统(LC-MS/MS)是实现高通量蛋白鉴定的主要方法。


  其基本原理是:首先将纯化后的蛋白质用消化酶(如胰酶)水解成肽段,肽段混合物经过除盐后首先进入液相色谱,实现初步分离,以降低样品复杂度。经液相色谱分离后的肽段先经过质谱的第一级--离子源(ESI,MALDI)使肽段离子化并形成分散的离子。接着选择部分强度较高的肽段母离子进入质谱的第二级系统(碎裂源)做进一步碎裂,使肽段离子被打碎成更小的、有规律的碎片离子。理论上蛋白质序列经过酶解后形成肽段,肽段再经过理论二级碎裂形成理论的二级碎片离子谱图。然后用实验产生的MS/MS谱图信息(主要包括质荷比、离子强度)与理论产生的MS/MS谱图信息比对,通过比较两者的相似度来确定谱图对应哪个肽段/蛋白(如图1)。其中理论蛋白质数据库来自基因组预测或前期实验验证等数据。
目前,常用的数据库有NCBI-nr 、Uniprot等。常用的搜索引擎有Mascot 、Proteinpilot。Mascot一度被业界奉为鉴定软件的金标准,但其算法更偏向于鉴定长度较短的肽段序列。而Proteinpilot由于采用自动容错匹配、对所有可能的蛋白修饰采用了盲搜的策略,无肽段长度偏向性,鉴定效果更好。
      
                                  图1 蛋白质组鉴定流程图                                            
技术特点:
1、通量大:一次实验可鉴定6000多种蛋白质(以人HepG2为例);
2、结果准确可靠:质谱仪的质量精度可达到1ppm以下,分辨率能达到4x104以上,可提供高质量的数据。
3、适用范围广泛:对物种要求无限制,理论上适用于任何物种。


经典案例:
题目:A draft map of the human proteome(人类蛋白质组草图绘制)
期刊:Nature
主要技术:LC-MS/MS
文章摘要:采用LC-MS/MS技术,对30个来自正常人类的不同组织、器官(17个成年人组织、7个胎儿组织、6个初级纯化造血细胞)样品进行了深度蛋白质组解析,共鉴定到17294个蛋白,占人类全部有注释编码蛋白基因的84%。本文同时采用蛋白质组和基因组学(Proteogenomic)的方法发现了一些新的编码区(这些区域过去被认为是非编码区)。这一海量蛋白质组数据将会补充现有的基因组和转录组数据,从而加速健康、疾病方面的生物医学研究。
                          
                             
                            图2 人体中不同样品来源   

                        


                              
                      图3 鉴定结果与数据库PeptideAtlas 和GPMDB收录的结果比较                           


文献来源:
Kim MS, Pinto SM, Getnet D, Nirujogi RS, Manda SS, Chaerkady R, Madugundu AK, Kelkar DS, Isserlin R, Jain S et al: A draft map of the human proteome. Nature 2014, 509(7502):575-581.


您需要登录后才可以回帖 登录 | 注册新帐号

本版积分规则  | 请遵守小木虫学术科研第一站管理条例,不得违反国家法律法规

Copyright 2014-2018 小木虫学术科研第一站(xmuchong.com)All Rights Reserved.

公安备案:津公网安备 12011102000110号

      

ICP备案/许可证号:津ICP备14003772号-3

      

跟帖评论自律管理承诺书

      

统一社会信用代码:911201110731367936