第35期:2013年12月12日 蛋白质组海量质谱数据的深度解析等

  学术报告 

  报告一: 

  蛋白质组海量质谱数据的深度解析 

  报告人:贺思敏 中科院计算所研究员 

  摘要 

  蛋白质组学的发展始终受到串联质谱数据解析率低的困扰,而近年来以高精度串联质谱数据为基础的精密蛋白质组学有望摆脱这一困扰。本报告以德国马普生化研究所Mann实验室的蛋白质组学数据为对象,以MaxQuantpFind系列软件为工具,分析了当前高质量的高精度串联质谱数据的解析率,分析了过去低精度串联质谱数据解析率低的原因,分析了未来获得更高解析率的途径和可能,最终乐观预测蛋白质组学的数据分析瓶颈即将被打破。 

  报告人简介 

  贺思敏,中国科学院计算技术研究所研究员、博士生导师。1997年毕业于清华大学计算机科学与技术系。近十年研究方向为计算蛋白质组学,专注于蛋白质组海量质谱数据的深度解析,带领团队完成了具有完全自主知识产权的规模化蛋白质鉴定的数据库搜索引擎pFind、从头测序引擎pNovo和交联鉴定引擎pLinkpFind引擎连续三年在美国ABRF iPRG蛋白质鉴定国际评测中表现出色,并成功用于核心岩藻糖化蛋白质的规模化鉴定,合作研究论文发表在MCPpNovo引擎在多种酶切肽段的高精度HCD谱图、ETD谱图单独或联用条件下的从头测序精度和速度均达到当前国际最佳水平,并成功用于线虫纲精细胞活化与精子竞争机制研究中两个关键蛋白因子的测序,合作研究论文发表在PNASpLink引擎在国际上首次实现了常规实验条件下复杂样品交联肽段的规模化鉴定及其质量控制,合作研究论文发表在Nature Methods并受到专题评论。pFind团队与国内蛋白质组学团队开展了广泛而深入的交叉合作研究,倡议并主办了第一届、第二届中国计算蛋白质组学研讨会。 


  报告二:pNovo+:集成高精度HCDETD质谱数据的肽段从头测序算法 

  报告人:迟浩 中科院计算所助理研究员 

  摘要 

  从头测序是指直接从串联质谱图推导出肽段序列的方法,它在谱图解析过程中完全不依赖蛋白质数据库,而是通过质谱图中的连续谱峰的质量差推导出整个序列。我们首先开发了基于HCD谱图的从头测序算法pNovo,并利用该算法参与了线虫精细胞活化的相关研究。该项研究发现了在猪蛔虫Ascaris suum的精细胞活化过程和精子竞争过程中,两种关键蛋白质As_Srp-1As_Try-5的作用,并阐明了其中较为完整的调控机制。以此为基础,我们针对高精度HCDETD谱图对 (spectral pair) 设计了新的从头测序算法pNovo+,并在多种酶切产生的数据集中进行测试。结果表明,使用HCDETD谱图对进行从头测序,在测试数据集上前三名结果的平均正确率约为92%,比单独使用HCDETD分别多出25%55%,比二者结果的并集也多出了13%。同时,pNovo+算法的速度相对同类算法而言也有大幅提升。目前,在长度不超过19的肽段数据上,测序速度可以达到每秒钟50张谱图或谱图对,接近甚至超过目前几种主流质谱仪的数据产出速度。同时,基于多种酶切产生的质谱数据,我们设计了序列拼接算法,在标准蛋白数据集上,每条蛋白的平均可拼接长度达到70,大大超出了常规从头测序算法可支持的测序长度范围。 

  报告人简介 

  迟浩,中国科学院计算技术研究所助理研究员。2013年博士毕业于中科院计算所。自2006年以来,致力于蛋白质组海量质谱数据的深度解析研究,于20102013年先后在JPR发表pNovopNovo+两个算法和软件,其算法精度和速度达到当前国际最佳水平,并成功用于线虫纲精细胞活化与精子竞争机制研究中两个关键蛋白因子的测序,这是国际上从头测序技术不多的成功实践,相关文章发表在PNAS。迟浩也是蛋白质鉴定搜索引擎pFind的核心代码和支撑软件的主要设计者与开发者之一,目前pFind软件系统国内外注册下载达400套,在国内外蛋白质组学教学、科研中发挥着积极作用。 

  主持人:谭敏佳、周虎 研究员 

  时间:20131212日(周四)下午 13:30-16:00  

  报告地点:上海药物所一号楼怡生厅