如需在网页中查看本邮件,请点击这里

newsletter banner

欢迎

如果您将去参加在台湾举行的 Human Proteome Organization World Congress,欢迎来展位23拜访我们。

本期我们将关注为何修饰较多的肽段研究结果总是会得到较高的false discovery rate (FDR),并给您如何避免出错的一系列建议。

本月特色文献深入表征了著名的痘病毒蛋白。如果您最近也有文章发表并且希望我们列举在下一期的Newsletter中,请发给我们 相关的PDF 或者URL.

本月Mascot技巧讨论了NCBI将要放弃的'gi number'定义这样一个重要更新。

如果你有任何建议和问题,请随时 联系我们.

 

September 2016

甲基化肽段高FDR的原因
特色文章
本月Mascot小技巧
 

甲基化肽段高FDR的原因

采用target/decoy方法评估false discovery rate是MS/MS大数据集搜库的极佳策略,在过去的十年中得到了研究者们的广泛应用。最近新南威尔士大学的研究者在进行甲基化肽段研究时发现在全局FDR小于1%的时候,只计算甲基化肽段的FDR,其值依然高达70%。

这个研究实验及分析非常重要且相当严谨,同时提出了对于提高数据库搜索结果精度和可解释性的重要问题:

  • 我们不能讲全局性的FDR标准直接在一组子集,如修饰肽段群体中直接引用
  • Target/decoy评估的是序列随机匹配的比例。但它不对同源但序列错位的肽段或者修饰肽段进行建模评估
  • 我们依赖于找到随机匹配结果来排除某些形式的错误匹配
  • 数据库搜索无法告诉你某个修饰匹配结果是否元素组成正确而修饰结果或者是人工合成的非自然存在修饰
  • FDRs基于PSM或者不同序列的计数,但这两个方法计算方式不同,不要混用,根据个人习惯一直用其中一种就行了
  • 如果你要混合多次搜库数据结果评估FDR,那就不建议使用基于不同序列计数的FDR算法了

这些影响因素我们在一系列日志中进行了详细分析 (part I, part II, part III). 部分因素我们目前还找不到方法解决。其他一些可以尽可能的进行规避。比如说可以利用Mascot Error Tolerant Search来判断某些修饰是否需要设置为固定或可变来纳入正式搜库分析中。

ROC curve

使用Mascot发表的优秀文章

这里我们列举了近期一篇很有意思的,也很重要的文章。该文章运用Mascot进行了蛋白鉴定,定量及特性分析。如果您也想让我们列举您的文章,请将文章的 PDF 或者URL 发送给我们

 

牛痘病毒蛋白更高分辨率下的主要结构

Tuan Ngo, Yeva Mirzakhanyan, Nissin Moussatche and Paul David Gershon

Journal of Virology, published online August 24, 2016

痘病毒家族中,牛痘病毒蛋白被我们用于消灭天花,同时它是一种巨大且复杂的蛋白复合物。尽管我们对它的研究已经相当透彻了,其蛋白组成成分依然没有得到彻底解析。本文作者采用了一系列样品制备和解析方式对其进行了相当深入和细致的蛋白质组分析。

作者采用了四种内切酶和CNBr消化了病毒蛋白组,并联合使用了CID,HCD,ETD模式采集数据并用用Mascot对结果进行了分析,从而获得了痘病毒蛋白质组更加全面的数据信息。作者进一步采用18O-ATP标记和IMAC技术分析了其磷酸肽的信息。

该结果覆盖了其理论蛋白质组88%的序列并第一次检测到了其27个开放读码框。该病毒的磷酸化蛋白组数据量也从原有的189个磷酸化位点数据翻倍到了396个。

Thumbnail from featured publication

本月Mascot小技巧

NCBI 近期正式弃用了'gi number'来索引其'nr'蛋白质数据库,比 之前的计划略微提前。

nr数据库的优势在于其相对完整而频繁更新。而其数据库大小在2016年9月时已经达到了fasta格式下的54GB,包含9400万条序列。大多数情况下有更合适的数据库可以选择,比如选择GenBank的感兴趣物种蛋白库或者Uniprot物种蛋白质组数据库。

但如果您研究的对象不在主流数据库收集范围内,或者有分析流程一定要用到gi索引号,那么你可能得保存一份2016年8月的最后一版的nr数据库了。 也就是说记得不要对它开启任何自动升级功能避免覆盖。

nr Fasta和种属索引目前在NCBI上可以下载,不过其还是有些错误和遗漏。Mascot已经公布了 新的配置说明, 但依然需要一点时间来调试和优化,所以建议各位不要立刻去更新现有的nr数据库。

NCBI dumps gi numbers

关于 Matrix Science

Matrix Science 为蛋白组学的研究人员以及科学家提供生物信息分析工具,帮助他们更快速,更可信的鉴定和定量蛋白。Mascot 软件全线支持来自Sciex, Agilent, Bruker, Shimadzu, Thermo Scientific 以及 Waters质谱仪生成的质谱数据。

请联系康昱盛以获取更多的信息。

 

Matrix Science logo

Matrix Science Ltd, 64 Baker Street, London W1U 7GB, UK
T +44 (0)20 7486 1050  F +44 (0)20 7224 1344  E info@matrixscience.com
 

View in a web browser Forward to a colleague Unsubscribe