微生物群落研究中的PK 二代测序VS三代测序?
三代测序中的PacBio SMRT测序平均读长可以达到10-15Kb,微生物群落生态学中常使用的标志物16S rRNA基因全长约1.5Kb,目前16S的扩增子测序常采用的策略是扩增一小片段高变区如V4区来进行群落生态方面的研究,人类微生物组计划(HMP)等也都是采用的这种方法,虽然短片段没有全长那么准确,但是当研究目的偏向于生态学时这种方法影响也不是很大。采用这种策略的话通常使用的测序平台是454平台或Illumina Miseq/Hiseq,454测序长度相对较长,但通量相对较低且接近淘汰, Illlumina平台是目前使用最为广泛的,大量的生物信息软件也都是为短读长reads设计的。
如果研究目的对分类的要求比较高也就是更加偏向于生物学研究的话,那么是否可以使用PacBio平台进行16S的研究?目前基于模拟群落(synthetic mock community)以及自然群落的研究发现在相同的试验和分析条件下,Miseq与PacBio显示出了较大的差别,使用三代测序能够提升OTU聚类的准确性[1],因为较长的读长能够横跨更长的高变区(如V1-V6)。三代测序的最大问题在于测序错误率要比二代高出10倍以上[2],而且其通量要比目前常用的Illumina平台低很多。因此用于扩增子测序和宏基因组测序仍不是很现实,不具有价格上和效率上是优势。
综合二代和三代的优势来看当前三代常用在基因组测序中,因为三代测序的错误是随机错误,在增加测序覆盖度后,能显著降低基因组de novo和重测序的错误率。三代测序的长读长能够较大的提升序列组装的效果。二代的高通量加上三代的长读是一种强强联合。
Fig1:聚类方法与测序平台均会影响群落分析结果
参考文献:
- 上一条:肠道微生物竟然影响癌症免疫治疗效果?!
- 下一条:罗宁生物云服务器维护通知