动植物基因组de novo测序
常见问题及解答:
1. 如何避免基因组中的重复序列造成的组装错误?
应用新一代高通量测序技术,构建200bp、500bp、2Kb、6Kb、10Kb、20Kb等不同大小的DNA测序文库,进行双末端海量测序,可以避免基因组中的重复序列造成的错拼。当测序数据量达到基因组大小的60倍以上时,即可保证基因组的完整性和序列中单碱基的准确性。
2. 如何检测基因组组装的准确性?
目前,主要可以通过以下几种方法来检验基因组组装的准确性。①通过构建BAC或Fosmid文库,并进行常规测序,将所得序列与拼接好的Contigs做比对以判断基因组组装的准确率。② 将已知的基因序列与拼接好的Scaffolds做比对,查看两者是否吻合,吻合度越高,表明基因组组装越好。而且已知的基因序列越多,评价结果越可靠。③ 估计组装后基因组的单碱基准确度,利用新一代测序技术,如果95%以上的基因组单碱基覆盖度超过20×,则认为该基因组的单碱基准确度较高。
3. 第二代测序技术与传统Sanger测序相比有什么优势?
第二代测序技术的测序通量是传统Sanger法的上万倍,并且可以进行长片段双末端测序,将测序数据拼接成较长的Contig和Scaffold。与Sanger法相比,具有高通量、高灵敏度、高准确性、低成本及耗时短等多个突出的优势。如人类基因组测序是六个国家耗资27亿多美元历经10年才完成的,而如今利用第二代测序技术平台只需要几个月就可以完成。
编辑: helen