动植物基因组de novo测序
基因组de novo测序也叫做基因组从头测序,是指不依赖于任何已知基因组序列信息对某个物种的基因组进行测序,然后应用生物信息学手段对测序序列进行拼接和组装,最终获得该物种基因组序列图谱。从基因组水平上对物种的生长、发育、进化、起源等重大问题进行研究,将加深我们对物种的认识,在新基因的发现、物种改良等方面发挥巨大作用。
采用传统的Sanger法测定高等动植物的全基因组需要花费大量的人力和物力资源,这极大限制了全基因组测序的发展。第二代高通量测序技术的成熟和广泛应用,大大降低了基因组测序的成本,缩短了测序时间,让更多实验室可以独立开展动植物基因组测序项目。
技术路线
应用第二代高通量测序技术,构建200bp、500bp、2Kb、6Kb、10Kb、20Kb等不同大小的DNA测序文库,进行双末端海量测序,以避免基因组中重复序列造成的错拼。当测序数据量达到基因组大小的60倍以上时,即可保证基因组的完整性和序列中单碱基的准确性。
Roche 454测序技术的优点是单序列读长可以达到500bp,结合20Kb的Paired-End测序数据,可为基因组组装提供高质量的框架。Illumina测序技术的优点是测序数据量大,可为基因组组装提供高覆盖率的数据。根据物种基因组的复杂度,特别是重复区域的大小和数量等信息,科学的制备不同梯度的测序文库,合理的使用不同的高通量测序技术,能够高效经济的完成高等动植物的基因组图谱绘制。
技术指标
基因组框架图 | 基因组精细图 |
基因组覆盖率>90% | 基因组覆盖率>95% |
基因区覆盖率>95% | 基因区覆盖率>98% |
Contig N50 >5Kb | Contig N50 >20Kb |
Scaffold N50 >20Kb | Scaffold N50 >300Kb |
单碱基错误率<0.01% | 单碱基错误率 <0.01% |
生物信息分析
1. 基因组拼装统计
提供基因组拼装的基本信息,包括原始数据统计、测序覆盖率统计、Contig N50大小、Scaffold N50大小、基因组GC含量等信息。
2. 基因组注释
包括基因预测、基因功能注释(同NR、Swissprot、Interpro等数据库进行同源比对)、重复序列分析及Non-coding RNA注释等。
3. 基因功能分类
COG分类、GO分类、KEGG通路分析等。
4. 比较基因组学及进化分析
通过比较相近物种的基因组数据,从基因功能、基因组骨架结构、分子进化等方面对目标基因组进行分析。
5. 建立数据库
建立符合国际标准且具有良好兼容性的基因组数据库,实现基因组数据的查询与共享。
实验周期
美吉生物从获得合作伙伴样品、高通量测序到数据分析,一般控制在4个月内完成。具体完成时间视基因组大小和重复序列情况而定。
送样要求
1. DNA样品:浓度≥30ng/μl,总量≥500μg,OD值应在1.8~2.0之间,样品浓度越高越好。
2. 植物样品:需为黑暗无菌条件下培养的黄化苗或组培样品,最好为纯合或单倍体。
3. 动物样品:应挑选肌肉、血等脂肪含量较少的组织进行取样。为了减少个体差异对后续拼接产生的影响,应尽量从同一个体中取样,若物种体积较小,从一个个体提取的DNA量不够进行一次测序反应,在保证量的情况下,应尽量减少个体的个数。测序样品最好为纯合体。
4. 请填写完整的送样订单,用自封袋密封后随同样品一起送样。
了解更多内容,请点击:http://www.majorbio.com/Products/de_novo_Sequencing
编辑: helen