全基因组重测序是对基因组序列已知的个体进行基因组测序,并在个体或群体水平上进行差异性分析的方法。随着基因组测序成本的不断降低,人类疾病的致病突变研究由外显子区域扩大到全基因组范围。华大基因将构建不同长度的插入片段文库和短序列、双末端测序相结合的策略进行高通量测序,实现在全基因组水平上检测疾病关联的常见、低频、甚至是罕见的突变位点,以及结构变异等,具有重大的科研和产业价值。
1、主要流程:
客户基因组DNA样本寄送,我们对DNA样本的质量进行检测,检测合格后进行基因组DNA片段化,电泳回收所需长度的DNA片段后,加上接头进行Cluster制备,最后上机测序。
华大采用Illumina Hiseq 2000和ABI SOLiDTM4.0 测序平台进行全基因组的高通量测序。对于全基因组测序来说,通常采用小片段文库,双末端测序,读长为91bp。为获得更准确的序列信息,建议所有样品的平均测序深度至少为10-20×。具体流程如图1所示:
2、生物信息学分析
测序完成后,经过滤接头等污染后获得的reads,运用SOAP aligner软件比对到参考基因组上,进行测序深度、覆盖度及均一性等产出数据的质量评估。对获得的数据进行标准流程下的信息分析,可以得到大量的单核苷酸多态性(SNP),插入缺失突变(InDels),结构变异(SV),拷贝数变化(CNV)等分析结果,利用生物信息分析对基因间的差异进行注释,最后寻找与疾病关联突变信息。另外,还能够根据已有数据库的信息对表型或疾病风险进行评估(使用HGMD的数据库)。具体分析内容如图2所示。
3、华大案例
华大基因对于全基因组重测序有丰富的经验(表1),如炎黄一号(The diploid genome sequence of an Asian individual)以封面文章发表在Nature上,该文章通过重测序发现了307万例单核苷酸多态性位点,13.5万核苷酸插入与缺失变异及2600例大片段DNA结构变异,阐述了中国人基因组结构特异性,对中国人与白种人基因组序列差异进行了比较,为常见疾病风险预测提供了大量数据;2008年华大与Sanger中心以及NHGRI合作启动了国际千人基因组计划,利用新一代测序技术对全世界的主要人种进行重测序。
*更多技术细节,请与BGI技术人员联系!
以下网友留言只代表网友个人观点,不代表网站观点 | |||