随着越来越多的全基因组测序项目的完成,以及GWAS研究的广泛开展,如今往往只需对基因组中感兴趣的特定区域进行测序就可满足研究需求。目标区域测序就是通过定制感兴趣的基因组区域的探针,与基因组DNA进行芯片杂交(NimbleGen序列捕获芯片)或液相杂交(Agilent Sure-SelectTM系统),将目标区域DNA富集后进行高通量测序的研究策略。
目标区域测序已经成功的应用于发现遗传性疾病的新的致病基因。最近,通过目标区域测序技术发现了多个疾病的新的致病突变,包括SMNA[1] ,PN[2] ,FEVR[3] ,隐性非综合征型耳聋[4] ,TARP[5] 等遗传性疾病。
1、技术优势
♦ 针对感兴趣的基因组区域进行遗传变异位点的寻找
♦ 对特定区域进行深入研究
♦ 缩短研究周期-加快文章发表与加速临床应用
♦ 更高通量-适合大样本量的研究
♦ 节约成本
2、实验流程
目标区域测序的流程:被选区域可以是连续的基因组序列,也可以是独立位点或外显子序列。合作伙伴只需提供待测DNA样品和候选基因列表,华大即可完成探针定制、区域捕获、高通量测序和生物信息分析等全套流程(图1)。
华大采用HiSeq2000高通量测序平台,对于目标区域测序来说,通常采用双末端测序,读长为90bp。为获得更多更准确的目标区域信息,建议所有样品的平均测序深度为50X或以上。
3、目标区域捕获平台介绍
在华大基因,NimbleGen芯片杂交与Agilent液相杂交两种捕获平台都已成功应用于目标区域的捕获。对于6M以下的目标区域,合作伙伴可任意选择某种捕获平台,当目标区域大于6M时,建议选择NimbleGen平台,可降低成本。两种目标区域捕获平台的实验流程如下:
4、信息分析流程
目标区域测序后经过滤等处理后获得的reads,运用SOAPaligner软件比对到参考基因组上,对获得的数据进行标准流程下的信息分析,可以得到单核苷酸多态性(SNP),插入缺失突变(InDels)等分析结果。同时进行测序深度、覆盖度及均一性等有效数据统计。另外,华大也可根据研究需要,提供个性化信息分析结果。目标区域测序具体的信息分析流程见图3。
标准信息分析
♦ 数据产出的统计
♦ 外显子区域测序深度的直方分布图
♦ 外显子捕获的均一性分析
♦ 一致性序列的获得和SNPs的检测
♦ SNPs的注释
♦ 插入和缺失(Indels)的检测
♦ 插入和缺失(Indels)的注释
个性化信息分析
♦ 氨基酸替代的预测分析
♦ 群体SNP的获取和等位基因频率评估
♦ Mendelian disorder analysis 孟德尔遗传疾病分析
♦ 基于新一代测序技术的全基因组关联(NGS-GWAS)分析
♦ 阳性信号的检测
到目前为止,华大已经顺利完成15000多样本的目标区域捕获测序,结果令人满意。正在进行中的也有10000多样本。另外,华大在目标区域测序方面也在积极展开研发工作,如HLA的测序等。
缩略词
SMNA: Sensory/Motor Neuropathy with Ataxia; PN: Clericuzio-type Poikiloderma with Neutropenia; FEVR: Familial Exudative VitreoRetinopathy; TARP: Talipes equinovarus, Atrial septal defect, Robin sequence, Persistent left superior vena cava.
参考文献
⑴. Brkanac, Z., Spencer, D., Shendure, J., et al. FRD1 is a candidate gene for SMNA on chromosome 7q22-q23. Am J Hum Genet, 2009. 84: 692-7.
⑵. Volpi, L., Roversi, G., Colombo, E.A., et al. Targeted next-generation sequencing appoints c16orf57 as clericuzio-type poikiloderma with neutropenia gene. Am J Hum Genet, 2010. 86: 72-6.
⑶. Nikopoulos, K., Gilissen, C., Hoischen, A., et al. Next-generation sequencing of a 40 Mb linkage interval reveals TSPAN12 mutations in patients with familial exudative vitreoretinopathy. Am J Hum Genet, 2010. 86: 240-7.
⑷. Rehman, A.U., Morell, R.J., Belyantseva, I.A., et al. Targeted capture and next-generation sequencing identifies C9orf75, encoding taperin, as the mutated gene in nonsyndromic deafness DFNB79. Am J Hum Genet, 2010. 86: 378-88.
⑸. Johnston, J.J., Teer, J.K., Cherukuri, P.F., et al. Massively parallel sequencing of exons on the X chromosome identifies RBM10 as the gene that causes a syndromic form of cleft palate. Am J Hum Genet, 2010. 86:743-8.
*更多技术细节,请与BGI技术人员联系!
以下网友留言只代表网友个人观点,不代表网站观点 | |||