复杂疾病,也被称为多基因遗传病,是指由多个微效基因的累加效应结合环境因素共同作用所导致的疾病。大多数人类常见疾病都属于复杂疾病,例如糖尿病、高血压、冠心病、银屑病、精神分裂症、阿尔茨海默症等。因其具有患病率高,发病机理复杂,难以治愈等特点,一直是困扰医学界的难题。
针对复杂疾病我们可以从以下几个方面展开测序研究:
一、DNA水平的测序研究
对于复杂疾病的遗传学研究,主要集中在寻找和定位疾病易感基因方面。传统的研究模式是以假说为导向,即首先假设某基因为致病候选基因,再对其进行深入研究,一次只能研究单个或几个基因。而现代的重大疾病的研究模式,是以数据为导向,对物种或个体进行基因组水平、大规模化研究,即在掌握基因组全局的情况下,发现影响疾病的基因位点。全基因组关联分析(Genome-wide association studies,GWAS),不同于以往假说驱动的候选基因研究方法,GWAS利用分析标签SNPs,检测人类基因组中大多数常见SNPs,目的是识别人类基因组中可能与复杂疾病相关联的变异。在过去五年中,研究人员利用GWAS对100多种复杂疾病和性状进行了研究,发现了大批易感基因和位点。
然而,目前GWAS识别的变异仅能解释小部分常见疾病的遗传风险,这可能和目前GWAS只能识别常见变异有关[1] 。几年前,“常见疾病-常见变异”(common diseases-common variants)的说法已经被广泛接受,其主要观点认为常见疾病由常见变异引起,GWAS研究就是利用这种学说的理论进行关联性研究。然而近年来更有说服力的证据表明,稀有变异在疾病的发生和发展中发挥与常见变异相似甚至更重要的作用[2] 。
1.新一代GWAS
与现在普遍运用的基于芯片(已知SNPs)的GWAS不同,新一代GWAS 针对整个外显子组或感兴趣的目标区域(已被GWAS等前期研究识别)进行高通量测序,能够发现新的致病性突变。不仅是已知的、常见的SNPs,新一代GWAS在发现尚未揭示的遗传信息方面(包括稀有SNPs和结构性变异)显示了惊人的优势。
华大基因基于全基因组关联分析的研究思路,向复杂疾病的研究者推荐两套新一代GWAS的应用方案:
♦ 方案1
在第1阶段对选定的病例和对照组进行外显子测序,获得候选的SNP集合。然后通过在更大的群体中对候选SNPs进行基因分型验证,以进一步发现可能的致病基因突变,尤其是那些较为稀有的突变。方案1的具体流程见图1。
• 第一阶段:高通量的外显子组测序
如图1所示,在第1阶段,对外显子组进行测序。获得测序数据后,我们建立了一种统计分析方法对其进行似然比的分析[3] ,并通过大量的模拟分析确保了该统计方法的准确性。对数据的模拟分析表明,样本量对power值(检验效能)的贡献远高于测序深度对power值的贡献,所以,在经费一定的情况下,适当降低测序深度,增加测序样本量,能显著提高Power值。这一发现可以为基于新一代测序技术的关联分析的样本选择提供指导。表1列出了四个可供选择的参考方案。研究者可以根据不同的研究目标,进行外显子测序样本量的选择。
注:Power值指的是检验效能,也称为把握度。它表示如果确实存在差异的话,能发现这种差异的概率有多大。在复杂疾病的GWAS研究中,Power值指的是找到与疾病遗传性相关位点的效能,Power值越大,能够检测到疾病关联信号的可能性更大。
对外显子测序结果的信息学分析,主要是通过对病例组和对照组的等位基因频率的估计进行疾病相关SNPs的选择,以及识别潜在的有害SNPs(MAF>1%)。这些分析结果结合已知的SNPs(主要是之前的GWAS研究获得),就能得到一个候选的SNP集合。最后,通过进一步的大规模基因分型对这个候选的SNP集合进行验证(图2)。
• 第二阶段:大规模的基因分型验证
在更大样本条件下对获得的候选SNPs进行基因分型验证。BGI拥有自己的iScan基因分型平台进行基因分型,iScan系统是一套技术一流的专业芯片扫描系统,能对Illumina基因分型芯片进行快速、灵敏和精确的成像。表2中列出了两类常用的定制型基因分型芯片。经过基因分型实验和SNP质控后,通过进一步的关联分析,进行疾病的相关基因/位点的验证。
以下网友留言只代表网友个人观点,不代表网站观点 | |||