丁香园 | 丁香通 | 人才 | 会议 | 药学 | 博客  
 点击次数:

基因表达谱分析

转载请注明来自丁香园
发布日期:2011-08-10 18:22 文章来源:丁香园
分享到: 收藏夹 新浪微博 腾讯微博 开心网 豆瓣社区 人人网
关键词: 专题 高通量 测序 生物   点击次数:

常见问题及解决:
 

1. 基于转录组测序数据,如何估算基因表达水平?

一个基因表达水平的直接体现就是其转录本的丰度情况,转录本丰度越高,则基因表达水平越高。在分析中,我们可以通过定位到基因组区域或基因外显子区的reads计数来估计基因的表达水平。Reads计数除了与基因的真实表达水平成正比外,还与基因的长度、测序深度成正相关。为了使不同基因、不同实验间估计的基因表达水平具有可比性,人们提出了RPM和RPKM的概念。RPM (Reads Per Million reads)是每百万条reads中来自于某一基因的reads数目,考虑了测序深度对reads计数的影响。RPKM(Reads Per Kilo bases per Million reads)是每百万reads中来自某一基因每千碱基长度的reads数目。RPKM同时考虑了测序深度和基因长度对reads计数的影响,是目前最为常用的基因表达水平估算方法。软件rSeq、DEGseq、Cufflinks等都提供了基于上述方法进行基因表达水平计算的功能。
 

2. 基因表达谱分析与以往的数字化表达谱分析有什么差异?

以往的数字化表达谱利用NlaIII酶有选择的测定接近mRNA 3'端,长度为21bp的序列,并作为标签(tag)来代表每一个转录本,从而研究基因的表达差异。而现在的基因表达谱分析则是通过构建cDNA测序文库,并测定35bp的序列片段来分析基因的表达情况。与数字化表达谱相比,这种方法具有更高的随机性;更长的序列长度提高了测序数据的特异性,减少了一个tag代表多个基因的可能性。
 

3. 短片段测序是否足够注释一个基因?

以往的数字化表达谱测序片段长度仅21bp,在大多数情况下已经足够注释一个基因,而现在的基因表达谱分析在测序的随机性和长度方面都有所改进,所以足够注释基因并分析其表达情况。

编辑: helen

以下网友留言只代表网友个人观点,不代表网站观点