数据挖掘方法及TCGA、GEO、公共数据库挖掘培训课程

作者:   2018-12-21
字体大小:
  • 会议时间: 2019-01-16至 2019-01-18
  • 会议地点: 北京
  • 电话:17600400581
  • 传真:暂无
  • 联系人:康老师
  • Email: 18351788667@163.com
  • 联系地址:北京市海淀区信息路甲28号D座6层06B-6066
  • 会议网址:www.hdpaii.com

各有关单位:

当前的大数据时代对生物医学领域产生了巨大的影响,成为生物医学领域的最新驱动力。各种生物医学数据库应运而生,使得数据分析及数据挖掘在生物医学领域的应用具有重要的意义。其中癌症基因图谱The Cancer Genome Atlas (TCGA)数据库为肿瘤基础医学和转化医学研究者提供了海量的基因组数据和与其关联的临床数据,从而为发现影响肿瘤起始、发展、分化、转移等生物学机制提供了海量数据基础。Gene

Expression Omnibus(GEO)基因表达数据库是当今最大、最全面的公共基因表达数据资源,含有除肿瘤外的多种疾病种类,临床医生可以从该网站上免费下载与自己研究方向相似的数据来进行分析,并撰写论文。因此通过将数据挖掘方法、生物信息学和医学统计学进行融合,挖掘公共数据库并提取有价值的信息,能够为研究者更深入的进行研究提供帮助。应广大技术工作者的要求,北京软研国际信息技术研究院特举办“数据挖掘方法及TCGA、GEO公共数据库挖掘”培训班,本次培训由互动派(北京)教育科技有限公司具体承办,具体相关事宜通知如下:

一、时间地点:2019年1月16日-1月18日 北京(时间安排:第1天报到,授课2天)

二、主讲老师:来自985院校资深教授,主要研究各类型数据统计分析、生物医学大数据挖掘及生物信息学分析等,主持和参与多项国家级、省部级和局级科研课题。

三、报名费用:每人¥3300元(含报名费、培训费、资料费),食宿费用自理。如需开具会议费的单位请联系招生老师要会议邀请函;价格优惠政策:1月8号之前报名汇款的客户每人优惠400元;

四、培训目标及课程特色:当前,很多公司开发的商业数据挖掘产品较为昂贵,算法更新较慢,不适合个人和小型科研团队使用。而R软件是一款国际通用的免费软件,其功能十分强大,且运算结果可靠。目前,在国际上非常流行。本次课程拟解决的问题包括:

1.轻松掌握R语言的基本操作;

2.以案例形式详细讲解如何应用R软件完成数据挖掘分析,涉及的数据挖掘方法均为当前较为热门的分析算法:包括随机森林分类器的构建、指标和样本的聚类与分类、各种热图的绘制及肿瘤基因组数据的整合分析等。

3.了解芯片分析相关知识,掌握GEO数据库的下载

4.掌握GEO2R在线分析工具,轻松完成芯片数据分析

5.应用Cytoscape软件绘制基因网络调控图

6.应用DAVID在线工具完成基因功能富集分析(GO和Pathway富集分析)

7.掌握TCGA数据库的下载,结合TCGA在线工具和R语言编程分析各种类型数据(mRNA, miRNA,甲基化,拷贝数等)

8.结合文章实例和实战经验,熟悉数据挖掘文章撰写的基本套路,详细讲解近年来国内外基于GEO和TCGA数据挖掘的经典案例及SCI论文发表经验。

五、报名联系方式:

联系人: 康老师 

咨询QQ:1608279788

手机:17600400581

邮箱:18351788667@163.com(同微信)

“数据挖掘方法及TCGA、GEO公共数据库挖掘”培训班课程内容

一、数据挖掘介绍及R软件实操

1. 临床科研中的数据挖掘思路

2. 如何应用数据挖掘方法提升论文级别

3. R软件实操

1)R软件的下载和安装

2)R软件的基本运算(向量运算、矩阵计算)

3)R软件的基本统计分析操作(t检验,卡方检验,线性回归,logistic回归)

4)统计分析批处理的R软件实现

二、数据挖掘常见算法的R软件实现

1. 随机森林分类器的构建及R软件实现

2. 应用主成分分析绘制分类图

3. K均值聚类与系统聚类的R软件实现及可视化

4. 双向聚类热图的绘制

5. Logistic回归与Cox回归的列线图绘制

三、肿瘤基因组数据挖掘的R软件包CancerSubtypes

1. 数据导入及数据预处理(数据正态化,数据的缺失值填补)

2. 聚类热图的绘制

3. 提取差异表达基因

4. 绘制火山图

5. 应用非负矩阵分解聚类法进行肿瘤亚型分析(肿瘤亚型比较,绘制亚型聚类热图和Silhouette图)

四、GEO数据库及GEO2R在线分析工具

1.了解芯片分析相关知识,掌握GEO数据库的下载

2.掌握GEO2R在线分析工具,轻松完成芯片数据分析

3.应用DAVID在线工具完成基因功能富集分析(GO和Pathway富集分析)

五、TCGA数据库

1. TCGA数据库下载

2. TCGA在线分析工具介绍

3. 生物数据与临床数据的整合分析思路

4. 应用Cytoscape软件绘制基因组网络调控图(如miRNA-mRNA互作网络图,蛋白质-蛋白质互作网络图等)

六、数据挖掘案例讨论与分享

1. 案例:应用决策树获得影响结局的决策准则及应用随机森林算法预测样本分类并提取结局的重要风险因素——决策树和随机森林方法发表SCI论文经验分享

2. 案例:应用分类与聚类进行全基因组突眼症的DNA甲基化数据分析——分类与聚类发表SCI论文的经验分享

七、基于TCGA数据和GEO数据挖掘的案例解析

1. 利用TCGA进行数据挖掘及临床转化课题设计

2. 基于TCGA数据挖掘和GEO数据挖掘文章的解析

编辑: 会议君   

声明:

1.丁香会议频道仅负责发布会议信息,如需参会、获取邀请函或会议日程,请与主办单位联系

2.部分会议信息来自互联网,如您发现信息有误,请联系meeting@dxy.cn纠错

3.如您发现信息不全,可点击Google搜索更多

4.更多服务信息请点击这里