本会议由于带着明确的目的性去学习R语言,且针对有/无R语言基础的学员均具有很大宽容性,自开班起就广受好评。随着近年来生物信息学技术的普及,R语言是每个科研工作者都有必要掌握的技能,以往漫无目的的学习R效果不理想,用R去进行科研数据挖掘,既学习了R又解决了实际科研问题。
学完课程并掌握后能干什么:
1.没有课题的时候找到课题,没有机制的时候挖掘机制
2.为基金申请保驾护航,发表paper如虎添翼
3.掌握R语言的核心技能,GEO,TCGA,SEER的数据处理没有压力
4.科研绘图:以一敌百,高端大气,私人订制。
这是一份带有诚意且注重实战的数据挖掘课程。我们的目标是:一次学习,不再报班。
课程特点:
1.不留秘密,私货全出,全程只用R语言,关键步骤不隐藏。
2.第一天晚上时间充分利用,增加带有讲师指导的练习,更多的训练时间,更好的掌握。
3.讲最核心的知识,讲通用的技能,学后可应用到其他数据库的挖掘。
4.实例操作(至少3个套路),让你快速掌握数据挖掘套路。
5.现场完成一篇paper的思路以及图表。
适合人群:广大临床/科研工作者及心有热血被困囚笼的研究生
内容安排
第一天08:30-11:55
R语言基础知识介绍
R语言数据结构以及循环控制(向量,因子,矩阵,数据框,列表,for循环,if控制)编写自己的第一个批量处理数据的程序
R语言中数据框的操作(增删改查)
真实数据的清洗和整理
R包以及bioconductor资源的使用
R包无敌安装攻略
R语言绘图系统
11:55-13:30统一午餐
13:30-17:00
TCGA数据库背景介绍+阅读文献
TCGA相关的网页工具汇总学习
介绍不同的癌症和不同组学
不同的分析套路解读(WGCNA,signatures,miRNA-mRNA配对或者ceRNA等)
TCGA数据分析的软硬件准备
下载及理解TCGA数据(所有数据)
R制作TCGA表型数据临床三线表
17:00-18:00统一晚餐晚上
18:00-21:00
R语言数据框的操作练习(掌握tidyr和dplyr)
GEO数据库成套流程实战(数据清洗,热图,火山图,气泡图)
如何根据需求绘制一个漂亮的火山图(学习ggplot2)
使用R语言制作特定肿瘤所有基因表达的数据库
第一天答疑,消化,为第二天做准备
第二天08:30-11:55
差异分析(表达数据,表达矩阵归一化,DESeq2)
任意癌症任意基因在癌和癌旁的表达
如果有亚型,在不同亚型中的表达
如果有肿瘤有分期,在不同临床分期中的表达
单个基因在多个正常组织中的表达
单个基因在多个细胞系中的表达
单个基因在多个肿瘤中的表达
两个基因的相关性如何分析
聚类注释与图表展示(GO/KEGG,GSEA)
使用多种统计算法定位 signatures cox,lasso回归
生存分析
绘图美化
任意癌症中任意基因的生存分析
任意癌症中批量生存分析
TCGA文章的框架分析以及复现
答疑环节
11:55-13:00统一午餐
13:00-16:30
利用GEO和TCGA数据库找到课题
利用GEO和TCGA数据库发掘下游机制
如何利用GEO和TCGA数据库申请基金
如何利用GEO和TCGA数据库发表文章
现场完成一篇生信文章的所有图表
提出科研假设
根据科研假设下载整理数据导入R语言
在R语言中清洗和整理数据达到对应R包的要求
数据处理过程中调整分析策略
绘制各个部分需要的图标
时间地点:
第十六期 2019/12/14-15(13日报到) 上海维也纳酒店天山西路店(会议时间两天&一晚)
地址:上海市闵行区天山西路4086号,地铁2/10号线虹桥地铁站
第十七期 2020/1/4-5(3日报到) 北京冠京饭店(会议时间两天&一晚)
地址:北京市丰台区丰台北路79号,地铁9号线七里庄地铁站A口出
注册费用:3400元/人 按交费先后顺序安排座次,注册费包含会场、教材、午餐、视频课程等费用,不含住宿费。
主办单位:上海莫速乎教育投资有限公司、上海荆麦信息科技中心
报名咨询:王老师 136 2183 4129 (微信同号) msh088@126.com
请来电或者微信联系索取word函件。