生物医学大数据的产出已经非常庞大,利用这些公共数据资源并融入自己的构想,然后分析解决生物学问题将是以后的关键,也是目前科研的热点。各种公共数据库呈井喷式发展,如TCGA、GEO和SRA。TCGA(癌症基因组图谱)是全球最大的癌症基因信息数据库,是一个多组学的数据库,包括常见癌症的基因组、转录组、蛋白组、表观遗传组数据和与其关联的临床数据,为挖掘有意义的组学变化和发现肿瘤发生、发展、转移等生物学机制提供了海量数据。
GEO数据库是当今最大、最全面的公共基因表达数据资源。不仅可以上传自己的数据,而且还可以免费下载数据库中和自己研究方向类似甚至相同的数据来进行分析,为自己的研究提供一些启示或者验证。SRA是NCBI上常用的一个数据库。它接受通过二代测序技术产生的遗传学数据以及与其相关的质控报告。
但是面对这些极其有价值的公共数据时,科研人员往往心有余而力不足,而且面对市面上的浩如烟海的各类教程也是一头雾水。本次培训提供了一次系统了解TCGA等数据产生,分析及挖掘的课程,帮助科研人员利用这些公共数据库挖掘多组学数据,以便为自身科研项目服务。
授课对象:从事肿瘤研究的临床医生、转化研究科研人员、在校研究生以及广大临床肿瘤研究领域的爱好者。
主办单位:中国生物工程学会计算生物学与生物信息学专委会
承办单位:北京市计算中心
举办地点:北京市海淀区丰贤中路7号北科产业3号楼,北京市计算中心会议室
举办时间: 2019.4.12-15(报名中)上午9:30-12:00,下午13:30-17:00.
日期 | 时间 | 授课题目 | 授课内容 |
第一天 | 上午 | Linux操作基础及常见命令 | 1、Linux系统操作 2、基本上机命令 |
下午 | R语言基础及实操 | 1、R语言简介 2、R基本数据结构,各种软件包下载和安装 3、R编程基础及语句判断 | |
第二天 | 上午 | SRA数据库介绍及使用 | 1、数据挖掘概述; 2、高通量组学研究基础知识; 3、SRA数据库在线工具的应用; 4、SRA数据上传与下载 |
下午 | GEO数据库介绍及使用 | 1、GEO在线工具的应用; 2、GEO数据下载和数据质量分析; 3、GEO芯片数据处理 | |
第三天 | 上午 | TCGA数据库介绍及使用 | 1、TCGA数据库基本概念介绍及数据获取 2、操作实战: TCGA数据获取,不同类型数据的使用 3、基于发表文章的TCGA数据分析作图实例 |
下午 | TCGA及生物网络调控分析 | 1、基因表达谱的PPI网络挖掘 2、利用cytoscape进行miRNA-mRNA互作网络、蛋白质-蛋白质互作网络上机操作 | |
第四天 | 上午 | 公共数据库挖掘文献解析1 | 1、基于TCGA和GEO数据挖掘文章的深度解析及复现(结合具体实例); 2、如何做成发表文章中的图表 |
下午 | 公共数据库挖掘文献解析2 | 1、经典文献解析及复现; 2、如何利用TCGA和GEO进行数据挖掘及临床转化课题设计 |
(课程内容以实际授课为准)
报名费用:注册费:3000元/人,包括学费、材料费、午餐费等。请自带笔记本电脑。 材料:《高通量测序与高性能计算理论和实践》北京科学技术出版社。
报名优惠政策:
1、2019.3.18日前报名并缴费,可享受减免200元优惠。
2、3人以上团体报名每人可减少300元;
3、4+1团报,可免费赠送一个名额;
4、上面3种优惠政策不能同时享受,只能享受其中一种。
老学员参加及推荐学员参加均可额外优惠200元。
培训以收到学员培训费为成功报名,培训座位按收到费用先后顺序安排。