在最近三五年内如果去介绍一个科研领域内的热点明星,我会毫不犹豫的推荐单细胞测序。从基金申请热度上来看,目前单细胞话题已经稳居前二,在测序领域单细胞测序的热门程度也逐渐超越了传统的RNAseq和ChIPseq,逐渐成为了新的流量话题王。
2017年10月16日 “人类细胞图谱计划”问世。第一批资助项目总计38个,其中唯一来自中国的是清华大学张学工教授,主要任务是“研究单细胞测序分析的生物信息学全景,为项目的后续发展提供基准参考”,在该项目的推动下单细胞测序热潮更是不断走高。
从09年的第一篇单细胞测序文章到现在10年的时间,单细胞测序的技术,分析算法,科研以及临床应用都取得了非常大的进步。积累的宝贵数据更是十分诱人,单单GEO数据库收录的单细胞研究样本已经近2万例,而且数据的增长呈现明显的指数上升趋势,而且单细胞测序几乎成为非常多CNS优秀文章的标配。但是居高不下的实验及测序成本一直困扰着大部分科研人员,动辄3万+/样,单个课题起码测个6例以上最低投入也接近20万,如果再加上实验失败的样本费用及分析费用预计在30万上下。
那么有没有较低门槛可以介入单细胞测序领域快速发文章的方法呢?
我们邀请到国内第一批做单细胞测试实验室的Dr Wang,为大家专门设计了一门数据挖掘课程,专门针对单细胞转录组测序数据进行「课题设计以及数据挖掘」。数据挖掘类的文章伴随二代测序的发展已经有了趋于成熟的研究策略,但是目前进行传统测序数据挖掘的研究太多,发文的难度也是越来越高。
但是单细胞测序数据的挖掘目前还是处于从零开始的状态,而这座巨大的数据宝库又那么诱人。所以我们在努力争做第一批吃螃蟹的人,从单细胞测序的原理,挖掘思路的寻找,到找数据,到整合分析,再到结果解读以及成文思路,课程都会进行详细的讲解及演示,并提供一套老师写好的高度自动化的分析代码直接产出发表级别的图。争取让学员通过课程能尽可能全面的了解单细胞是什么,能做什么,以及该怎么做。可能会有学员关心自己关注的课题领域是否有足够的测序数据可供挖掘,目前在公共数据库中的单细胞测序几乎都围绕常见模式生物来做。人,小鼠,斑马鱼等,涉及正常组织、血液、不同发育阶段样本,疾病类型也各种各样包括肿瘤、免疫细胞、炎症类甚至包括较难研究的神经、肌肉、骨骼等。最重要的是,它一直在增加,因此我相信您也一定能参与进来。
课程目标及特色:
1. 编程零基础学员即可参加,用通俗易懂的方式掌握R语言基本语法及做生信分析的技能;
2. 了解单细胞测序的基本概念、原理、主要数据库及下载流程方法;
3. 通过全流程讲解单细胞测序及分析,掌握单细胞挖掘的全流程,及单细胞转录组的发文思路;
4. 通过高度自动化的代码全分享,学会用R软件进行单细胞转录组分析及作图
5. 掌握零成本的单细胞相关课题设计思路,基金申请注意事项,可辅导针对性的课题设计及实操;
6. 通过课程学习可直接接近产出文章,课后讲师定期答疑;
课程安排:
第一天
上午8:30-10:30
生物信息学及单细胞转录组介绍
1.生物信息简介
2.如何学习并入门生物信息
3. 自学生信需要哪些条件
4. 二代测序到底在测什么
5. 二代测序的地位及防骗指南
6. 单细胞转录组技术发展历史
7. 单细胞测序的重要性
8. 当前单细胞测序的进展及投入程度
9. 单细胞转录组的测序原理
10. 通过单细胞转录组测序可以解决什么科研问题
10:30 - 12:00
单细胞挖掘的基础R语言
1. 为什么做生信要学R语言
2. 能不能只学R语言来解决全部的生信数据分析
3. 学习R语言的路线及资源分享
4. 快速进阶R语言的技巧分享
第一天下午13:30 - 15:30
R语言实操练习
5. R语言实操练习-先学帮助系统
6. R语言package的安装,加载及管理
7. R语言的错误提示及解决问题方法
8. R语言的常见数据类型:数值,字符,逻辑
9. R语言的常见数据结构:向量,因子,矩阵,数据框,列表
10. 编写第一个复杂的R函数
11. 用循环来解决重复性的工作
12. 常见的高频R内置函数
13. R语言的文件读写:文本,CSV,XLSX文件一行命令搞定
14. 用R语言处理一个表达矩阵提取高表达基因
15:40 - 17:00
常用单细胞数据库介绍、应用及实操
1. 最大最全的常用数据挖掘数据库-GEO
2. GEO数据库介绍及检索技巧分享
3. GEO数据内容解读,关键信息提取
4. 练习如何寻找到自己想要的数据,挑选1-2例点评
5. 介绍GEO中常见单细胞测序数据的类型
6. PanglaoDB数据库介绍
7. 如何借用PanglaoDB寻找数据,辅助设计课题
8. PanglaoDB隐藏功能分享
9. CellMarker数据库解读
10. CellMarker数据库在单细胞分析中的重要性
11. 用R批量下载CellMarker数据库并处理成内置数据库用于后续分析
12. 实操下载两套单细胞数据并用R读入
13. 常用单细胞转录组数据库总结
第二天
上午8:30-12:00
单细胞转录组分析全套流程演练及实操(附相关的高度自动化运行代码)
1. 分析GEO中下载的数据
2. 常见单细胞分析工具包Seurat,Monocle,scater介绍
3. 单细胞数据读入:10X数据,表达矩阵数据
4. 多组样本数据合并
5. 测序数据QC-线粒体基因分析,RNA分子量分析
6. 细胞表达谱过滤
7. 表达矩阵标准化
8. 计算高显著变化的基因
9. PCA降维分析:碎石图,PC热图展示结果
10. 随机抽样JackStraw图
11. TSNE聚类生成细胞聚类TSNE图
12. DIY多种类型TSNE图
13. 组间细胞类型对比分析
14. 特定细胞类型的细胞统计
15. 不同类细胞的cluster基因计算
16. Marker基因热图及TSNE表达水平图
17. Marker基因细胞类型分析
第二天
下午13:30-17:00单
细胞分析实操、案例性解析归纳单细胞的课题设计方法、基金申请注意点
1. 特定类群细胞功能分析-GO/KEGG
2. GeneOntology分析特定类群细胞
3. 自动绘制GO图代码分享
4. 自动绘制KEGG图代码分享
5. 单基因功能分析方法及数据库介绍
6. 单基因共作用通路图
7. 单细胞数据分析总结
8. 如何避免单细胞数据挖掘的坑
9. 解析顶级期刊发表的经典单细胞文献
10. 单细胞文献中的图重现
11. 归纳总结两种经典实用的零成本单细胞数据挖掘思路
12. 如何零成本进行单细胞相关的课题设计思路、方法、技巧
13. 单细胞测序基金申请思路、相关准备、注意事项等
适合人群:医学、生物、农业等专业的各级临床医生、药师、科研单位研究人员、高校硕/博士研究生、对利用单细胞测序或公共数据库研究进行数据挖掘感兴趣的广大师生(尤其适合初学者和无基础的学员,无需任何基础,也无需学习任何编程语言)。
时间地点:2019/11/30-12/1(29日报到);上海维也纳酒店天山西路店
地址:上海市闵行天山西路4086号(地铁10/2号线虹桥火车站出3000米左右)
注册费用:3400元/人 按交费先后顺序安排座次。注册费包含会场、教材、午餐、视频课程等费用,不含住宿费。
主办单位:上海莫速乎教育投资有限公司、上海荆麦信息科技中心
报名咨询:王老师 136 2183 4129 (微信同号) msh088@126.com
请来电或加微信索取报名回执表及函件。