科研数据清洗、分析、统计建模与绘图研讨班(基于 R 语言)

作者:   2018-04-04
字体大小:
  • 会议时间: 2018-05-11至 2018-05-13
  • 会议地点: 北京
  • 电话:13691133178
  • 传真:暂无
  • 联系人:吴老师
  • Email: 13691133178@163.com
  • 联系地址:暂无
  • 会议网址:www.kyjyz.net

【开班目的】 
R 语言正日益受到中国科研工作者的重视,R 语言的功能非常强大,它不仅可以完成生物大数据的处理与统计工作,同时可以进行高质量的绘图,在 CNS 等顶级杂志发表的诸多文章中,不管是复杂的统计分析还是精美的绘图,R 都可以轻松完成。R 还擅长对原始实验数据的清洗和数据管理。
R 语言有丰富的数据处理、统计与绘图包,需要结合代码来运行,让无编程经验的科研人员望而却步,而事实上,只要掌握 R 语言的内在规律,实际操作起来并不难,甚至必比那些固化了多级菜单及各项参数的软件还要简单。
开办本学习班的目的就是让无任何 R 基础的科研人员在 3 天时间内,能够实现 R 语言从入门到解决科研实际中的数据清洗、分析、统计建模与高级绘图的飞跃,从此笑对实验数据。

【授课方式】
无需编程基础,从零基础开始,3 天之内让每位学员成为系统掌握;
从科研的实际应用场景出发,以案例式教学,通俗易懂、实用性强;
以实际操作为主,让每个学员都能学到实实在在的东西,帮助解决实际的问题;
本培训班每 2 个月开办一期,一次不会者可以免费重修;课程结束后根据学员问题不定期进行网络教学;奉送所有代码给学员。

【培训目标】
比较系统的掌握以下几方面:
1、掌握 R 语言的使用及技巧;
2、掌握实验数据的清洗、管理、分析;
3、掌握基础统计及模型构建与评价;
4、掌握各种图形,尤其复杂图形的绘制。

【主办单位】
科研加油站(网址:http://www.kyjyz.net;公众号:ky6668666),主要从事科研培训与咨询,致力于提升科研效率和质量,让科研变得简单!
目前,科研基本技能培训班有 2 个:《科研数据清洗、分析、统计建模与绘图研讨班(基于 R 语言)》(3 天)、《科研图表专题研讨班》(3 天),每 2 个月举办一期,不会者可以免费重修。详细发布内容见公众号。

【主讲老师】
本站主讲老师来自重点高校及科研院所,科研一线长期从事生物统计、生物信息分析、临床及基础实验等研究工作,精通 R 语言、Graphad、SPSS、AI 及 photoshop 等分析及绘图工具,具有丰富的科研项目及 SCI 论文撰写经验。

【授课内容】(以下为内容大纲,未写明详细知识点,根据学员需求可适当调整内容)
R 语言安装
R 语言软件安装和功能介绍
R 语言开发工具 RStudio 的安装及使用(RStudio 界面友好,通过它来使用 R)
R 语言包的安装和帮助文档
R 语言基础语法
R 语言中常用的数据结构
R 语言中数据的导入导出
科研中实用且常用函数
R 语言编程中常用的控制语句
实验数据清洗(预处理)
数据清洗流程
缺失值识别与插补
重复值的识别与处理
异常值(离群值)处理
随心所欲管理实验数据
创建新变量、变量重编码、变量重命名
数据类型转换、数据排序、数据的合并与拆分
一、二维表的转换  
表的合并等
连续变量转有序分类变量
轻松处理任何格式的时间变量
选取数据子集
随机抽样
探索性数据分析
快速了解数据的特点,选择合适的统计方法
连续变量描述性统计
二分类及多分类变量的描述性统计
统计+图形,轻松评价数据正态性
基础绘图
R 语言中常用绘图函数和绘图参数的介绍
常见图表(散点图、折线图、条形图、直方图、箱线图以及密度图等)绘制
使用专门的绘图包进行绘图(散点矩阵图、QQ 图、茎叶图等)
高级绘图(基于 ggplot2)
ggplot2 语法
ggplot2 绘制常规图表(散点图、折线图、条形图、直方图、箱线图以及密度图等)
ggplot2 修图:添加注释,图例、分面、配色、坐标轴调整
ggplot2 绘制用于发表级别的图(主题调整)
ggplot2 绘制复杂图形(相关矩阵图、主成分图(PCA)、热图(heatmap)、谱系图、火山图(volcano)、Roc 曲线、词云图(wordcloud)、气泡图、小提琴图(violin)、马赛克图、累积经验分布图、地图等)
基础统计
各种研究设计的功效分析(样本量计算)
参数检验:各种 t 检验、各种方差分析
非参数检验:各种类型秩和检验
卡方检验
列联表分析
统计建模
模型中相互作用的应用
混合效应模型(重复测量资料的最佳统计模型)
简单线性回归建模(如何在方程中添加二项式,提高预测的精度)
多重线性回归建模与评价
广义线性模型/Logistic 回归建模与评价
模型中离群点、杠杆值和强影响点处理,多重共线性检测,模型评价,变量相对权重计算
倾向性评分匹配:从大样本中选择相匹配的样本,有效降低混杂偏倚,充分利用实验数据,适用于回顾性研究
生存分析
寿命表法
单因素生存曲线比较/Kaplan-Meier 法(建模,绘制生存曲线)
多因素生存分析/Cox 回归(建模、模型评价、分层分析、生存曲线图)
诊断试验
准确性检验/Roc 曲线(评价新的测量方法与金标准的比较)
一致性检验/Bland-Altman 图(评价两种测量方法的一致性)
以下为介绍内容:
R 语言在医学大数据中的应用
决策树、随机森林、贝叶斯网络、支持向量机(介绍,不进行实例操作)
R 语言在生物信息学分析中的应用
介绍 Bioconductor 相关 R 包,不进行实例操作

【注册费用】
3600 元/人     注册费包含教材、午餐等费用。住宿可统一安排,费用自理。
按交费先后顺序安排座次,必须现场刷公务卡的学员请提前支付宝或微信转 1 千元定金算提前缴费(现场刷卡时退还)
发票可开类型:培训费、会议费、资料费、咨询费

【报名优惠政策】
1、会议开始前 10 天缴费每人减 200 元
2、2 人团体报名每人减 200 元,3 人团体报名每人减 300 元,
4 人团体报名每人减 400 元,5 人团体报名每人减 500 元,6 人及以上团体报名每人减 600 元
3、以上优惠可叠加
4、老学员参加其它培训班,或新学员同时报 2 个培训班,除以上优惠外,每次可额外奖励 200 元
5、介绍学员参加有重奖,详情请咨询报名老师
6、本培训班计划每 2 个月开办一期,一次不会者可以免费重修,培训计划见:公众号:科研加油站(ky6668666)

备注:某些单位需提前借款的可先报名并索取 pdf 版邀请函,打印后用于向单位借款。缴费后请将汇款凭据截图或拍照,并发送邮件到 13691133178@163.com 告知详情以备核实。某些单位需要现场刷公务卡的请报名时备注以便合理安排座次。

【时间地点】
2018 年 5 月 11-13 日 
北京冠京饭店 

【酒店入住】
可以自己预订,费用自理。也可以代订,报名时请说好。
北京冠京饭店 
地址:北京市丰台区丰台北路 79 号 (近丰体南路),地铁 9 号线七里庄站 A2 口出
标准间: 320 元起/间/晚     (含早餐)
酒店停车方便,会议举办方报销停车费。

报名咨询】  吴老师:13801242452 (微信同号)        QQ 咨询:601964198
13691133178(微信同号)
报名及咨询邮箱:13691133178@163.com
公众号咨询:科研加油站(ky6668666)
报名表单填写---网址:http://keyan2018.mikecrm.com/fSepd77

编辑: 会议君   

声明:

1.丁香会议频道仅负责发布会议信息,如需参会、获取邀请函或会议日程,请与主办单位联系

2.部分会议信息来自互联网,如您发现信息有误,请联系meeting@dxy.cn纠错

3.如您发现信息不全,可点击Google搜索更多

4.更多服务信息请点击这里