作为一个资深调包侠,收集各式各样功能的R包是我的爱好之一,R语言现在是我工作中最主要的工具,无论是科研中的数据读取还是下游的数据报告,我都会使用R的各种包来完成。下面从数据分析的整个工作流程(数据导入与获取-数据处理-数据分析-数据报告-其他奇技淫巧)介绍一些相对小众但是超好用的R包。
1.数据导入与获取
1.1readr
一般数据读取readr,read_xx系列(这个包其实不小众)
相对于R基础包的,read_xxx系列主要有两个改动:1.字符没有默认为因素变量,2.读取数据时会显示数据的类型,如下图。
出处:
1.2vroom
大体量数据读取vroom包。可以媲美包中的fread函数的读取速度,快速读取GB体量的数据。主要用法见下图:
出处:
R中各种函数读取文件速度的测评见:
1.3datapasta
复制黏贴大师,datapasta包,它可以直接从excel,网页等数据源中将数据直接复制到R中,甚至可以一定程度上代替简单爬虫。
datapasta示例:摘自:
2.数据处理和汇总
2.1Rmisc
数据处理和汇总这部分现在基本被dplyr+tidyr和垄断。但是我偶尔也会用到别的包,比方说Rmisc这个包做数据汇总。原因是这个包中的summarySEwithin函数可以用来处理被试内变量画errorbar图。
比如上图这种情况,重复测量的errorbar和被试间设计的errorbar一个样,所以需要校正图片引自:AndyFieldDiscoveringStatisticsUsingRChapter9
2.2naniar
此外,在缺失值处理上,如果需要快速找出缺失值,或者简单查看缺失值占比和分布,可以使用naniar包。比如可以通过下面的代码快速发现缺失值的分布:
library(naniar)ggplot(data=airquality,aes(x=Ozone,y=))+geom_miss_point()
naniar用法摘自:
3.数据分析相关
3.1skimr
skimr包,快速给出数据的描述性统计结果并附带频数分布图,用法见下图:
出处:
3.2compareGroups
compareGroups包,快速做描述性统计表格(比如下图这种,附带频数的卡方检验),支持输出docx格式。
出处:
3.3effectsize
effectsize包,万能效应量转换器,我一般用到的是图下的函数,比如通过F值和自由度求效应量等等。
出处:
4.数据报告相关
4.1esquisse
esquisse包,免代码ggplot生成器,鼠标点点点就能在R-studio里面画图。
出处:
4.2ggThemeAssit
ggThemeAssit包,调节ggplot对象的神器,免代码调节ggplot的细节参数,比如字体,背景颜色等等。
出处:
4.3apaTables
直接一键输出apa格式表格到word文档。
输出apa格式的表格到doc文件,出处:
4.4papaja
这个包可以借助Rmarkdown写APA格式的可发表的论文,不过我平时主要是用它里面的theme_apa()ggplot的主题。
出处:
4.5xaringan
xaringan包,使用Rmarkdown写类似PPT一样的幻灯片进行数据分析报告。大神谢益辉写的包,支持中文!
出处:
4.6patchwork
patchwork包,让你能够非常轻松的在一张画布上布局多张ggplot的图片,如下图:
出处:
5.其他奇技淫巧
5.1BERT(这其实是个excel插件)
在Excel里面用R语言进行数据处理
详情见:
5.2waldo
比较R中的对象并给出前后差异,神器!
出处:
5.3livecode
局域网网页直播写代码,上课或者工作坊必备!
出处:
5.4ProjectTemplate
建立结构化的数据分析项目,给每个数据分析单独建一个项目,促进数据分析的可再生性。
出处:
5.5emo
在R里面输入各种表情包:
出处:
5.6taskscheduleR
R语言定时任务必备。比如爬虫任务,每隔一段时间抓取某网页信息,想当年我就是用这个包抢到了租房网站的房子。。。
出处:
5.7DataEditR
像Excel一样无代码操作R-studio里面导入的数据:
出处:
5.8todor
这个包特别在专门针对你代码中的comment进行归类,使你的代码更加结构化。可以通过R-studio的插件来使用这个包
详情见:
小结感谢大家耐心看完,自己的文章都写的很细,代码都在原文中,希望大家都可以自己做一做,如果对您有用请先收藏,再点赞转发。
也欢迎大家的意见和建议。
如果你是一个大学本科生或研究生,如果你正在因为你的统计作业、数据分析、论文、报告、考试等发愁,如果你在使用SPSS,R,Python,Mplus,Excel中遇到任何问题,都可以联系我。因为我可以给您提供最好的,最详细和耐心的数据分析服务。
如果你对Z检验,t检验,方差分析,多元方差分析,回归,卡方检验,相关,多水平模型,结构方程模型,中介调节等等统计技巧有任何问题,请私信我,获取最详细和耐心的指导。
IfyouareastudentandyouareworriedaboutyoustatisticalDataThesis,composing,SPSS,Excel,Mplus,
AreyouconfusedwithstatisticalTechniqueslikez-test,t-test,ANOVA,MANOVA,Regression,LogisticRegression,Chi-Square,Correlation,Association,SEM,multilevelmodel,??
加油吧,打工人!
免责声明:本文章如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系