R数据分析:相对小众但是超好用的R包汇总

作为一个资深调包侠,收集各式各样功能的R包是我的爱好之一,R语言现在是我工作中最主要的工具,无论是科研中的数据读取还是下游的数据报告,我都会使用R的各种包来完成。下面从数据分析的整个工作流程(数据导入与获取-数据处理-数据分析-数据报告-其他奇技淫巧)介绍一些相对小众但是超好用的R包。

1.数据导入与获取

1.1readr

一般数据读取readr,read_xx系列(这个包其实不小众)

相对于R基础包的,read_xxx系列主要有两个改动:1.字符没有默认为因素变量,2.读取数据时会显示数据的类型,如下图。

出处:

1.2vroom

大体量数据读取vroom包。可以媲美包中的fread函数的读取速度,快速读取GB体量的数据。主要用法见下图:

出处:

R中各种函数读取文件速度的测评见:

1.3datapasta

复制黏贴大师,datapasta包,它可以直接从excel,网页等数据源中将数据直接复制到R中,甚至可以一定程度上代替简单爬虫。

datapasta示例:摘自:

2.数据处理和汇总

2.1Rmisc

数据处理和汇总这部分现在基本被dplyr+tidyr和垄断。但是我偶尔也会用到别的包,比方说Rmisc这个包做数据汇总。原因是这个包中的summarySEwithin函数可以用来处理被试内变量画errorbar图。

比如上图这种情况,重复测量的errorbar和被试间设计的errorbar一个样,所以需要校正图片引自:AndyFieldDiscoveringStatisticsUsingRChapter9

2.2naniar

此外,在缺失值处理上,如果需要快速找出缺失值,或者简单查看缺失值占比和分布,可以使用naniar包。比如可以通过下面的代码快速发现缺失值的分布:

library(naniar)ggplot(data=airquality,aes(x=Ozone,y=))+geom_miss_point()

naniar用法摘自:

3.数据分析相关

3.1skimr

skimr包,快速给出数据的描述性统计结果并附带频数分布图,用法见下图:

出处:

3.2compareGroups

compareGroups包,快速做描述性统计表格(比如下图这种,附带频数的卡方检验),支持输出docx格式。

出处:

3.3effectsize

effectsize包,万能效应量转换器,我一般用到的是图下的函数,比如通过F值和自由度求效应量等等。

出处:

4.数据报告相关

4.1esquisse

esquisse包,免代码ggplot生成器,鼠标点点点就能在R-studio里面画图。

出处:

4.2ggThemeAssit

ggThemeAssit包,调节ggplot对象的神器,免代码调节ggplot的细节参数,比如字体,背景颜色等等。

出处:

4.3apaTables

直接一键输出apa格式表格到word文档。

输出apa格式的表格到doc文件,出处:

4.4papaja

这个包可以借助Rmarkdown写APA格式的可发表的论文,不过我平时主要是用它里面的theme_apa()ggplot的主题。

出处:

4.5xaringan

xaringan包,使用Rmarkdown写类似PPT一样的幻灯片进行数据分析报告。大神谢益辉写的包,支持中文!

出处:

4.6patchwork

patchwork包,让你能够非常轻松的在一张画布上布局多张ggplot的图片,如下图:

出处:

5.其他奇技淫巧

5.1BERT(这其实是个excel插件)

在Excel里面用R语言进行数据处理

详情见:

5.2waldo

比较R中的对象并给出前后差异,神器!

出处:

5.3livecode

局域网网页直播写代码,上课或者工作坊必备!

出处:

5.4ProjectTemplate

建立结构化的数据分析项目,给每个数据分析单独建一个项目,促进数据分析的可再生性。

出处:

5.5emo

在R里面输入各种表情包:

出处:

5.6taskscheduleR

R语言定时任务必备。比如爬虫任务,每隔一段时间抓取某网页信息,想当年我就是用这个包抢到了租房网站的房子。。。

出处:

5.7DataEditR

像Excel一样无代码操作R-studio里面导入的数据:

出处:

5.8todor

这个包特别在专门针对你代码中的comment进行归类,使你的代码更加结构化。可以通过R-studio的插件来使用这个包

详情见:

小结

感谢大家耐心看完,自己的文章都写的很细,代码都在原文中,希望大家都可以自己做一做,如果对您有用请先收藏,再点赞转发。

也欢迎大家的意见和建议。

如果你是一个大学本科生或研究生,如果你正在因为你的统计作业、数据分析、论文、报告、考试等发愁,如果你在使用SPSS,R,Python,Mplus,Excel中遇到任何问题,都可以联系我。因为我可以给您提供最好的,最详细和耐心的数据分析服务。

如果你对Z检验,t检验,方差分析,多元方差分析,回归,卡方检验,相关,多水平模型,结构方程模型,中介调节等等统计技巧有任何问题,请私信我,获取最详细和耐心的指导。

IfyouareastudentandyouareworriedaboutyoustatisticalDataThesis,composing,SPSS,Excel,Mplus,

AreyouconfusedwithstatisticalTechniqueslikez-test,t-test,ANOVA,MANOVA,Regression,LogisticRegression,Chi-Square,Correlation,Association,SEM,multilevelmodel,??

加油吧,打工人!

免责声明:本文章如果文章侵权,请联系我们处理,本站仅提供信息存储空间服务如因作品内容、版权和其他问题请于本站联系