R ggplot2 !!!ggstatsplot {{outline}} ---- {{pre Patil, I. (2021). Visualizations with statistical details: The 'ggstatsplot' approach. Journal of Open Source Software, 6(61), 3167, doi:10.21105/joss.03167 }} https://indrajeetpatil.github.io/ggstatsplot/articles/ggstatsplot.html https://indrajeetpatil.github.io/ggstatsplot/ *統計分析値ともにグラフも描いてくれる。 *統計部分の見方 **https://indrajeetpatil.github.io/ggstatsplot/articles/ggstatsplot.html#benefits {{pre # ggstatsplot install.packages("ggstatsplot") library(ggstatsplot) }} !!例えばヒストグラム !普通はこのように↓ hist(lexdec$RT) {{ref_image hist_lexdec_RT.jpg}} !gghistostatsを使うとこのように↓ gghistostats(lexdec, x=RT) {{ref_image gghist.jpg}} !グループ分けして見ることも {{pre grouped_gghistostats(lexdec, x=RT, grouping.var=NativeLanguage, plotgrid.args=list(nrow=2)) }} {{ref_image gghist2.jpg}} !!二群の差 !ggbetweenstats {{pre ggbetweenstats(lexdec, x=Complex, y=RT ) }} {{ref_image between1.jpg}} *語の複雑さにより反応時間に、違いがあるとは言えない。 *しかし、母語話者と非母語話者のデータが混ざっている、、、 !grouped_ggbetweenstats {{pre grouped_ggbetweenstats(lexdec, x=Complex, y=RT, grouping.var=NativeLanguage, #pairwise.display = "significant", #p.adjust.method = "fdr", plotgrid.args=list(nrow=2)) }} {{ref_image between.jpg}} *英語母語話者は、''p''=0.76で、複雑な語と単純な語の差は、有意ではない。 *非母語話者は、''p''=0.03で、有意。 !!散布図 !ggscatterstats {{pre ggscatterstats(english, x=WrittenFrequency, y=RTlexdec ) }} {{ref_image ggscat.jpg}} *相関係数は -0.43 *しかし、どうも反応時間に二つ山があるみたい !年齢(AgeSubject)が、oldとyoungとある。ひょっとして、年齢で反応時間が違うかも。 {{pre g <- ggplot(english) g <- g + aes(RTlexdec, fill=AgeSubject) g <- g + geom_density(alpha=.7) plot(g) }} {{ref_image english_age.jpg}} !二群の差は、ggbetweenstats {{pre ggbetweenstats(english, x=AgeSubject, y=RTlexdec) }} {{ref_image english_age2.jpg}} !grouped_ggscatterstats *二つのグループに分けてみる {{pre grouped_ggscatterstats(english, x=WrittenFrequency, y=RTlexdec, grouping.var=AgeSubject, plotgrid.args=list(ncol=2) ) }} {{ref_image ggscat2.jpg}}