Protocolo para aprender e ensinar R

Como parte de capítulo integrante do livro “Aplicações da Linguagem R em Análises de Vegetação”, o protocolo de análises de dados BIOVEG em sua terceira edição como integrante do capítulo “BIOVEG – A protocol to learn and teach statistics in R using vegetation data” traz um amplo conjunto de métodos que vão desde análises estatísticas básicas à machine learning. Através de script com códigos das análises e comentários teóricos centrais sobre cada método estatístico os autores, incluindo Écio Souza Diniz (Diretor executivo da Beta Analítica), se baseiam em exemplos usando dados de vegetação brasileira e alemã que eles forneceram livremente para os usuários praticarem os métodos constituintes do script. Além disso, a transferibilidade de aplicações dos métodos demonstrados e explicados no script abrange amplo contexto interdisciplinar, permitindo que usuários das mais distintas áreas do conhecimento possam transpor seu uso para sua realidade de estudo.

O script também incluem diversas dicas para melhor desempenho de análises estatísticas e sugestões de leitura para aprofundamento. A tabela abaixo mostra todos os métodos que são contemplados com códigos e protocolos para executar e praticar as análises.

ANALYSIS TYPE

STATISTICS APPLIED

R PACKAGES

 

   

Normality test

Shapiro Wilk test and residuals

Built-in Function

Data Transformation

Log, square, inverse and Arcsine square root

Built-in Function

One sample test

Parametric: T-test; Nonparametric: Wilcoxon Signed Rank Test

Built-in Function

 

 

Two sample tests

Independent samples: Nonparametric: Wilcoxon Rank-Sum Test (Mann-Whitney U-test); Parametric: T-test; Dependent sample: Wilcoxon Rank-Sum; Paired T-test

Built-in Function

Analyses of variance

Parametric: ANOVA One Way and Tukey post-hoc; Nonparametric: Kruskal-Wallis and Dunn’s post-hoc test

Built-in Function and dunn.test

Independence test

Chi-squared

Built-in Function and MASS

Correlation analysis

Pearson, Spearman and Variance Inflation Factor (VIF)

Built-in Function and PerformanceAnalytics

 

 

 

 

Regression   modeling

Linear: LM (Linear Model), GLM (Generalized Linear Models, GLMM (Generalized linear mixed models), LME (Linear mixed models), GLS (Generalized Least squares) and post-hoc Tukey HSD and LmerTest tests. Nonlinear: Quadratic Model, Generalized Non-Linear Models (GNM), GAM (Generalized Additive Models) and GAMM (Generalized Additive Mixed Models). Note: There are examples treating spatial and temporal correlation.

Lme4, nlme, gnm, mgcv, multcomp, lmerTest, MASS, car, gmodels and ROCR

Model selection

Akaike information criterion (AIC) and AIC model average

MuMIn

Diagnostic for Linearity

Based on residuals of linear regression models

car

Spatial autocorrelation

Based on Moran’s I statistics applied on linear regression models

lctools, ncf, nlme,

Supervised learning

Random Forest

randomForest

Multivariate analysis

NMDS, ANOSIM, CCA, PCA, PERMANOVA and INDVAL

BiodiversityR, vegan, indicspecies, permute and lattice

Fonte: DINIZ e THIELE (2020)

Para baixar o capítulo que contém os links para baixar o conjunto de protocolos (dados + script) BIOVEG, por favor acesse: https://www.atenaeditora.com.br/post-artigo/33323

Se você quer baixar o livro completo acesse: https://www.atenaeditora.com.br/post-ebook/3054