Como parte de capítulo integrante do livro “Aplicações da Linguagem R em Análises de Vegetação”, o protocolo de análises de dados BIOVEG em sua terceira edição como integrante do capítulo “BIOVEG – A protocol to learn and teach statistics in R using vegetation data” traz um amplo conjunto de métodos que vão desde análises estatísticas básicas à machine learning. Através de script com códigos das análises e comentários teóricos centrais sobre cada método estatístico os autores, incluindo Écio Souza Diniz (Diretor executivo da Beta Analítica), se baseiam em exemplos usando dados de vegetação brasileira e alemã que eles forneceram livremente para os usuários praticarem os métodos constituintes do script. Além disso, a transferibilidade de aplicações dos métodos demonstrados e explicados no script abrange amplo contexto interdisciplinar, permitindo que usuários das mais distintas áreas do conhecimento possam transpor seu uso para sua realidade de estudo.
O script também incluem diversas dicas para melhor desempenho de análises estatísticas e sugestões de leitura para aprofundamento. A tabela abaixo mostra todos os métodos que são contemplados com códigos e protocolos para executar e praticar as análises.
ANALYSIS TYPE |
STATISTICS APPLIED |
R PACKAGES |
|
||
Normality test |
Shapiro Wilk test and residuals |
Built-in Function |
Data Transformation |
Log, square, inverse and Arcsine square root |
Built-in Function |
One sample test |
Parametric: T-test; Nonparametric: Wilcoxon Signed Rank Test |
Built-in Function |
Two sample tests |
Independent samples: Nonparametric: Wilcoxon Rank-Sum Test (Mann-Whitney U-test); Parametric: T-test; Dependent sample: Wilcoxon Rank-Sum; Paired T-test |
Built-in Function |
Analyses of variance |
Parametric: ANOVA One Way and Tukey post-hoc; Nonparametric: Kruskal-Wallis and Dunn’s post-hoc test |
Built-in Function and dunn.test |
Independence test |
Chi-squared |
Built-in Function and MASS |
Correlation analysis |
Pearson, Spearman and Variance Inflation Factor (VIF) |
Built-in Function and PerformanceAnalytics |
Regression modeling |
Linear: LM (Linear Model), GLM (Generalized Linear Models, GLMM (Generalized linear mixed models), LME (Linear mixed models), GLS (Generalized Least squares) and post-hoc Tukey HSD and LmerTest tests. Nonlinear: Quadratic Model, Generalized Non-Linear Models (GNM), GAM (Generalized Additive Models) and GAMM (Generalized Additive Mixed Models). Note: There are examples treating spatial and temporal correlation. |
Lme4, nlme, gnm, mgcv, multcomp, lmerTest, MASS, car, gmodels and ROCR |
Model selection |
Akaike information criterion (AIC) and AIC model average |
MuMIn |
Diagnostic for Linearity |
Based on residuals of linear regression models |
car |
Spatial autocorrelation |
Based on Moran’s I statistics applied on linear regression models |
lctools, ncf, nlme, |
Supervised learning |
Random Forest |
randomForest |
Multivariate analysis |
NMDS, ANOSIM, CCA, PCA, PERMANOVA and INDVAL |
BiodiversityR, vegan, indicspecies, permute and lattice |
Fonte: DINIZ e THIELE (2020)
Para baixar o capítulo que contém os links para baixar o conjunto de protocolos (dados + script) BIOVEG, por favor acesse: https://www.atenaeditora.com.br/post-artigo/33323
Se você quer baixar o livro completo acesse: https://www.atenaeditora.com.br/post-ebook/3054