Introducción al Lenguaje R

1. ¿Por qué usar R?

Santiago Benitez-Vieyra

¿Por qué R?

creadores de R

Ross Ihaka y Robert Gentleman

Ihaka, Ross., & Gentleman, Robert. (1996). R: A Language for Data Analysis and Graphics. Journal of Computational and Graphical Statistics, 5(3), 299. doi:10.2307/1390807

R Core Team (actual)

Douglas Bates - John Chambers - Peter Dalgaard - Robert Gentleman - Kurt Hornik - Ross Ihaka - Tomas Kalibera - Michael Lawrence - Friedrich Leisch - Uwe Ligges - Thomas Lumley - Martin Maechler - Sebastian Meyer - Paul Murrell - Martyn Plummer - Brian Ripley - Deepayan Sarkar - Duncan Temple Lang - Luke Tierney - Simon Urbanek

R Core Team (2024). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL https://www.R-project.org/.

La comunidad

R users groups, R-Ladies

¿Para qué vamos a usar R en este curso?

Lenguaje para construir una rutina de análisis.

library(vegan)
dat <- read.table("/home/santiago/mandevilla.txt", header = TRUE)

## multidimensional scaling
m1 <- metaMDS(dat2, dist = "bray", k = 2)
m1

## figura
plot(m1, "sites", type = "n") 
points(m1$points[,1],
       m1$points[,2],
       pch = c(rep(1, 4), rep(19, 4), rep(19, 3),
               rep(1, 5), rep(19, 4), rep(1, 4)), 
       col = c(rep("blue4", 4), rep("blue4", 4), rep("red4", 3), 
      rep("red4", 5), rep("green4", 4), rep("green4", 4)))

## agregar compuestos
points(m1, "species", pch = 2, cex = 0.7)
## agregar nombres de compuestos
text(m1$species[, 1], m1$species[, 2] - 0.1, colnames(dat2), cex = 0.6)

## anosim
tipo <- as.factor(c(rep("hib", 8), rep("lax", 8), rep("pen", 8)))
a1 <- anosim(dat = dat2, grouping = tipo, distance = "bray", permutations = 9999)
summary(a1)
perm <- permustats(a1)
densityplot(perm)
plot(a1)

Guardar las instrucciones de un gráfico.

library(ggridges)
library(ggplot2)
 
# Diamonds dataset is provided by R natively
#head(diamonds)
 
# basic example
ggplot(diamonds, aes(x = price, y = cut, fill = cut)) +
  geom_density_ridges() +
  theme_ridges() + 
  theme(legend.position = "none")

Guardar las instrucciones de un gráfico.

Usar R para que la investigación sea REPRODUCIBLE

  • Métodos cuidadosamente descriptos
  • Datos de libre disponibilidad
  • Código del análisis estadístico

Publicar la rutina de análisis

sup

Zenodo Figshare GitHub Supplementary Material
Licencia flexible MIT flexible no
A largo plazo? si* si no si*
Asigna DOI? si si no no
Permite buscar código? si si si no
Conexión con GitHub? si no si no
Costo para el autor no no no no*

Modificado de Mislan et al. 2016

Publicar un paquete

sup

sup

CRAN

Interfaces Gráficas de Usuario (GUI)

Entorno de Desarrollo Integrado (IDE)

Interfaces Gráficas de Usuario (GUI)

Entorno de Desarrollo Integrado (IDE)

¿Dónde buscar ayuda?

Contenidos del curso.

  • Funciones básicas de R (creación de objetos, ingreso de datos, análisis básicos). Análisis gráfico. Modelos Lineales. Training and Test. Selección de variables, selección de modelos y regularización.
  • Manejo de gráficos básicos: Comandos gráficos de alto y bajo nivel, exportación de gráficos. Elección del gráfico adecuado para representar un análisis. Introducción a los paquetes lattice, y ggplot2.
  • Construcción de rutinas. Introducción a R Markdown. Cómo presentar los resultados.
  • Introducción a la programación: Construcción de funciones, bucles y funciones condicionales.
  • Métodos de remuestreo y randomizaciones. Bootstrap

Objetivos del curso.

  • Adquirir destreza en el uso del lenguaje R para su uso en estadística básica y gráficos, así como nociones de programación.
  • Desarrollar una visión sobre los fundamentos de una amplia clase de modelos estadísticos.
  • Adquirir destreza en la interpretación de análisis estadísticos y gráficos.

Cronograma

ver PÁGINA DEL CURSO

Trabajo Final

Construcción de una rutina de resolución de problemas estadísticos y gráficos. Entrega de un informe, 15 días después de que el curso acabe.

FIN