R es un lenguaje utilizado para análisis estadísticos, gráficos y programación. Puede ser copiado y distribuido de forma gratuita y permite que los usuarios estudien como funciona, lo modifiquen de acuerdo a sus necesidades y publiquen sus mejoras y extensiones para ser compartidas con otros usuarios.
R es actualmente el software que ofrece mayor número de funciones estadísticas y aplicaciones para la creación de gráficos. Colaboradores producen paquetes destinados a resolver problemas particulares o desarrollan determinadas técnicas estadísticas. Cada usuario puede, además, crear sus propias funciones y rutinas combinando las funciones existentes.
Existe una amplia comunidad de usuarios y por lo tanto, una gran oferta de ayudas para aquellos que se inician en el uso del programa, incluyendo foros de discusión en internet, grupos de usuarios y una profusa bibliografía.
Para quienes trabajamos en ciencias, R es una lingua franca para el intercambio y la difusión de ideas. De la misma manera en que se escribe un artículo para comunicar ideas, pueden escribirse rutinas para comunicar un análisis. Como lenguaje, R asegura la reproduciblidad de los análisis: un registro completo de los procedimientos que se siguieron, permitiendo repetir los análisis después.
Para finalizar, y tal vez lo más importante, el aprendizaje de R tiene un gran componente lúdico, fomenta la capacidad de análisis y la creatividad.
Las rutinas de una investigación científica pueden ser separadas en dos grandes categorías (Mislan et al. 2016).
En este curso las rutinas aparecen incrustadas en la página web y pueden reconocerse por su distinta tipografía y por estar en recuadros. Por comodidad utilizaremos RStudio como interfaz gráfica de usuario (GUI) para ejecutar la rutinas, pero resaltando siempre su naturaleza de lenguaje, independiente del soporte donde es ejecutado. Todo el material de este curso, incluyendo versiones anteriores en formato virtual, está disponibles en forma abierta en https://santiagombv.github.io/teaching/.
Este curso está orientado al análisis de datos biológicos,
particularmente en el ámbito de la ecología y evolución. Por lo tanto,
utilizaremos bases de datos de tamaño medio, que no requieren procesos
de manipulación elaborados. El objetivo de este curso es brindar las
capacidades para realizar una rutina de análisis estadístico, aplicando
conocimientos de modelos lineales, manejos de gráficos y
programación.
El contenido teórico de este curso comprende introducción al aprendizaje
estadístico supervisado, modelos lineales generales, selección de
modelos y regularización, y métodos de remuestreo (bootstrap y
permutaciones). También aborda la construccíon de gráficos a través de
los paquetes graphics, lattice y, fundamentalmente,
ggplot2 y la construcción de funciones.
Cada año por medio se dicta un curso que es la continuación de éste, e
involucra modelos estadísticos avanzados como lineales generalizados,
aditivos, mixtos, métodos de clasificación y de aprendizaje automático
no supervisado.
Ingresar a http://cran.r-project.org/
En download R for Windows - base, seleccionar la última versión
disponible de R (4.4.1 “Puppy Cup” al momento de actualizar este curso).
Guardar el archivo R-4.4.1-win.exe en cualquier parte de la computadora,
ejecutarlo y seguir las instrucciones de instalación.
Descargar la última version de RStudio Desktop para el sistema operativo deseado (version gratuita) desde https://posit.co/download/rstudio-desktop/ y seguir las instrucciones de instalación.
Así se ven los paneles principales de RStudio con una rutina ya abierta. Características como el tamaño de fuente y los colores son personalizables.
Los paquetes de R son colecciones de funciones para un fin determinado, asociadas a su ayuda, un manual de referencia y, frecuentemente, a bases de datos y demostraciones de uso (llamadas vignettes).
En R-base seleccionar Paquetes - Instalar Paquetes (la computadora
debe estar conectada a internet). Alternativamente, en R Studio
seleccionar install en la pestaña packages.
Seleccionar el espejo CRAN desde donde se bajará el paquete.
Seleccionar un paquete de la lista desplegable.
En ambos casos, puede hacerse mediante instrucciones en la consola:
install.packages("nombre_del_paquete")
Los paquetes mismos deben actualizarse regularmente, particualrmente junto a los cambios en las versiones de R (recomiendo hacerlo al menos dos veces al año). Para esto, ejecute y posteriormente siga las instrucciones.
update.packages()
Para este curso, se requieren los siguientes paquetes que no son descargados de forma automática con la instalación de R, por lo que deberá instalarlos manualmente: arm, car, caret, devtools, dplyr, emmeans, glmnet, GGally, ggplot2, lattice, leaps, magrittr, MuMIn, patchwork, performance, rgl, rmarkdown, sciplot, viridis y todas las dependencias necesarias.
La manera más práctica es el paquete installr y ejecutando
install.packages("installr")
library(installr)
updateR() #seguir las instrucciones que aparezcan
Dirigirse a Help - check for updates
.
Se recomienda fuertemente seguir este curso con una versión actualizada de R y RStudio. Si tiene una versión de R < 4.0.0 podría tener problemas en ejecutar las rutinas de este curso. En caso de tener problemas con la actualización, desinstalar todas las versiones anteriores.
Añadir una fuentes de software desde “Software y actualizaciones” - “Otro Software”. Seleccionar “Añadir”. En la ventana que solicita la línea de APT completa del repositorio colocar:
deb https://cloud.r-project.org/bin/linux/ubuntu jammy-cran40/
En esta línea puede cambiar el espejo CRAN elegido por alguno de los listados en http://cran.r-project.org/ Por ejemplo http://cran.rstudio.com/bin/linux/ubuntu/ corresponde al espejo propio de RStudio. Puede cambiar también la distribución de Ubuntu empleada (jammy, focal, bionic, etc. indicada antes del -cran40).
Agregar una clave de seguridad al sistema (en caso de que esta opción “no funcione”, ver otras posibilidades en http://cran.r-project.org/). En la terminal ingresar:
sudo apt-key adv --keyserver keyserver.ubuntu.com --recv-keys E298A3A825C0D65DFD57CBB651716619E084DAB9
Instalar R desde terminal.
sudo apt-get update
sudo apt-get install r-base
Descargar la última version de RStudio Desktop (version gratuita) desde https://posit.co/download/rstudio-desktop/ y seguir las instrucciones de instalación.
Así se ven los paneles principales de RStudio con una rutina ya abierta. Características como el tamaño de fuente y los colores son personalizables.
Los paquetes de R son colecciones de funciones para un fin determinado, asociadas a su ayuda y, frecuentemente, a bases de datos y demostraciones de uso (vignettes).
La manera más práctica y segura en Ubuntu es desde terminal.
sudo R
install.packages("nombre_del_paquete")
Para este curso, se requieren los siguientes paquetes que no son descargados de forma automática con la instalación de R, por lo que deberá instalarlos manualmente: arm, car, caret, devtools, dplyr, emmeans, glmnet, GGally, ggplot2, lattice, leaps, magrittr, MuMIn, patchwork, performance, rgl, rmarkdown, sciplot, viridis y todas las dependencias necesarias.
Los paquetes mismos deben actualizarse regularmente, particualrmente junto a los cambios en las versiones de R. Para esto, ejecute y posteriormente siga las instrucciones.
update.packages()
Al agregar una fuente de software a la computadora, R se actualizará junto a todos los otros programas, automáticamente.
Se recomienda fuertemente seguir este curso con una versión actualizada de R y RStudio. Si tiene una versión de R < 4.0.0 podría tener problemas en ejecutar las rutinas de este curso. En caso de tener problemas con la actualización, desinstalar todas las versiones anteriores.