R Tutorial
Obtención de R
R está disponible para Linux, MacOS y Windows. El software puede descargarse de The Comprehensive R Archive Network (CRAN).
Puesta en marcha
Una vez descargado e instalado R, sólo tienes que buscar e iniciar R desde tu carpeta Aplicaciones.
Introducir comandos
R es un programa que se ejecuta desde la línea de comandos. El usuario introduce los comandos en el prompt ( > por defecto) y cada comando se ejecuta de uno en uno.
El espacio de trabajo
El espacio de trabajo es tu entorno de trabajo R actual e incluye cualquier objeto definido por el usuario (vectores, matrices, marcos de datos, listas, funciones). Al final de una sesión de R, el usuario puede guardar una imagen del espacio de trabajo actual que se recarga automáticamente la próxima vez que se inicie R.
Interfaces gráficas de usuario
Aparte de la consola de R incorporada, RStudio es el editor de código R más popular, e interactúa con R para las plataformas Windows, MacOS y Linux.
Operadores en R
Los operadores binarios y lógicos de R resultarán muy familiares a los programadores. Ten en cuenta que los operadores binarios funcionan tanto con vectores y matrices como con escalares.
Los operadores aritméticos son
Operario | Descripción |
+ | adición |
- | sustracción |
* | multiplicación |
/ | división |
^ o ** | exponenciación |
Los operadores lógicos son
Operario | Descripción |
> | superior a |
>= | mayor o igual que |
== | exactamente igual a |
!= | no igual a |
Tipos de datos
R dispone de una gran variedad de tipos de datos, como escalares, vectores (numéricos, de caracteres, lógicos), matrices, marcos de datos y listas.
Crear nuevas variables
Utiliza el operador de asignación <- para crear nuevas variables.
# An example of computing the mean with variables
mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2
Funciones
Casi todo en R se hace mediante funciones. Una función es un fragmento de código escrito para realizar una tarea específica; puede aceptar argumentos o parámetros (o no) y puede devolver uno o más valores (¡o no!). En R, una función se define con la construcción
function ( arglist ) {body}
El código entre llaves es el cuerpo de la función. Ten en cuenta que, al utilizar funciones incorporadas, de lo único que tienes que preocuparte es de cómo comunicar eficazmente los argumentos de entrada correctos (arglist) y gestionar el/los valor/es de retorno (si los hay).
Importar datos
Importar datos a R es bastante sencillo. R ofrece opciones para importar muchos tipos de archivos, desde CSV a bases de datos.
Por ejemplo, así se importa un CSV en R.
# first row contains variable names, comma is separator
# assign the variable id to row names
# note the / instead of \ on mswindows systems
mydata <- read.table("c:/mydata.csv", header=TRUE,
sep=",", row.names="id")
Estadísticas descriptivas
R proporciona una amplia gama de funciones para obtener estadísticas de resumen. Una forma de obtener estadísticas descriptivas es utilizar la función sapply( ) con una estadística de resumen especificada.
A continuación se muestra cómo obtener la media con la función sapply( ):
# get means for variables in data frame mydata
# excluding missing values
sapply(mydata, mean, na.rm=TRUE)
Las posibles funciones utilizadas en sapply son media, sd, var, min, max, mediana, rango y cuantil.
Trazado en R
En R, los gráficos suelen crearse de forma interactiva. He aquí un ejemplo:
# Creating a Graph
attach(mtcars)
plot(wt, mpg)
abline(lm(mpg~wt))
title("Regression of MPG on Weight")
La función trazar( ) abre una ventana gráfica y traza el peso frente a las millas por galón. La siguiente línea de código añade una línea de regresión a este gráfico. La última línea añade un título.
Paquetes
Los paquetes son colecciones de funciones R, datos y código compilado en un formato bien definido. El directorio donde se almacenan los paquetes se llama biblioteca. R viene con un conjunto estándar de paquetes. Hay otros disponibles para descargar e instalar. Una vez instalados, hay que cargarlos en la sesión para utilizarlos.
.libPaths() # get library location
library() # see all packages installed
search() # see packages currently loaded
Conseguir ayuda
Una vez instalado R, hay un completo sistema de ayuda incorporado. En el símbolo del sistema del programa puedes utilizar cualquiera de las siguientes opciones:
help.start() # general help
help(foo) # help about function foo
?foo # same thing
apropos("foo") # list all functions containing string foo
example(foo) # show an example of function foo
Ir más lejos
Si prefieres un entorno interactivo en línea para aprender R, este tutorial gratuito de R de DataCamp es una forma estupenda de empezar.