Saltar al contenido principal
Documentos
Gestión de datos en RGráficos en RR DocumentaciónInterfaz REstadística en RIntroducción de datos en R

Crear nuevas variables en R

Utiliza el operador de asignación <- para crear nuevas variables. Aquí dispones de una amplia gama de operadores y funciones.

# Three examples for doing the same computations

mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2

attach(mydata)
mydata$sum <- x1 + x2
mydata$mean <- (x1 + x2)/2
detach(mydata)

mydata <- transform( mydata,
sum = x1 + x2,
mean = (x1 + x2)/2
)

(Para practicar el trabajo con variables en R, prueba el primer capítulo de este curso interactivo gratuito).

Recodificación de variables

Para recodificar datos, probablemente utilizarás una o varias de las estructuras de control de R.

# create 2 age categories

mydata$agecat <- ifelse(mydata$age > 70,
c("older"), c("younger"))

# another example: create 3 age categories

attach(mydata)
mydata$agecat[age > 75] <- "Elder"
mydata$agecat[age > 45 & age <= 75] <- "Middle Aged"
mydata$agecat[age <= 45] <- "Young"
detach(mydata)

Renombrar variables

Puedes renombrar variables mediante programación o de forma interactiva.

# rename interactively
fix(mydata) # results are saved on close

# rename programmatically
library(reshape)
mydata <- rename(mydata, c(oldname="newname"))

# you can re-enter all the variable names in order
# changing the ones you need to change.the limitation
#
is that you need to enter all of them!
names(mydata) <- c("x1","age","y", "ses")

Tipos de variables en R

R admite una amplia gama de tipos de variables, cada uno adaptado para manejar formas de datos específicas:

  • Numérico: Representan números y pueden ser enteros o decimales.
  • Carácter: Este tipo es para datos textuales o cadenas.
  • Lógico: Son binarias y pueden tomar valores de VERDADERO o FALSO.
  • Factor: Ideales para datos categóricos, los factores pueden ayudar a representar categorías distintas dentro de un conjunto de datos.
  • Fecha: Como su nombre indica, este tipo se utiliza para valores de fecha.

Cuando crees nuevas variables, es esencial que te asegures de que son del tipo adecuado para tu análisis. Si no estás seguro, puedes utilizar la función class() para comprobar el tipo de una variable.

Comprobar y cambiar los tipos de variables

Asegurarse de que tus variables son del tipo correcto es crucial para un análisis preciso:

  • Comprobación Tipo de variable: La función class() puede ayudarte a determinar el tipo de una variable.
  • Cambiar el tipo de variable: Si necesitas convertir una variable de un tipo a otro, R proporciona funciones como as.numeric(), as.character() y as.logical().

Ámbito variable

Comprender el alcance de una variable es esencial:

  • Variables globales: Son accesibles a lo largo de todo tu guión o sesión.
  • Variables locales: Están confinadas a la función o entorno en el que se crean y no se puede acceder a ellas fuera de él. Cuando crees nuevas variables, especialmente dentro de funciones, ten siempre en cuenta su ámbito para evitar comportamientos inesperados.

Utilizar variables con funciones

Las variables desempeñan un papel fundamental cuando se trabaja con funciones:

  • Pasar variables: Puedes proporcionar variables como argumentos a las funciones, lo que permite realizar cálculos dinámicos basados en los valores de las variables.
  • Almacenar salidas de función: Las funciones pueden devolver valores, y puedes asignar estos valores a variables nuevas o existentes para su posterior análisis.

Operaciones variables

Según su tipo, puedes realizar diversas operaciones con las variables:

  • Operaciones aritméticas: Para las variables numéricas, puedes realizar operaciones matemáticas estándar como sumas, restas, multiplicaciones y divisiones.
  • Operaciones con cadenas: Para las variables de caracteres, operaciones como la concatenación te permiten combinar varias cadenas en una sola.

Recodificación de variables

La recodificación consiste en cambiar los valores de una variable en función de determinadas condiciones. Por ejemplo, quizá quieras agrupar las edades en categorías como "joven", "de mediana edad" y "senior". R ofrece varias estructuras de control para facilitar este proceso. Al recodificar, asegúrate siempre de que las nuevas categorías o valores tengan un sentido lógico y sirvan al propósito de tu análisis.

Renombrar variables

Puede haber casos en los que quieras cambiar el nombre de las variables por claridad o coherencia. R proporciona dos formas principales de renombrar variables:

  • Interactivamente: Puedes utilizar la función fix() para abrir un editor de datos en el que puedes renombrar directamente las variables.
  • Programáticamente: Existen varios paquetes y funciones en R que te permiten renombrar variables dentro de tu script. Al renombrar, asegúrate de que los nuevos nombres son descriptivos y se ajustan a las convenciones de nomenclatura de variables de R.

Preguntas frecuentes sobre las variables en R

Q: ¿Cuál es la diferencia entre <- y = para la asignación en R?

A: Tanto <- como = pueden utilizarse para asignar en R. Sin embargo, <- es el método más tradicional y preferido, sobre todo en scripts y funciones. El operador = se utiliza a menudo en las llamadas a funciones para especificar argumentos con nombre.

Q: ¿Cómo puedo comprobar el tipo de una variable en R?

A: Puedes utilizar la función class() para determinar el tipo o clase de una variable. Esta función devolverá valores como "numérico", "carácter", "factor", etc., según el tipo de la variable.

Q: Asigné por error un valor de carácter a una variable numérica. ¿Cómo puedo corregirlo?

A: R proporciona funciones de conversión de tipos como as.numeric(), as.character() y as.logical(). Puedes utilizar estas funciones para convertir una variable al tipo deseado.

Q: ¿Qué significa "recodificar variables"?

A: La recodificación se refiere al proceso de cambiar o transformar los valores de una variable en función de determinados criterios. Por ejemplo, convertir una variable continua de edad en categorías de edad (por ejemplo, "joven", "de mediana edad", "mayor") es un ejemplo de recodificación.

Q: ¿Cómo puedo cambiar el nombre de una variable de mi conjunto de datos?

A: R ofrece múltiples formas de renombrar variables. Puedes hacerlo interactivamente utilizando la función fix(), que abre un editor de datos. Como alternativa, existen varios paquetes y funciones de R que permiten renombrar variables de forma programática.

Q: ¿Los nombres de las variables en R distinguen entre mayúsculas y minúsculas?

A: Sí, los nombres de las variables en R distinguen entre mayúsculas y minúsculas. Esto significa que miVariable, MiVariable y miVariable se tratarían como tres variables distintas.

Q: ¿Puedo utilizar espacios en los nombres de las variables?

A: No se recomienda utilizar espacios en los nombres de las variables en R. En su lugar, puedes utilizar guiones bajos (_) o puntos (.) para separar palabras en los nombres de las variables, como mi_variable o mi.variable.

Q: ¿Cómo borro o elimino una variable de mi área de trabajo?

A: Puedes utilizar la función rm() seguida del nombre de la variable para eliminarla de tu espacio de trabajo. Es una buena práctica borrar las variables innecesarias para liberar memoria.

Q: ¿Cuál es la diferencia entre variables locales y globales?

A: Las variables locales se limitan a la función o entorno en el que se crean y no se puede acceder a ellas fuera de él. En cambio, las variables globales son accesibles en todo tu script o sesión de R.

Q: ¿Cómo puedo ver todas las variables que hay actualmente en mi espacio de trabajo?

A: Puedes utilizar la función ls() para listar todas las variables presentes actualmente en tu espacio de trabajo.

Aprende lo esencial de R

Domina los fundamentos del análisis de datos en R, incluyendo vectores, listas y marcos de datos, y practica R con conjuntos de datos reales.
Empieza a aprender R gratis