Criando novas variáveis no R
Use o operador de atribuição <- para criar novas variáveis. Uma grande variedade de operadores e funções está disponível aqui.
# Three examples for doing the same computations
mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2
attach(mydata)
mydata$sum <- x1 + x2
mydata$mean <- (x1 + x2)/2
detach(mydata)
mydata <- transform( mydata,
sum = x1 + x2,
mean = (x1 + x2)/2
)
(Para praticar o trabalho com variáveis no R, experimente o primeiro capítulo deste curso interativo gratuito).
Variáveis de recodificação
Para recodificar dados, você provavelmente usará uma ou mais das estruturas de controle do R.
# create 2 age categories
mydata$agecat <- ifelse(mydata$age > 70,
c("older"), c("younger"))
# another example: create 3 age categories
attach(mydata)
mydata$agecat[age > 75] <- "Elder"
mydata$agecat[age > 45 & age <= 75] <- "Middle Aged"
mydata$agecat[age <= 45] <- "Young"
detach(mydata)
Renomear variáveis
Você pode renomear variáveis de forma programática ou interativa.
# rename interactively
fix(mydata) # results are saved on close
# rename programmatically
library(reshape)
mydata <- rename(mydata, c(oldname="newname"))
# you can re-enter all the variable names in order
# changing the ones you need to change.the limitation
#
is that you need to enter all of them!
names(mydata) <- c("x1","age","y", "ses")
Tipos de variáveis no R
O R oferece suporte a uma gama diversificada de tipos de variáveis, cada uma delas adaptada para lidar com formulários de dados específicos:
- Numérico: Eles representam números e podem ser números inteiros ou decimais.
- Personagem: Esse tipo é para dados textuais ou cadeias de caracteres.
- Logical: Eles são binários e podem assumir os valores TRUE (verdadeiro) ou FALSE (falso).
- Fator: Ideal para dados categóricos, os fatores podem ajudar a representar categorias distintas em um conjunto de dados.
- Data: Como o nome sugere, esse tipo é usado para valores de data.
Ao criar novas variáveis, é essencial garantir que elas sejam do tipo apropriado para sua análise. Se não tiver certeza, você pode usar a função class() para verificar o tipo de uma variável.
Verificação e alteração de tipos de variáveis
Garantir que suas variáveis sejam do tipo correto é fundamental para uma análise precisa:
- Verificação Tipo de variável: A função class() pode ajudar você a determinar o tipo de uma variável.
- Mudança do tipo de variável: Se você precisar converter uma variável de um tipo para outro, o R oferece funções como as.numeric(), as.character() e as.logical().
Escopo variável
Compreender o escopo de uma variável é essencial:
- Variáveis globais: Eles podem ser acessados durante todo o script ou sessão.
- Variáveis locais: Eles estão confinados à função ou ao ambiente em que foram criados e não podem ser acessados fora dele. Ao criar novas variáveis, especialmente dentro de funções, esteja sempre atento ao seu escopo para evitar comportamentos inesperados.
Uso de variáveis com funções
As variáveis desempenham um papel central quando você trabalha com funções:
- Passagem de variáveis: Você pode fornecer variáveis como argumentos para funções, permitindo cálculos dinâmicos com base em valores de variáveis.
- Armazenamento de saídas de função: As funções podem retornar valores, e você pode atribuir esses valores a variáveis novas ou existentes para análise posterior.
Operações variáveis
Dependendo do tipo, você pode executar várias operações em variáveis:
- Operações aritméticas: Para variáveis numéricas, você pode realizar operações matemáticas padrão, como adição, subtração, multiplicação e divisão.
- Operações com strings: Para variáveis de caracteres, operações como a concatenação permitem que você combine várias cadeias de caracteres em uma só.
Variáveis de recodificação
A recodificação envolve a alteração dos valores de uma variável com base em determinadas condições. Por exemplo, você pode querer agrupar as idades em categorias como "jovem", "meia-idade" e "idoso". O R oferece várias estruturas de controle para facilitar esse processo. Ao recodificar, certifique-se sempre de que as novas categorias ou valores façam sentido lógico e sirvam ao propósito da sua análise.
Renomear variáveis
Pode haver casos em que você queira renomear as variáveis para maior clareza ou consistência. O R oferece duas maneiras principais de renomear variáveis:
- De forma interativa: Você pode usar a função fix() para abrir um editor de dados em que é possível renomear variáveis diretamente.
- De forma programática: Há vários pacotes e funções no R que permitem que você renomeie variáveis no seu script. Ao renomear, certifique-se de que os novos nomes sejam descritivos e sigam as convenções de nomenclatura de variáveis do R.
Perguntas frequentes sobre variáveis no R
Q: Qual é a diferença entre <- e = para atribuição no R?
A: Tanto <- quanto = podem ser usados para atribuição no R. Entretanto, <- é o método mais tradicional e preferido, especialmente em scripts e funções. O operador = é frequentemente usado em chamadas de função para especificar argumentos nomeados.
Q: Como posso verificar o tipo de uma variável no R?
A: Você pode usar a função class() para determinar o tipo ou a classe de uma variável. Essa função retornará valores como "numérico", "caractere", "fator" e assim por diante, dependendo do tipo da variável.
Q: Por engano, atribuí um valor de caractere a uma variável numérica. Como posso corrigir isso?
A: O R fornece funções de conversão de tipos como as.numeric(), as.character() e as.logical(). Você pode usar essas funções para converter uma variável no tipo desejado.
Q: O que significa "recodificação de variáveis"?
A: A recodificação refere-se ao processo de alteração ou transformação dos valores de uma variável com base em determinados critérios. Por exemplo, a conversão de uma variável de idade contínua em categorias de idade (por exemplo, "jovem", "meia-idade", "idoso") é um exemplo de recodificação.
Q: Como posso renomear uma variável em meu conjunto de dados?
A: O R oferece várias maneiras de renomear variáveis. Você pode fazer isso de forma interativa usando a função fix(), que abre um editor de dados. Como alternativa, há vários pacotes e funções do R que permitem a renomeação programática de variáveis.
Q: Os nomes de variáveis no R diferenciam maiúsculas de minúsculas?
A: Sim, os nomes de variáveis no R diferenciam maiúsculas de minúsculas. Isso significa que myVariable, MyVariable e myvariable seriam tratadas como três variáveis distintas.
Q: Posso usar espaços em nomes de variáveis?
A: Não é recomendável usar espaços em nomes de variáveis no R. Em vez disso, você pode usar sublinhados (_) ou pontos (.) para separar palavras em nomes de variáveis, como my_variable ou my.variable.
Q: Como faço para excluir ou remover uma variável do meu espaço de trabalho?
A: Você pode usar a função rm() seguida do nome da variável para removê-la do espaço de trabalho. É uma boa prática limpar variáveis desnecessárias para liberar memória.
Q: Qual é a diferença entre variáveis locais e globais?
A: As variáveis locais estão confinadas à função ou ao ambiente em que foram criadas e não podem ser acessadas fora dele. Por outro lado, as variáveis globais podem ser acessadas em todo o script ou sessão do R.
Q: Como posso visualizar todas as variáveis atualmente em meu espaço de trabalho?
A: Você pode usar a função ls() para listar todas as variáveis atualmente presentes em seu espaço de trabalho.