Tutorial R
Obtenção de R
O R está disponível para Linux, MacOS e Windows. Você pode fazer o download do software na Comprehensive R Archive Network (CRAN).
Inicialização
Depois que o R for baixado e instalado, basta localizar e iniciar o R na pasta Aplicativos.
Inserção de comandos
O R é um programa orientado por linha de comando. O usuário insere comandos no prompt ( > por padrão) e cada comando é executado um de cada vez.
O espaço de trabalho
O espaço de trabalho é o ambiente de trabalho atual do R e inclui todos os objetos definidos pelo usuário (vetores, matrizes, quadros de dados, listas, funções). Ao final de uma sessão do R, o usuário pode salvar uma imagem do espaço de trabalho atual que será recarregada automaticamente na próxima vez que o R for iniciado.
Interfaces gráficas de usuário
Além do console integrado do R, o RStudio é o editor de código R mais popular e faz interface com o R para as plataformas Windows, MacOS e Linux.
Operadores no R
Os operadores binários e lógicos do R são muito familiares para os programadores. Observe que os operadores binários funcionam em vetores e matrizes, bem como em escalares.
Os operadores aritméticos incluem:
Operador | Descrição |
+ | adição |
- | subtração |
* | multiplicação |
/ | divisão |
^ ou ** | exponenciação |
Os operadores lógicos incluem:
Operador | Descrição |
> | maior que |
>= | maior ou igual a |
== | exatamente igual a |
!= | não igual a |
Tipos de dados
O R tem uma grande variedade de tipos de dados, incluindo escalares, vetores (numéricos, de caracteres, lógicos), matrizes, quadros de dados e listas.
Criação de novas variáveis
Use o operador de atribuição <- para criar novas variáveis.
# An example of computing the mean with variables
mydata$sum <- mydata$x1 + mydata$x2
mydata$mean <- (mydata$x1 + mydata$x2)/2
Funções
Quase tudo no R é feito por meio de funções. Uma função é um trecho de código escrito para executar uma tarefa específica; ela pode aceitar argumentos ou parâmetros (ou não) e pode retornar um ou mais valores (ou não!). No R, uma função é definida com a construção:
function ( arglist ) {body}
O código entre chaves é o corpo da função. Observe que, ao usar funções incorporadas, a única coisa com que você precisa se preocupar é como comunicar efetivamente os argumentos de entrada corretos (arglist) e gerenciar o(s) valor(es) de retorno (se houver).
Importação de dados
A importação de dados para o R é bastante simples. O R oferece opções para importar vários tipos de arquivos, de CSVs a bancos de dados.
Por exemplo, é assim que você importa um CSV para o R.
# first row contains variable names, comma is separator
# assign the variable id to row names
# note the / instead of \ on mswindows systems
mydata <- read.table("c:/mydata.csv", header=TRUE,
sep=",", row.names="id")
Estatísticas descritivas
O R oferece uma ampla gama de funções para a obtenção de estatísticas resumidas. Uma maneira de obter estatísticas descritivas é usar a função sapply( ) com uma estatística de resumo especificada.
A seguir, você verá como obter a média com a função sapply( ):
# get means for variables in data frame mydata
# excluding missing values
sapply(mydata, mean, na.rm=TRUE)
As possíveis funções usadas no sapply incluem média, sd, var, min, max, mediana, intervalo e quantil.
Plotagem no R
No R, os gráficos geralmente são criados de forma interativa. Aqui está um exemplo:
# Creating a Graph
attach(mtcars)
plot(wt, mpg)
abline(lm(mpg~wt))
title("Regression of MPG on Weight")
A função plot( ) abre uma janela de gráfico e plota o peso versus milhas por galão. A próxima linha de código adiciona uma linha de regressão a esse gráfico. A linha final adiciona um título.
Pacotes
Os pacotes são coleções de funções, dados e código compilado do R em um formato bem definido. O diretório em que os pacotes são armazenados é chamado de biblioteca. O R vem com um conjunto padrão de pacotes. Outros estão disponíveis para download e instalação. Depois de instalados, eles precisam ser carregados na sessão para serem usados.
.libPaths() # get library location
library() # see all packages installed
search() # see packages currently loaded
Obtendo ajuda
Depois que o R é instalado, há um sistema de ajuda integrado abrangente. No prompt de comando do programa, você pode usar qualquer uma das opções a seguir:
help.start() # general help
help(foo) # help about function foo
?foo # same thing
apropos("foo") # list all functions containing string foo
example(foo) # show an example of function foo
Indo além
Se você preferir um ambiente interativo on-line para aprender R, este tutorial gratuito de R do DataCamp é uma ótima maneira de começar.