Curso

Os notebooks Jupyter são documentos para conteúdo técnico e de ciência de dados. Este tutorial fornece uma visão geral dos notebooks Jupyter, seus componentes e como usá-los.
Exploraremos os notebooks usando o Datacamp Workspace, um serviço de notebook hospedado que oferece toda a funcionalidade dos notebooks Jupyter, além da funcionalidade de conexão com bancos de dados, colaboração em tempo real e publicação do seu trabalho.
Este tutorial pressupõe que você já tenha usado uma linguagem de programação de ciência de dados, como Python, SQL, R ou Julia.
Visão geral dos notebooks
Os notebooks combinam código de computador (como Python, SQL ou R), o resultado da execução do código e elementos de rich text (formatação, tabelas, figuras, equações, links etc.) em um único documento.
O principal benefício dos notebooks é a capacidade de incluir comentários em seu código. Isso significa que você pode evitar o processo propenso a erros de copiar e colar os resultados da análise em um relatório separado. Em vez disso, basta misturar sua análise com o texto do relatório no notebook.
Quem deve usar o Jupyter Notebooks?
Os Jupyter Notebooks são usados principalmente por profissionais de dados, especialmente analistas de dados e cientistas de dados. De acordo com os resultados da Pesquisa Kaggle 2022, o Jupyter Notebooks é o IDE de ciência de dados mais popular, usado por mais de 80% dos entrevistados.
Tipos de Jupyter Notebook
Há dois tipos principais de Jupyter Notebook: notebooks hospedados e locais. A DataCamp fornece o DataCamp Workspace, um Jupyter Notebook hospedado que usaremos na maior parte deste tutorial. O Workspace é uma excelente opção para alunos e profissionais que não desejam configurar um ambiente local.
Exceto quando indicado, a funcionalidade descrita neste tutorial funcionará em outras versões do notebook Jupyter. Se preferir usar um ambiente local, você pode instalar o Jupyter Notebook em seu computador usando nosso tutorial Instalando o Jupyter Notebook. Marcus Schanta mantém uma lista de outras plataformas de notebook hospedadas.
Componentes de um notebook
Um Jupyter Notebook consiste em três componentes principais: células, um ambiente de tempo de execução e um sistema de arquivos.
As células são as unidades individuais do bloco de notas e podem conter texto ou código:
- As células de texto são usadas para escrever textos narrativos e incluem imagens, links e equações.
- As células de texto são escritas em Markdown, uma linguagem de marcação simples.
- As células de código são usadas para escrever e executar código.
- A saída das células de código será exibida diretamente abaixo da célula de código.
- As células SQL (somente no Workspace) são usadas para executar consultas SQL, o que significa que você pode recuperar facilmente dados de um banco de dados.
- As células de gráfico (somente no Workspace) podem ser usadas para criar visualizações e visualizar rapidamente os quadros de dados do Pandas.
O ambiente de tempo de execução é responsável pela execução do código no notebook. O ambiente de tempo de execução pode ser configurado para suportar diferentes linguagens, incluindo Python, R ou SQL.
O sistema de arquivos permite fazer upload, armazenar e baixar arquivos de dados, arquivos de código e resultados da sua análise.
Modo de comando e modo de edição
Os notebooks Jupyter têm dois modos diferentes de interação: modo de comando e modo de edição. No modo de comando, você pode navegar entre as células, adicionar e excluir células e alterar o tipo de célula. No modo de edição, você pode editar o conteúdo de uma célula.
Para entrar no modo de comando, você pode pressionar Escape ou clicar fora de uma célula. Para entrar no modo de edição, pressione Enter ou clique dentro de uma célula.
No Workspace, você pode clicar nos botões "Add Text" (Adicionar texto) ou "Add Code" (Adicionar código) para adicionar uma nova célula.

Obter ajuda
Para o notebook Jupyter, você pode obter ajuda usando a documentação ou a opção no menu. No Workspace, a ajuda e os atalhos de teclado podem ser acessados rapidamente pressionando o botão de ajuda no menu.

Texto escrito
As células de texto são escritas na linguagem de marcação Markdown, permitindo que você escreva e formate textos com facilidade. No modo de edição, você pode usar a sintaxe, como ** ** para negrito, ou usar os botões para formatar o texto.
Aqui estão algumas opções diferentes:

Pressionar shift + enter ou o botão "View" executará a célula, apresentando o seguinte resultado.

- As linhas que começam com # são um cabeçalho de nível superior. Comece com ## para um cabeçalho de segundo nível, ### para um cabeçalho de terceiro nível e assim por diante.
- Coloque o texto em ** para torná-lo em negrito, __ para torná-lo em itálico e ` para torná-lo formatado em código.
- Inicie linhas consecutivas com - para transformá-las em uma lista com marcadores.
- Inicie as linhas com números seguidos de um ponto final para transformá-las em uma lista numerada.
- Os hiperlinks são escritos em duas partes. O texto a ser exibido é colocado entre colchetes e, em seguida, o URL é colocado entre parênteses.
Escrever e executar código
Pressionar "Add Code" ou digitar um comando com (escape) e pressionar "B" adicionará um novo bloco de código.

Escreva o código na célula da mesma forma que faria em um script.

Pressionar Run ou CTRL/CMD+Enter executa o código e exibe sua saída.

Leitura e gravação de arquivos
Pressionar "Browse and upload files" (Procurar e fazer upload de arquivos) no menu à esquerda abre o sistema de arquivos, e pressionar o "mais" permitirá que você faça upload de um arquivo do computador local. Abaixo, fizemos o upload de um arquivo de texto simples chamado hello_world.txt.


Podemos usar o código a seguir para abrir o arquivo, adicionar algum texto e, em seguida, salvar um novo arquivo.

Agora você verá o novo arquivo no sistema de arquivos e ele conterá nossas atualizações.

Trabalhando com o sistema de arquivos
Mostramos como fazer upload, atualizar e criar um novo arquivo. Para fazer o download do novo arquivo, pressione os três pontos no sistema de arquivos e clique em download.

O botão de adição usado para criar novos arquivos também pode ser usado para criar novos notebooks, que não terão células ou saída.

Células de comando
Você pode reordenar rapidamente as células com os botões mover para cima e mover para baixo, conforme mostrado na imagem abaixo.

Isso reordenará seu código. (Observe que seu código pode ser interrompido se você tentar executá-lo na ordem errada!)
O botão Hide Code (Ocultar código) recolherá e ocultará o código; isso é útil para blocos de código muito longos nos quais você não está trabalhando no momento. Também é útil se os leitores de sua análise não se importarem com os detalhes técnicos e quiserem apenas ver os resultados.

Da mesma forma, o botão Hide Output (Ocultar saída) permite ocultar saídas longas.
botões também podem ser usados juntos para ocultar o código e a saída.
Publicação de relatórios (somente no Workspace)
O Workspace permite que você publique seus notebooks como publicações. Essa é uma ótima maneira de mostrar seu excelente trabalho e colaborar com outros cientistas de dados.
Você pode publicar seu notebook pressionando o botão "Publicar" no menu lateral. A partir daí, clique em publicar para compartilhar seu notebook. É uma boa ideia executar o notebook de cima para baixo antes de publicar. Isso ajuda a verificar seu código e garante que ele seja legível, pois a maioria das pessoas lê de cima para baixo.

Depois que o notebook for publicado, outros usuários poderão visualizar a publicação e comentar em células individuais. Você também pode fazer o mesmo com outras pessoas. Essa é uma ótima maneira de abrir uma discussão ou entender um trecho de código complexo. Aqui está um exemplo de local de trabalho:

Compartilhamento de Jupyter Notebooks (somente no Workspace)

O compartilhamento de espaços de trabalho é outra função útil somente do Workspace. Como o notebook é hospedado, você pode compartilhar um link público ou privado, com acesso controlado, que o destinatário pode executar por conta própria.
Essa é uma maneira fantástica de colaborar. A ciência de dados é um campo amplo e profundo, o que significa que não se espera que uma única pessoa saiba tudo. Os cientistas de dados devem colaborar para obter os melhores resultados, seja um código eficiente, visualizações atraentes ou um modelo preciso. O Workspace permite a colaboração em tempo real, em que várias pessoas podem editar um notebook ao mesmo tempo.
Para compartilhar seu notebook, pressione o botão de compartilhamento no canto superior direito. Aqui você pode copiar o link, tornar o notebook privado/público e definir quem pode acessar o notebook (se for privado).
Leve-o para o próximo nível
Comece sua jornada de ciência de dados hoje mesmo, inscrevendo-se gratuitamente no DataCamp Workspace. Se você tiver dúvidas, a documentação do Workspace é um ótimo lugar para obter mais informações.
