Pular para o conteúdo principal

Como usar o Jupyter Notebooks: O guia definitivo

Este artigo aborda o que são os notebooks e por que você deve usá-los. Também nos aprofundamos nos notebooks hospedados, que facilitam o compartilhamento e a colaboração. Este artigo também aborda dicas, truques e atalhos de teclado.
24 de abr. de 2024  · 25 min de leitura

Jupyter e o notebook

Os notebooks Jupyter são documentos para conteúdo técnico e de ciência de dados. Este tutorial fornece uma visão geral dos notebooks Jupyter, seus componentes e como usá-los. 

Exploraremos os notebooks usando o Datacamp Workspace, um serviço de notebook hospedado que oferece toda a funcionalidade dos notebooks Jupyter, além da funcionalidade de conexão com bancos de dados, colaboração em tempo real e publicação do seu trabalho. 

Este tutorial pressupõe que você já tenha usado uma linguagem de programação de ciência de dados, como Python, SQL, R ou Julia.

Visão geral dos notebooks

Os notebooks combinam código de computador (como Python, SQL ou R), o resultado da execução do código e elementos de rich text (formatação, tabelas, figuras, equações, links etc.) em um único documento. 

O principal benefício dos notebooks é a capacidade de incluir comentários em seu código. Isso significa que você pode evitar o processo propenso a erros de copiar e colar os resultados da análise em um relatório separado. Em vez disso, basta misturar sua análise com o texto do relatório no notebook.

Quem deve usar o Jupyter Notebooks?

Os Jupyter Notebooks são usados principalmente por profissionais de dados, especialmente analistas de dados e cientistas de dados. De acordo com os resultados da Pesquisa Kaggle 2022, o Jupyter Notebooks é o IDE de ciência de dados mais popular, usado por mais de 80% dos entrevistados. 

Tipos de Jupyter Notebook

Há dois tipos principais de Jupyter Notebook: notebooks hospedados e locais. A DataCamp fornece o DataCamp Workspace, um Jupyter Notebook hospedado que usaremos na maior parte deste tutorial. O Workspace é uma excelente opção para alunos e profissionais que não desejam configurar um ambiente local. 

Exceto quando indicado, a funcionalidade descrita neste tutorial funcionará em outras versões do notebook Jupyter. Se preferir usar um ambiente local, você pode instalar o Jupyter Notebook em seu computador usando nosso tutorial Instalando o Jupyter Notebook. Marcus Schanta mantém uma lista de outras plataformas de notebook hospedadas.

Componentes de um notebook

Um Jupyter Notebook consiste em três componentes principais: células, um ambiente de tempo de execução e um sistema de arquivos.

 As células são as unidades individuais do bloco de notas e podem conter texto ou código:

  • As células de texto são usadas para escrever textos narrativos e incluem imagens, links e equações.
    • As células de texto são escritas em Markdown, uma linguagem de marcação simples.
  • As células de código são usadas para escrever e executar código. 
    • A saída das células de código será exibida diretamente abaixo da célula de código. 
  • As células SQL (somente no Workspace) são usadas para executar consultas SQL, o que significa que você pode recuperar facilmente dados de um banco de dados.
  • As células de gráfico (somente no Workspace) podem ser usadas para criar visualizações e visualizar rapidamente os quadros de dados do Pandas.

O ambiente de tempo de execução é responsável pela execução do código no notebook. O ambiente de tempo de execução pode ser configurado para suportar diferentes linguagens, incluindo Python, R ou SQL.

O sistema de arquivos permite fazer upload, armazenar e baixar arquivos de dados, arquivos de código e resultados da sua análise.

Modo de comando e modo de edição

Os notebooks Jupyter têm dois modos diferentes de interação: modo de comando e modo de edição. No modo de comando, você pode navegar entre as células, adicionar e excluir células e alterar o tipo de célula. No modo de edição, você pode editar o conteúdo de uma célula.

Para entrar no modo de comando, você pode pressionar Escape ou clicar fora de uma célula. Para entrar no modo de edição, pressione Enter ou clique dentro de uma célula.

No Workspace, você pode clicar nos botões "Add Text" (Adicionar texto) ou "Add Code" (Adicionar código) para adicionar uma nova célula.

image9.png

Obter ajuda

Para o notebook Jupyter, você pode obter ajuda usando a documentação ou a opção no menu. No Workspace, a ajuda e os atalhos de teclado podem ser acessados rapidamente pressionando o botão de ajuda no menu.

image14.png

Texto escrito

As células de texto são escritas na linguagem de marcação Markdown, permitindo que você escreva e formate textos com facilidade. No modo de edição, você pode usar a sintaxe, como ** ** para negrito, ou usar os botões para formatar o texto. 

Aqui estão algumas opções diferentes:

image11.png

Pressionar shift + enter ou o botão "View" executará a célula, apresentando o seguinte resultado.

image17.png

  • As linhas que começam com # são um cabeçalho de nível superior. Comece com ## para um cabeçalho de segundo nível, ### para um cabeçalho de terceiro nível e assim por diante.
  • Coloque o texto em ** para torná-lo em negrito, __ para torná-lo em itálico e ` para torná-lo formatado em código.
  • Inicie linhas consecutivas com - para transformá-las em uma lista com marcadores.
  • Inicie as linhas com números seguidos de um ponto final para transformá-las em uma lista numerada.
  • Os hiperlinks são escritos em duas partes. O texto a ser exibido é colocado entre colchetes e, em seguida, o URL é colocado entre parênteses.

Escrever e executar código

Pressionar "Add Code" ou digitar um comando com (escape) e pressionar "B" adicionará um novo bloco de código.

image3.png

Escreva o código na célula da mesma forma que faria em um script.

image12.png

Pressionar Run ou CTRL/CMD+Enter executa o código e exibe sua saída.

image2.png

Leitura e gravação de arquivos

Pressionar "Browse and upload files" (Procurar e fazer upload de arquivos) no menu à esquerda abre o sistema de arquivos, e pressionar o "mais" permitirá que você faça upload de um arquivo do computador local. Abaixo, fizemos o upload de um arquivo de texto simples chamado hello_world.txt.

image13.pngimage19.png
Podemos usar o código a seguir para abrir o arquivo, adicionar algum texto e, em seguida, salvar um novo arquivo.

image7.png
Agora você verá o novo arquivo no sistema de arquivos e ele conterá nossas atualizações.

image15.png
Trabalhando com o sistema de arquivos

Mostramos como fazer upload, atualizar e criar um novo arquivo. Para fazer o download do novo arquivo, pressione os três pontos no sistema de arquivos e clique em download.

image18.png
O botão de adição usado para criar novos arquivos também pode ser usado para criar novos notebooks, que não terão células ou saída. 

image4.png

Células de comando

Você pode reordenar rapidamente as células com os botões mover para cima e mover para baixo, conforme mostrado na imagem abaixo. 

image20.png

Isso reordenará seu código. (Observe que seu código pode ser interrompido se você tentar executá-lo na ordem errada!)

O botão Hide Code (Ocultar código) recolherá e ocultará o código; isso é útil para blocos de código muito longos nos quais você não está trabalhando no momento. Também é útil se os leitores de sua análise não se importarem com os detalhes técnicos e quiserem apenas ver os resultados.

image6.png
Da mesma forma, o botão Hide Output (Ocultar saída) permite ocultar saídas longas. 

image10.pngEssesbotões também podem ser usados juntos para ocultar o código e a saída.

Publicação de relatórios (somente no Workspace)

O Workspace permite que você publique seus notebooks como publicações. Essa é uma ótima maneira de mostrar seu excelente trabalho e colaborar com outros cientistas de dados.

Você pode publicar seu notebook pressionando o botão "Publicar" no menu lateral. A partir daí, clique em publicar para compartilhar seu notebook. É uma boa ideia executar o notebook de cima para baixo antes de publicar. Isso ajuda a verificar seu código e garante que ele seja legível, pois a maioria das pessoas lê de cima para baixo.

image1.png
Depois que o notebook for publicado, outros usuários poderão visualizar a publicação e comentar em células individuais. Você também pode fazer o mesmo com outras pessoas. Essa é uma ótima maneira de abrir uma discussão ou entender um trecho de código complexo. Aqui está um exemplo de local de trabalho

image5.png
Compartilhamento de Jupyter Notebooks (somente no Workspace)

image8.png

O compartilhamento de espaços de trabalho é outra função útil somente do Workspace. Como o notebook é hospedado, você pode compartilhar um link público ou privado, com acesso controlado, que o destinatário pode executar por conta própria. 

Essa é uma maneira fantástica de colaborar. A ciência de dados é um campo amplo e profundo, o que significa que não se espera que uma única pessoa saiba tudo. Os cientistas de dados devem colaborar para obter os melhores resultados, seja um código eficiente, visualizações atraentes ou um modelo preciso. O Workspace permite a colaboração em tempo real, em que várias pessoas podem editar um notebook ao mesmo tempo.

Para compartilhar seu notebook, pressione o botão de compartilhamento no canto superior direito. Aqui você pode copiar o link, tornar o notebook privado/público e definir quem pode acessar o notebook (se for privado).

Leve-o para o próximo nível

Comece sua jornada de ciência de dados hoje mesmo, inscrevendo-se gratuitamente no DataCamp Workspace. Se você tiver dúvidas, a documentação do Workspace é um ótimo lugar para obter mais informações.

Temas

Saiba mais sobre Python

curso

Introduction to Python

4 hr
5.5M
Master the basics of data analysis with Python in just four hours. This online course will introduce the Python interface and explore popular packages.
Ver DetalhesRight Arrow
Iniciar Curso
Ver maisRight Arrow
Relacionado

blog

Jupyter e R Markdown: Notebooks com R

Saiba como instalar, executar e usar o R com o Jupyter Notebook e o R Notebook do RStudio, incluindo dicas e alternativas
Karlijn Willems's photo

Karlijn Willems

20 min

blog

Como aprender Python do zero em 2024: um guia especializado

Descubra como aprender Python, suas aplicações e a demanda por competências em Python. Comece sua jornada em Python hoje mesmo ​com nosso guia detalhado.
Matt Crabtree's photo

Matt Crabtree

19 min

tutorial

Tutorial de introdução ao JupyterLab

Neste artigo, apresentaremos a você o JupyterLab, um dos IDEs mais populares para ciência de dados.

tutorial

Tutorial de execução de scripts Python no Power BI

Descubra as diferentes maneiras de usar o Python para otimizar a análise, a visualização e a modelagem de dados no Power BI.
Joleen Bothma's photo

Joleen Bothma

9 min

tutorial

Tutorial de conjuntos e teoria de conjuntos em Python

Aprenda sobre os conjuntos do Python: o que são, como criá-los, quando usá-los, funções incorporadas e sua relação com as operações da teoria dos conjuntos.
DataCamp Team's photo

DataCamp Team

13 min

See MoreSee More