Pular para o conteúdo principal
aprendendo ciencia de datos

Data Science Tutorials

Develop your data science skills with tutorials in our blog. We cover everything from intricate data visualizations in Tableau to version control features in Git.
Encontre categorias
GroupTreinar 2 ou mais pessoas?Experimentar DataCamp for Business
Python

if __name__ == "__main__" Python: Explicação completa

O bloco if __name__ == "__main__" em Python permite que você defina o código que será executado somente quando o arquivo for executado diretamente como um script, mas não quando for importado como um módulo em outro script.
Stephen Gruppetta's photo

Stephen Gruppetta

6 de outubro de 2024

Inteligência Artificial

Ajuste fino do GPT-4o Mini: Um guia passo a passo

Personalize o modelo GPT-4o Mini para classificar as publicações do Reddit em rótulos "estressantes" e "não estressantes".
Abid Ali Awan's photo

Abid Ali Awan

3 de outubro de 2024

Python

Modelagem de equações estruturais: O que é e quando usá-lo

Explore os tipos de modelos de equações estruturais. Aprenda a fazer suposições teóricas, criar um modelo hipotético, avaliar a adequação do modelo e interpretar os resultados da modelagem de equações estruturais.
Bunmi Akinremi's photo

Bunmi Akinremi

2 de outubro de 2024

Engenharia de dados

Movimentação de dados com Python e dlt: Um guia para engenheiros de dados

O Python dlt é uma ótima opção para engenheiros de dados que desejam mover dados com rapidez e confiança. Ele se integra a praticamente qualquer origem e destino e permite que você escreva seus pipelines ELT/ETL rapidamente. Este tutorial mostra a você como controlar cada etapa do pipeline e trabalhar com arquivos locais, nuvem, bancos de dados e APIs REST.
Dario Radečić's photo

Dario Radečić

2 de outubro de 2024

MLOps

Jenkins para MLOps: Um tutorial completo de CI/CD

Saiba como instalar o Jenkins no Windows, configurar e executar agentes e pipelines do Jenkins e criar projetos MLOps com pipelines do Jenkins, desde o treinamento do modelo até a veiculação do modelo.
Abid Ali Awan's photo

Abid Ali Awan

2 de outubro de 2024

Python

Paleta de cores Seaborn: Guia rápido para a escolha de cores

Use color_palette() para separação categórica clara, cubehelix_palette() para dados sequenciais graduais e diverging_palette() para divergência clara de um ponto médio.
Vinod Chugani's photo

Vinod Chugani

1 de outubro de 2024

Data Analysis

AUC e a curva ROC no aprendizado de máquina

Saiba como a curva AUC-ROC avalia os modelos de classificação binária, concentrando-se no desempenho entre os limites, especialmente em conjuntos de dados desequilibrados. Use as bibliotecas do Python para calcular os valores de AUC e comparar os classificadores em um fluxo de trabalho.
Vidhi Chugh's photo

Vidhi Chugh

1 de outubro de 2024

Data Analysis

Média Winsorizada: Uma abordagem robusta para lidar com outliers

Uma média winsorizada reduz a influência de outliers limitando os valores extremos a percentis específicos, preservando a estrutura geral do conjunto de dados. Continue lendo para saber como calcular a média winsorizada usando Python para praticar.
Arunn Thevapalan's photo

Arunn Thevapalan

1 de outubro de 2024

Ciência de dados

Vetores e valores próprios: Principais percepções para a ciência de dados

Os vetores e valores próprios são essenciais para entender as transformações lineares. Este artigo aborda sua interpretação geométrica, cálculo matemático e importância no aprendizado de máquina.
Islam Salahuddin's photo

Islam Salahuddin

1 de outubro de 2024

Python

Coleta de lixo do Python: Principais conceitos e mecanismos

Saiba como o Python gerencia automaticamente a memória com contagem de referência e coleta de lixo geracional e entenda como controlar manualmente a coleta de lixo usando o módulo gc.
Samuel Shaibu's photo

Samuel Shaibu

1 de outubro de 2024