Data Science Tutorials
Develop your data science skills with tutorials in our blog. We cover everything from intricate data visualizations in Tableau to version control features in Git.
Encontre categorias
Treinar 2 ou mais pessoas?Experimentar DataCamp for Business
if __name__ == "__main__" Python: Explicação completa
O bloco if __name__ == "__main__" em Python permite que você defina o código que será executado somente quando o arquivo for executado diretamente como um script, mas não quando for importado como um módulo em outro script.
Stephen Gruppetta
6 de outubro de 2024
Llama Stack: Um guia com exemplos práticos
O Llama Stack é um conjunto de ferramentas padronizadas e APIs desenvolvidas pela Meta que simplifica o processo de criação e implantação de grandes aplicativos de modelos de linguagem.
Hesam Sheikh Hassani
3 de outubro de 2024
Ajuste fino do GPT-4o Mini: Um guia passo a passo
Personalize o modelo GPT-4o Mini para classificar as publicações do Reddit em rótulos "estressantes" e "não estressantes".
Abid Ali Awan
3 de outubro de 2024
Modelagem de equações estruturais: O que é e quando usá-lo
Explore os tipos de modelos de equações estruturais. Aprenda a fazer suposições teóricas, criar um modelo hipotético, avaliar a adequação do modelo e interpretar os resultados da modelagem de equações estruturais.
Bunmi Akinremi
2 de outubro de 2024
Movimentação de dados com Python e dlt: Um guia para engenheiros de dados
O Python dlt é uma ótima opção para engenheiros de dados que desejam mover dados com rapidez e confiança. Ele se integra a praticamente qualquer origem e destino e permite que você escreva seus pipelines ELT/ETL rapidamente. Este tutorial mostra a você como controlar cada etapa do pipeline e trabalhar com arquivos locais, nuvem, bancos de dados e APIs REST.
Dario Radečić
2 de outubro de 2024
Jenkins para MLOps: Um tutorial completo de CI/CD
Saiba como instalar o Jenkins no Windows, configurar e executar agentes e pipelines do Jenkins e criar projetos MLOps com pipelines do Jenkins, desde o treinamento do modelo até a veiculação do modelo.
Abid Ali Awan
2 de outubro de 2024
Paleta de cores Seaborn: Guia rápido para a escolha de cores
Use color_palette() para separação categórica clara, cubehelix_palette() para dados sequenciais graduais e diverging_palette() para divergência clara de um ponto médio.
Vinod Chugani
1 de outubro de 2024
R-quadrado ajustado: Uma explicação clara com exemplos
Descubra como interpretar o r-quadrado ajustado para avaliar o desempenho do modelo de regressão. Compare a diferença entre o r-quadrado e o r-quadrado ajustado com exemplos em R e Python.
Allan Ouko
1 de outubro de 2024
AUC e a curva ROC no aprendizado de máquina
Saiba como a curva AUC-ROC avalia os modelos de classificação binária, concentrando-se no desempenho entre os limites, especialmente em conjuntos de dados desequilibrados. Use as bibliotecas do Python para calcular os valores de AUC e comparar os classificadores em um fluxo de trabalho.
Vidhi Chugh
1 de outubro de 2024
Média Winsorizada: Uma abordagem robusta para lidar com outliers
Uma média winsorizada reduz a influência de outliers limitando os valores extremos a percentis específicos, preservando a estrutura geral do conjunto de dados. Continue lendo para saber como calcular a média winsorizada usando Python para praticar.
Arunn Thevapalan
1 de outubro de 2024
Vetores e valores próprios: Principais percepções para a ciência de dados
Os vetores e valores próprios são essenciais para entender as transformações lineares. Este artigo aborda sua interpretação geométrica, cálculo matemático e importância no aprendizado de máquina.
Islam Salahuddin
1 de outubro de 2024
Coleta de lixo do Python: Principais conceitos e mecanismos
Saiba como o Python gerencia automaticamente a memória com contagem de referência e coleta de lixo geracional e entenda como controlar manualmente a coleta de lixo usando o módulo gc.
Samuel Shaibu
1 de outubro de 2024