Tutoriales de Ciencia de Datos
Desarrolla tus habilidades en ciencia de datos con tutoriales en nuestro blog. Cubrimos todo, desde visualizaciones de datos complejas en Tableau hasta funciones de control de versiones en Git.
Descubre categorías
Puesta a punto del GPT-4o Mini: Guía paso a paso
Personaliza el modelo GPT-4o Mini para clasificar las publicaciones de Reddit en etiquetas "estresantes" y "no estresantes".
Abid Ali Awan
3 de octubre de 2024
Pila de llamas: Una guía con ejemplos prácticos
Llama Stack es un conjunto de herramientas y API estandarizadas desarrolladas por Meta que simplifican el proceso de creación y despliegue de grandes aplicaciones de modelos lingüísticos.
Hesam Sheikh Hassani
3 de octubre de 2024
Mover datos con Python y dlt: Guía del ingeniero de datos
Python dlt es una gran elección para los ingenieros de datos que quieren mover datos con rapidez y confianza. Se integra con casi cualquier fuente y destino y te permite escribir rápidamente tus pipelines ELT/ETL. Este tutorial te muestra cómo controlar cada paso del pipeline y trabajar con archivos locales, la nube, bases de datos y APIs REST.
2 de octubre de 2024
Jenkins para MLOps: Un tutorial completo de CI/CD
Aprende a instalar Jenkins en Windows, a configurar y ejecutar agentes y pipelines Jenkins, y a construir proyectos MLOps con pipelines Jenkins, desde la formación de modelos hasta el servicio de modelos.
Abid Ali Awan
2 de octubre de 2024
Modelización de ecuaciones estructurales: Qué es y cuándo utilizarlo
Explora los tipos de modelos de ecuaciones estructurales. Aprende a hacer suposiciones teóricas, construir un modelo hipotético, evaluar el ajuste del modelo e interpretar los resultados en el modelado de ecuaciones estructurales.
Bunmi Akinremi
2 de octubre de 2024
¿Qué es la dependencia transitiva?
Una dependencia transitiva se produce cuando un atributo de una base de datos depende indirectamente de otro a través de un tercer atributo, provocando redundancia. Sigue leyendo para aprender a identificar y eliminar las dependencias transitivas en el diseño de bases de datos .
Allan Ouko
1 de octubre de 2024
Comprender la suma de cuadrados: Guía de la TSM, la TSS y la ESS
Aprende a calcular la suma total de cuadrados (SST), la suma de cuadrados de regresión (SSR) y la suma de cuadrados de error (SSE) para evaluar la precisión del modelo de regresión. Descubre sus relaciones matemáticas y cómo influyen en la R-cuadrado.
Elena Kosourova
1 de octubre de 2024
R-cuadrado ajustado: Una explicación clara con ejemplos
Descubre cómo interpretar la r-cuadrado ajustada para evaluar el rendimiento del modelo de regresión. Compara la diferencia entre r-cuadrado y r-cuadrado ajustado con ejemplos en R y Python.
Allan Ouko
1 de octubre de 2024
Desviación típica de la muestra: Las ideas clave
Aprende a calcular la desviación típica muestral y comprende su importancia en el análisis estadístico. Explora ejemplos y buenas prácticas para la interpretación de datos del mundo real.
Allan Ouko
1 de octubre de 2024
AUC y Curva ROC en Aprendizaje Automático
Aprende cómo la curva AUC-ROC evalúa los modelos de clasificación binaria, centrándose en el rendimiento a través de umbrales, especialmente en conjuntos de datos desequilibrados. Utiliza las bibliotecas de Python para calcular los valores AUC y comparar clasificadores en un solo flujo de trabajo.
Vidhi Chugh
1 de octubre de 2024
Media Winsorizada: Un enfoque robusto para tratar los valores atípicos
Una media winsorizada reduce la influencia de los valores atípicos al limitar los valores extremos a percentiles específicos, preservando la estructura general del conjunto de datos. Sigue leyendo para aprender a calcular la media winsorizada utilizando Python para practicar.
Arunn Thevapalan
1 de octubre de 2024
Introducción a los espacios de código de GitHub
Descubre GitHub Codespaces, el entorno de desarrollo que te permite escribir, ejecutar y desplegar tu código en cualquier lugar.
Adejumo Ridwan Suleiman
1 de octubre de 2024