Modelos multimodales con Hugging Face

IntermedioNivel de habilidad

Actualizado 1/2026

Combina texto, imágenes, audio y vídeo con los últimos modelos de IA de Hugging Face y genera nuevas imágenes y vídeos.

Descripción del curso

Aprovecha el poder de la IA multimodal

Sumérgete en el innovador mundo de los modelos de IA multimodal, donde el texto, las imágenes y el habla se combinan para crear potentes aplicaciones. Descubre cómo aprovechar el amplio repositorio de modelos de Hugging Face, que pueden ver, oír y comprender como nunca antes. Tanto si estás analizando contenido de redes sociales, creando asistentes de voz o desarrollando aplicaciones de IA de última generación, los modelos multimodales son la clave para gestionar diferentes tipos de datos de forma fluida.

Domina las técnicas multimodales esenciales

Explora modelos de última generación como CLIP para la comprensión de imágenes y texto, SpeechT5 para la síntesis de voz y el modelo Qwen2 Vision Language para el análisis multimodal de sentimientos. A través de ejercicios prácticos, dominarás las técnicas utilizadas por las principales empresas de IA para crear sofisticados sistemas multimodales.

Prepara tus habilidades en IA para el futuro

Este curso te proporcionará un sólido conjunto de herramientas para gestionar tareas de IA multimodal. Aprenderás a procesar y combinar diferentes modalidades de datos de forma eficaz, ajustar modelos preentrenados para aplicaciones personalizadas y evaluar y mejorar el rendimiento de los modelos en todas las modalidades.

Requisitos previos

Introduction to LLMs in Python

Accessing Hugging Face Models and Datasets

Navigate the Hugging Face model hub, transform raw text, audio, and visual data into AI-friendly formats. Learn how to find the latest most popular models for tasks such as text generation and harness the power of pre-built pipelines.

Descripción del curso

Aprovecha el poder de la IA multimodal

Domina las técnicas multimodales esenciales

Prepara tus habilidades en IA para el futuro

Obtener certificado de logros

¡Únete a .css-nklxlk{color:var(--wf-brand--main, #03EF62);}19 millones de estudiantes y empieza Modelos multimodales con Hugging Face hoy mismo!

Crea tu cuenta gratuita

Desarrolla tus habilidades de datos con la aplicación móvil de DataCamp

¡Únete a 19 millones de estudiantes y empieza Modelos multimodales con Hugging Face hoy mismo!