Saltar al contenido principal
InicioTutorialesInteligencia Artificial (IA)

Cómo ejecutar Stable Diffusion

Explora la IA generativa con nuestro tutorial introductorio sobre Stable Diffusion. Aprende a ejecutar el modelo de aprendizaje profundo en línea y localmente para generar imágenes detalladas.
Actualizado ene 2024  · 7 min leer

En colaboración con varios investigadores académicos y organizaciones sin ánimo de lucro, una startup llamada Stability AI, fundada en 2019, desarrolló el modelo Stable Diffusion, que se lanzó posteriormente en 2022.

En efecto, se trata de un modelo de aprendizaje profundo de código abierto encargado principalmente de generar imágenes detalladas y de alta calidad a partir de texto. Sin embargo, también puedes utilizar texto para modificar imágenes o rellenar detalles de imágenes de baja resolución.

El Stable Diffusion se entrenó inicialmente con 2.300 millones de imágenes y se dice que es capaz de producir resultados comparables a los de DALL-E 2.

En este artículo, rascaremos la superficie de cómo funciona y luego cubriremos algunas formas en que puedes ejecutarlo por ti mismo.

¿Cómo funciona Stable Diffusion?

El modelo de Stable Diffusion pertenece a una clase de modelos de aprendizaje profundo conocidos como de difusión. Más concretamente, son modelos generativos; esto significa que están entrenados para generar nuevos datos similares a los que ha aprendido en el pasado.

Como nota al margen, el modelado generativo es un tipo de aprendizaje no supervisado que se ocupa de descubrir y aprender automáticamente patrones en los datos de entrada, de forma que el modelo pueda utilizarse para obtener nuevos ejemplos que puedan haberse extraído de los datos originales.

El Stable Diffusion se ganó el nombre de "difusión" por sus sorprendentes similitudes en la formulación matemática con la difusión en física.

Cómo ejecutar Stable Diffusion en línea

Si quieres empezar a utilizar inmediatamente el modelo de Stable Diffusion, puedes hacerlo ejecutándolo en línea con las siguientes herramientas.

DreamStudio

Stability AI, los creadores de Stable Diffusion, han hecho que sea extremadamente sencillo para los curiosos probar su modelo de conversión de texto en imagen con su herramienta en línea. Esta plataforma permite a los usuarios acceder a la última versión de modelos de Stable Diffusion, lo que te permite generar una imagen en hasta 15 segundos.

Estudio de sueños

Ten en cuenta que tendrías que registrarte en DreamsStudio para utilizar la herramienta. A los nuevos usuarios se les conceden 25 créditos (en el momento de escribir esto) al crear una cuenta, lo que te da aproximadamente más de 100 imágenes. Si necesitas más, puedes comprar fácilmente créditos adicionales desde el panel de control de la cuenta.

Cuadro de mandos de créditos

Stable Diffusion con Hugging Face

Hugging Face es una comunidad y plataforma de IA que promueve las contribuciones de código abierto. Aunque es muy reconocido por sus modelos de transformadores, Hugging Face también proporciona acceso al último modelo de Stable Diffusion; y como un verdadero amante del código abierto, es gratuito. La contrapartida de hugging face es que no puedes personalizar las propiedades como en DreamsStudio, y que se tarda notablemente más en generar una imagen.

Difusión Estable Cara Abrazada

Cómo ejecutar localmente Stable Diffusion

Pero, ¿y si quieres experimentar con Stable Diffusion en tu ordenador local?

Te tenemos cubierto.

Ejecutar Stable Diffusion localmente te permite experimentar con diversas entradas de texto para generar imágenes más adaptadas a tus necesidades. Además, puedes afinar el modelo con tus datos para mejorar los resultados dados los datos de entrada que proporciones.

Descargo de responsabilidad: Debes tener una GPU para ejecutar Stable Diffusion en tu PC.

Paso 1: Instalar Python y Git

Necesitarás Python 3.10.6 para ejecutar Stable Diffusion desde tu ordenador local; puedes instalarlo desde el sitio web oficial de Python. Si te quedas atascado, consulta nuestro tutorial Cómo instalar Python.

Comprueba que la instalación ha funcionado correctamente abriendo el símbolo del sistema y escribiendo pythony ejecutando el comando; esto debería imprimir la versión de Python que estás utilizando.

Instalar git y Python

Si no ves la versión 3.10.6 de Python, asegúrate de que has eliminado todas las demás versiones de Python de tu PC.

Descargo de responsabilidad: No sigas adelante sin Python 3.10.6.

A continuación, debes instalar el sistema de gestión de repositorios de código, Git; el Tutorial de instalación de Git está ahí para ayudarte si te quedas atascado, y nuestro curso Introducción a Git está disponible si deseas profundizar tus conocimientos sobre git.

Paso 2: Crear una cuenta GitHub y Hugging Face

GitHub es un servicio de alojamiento para el desarrollo de software; es donde los desarrolladores alojan su código para poder hacer un seguimiento y colaborar con otros desarrolladores en proyectos de software. Si no tienes una cuenta de Github, ahora también es un buen momento para crear una - consulta el Tutorial de Github y Git para principiantes para obtener ayuda.

Por otro lado, Hugging Face es una comunidad de IA que aboga por las contribuciones de código abierto. Sirve de centro neurálgico para varios modelos de diversos dominios, como el Procesamiento del Lenguaje Natural, la Visión por Ordenador, etc. Necesitarás una cuenta para descargar la última versión de Stable Diffusion - llegaremos a este paso más adelante.

Paso 3: Clona la Web-UI de Stable Diffusion en tu PC

Este paso es importante, pero puede complicarse fácilmente; lo único que queremos es descargar los elementos básicos de la instalación de Stable Diffusion e en nuestro PC local. Es útil crear una carpeta (por ejemplo, stable-diffusion-demo-project) en la que descargar el repositorio, pero no es un requisito necesario.

Para este paso, necesitarás Git bash. Navega hasta la carpeta en la que quieras clonar la interfaz web de Stable Diffusion utilizando el siguiente comando:

cd path/to/folder 

A continuación, ejecuta el siguiente comando:

git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git

Si el comando se ejecuta correctamente, ahora deberías tener una carpeta llamada stable-diffusion-webui.

Instala una difusión estable

Paso 4: Descargar el último modelo de Stable Diffusion

Aquí es donde tu cuenta de Hugging Face resulta útil; Entra en Hugging Face, y descarga un modelo de Stable Diffusion. Ten en cuenta que esto puede tardar unos minutos porque es un archivo bastante grande.

Una vez que hayas descargado el modelo, navega hasta la carpeta "models" dentro de la carpeta stable-diffusion-webui. Ahí dentro, debe haber una carpeta "stable-diffusion" que contenga un archivo de texto llamado "Put Stable Diffusion Checkpoints here" [Pon aquí los puntos de control de Stable Diffusion].

Ahora, mueve a esta carpeta el modelo de Stable Diffusion recién descargado.

Este es el camino para que quede claro:

stable-diffusion-webui\models\Stable-diffusion

Paso 5: Configurar la Web-UI

El siguiente paso es instalar las herramientas necesarias para ejecutar Stable Diffusion; este paso puede llevar aproximadamente 10 minutos.

Abre tu símbolo del sistema y navega hasta la carpeta stable-diffusion-webui utilizando el siguiente comando:

cd path/to/stable-diffusion-webui

Una vez allí, corre:

webui-user.bat

Esto creará un entorno virtual e instalará todas las dependencias necesarias.

Paso 6: Ejecutar Stable Diffusion

Una vez instaladas las dependencias, aparecerá una URL en tu símbolo del sistema: "http://127.0.0.1:7860". Copia y pega esto en tu barra de direcciones para ejecutar la web-ui de Stable Diffusion.

Tablero de difusión estable

Más información sobre la IA generativa

La IA generativa se refiere a un modo de aprendizaje profundo capaz de generar texto, imágenes, etc. de alta calidad, basándose en aquello en lo que se entrenó el modelo. Herramientas como Stable Diffusion, ChatGPT, DALL-E, etc., son grandes ejemplos de IA generativa que últimamente están causando sensación.

Si no estás al día con la IA Generativa, consulta los recursos que se enumeran a continuación para ponerte al día.

Temas
Relacionado

Cómo aprender IA desde cero en 2024: Guía completa de los expertos

Descubre todo lo que necesitas saber sobre el aprendizaje de la IA en 2024, desde consejos para empezar, recursos útiles y opiniones de expertos del sector.
Adel Nehme's photo

Adel Nehme

20 min

An avian AI exits its cage

12 alternativas de código abierto a GPT-4

Alternativas de código abierto a GPT-4 que pueden ofrecer un rendimiento similar y requieren menos recursos informáticos para funcionar. Estos proyectos vienen con instrucciones, fuentes de código, pesos del modelo, conjuntos de datos e IU de chatbot.
Abid Ali Awan's photo

Abid Ali Awan

9 min

Los mejores 8 LLM de código abierto para 2024 y sus usos

Descubre algunos de los LLM de código abierto más potentes y por qué serán cruciales para el futuro de la IA generativa
Javier Canales Luna's photo

Javier Canales Luna

13 min

Las 5 mejores bases de datos vectoriales

Una guía completa de las mejores bases de datos vectoriales. Domina el almacenamiento de datos de alta dimensión, descifra la información no estructurada y aprovecha las incrustaciones de vectores para aplicaciones de IA.
Moez Ali's photo

Moez Ali

14 min

OpenAI anuncia Sora: La IA generativa de texto a vídeo está a punto de generalizarse

Descubre Sora de OpenAI: una innovadora IA de texto a vídeo que revolucionará la IA multimodal en 2024. Explora sus capacidades, innovaciones e impacto potencial.
Richie Cotton's photo

Richie Cotton

Ajuste fino de LLaMA 2: Guía paso a paso para personalizar el modelo de lenguaje grande

Aprende a ajustar Llama-2 en Colab utilizando nuevas técnicas para superar las limitaciones de memoria y computación y hacer más accesibles los grandes modelos lingüísticos de código abierto.
Abid Ali Awan's photo

Abid Ali Awan

12 min

See MoreSee More