Tutorial de Qwen (Alibaba Cloud): Introducción y puesta a punto

Qwen es una familia de grandes modelos lingüísticos y multimodales desarrollados por Alibaba Cloud, diseñados para diversas tareas como la generación de textos, la comprensión de imágenes y la conversación.

Actualizado 29 jul 2024 · 10 min de lectura

¿Y si cualquiera pudiera utilizar la inteligencia artificial avanzada, no sólo las grandes empresas tecnológicas? Esta es la gran idea que subyace en Qwen, una nueva familia de modelos de IA creada por Alibaba Cloud.

Qwen (que es la abreviatura de Tongyi Qianwen) está intentando que los modelos de IA sean fácilmente accesibles para todo el mundo con un conjunto de herramientas de IA fabricadas por Alibaba Cloud. Qwen lo hace ofreciendo:

Una gama de modelos de IA listos para usar
Modelos ya entrenados y fácilmente adaptables
Herramientas que simplifican la incorporación de IA a los proyectos

Con Qwen, no necesitas tantos recursos ni tantos conocimientos especializados para utilizar la IA avanzada.

En este tutorial, lo haremos:

Explora las características clave de los modelos Qwen, incluidas sus capacidades multilingües y de procesamiento multimodal.
Te guiará en el proceso de acceso e instalación de los modelos Qwen.
Demuestra ejemplos prácticos del uso de Qwen para tareas como la generación de textos y la respuesta a preguntas.
Explora el ajuste fino de los modelos Qwen en conjuntos de datos personalizados para aplicaciones especializadas.
Discute las implicaciones más amplias y las perspectivas de futuro de Qwen.

¿Qué es Qwen?

Qwen es una serie de potentes modelos entrenados en conjuntos de datos masivos multilingües y multimodales. Desarrollado por Alibaba Cloud, Qwen lleva la IA a nuevos niveles, haciéndola más inteligente y útil para el procesamiento del lenguaje natural, la visión por ordenador y la comprensión de audio.

Estos modelos son capaces de realizar una amplia gama de tareas, entre ellas:

Generación de textos y comprensión
Respuesta a la pregunta
Subtitulado y análisis de imágenes
Respuesta visual a preguntas
Procesamiento de audio
Uso de herramientas y planificación de tareas

Los modelos Qwen se preentrenan en diversas fuentes de datos y se perfeccionan mediante postentrenamiento en datos de alta calidad.

Familia de modelos

La familia Qwen consta de distintos modelos especializados diseñados para diferentes necesidades y casos de uso.

La familia de modelos Qwen está diseñada para ser versátil y fácil de personalizar, ofreciendo un ajuste fino para aplicaciones o industrias específicas. Esta flexibilidad, combinada con sus potentes capacidades, hace de Qwen un gran recurso para la tecnología de IA en distintos campos.

Características principales de Qwen

La familia de modelos de Qwen proporciona una herramienta potente y versátil para diversas aplicaciones de IA. Exploremos las características clave que distinguen a Qwen:

Soporte multilingüe

Qwen destaca en la comprensión y generación multilingües, con sólidas capacidades tanto en inglés como en chino, así como compatibilidad con otros muchos idiomas. Los últimos modelos Qwen2 han ampliado su repertorio lingüístico para incluir 27 lenguas más, que abarcan regiones como Europa Occidental, Europa Central y Oriental, Oriente Medio, Asia Oriental y Asia Meridional.

Esta amplia compatibilidad lingüística permite a Qwen facilitar la comunicación intercultural, realizar traducciones de alta calidad, manejar escenarios de cambio de código y servir a aplicaciones globales con generación de contenidos localizados.

Generación de texto

Los modelos Qwen son muy competentes en diversas tareas de generación de texto. Algunas aplicaciones clave son:

Redacción de artículos: Generar contenidos de formato largo coherentes y contextualmente relevantes
Resumiendo: Condensar textos extensos en resúmenes concisos
Composición poética: Crear versos prestando atención al ritmo y al estilo
Generación de código: Escribir código funcional en múltiples lenguajes de programación

La capacidad de los modelos para mantener el contexto en secuencias largas (hasta 32.768 tokens) permite generar salidas de texto extensas y coherentes.

Respuesta a la pregunta

Qwen también es muy bueno respondiendo a preguntas tanto objetivas como abiertas. Esta función permite:

Recuperación de información: Extraer rápidamente hechos relevantes de una gran base de conocimientos
Razonamiento analítico: Proporcionar respuestas meditadas a preguntas complejas y abiertas
Respuestas específicas de la tarea: Adaptar las respuestas a diversos ámbitos, desde conocimientos generales a campos especializados

Comprensión de la imagen

Con el modelo Qwen-VL, la familia Qwen amplía sus capacidades a tareas multimodales con imágenes. Las características principales son:

Pie de foto: Generar texto descriptivo para contenidos visuales
Respuesta visual a preguntas: Responder a consultas sobre el contenido de las imágenes
Comprensión del documento: Extraer información de imágenes que contienen texto y gráficos
Procesamiento multiimagen: Manejar conversaciones con varias imágenes
Soporte para imágenes de alta resolución: Procesamiento de imágenes de hasta 448x448 píxeles (e incluso resoluciones superiores con Qwen-VL-Plus y Qwen-VL-Max)

Código abierto

Una de las características más significativas de Qwen es su naturaleza de código abierto, que aporta varios beneficios a la comunidad de IA:

Accesibilidad: Accede y utiliza libremente los modelos
Transparencia: La arquitectura del modelo y el proceso de formación están abiertos al escrutinio y la mejora
Personalización: Los usuarios pueden ajustar los modelos para aplicaciones o ámbitos específicos
Desarrollo impulsado por la comunidad: Fomenta la colaboración y el rápido avance de las tecnologías de IA
Consideraciones éticas: Permite debates más amplios y la aplicación de prácticas de IA responsables

El enfoque de código abierto ha dado lugar a un amplio apoyo de proyectos y herramientas de terceros:

Qwen: Acceso e instalación

Ahora que ya conoces Qwen y sus principales características, ¡es hora de aprender a utilizarlo en la práctica!

Acceder a los modelos Qwen

Los modelos Qwen están disponibles en varias plataformas, lo que los hace muy accesibles para diversos casos de uso.

Pasos de la instalación y cómo empezar

En esta sección, te guiaré a través del proceso de utilización del modelo lingüístico Qwen-7B mediante Cara de abrazo. Cubriremos la configuración de tu entorno, el inicio de sesión en Hugging Face y la ejecución del modelo.

Requisitos previos

Python 3.7 o posterior
pip (instalador de paquetes Python)

Paso 1: Instala las bibliotecas necesarias

Primero, instala las bibliotecas necesarias:

pip install transformers torch huggingface_hub

Paso 2: Iniciar sesión en Cara de abrazo

Para acceder al modelo Qwen-7B, tienes que iniciar sesión en tu cuenta de Hugging Face. Esto es necesario porque algunos modelos pueden tener restricciones de uso, pero aún así puedes acceder a modelos privados que te pertenezcan a ti o a tu organización. Esto ayuda a controlar el uso de la API e implantar límites de velocidad si es necesario.

Para conectarte, sigue estos pasos:

1. Ir a Cara de abrazo.

2. Ve a la configuración de tu perfil y crea un token de acceso.

3. En tu terminal, ejecuta

huggingface-cli login

4. Cuando se te solicite, introduce tu código de acceso.

Paso 3: Crear un script Python e importar paquetes

Ahora, crearemos un archivo Python o un archivo Jupyter Notebook donde empezaremos a escribir nuestro código.

En primer lugar, importaremos dos clases de la biblioteca transformers:

AutoModelForCausalLM: Esta clase selecciona automáticamente la arquitectura de modelo adecuada en función del nombre de modelo que le proporciones.
AutoTokenizer: Esta clase carga el tokenizador correcto para el modelo que estás utilizando.

from transformers import AutoModelForCausalLM, AutoTokenizer

Paso 4: Especifica el nombre del modelo

Ahora, especificamos qué modelo queremos utilizar. "Qwen/Qwen-7B" se refiere a la versión de 7.000 millones de parámetros del modelo Qwen alojado en el centro de modelos de Cara Abrazada, pero siéntete libre de utilizar otros modelos Qwen.

model_name = "Qwen/Qwen-7B"

Paso 5: Carga el tokenizador

A continuación, tenemos que cargar el tokenizador.

tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)

Esta línea carga el tokenizador asociado al modelo Qwen-7B. El parámetro trust_remote_code=True es necesario porque los modelos Qwen pueden requerir la ejecución de código personalizado durante la carga.

Paso 6: Carga el modelo

El siguiente paso es cargar el modelo.

model = AutoModelForCausalLM.from_pretrained(model_name, trust_remote_code=True)

Esto carga el modelo Qwen-7B real. De nuevo, utilizamos trust_remote_code=True para permitir que se ejecute cualquier código personalizado asociado al modelo.

Paso 7: Ejemplo de prueba

Una vez cargado el modelo, podemos probar si funciona generando un texto a partir de una entrada.

input_text = "Once upon a time"
inputs = tokenizer(input_text, return_tensors="pt")

Aquí estamos preparando la entrada para el modelo:

Definimos una cadena input_text como nuestro prompt.
Utilizamos el tokenizador para convertir este texto en un formato que el modelo pueda entender. El argumento return_tensors="pt" especifica que queremos la salida en formato tensor PyTorch.

Ahora, generamos el texto:

outputs = model.generate(**inputs, max_new_tokens=50)
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

La primera línea de código indica al modelo que genere texto:

Pasamos nuestro inputs tokenizado al método generate.
**inputs desempaqueta el diccionario devuelto por el tokenizador.
max_new_tokens=50 limita la generación a un máximo de 50 fichas nuevas.

generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)

Este paso convierte la salida del modelo (que está en formato ID de token) de nuevo en texto legible:

outputs selecciona la primera y única (en este caso) secuencia generada.
skip_special_tokens=True indica al descodificador que ignore los tokens especiales, como el relleno o los tokens de final de secuencia.

Por último, imprimimos el texto generado para ver el resultado.

print(generated_text)

Once upon a time, in a far-off kingdom, there lived a young princess named Lily. 
She was known throughout the land for her kindness and beauty. Despite living in a grand castle with everything she could ever want, Lily felt something was missing in her life. She longed for adventure and to see the world beyond the castle walls.
One day, while walking in the royal gardens, she stumbled upon a hidden door overgrown with vines. Curiosity got the better of her, and she decided to see where it led. As she pushed open the creaky door, she found herself stepping into a magical forest filled with talking animals and glowing flowers.
Little did Lily know that this discovery would be the beginning of an extraordinary journey that would change her life forever…

Notas y consejos

Aquí tienes algunas notas y consejos útiles:

El modelo Qwen-7B es grande (7.000 millones de parámetros). Asegúrate de que tu sistema tiene suficiente RAM y, preferiblemente, una GPU para un procesamiento más rápido.
Si tienes problemas de memoria, considera la posibilidad de utilizar un modelo más pequeño.
El parámetro trust_remote_code=True es necesario para los modelos Qwen, ya que requieren código personalizado para ejecutarse correctamente.
Revisa siempre la licencia del modelo y las restricciones de uso en su página Cara de Abrazo.
¡Has configurado y ejecutado correctamente el modelo Qwen! Siéntete libre de experimentar con diferentes textos de entrada y explorar las capacidades del modelo.

Qwen: Despliegue

Los modelos Qwen pueden desplegarse utilizando la Plataforma para la IA (PAI) de Alibaba Cloud y Elastic AI Serving (EAS). Veamos cómo puedes desplegar un modelo Qwen con sólo unos clics:

Qwen: Ejemplo de uso

Exploremos algunos ejemplos prácticos de uso de Qwen para tareas de generación de texto y respuesta a preguntas.

Generación de texto

Qwen es realmente bueno generando textos coherentes y contextualmente relevantes a partir de indicaciones dadas. Veamos algunos ejemplos:

Completar texto básico

prompt = "The future of artificial intelligence is"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(inputs, max_new_tokens=50)
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(generated_text)

The future of artificial intelligence is bright and full of potential. As technology continues to advance, AI will play an increasingly important role in various aspects of our lives. From healthcare and education to transportation and entertainment, AI will revolutionize the way we live and work. However, it's crucial to ensure that AI is developed and used responsibly, with proper ethical considerations and safeguards in place.

Escritura creativa

prompt = "Write a short poem about the changing seasons:"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(inputs, max_new_tokens=100, temperature=0.7)
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(generated_text)

Leaves of gold and crimson fall,
As autumn's whisper fills the air.
Winter's chill soon follows all,
Blanketing the earth with care.
Spring awakens with gentle rain,
Coaxing buds to bloom anew.
Summer's warmth returns again,
Painting skies in vibrant blue.
Nature's cycle, ever turning,
Each season brings its own delight.
In this dance, we're always learning,
Of life's beauty, day and night.

Generación de código

prompt = "Write a Python function to calculate the Fibonacci sequence:"
inputs = tokenizer(prompt, return_tensors="pt")
outputs = model.generate(inputs, max_new_tokens=200, temperature=0.2)
generated_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(generated_text)

def fibonacci(n):
    """
    Calculate the Fibonacci sequence up to the nth term.
    
    Args:
    n (int): The number of terms in the sequence to calculate.
    
    Returns:
    list: A list containing the Fibonacci sequence up to the nth term.
    """
    if n <= 0:
        return []
    elif n == 1:
        return [0]
    elif n == 2:
        return [0, 1]
    
    fib_sequence = [0, 1]
    for i in range(2, n):
        fib_sequence.append(fib_sequence[i-1] + fib_sequence[i-2])
    
    return fib_sequence
# Example usage:
print(fibonacci(10))

[0, 1, 1, 2, 3, 5, 8, 13, 21, 34]

Respuesta a la pregunta

Qwen puede utilizarse para responder a una amplia gama de preguntas, desde preguntas sobre hechos hasta preguntas más abiertas o analíticas. He aquí algunos ejemplos:

Cuestión de hecho

question = "What is the capital of France?"
inputs = tokenizer(question, return_tensors="pt")
outputs = model.generate(inputs, max_new_tokens=50)
answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(f"Q: {question}\nA: {answer}")

Q: What is the capital of France?
A: The capital of France is Paris. Paris is the largest city in France and serves as the country's political, economic, and cultural center. It is known for its iconic landmarks such as the Eiffel Tower, the Louvre Museum, and Notre-Dame Cathedral.

Pregunta abierta

question = "What are the potential ethical concerns surrounding artificial intelligence?"
inputs = tokenizer(question, return_tensors="pt")
outputs = model.generate(inputs, max_new_tokens=200, temperature=0.7)
answer = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(f"Q: {question}\nA: {answer}")

Q: What are the potential ethical concerns surrounding artificial intelligence?
A: There are several potential ethical concerns surrounding artificial intelligence (AI):
1. Privacy and data protection: AI systems often require large amounts of data, raising concerns about personal information collection and use.
2. Bias and discrimination: AI algorithms can perpetuate or amplify existing biases in training data, leading to unfair treatment of certain groups.
3. Job displacement: As AI becomes more advanced, it may replace human workers in various industries, potentially leading to unemployment and economic inequality.
4. Accountability and transparency: It can be challenging to understand how AI systems make decisions, making it difficult to assign responsibility for errors or harmful outcomes.
5. Autonomous weapons: The development of AI-powered weapons raises concerns about the ethics of warfare and the potential for uncontrolled escalation.
6. Superintelligence: There are concerns about the potential development of AI systems that surpass human intelligence, potentially posing existential risks to humanity.
7. Human autonomy: As AI systems become more integrated into our lives, there are concerns about the erosion of human decision-making and free will.
8. Security risks: AI systems can be vulnerable to hacking or manipulation, potentially leading to severe consequences in critical applications.
9. Social manipulation: AI-powered systems could be used to influence human behavior on a large scale, raising concerns about democracy and free will.
10. Ethical decision-making: As AI systems are tasked with making complex decisions, there are concerns about their ability to navigate ethical dilemmas appropriately.
Addressing these concerns requires ongoing dialogue between technologists, ethicists, policymakers, and the public to ensure responsible development and deployment of AI technologies.

Estos ejemplos demuestran cómo Qwen puede manejar varios tipos de tareas de generación de texto y de respuesta a preguntas.

Puedes ajustar parámetros como max_new_tokens y temperature para controlar la longitud y la creatividad de las respuestas generadas y adaptarlas a tus necesidades específicas.

Ajuste de los modelos Qwen

Ajuste fino Los modelos Qwen te permiten adaptarlos a tareas específicas, mejorando potencialmente su rendimiento para tu caso de uso particular. Este proceso implica entrenar el modelo preentrenado en un conjunto de datos personalizado, lo que le permite aprender conocimientos específicos de la tarea al tiempo que conserva sus capacidades generales de comprensión lingüística.

En esta sección, recorreremos el proceso de ajuste del modelo Qwen-7B en un conjunto de datos personalizado. Utilizaremos técnicas eficaces de ajuste fino para que este proceso sea manejable, incluso para modelos grandes. En nuestro ejemplo, estamos afinando el modelo para mejorar su rendimiento en tareas de traducción y en la respuesta a preguntas objetivas. Este proceso permite que el modelo aprenda de un conjunto de datos personalizado, al tiempo que conserva sus capacidades generales de comprensión lingüística.

Requisitos previos

Antes de empezar, asegúrate de que tienes instalado lo siguiente:

pip install datasets torch accelerate peft

Paso 1: Prepara tu conjunto de datos

Primero, prepara tu conjunto de datos en formato JSON. Cada entrada debe tener un campo de "indicación" y otro de "finalización". Guárdalo como custom_dataset.json. Utilizaremos este ejemplo:

[
  {
    "prompt": "Translate to French: 'Hello, how are you?'",
    "completion": "Bonjour, comment allez-vous?"
  },
  {
    "prompt": "What is the capital of Spain?",
    "completion": "The capital of Spain is Madrid."
  }
]

Paso 2: Configura el script de ajuste

Ahora añadimos las siguientes importaciones:

import torch
from transformers import TrainingArguments, Trainer
from datasets import load_dataset
from peft import LoraConfig, get_peft_model

Paso 3: Prepara el conjunto de datos

A continuación, definiremos una función para preprocesar nuestro conjunto de datos y cargarlo utilizando la biblioteca de conjuntos de datos Cara Abrazada:

def preprocess_function(examples):
    inputs = [f"{prompt}\n" for prompt in examples["prompt"]]
    targets = [f"{completion}\n" for completion in examples["completion"]]
    model_inputs = tokenizer(inputs, max_length=512, truncation=True, padding="max_length")
    labels = tokenizer(targets, max_length=512, truncation=True, padding="max_length")
    model_inputs["labels"] = labels["input_ids"]
    return model_inputs
dataset = load_dataset("json", data_files="custom_dataset.json")
tokenized_dataset = dataset["train"].train_test_split(test_size=0.1)
tokenized_dataset = tokenized_dataset.map(preprocess_function, batched=True, remove_columns=dataset["train"].column_names)

Paso 4: Configura LoRA para un ajuste fino eficaz

Para que el ajuste sea más eficaz, utilizaremos LoRA (Adaptación de bajo rango). Esta técnica nos permite afinar grandes modelos con menos parámetros:

lora_config = LoraConfig(
    r=8,
    lora_alpha=32,
    target_modules=["q_proj", "v_proj"],
    lora_dropout=0.05,
    bias="none",
    task_type="CAUSAL_LM"
)
model = get_peft_model(model, lora_config)

Paso 5: Definir argumentos de entrenamiento

Ahora, configuraremos los argumentos de entrenamiento que controlan diversos aspectos del proceso de ajuste:

training_args = TrainingArguments(
    output_dir="./results",
    num_train_epochs=3,
    per_device_train_batch_size=4,
    per_device_eval_batch_size=4,
    warmup_steps=500,
    weight_decay=0.01,
    logging_dir="./logs",
    logging_steps=10,
    evaluation_strategy="steps",
    eval_steps=500,
    save_strategy="steps",
    save_steps=1000,
    learning_rate=1e-4,
    fp16=True,
    gradient_checkpointing=True,
    gradient_accumulation_steps=4,
)

Paso 6: Crea un Entrenador y empieza a afinar

Con nuestro conjunto de datos y argumentos de entrenamiento preparados, ya podemos crear un objeto Entrenador e iniciar el proceso de ajuste:

trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=tokenized_dataset["train"],
    eval_dataset=tokenized_dataset["test"],
    tokenizer=tokenizer,
)
trainer.train()

Paso 8: Guarda el modelo afinado

Una vez finalizado el ajuste, guardaremos nuestro modelo para poder utilizarlo más adelante:

trainer.save_model("./fine_tuned_qwen")

El ajuste fino del modelo Qwen-7B en tu conjunto de datos personalizado mejorará su rendimiento en tareas similares a las de tus datos de entrenamiento. En este caso, el modelo debería mejorar en la traducción del inglés al francés y en la respuesta a preguntas objetivas sobre las capitales.

Utilizando el modelo afinado

Tras el ajuste, puedes utilizar el modelo para hacer inferencias:

fine_tuned_model = AutoModelForCausalLM.from_pretrained("./fine_tuned_qwen", trust_remote_code=True)
fine_tuned_tokenizer = AutoTokenizer.from_pretrained("./fine_tuned_qwen", trust_remote_code=True)
def generate_response(prompt):
    inputs = fine_tuned_tokenizer(prompt, return_tensors="pt").to(fine_tuned_model.device)
    outputs = fine_tuned_model.generate(**inputs, max_new_tokens=50)
    return fine_tuned_tokenizer.decode(outputs[0], skip_special_tokens=True)
# Example usage
prompt = "Translate to French: 'Good morning, have a nice day!'"
response = generate_response(prompt)
print(f"Prompt: {prompt}\n Response: {response}")

Prompt: Translate to French: 'Good morning, have a nice day!'
Response: Bonjour, passez une bonne journée !

Consejos para una puesta a punto eficaz

Aquí tienes algunos consejos a tener en cuenta para un ajuste eficaz:

Asegúrate de que tu conjunto de datos personalizado es de alta calidad y representativo de tu tarea objetivo.
Aunque los conjuntos de datos más grandes suelen dar mejores resultados, incluso unos cientos de ejemplos pueden beneficiar a tareas específicas.
Experimenta con distintos ritmos de aprendizaje, tamaños de lote y número de épocas para optimizar el rendimiento.
Evalúa periódicamente tu modelo en un conjunto de validación retenido para evitar el sobreajuste.
Si trabajas con una memoria de GPU limitada, considera la posibilidad de utilizar la acumulación de gradiente para simular lotes de mayor tamaño.
Utiliza el entrenamiento de precisión mixta para acelerar el proceso de ajuste y reducir el uso de memoria.
Para tareas específicas del dominio, considera la posibilidad de continuar el preentrenamiento en datos específicos del dominio antes de realizar el ajuste fino en tu conjunto de datos específico de la tarea.

El ajuste fino de Qwen en tu conjunto de datos personalizado te permite crear un modelo especializado que destaque en tu tarea específica, conservando al mismo tiempo los amplios conocimientos y capacidades del modelo original preentrenado. Este enfoque utiliza la potencia de los grandes modelos lingüísticos para tus aplicaciones y dominios únicos.

Qwen: Perspectivas de futuro

A medida que Qwen siga evolucionando, podemos anticipar varios desarrollos emocionantes:

Es probable que las futuras iteraciones de los modelos Qwen ofrezcan capacidades aún más avanzadas de comprensión, generación y procesamiento multimodal del lenguaje.
La investigación en curso puede conducir a modelos más eficientes que ofrezcan un alto rendimiento con menores requisitos computacionales.
A medida que la comunidad de IA siga explorando y experimentando con Qwen, es probable que veamos aplicaciones novedosas en diversos sectores y ámbitos.
Avances éticos de la IA: La naturaleza abierta de Qwen permite un escrutinio y una colaboración más amplios sobre las prácticas éticas de la IA, lo que podría conducir a sistemas de IA más responsables y justos.

Conclusión

Al concluir nuestra exploración de Qwen, está claro que estas herramientas de IA representan un importante salto adelante en la IA accesible, potente y versátil. Qwen es algo más que un conjunto de potentes modelos de IA: representa la visión de hacer que la IA avanzada sea accesible y adaptable para todos. Al proporcionar estas herramientas como recursos de código abierto, Alibaba Cloud está impulsando la innovación y el avance de la tecnología de IA.

Si quieres estar al día de lo último en IA, te recomiendo estos artículos:

¿Cuáles son los diferentes tamaños de los modelos Qwen disponibles?

¿Pueden los modelos Qwen manejar longitudes de contexto largas?

¿En qué se diferencia el tokenizador de Qwen de los utilizados en otros modelos lingüísticos?

¿Cuáles son las condiciones de licencia para utilizar los modelos Qwen en aplicaciones comerciales?

¿Qué es Qwen-Agente y cómo se puede utilizar?

Temas

Inteligencia Artificial

Aprende IA con estos cursos

Programa

Desarrollo de aplicaciones de IA

0 min

Aprende a crear aplicaciones potenciadas por IA con las últimas herramientas para desarrolladores de IA, como la API OpenAI, Hugging Face y LangChain.

Ver detalles

Comienza el curso

Curso

Desarrollo de aplicaciones LLM con LangChain

3 h

34.8K

Descubre cómo construir aplicaciones potenciadas por IA utilizando LLMs, prompts, cadenas y agentes en LangChain.

Ver detalles

Comienza el curso

Curso

Trabajar con Hugging Face

2 h

21.7K

Navega y utiliza el amplio repositorio de modelos y conjuntos de datos disponibles en el Hugging Face Hub.

Ver detalles

Comienza el curso

Relacionado

blog

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

Aprende a utilizar modelos de IA generativa para crear un editor de imágenes, un chatbot similar a ChatGPT con pocos recursos y una aplicación clasificadora de aprobación de préstamos y a automatizar interacciones PDF y un asistente de voz con GPT.

Abid Ali Awan

10 min

blog

10 maneras de utilizar ChatGPT para las finanzas

Descubre cómo los modelos lingüísticos de IA como ChatGPT pueden revolucionar tus operaciones financieras, desde la generación de informes hasta la traducción de jerga financiera.

Matt Crabtree

13 min

Tutorial

Guía introductoria para el ajuste preciso de los LLM

El ajuste preciso de los grandes modelos lingüísticos (LLM) ha revolucionado el procesamiento del lenguaje natural (PLN) y ofrece capacidades sin precedentes en tareas como la traducción lingüística, el análisis del sentimiento y la generación de textos. Este enfoque transformador aprovecha modelos preentrenados como el GPT-2 y mejora su rendimiento en dominios específicos mediante el proceso de ajuste preciso.

Josep Ferrer

Tutorial

Tutorial FLAN-T5: Guía y puesta a punto

Una guía completa para afinar un modelo FLAN-T5 para una tarea de respuesta a preguntas utilizando la biblioteca de transformadores, y ejecutando la inferencia optmizada en un escenario del mundo real.

Zoumana Keita

Tutorial

Convertir voz en texto con la API Whisper de OpenAI

Descubra las potentes funciones de la API Python de OpenAI Whisper para transcripción y traducción. Dispone de soporte multilingüe y mejora rápida para una transcripción precisa.

Abid Ali Awan

Tutorial

Tutorial sobre cómo crear aplicaciones LLM con LangChain

Explore el potencial sin explotar de los grandes modelos lingüísticos con LangChain, un marco Python de código abierto para crear aplicaciones avanzadas de IA.

Moez Ali

Ver más Ver más

¿Qué es Qwen?

Familia de modelos

Características principales de Qwen

Soporte multilingüe

Generación de texto

Respuesta a la pregunta

Comprensión de la imagen

Código abierto

Qwen: Acceso e instalación

Acceder a los modelos Qwen

Pasos de la instalación y cómo empezar

Requisitos previos

Paso 1: Instala las bibliotecas necesarias

Paso 2: Iniciar sesión en Cara de abrazo

Paso 3: Crear un script Python e importar paquetes

Paso 4: Especifica el nombre del modelo

Paso 5: Carga el tokenizador

Paso 6: Carga el modelo

Paso 7: Ejemplo de prueba

Notas y consejos

Qwen: Despliegue

Qwen: Ejemplo de uso

Generación de texto

Completar texto básico

Escritura creativa

Generación de código

Respuesta a la pregunta

Cuestión de hecho

Pregunta abierta

Ajuste de los modelos Qwen

Requisitos previos

Paso 1: Prepara tu conjunto de datos

Paso 2: Configura el script de ajuste

Paso 3: Prepara el conjunto de datos

Paso 4: Configura LoRA para un ajuste fino eficaz

Paso 5: Definir argumentos de entrenamiento

Paso 6: Crea un Entrenador y empieza a afinar

Paso 8: Guarda el modelo afinado

Utilizando el modelo afinado

Consejos para una puesta a punto eficaz

Qwen: Perspectivas de futuro

Conclusión

Preguntas frecuentes

¿En qué se diferencia el tokenizador de Qwen de los utilizados en otros modelos lingüísticos?

¿Cuáles son las condiciones de licencia para utilizar los modelos Qwen en aplicaciones comerciales?

¿Qué es Qwen-Agente y cómo se puede utilizar?

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

10 maneras de utilizar ChatGPT para las finanzas

Guía introductoria para el ajuste preciso de los LLM

Tutorial FLAN-T5: Guía y puesta a punto

Convertir voz en texto con la API Whisper de OpenAI

Tutorial sobre cómo crear aplicaciones LLM con LangChain

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Desarrollo de aplicaciones de IA

Desarrollo de aplicaciones LLM con LangChain

Trabajar con Hugging Face

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

10 maneras de utilizar ChatGPT para las finanzas

Guía introductoria para el ajuste preciso de los LLM

Tutorial FLAN-T5: Guía y puesta a punto

Convertir voz en texto con la API Whisper de OpenAI

Tutorial sobre cómo crear aplicaciones LLM con LangChain

Desarrollo de aplicaciones de IA