XBai o4: Guía con proyecto de demostración

Aprende a crear una demostración interactiva de razonamiento utilizando el modelo XBai o4 de MetaStone, que abarca su razonamiento generativo reflexivo.

Actualizado 13 ago 2025 · 12 min de lectura

MetaStone AI ha lanzado recientemente XBai-o4, un modelo de razonamiento de código abierto que introduce el escalado paralelo en tiempo de prueba y una arquitectura generativa reflexiva. Con 32 800 millones de parámetros y un cabezal de autoevaluación integrado, XBai o4 supera al o3-mini (modo medio) de OpenAI en las pruebas básicas de razonamiento matemático cuando se ejecuta localmente.

En este blog me centraré en las capacidades únicas de razonamiento reflexivo de XBai o4, demostrando cómo genera y evalúa múltiples trayectorias de solución para problemas matemáticos a través de una interfaz Streamlit implementada localmente y alimentada por LM Studio.

En este tutorial, explicaré paso a paso cómo:

Implementa XBai-o4 localmente con LM Studio y cuantificación GGUF para obtener un rendimiento óptimo.
Crea una aplicación Streamlit para visualizar en tiempo real el razonamiento rama por rama.
Experimenta con el escalado en tiempo de prueba, el control dinámico de la temperatura y la puntuación del modelo de recompensas.
Analiza y compara cómo las diferentes estrategias de razonamiento y los distintos entornos afectan a la calidad y la eficiencia de las soluciones.

Al final, tu aplicación tendrá este aspecto:

¿Qué es XBai-o4?

XBai-o4 es el modelo de razonamiento de código abierto de cuarta generación de MetaStone AI, que introduce una arquitectura generativa reflexiva que intenta redefinir la forma en que la IA aborda la resolución de problemas complejos. A diferencia de los LLM tradicionales, que tratan la generación y la evaluación de respuestas como dos procesos distintos, XBai o4 fusiona ambos en un modelo unificado mediante un modelo de recompensa de procesos compartidos (SPRM). Este diseño permite al modelo generar, puntuar y seleccionar múltiples rutas de razonamiento en paralelo.

Fuente: Jefe de SPRM

En esencia, XBai o4 combina el aprendizaje por refuerzo de cadena de pensamiento larga (Long-CoT) y el aprendizaje por recompensa de procesos ( ) en un único proceso de entrenamiento. Estas son algunas de las innovaciones clave introducidas en este modelo:

Arquitectura generativa reflexiva: El jefe de SPRM comparte la estructura principal del modelo, lo que permite tanto la generación como la autoevaluación en un solo paso altamente eficiente.
Escalado dinámico en tiempo de prueba: El modelo cambia instantáneamente entre los modos de razonamiento de 2, 8 o 32 ramificaciones, equilibrando la velocidad y la precisión para adaptarse a tu caso de uso.
Estilos de razonamiento unificados: Este modelo destaca en demostraciones directas, contradicciones, inducción, razonamiento algebraico y visual, al tiempo que aborda una amplia gama de problemas matemáticos y lógicos.
Liderazgo en el rendimiento: En el benchmark AIME24, XBai-o4 ofrece excelentes resultados. Incluso en su configuración más baja, XBai o4 iguala o supera a OpenAI o3-mini, mientras que utiliza una potencia de cálculo significativamente menor.

Fuente: Documentación de XBai-O4

Cómo configurar XBai o4 localmente con LM Studio

Puedes ejecutar XBai o4 localmente utilizando LM Studio, que utiliza automáticamente la aceleración de la GPU de tu sistema o Apple Silicon (Metal/MLX) cuando está disponible (no es necesaria ninguna configuración manual). Para obtener un rendimiento y una compatibilidad óptimos, te recomiendo utilizar la versión cuantificada GGUF del modelo.

¿Por qué utilizar la versión cuantificada de GGUF?

El estándar GGUF (formato unificado generado por GPT) permite una inferencia local muy eficiente al reducir la precisión de los pesos del modelo. En este proyecto, utilizaremos la variante cuantificada Q3_K_S, que es una opción muy popular por su excelente equilibrio entre calidad y uso de memoria.

Equilibrio óptimo: Con solo 14,39 GB, el formato Q3_K_S ofrece un gran rendimiento de razonamiento con una pérdida mínima de calidad en comparación con los modelos de precisión completa.
Amplia compatibilidad: GGUF es el estándar actual para ejecutar LLM cuantificados localmente, y funciona a la perfección en Mac, Windows y Linux.
Eficiente en el uso de los recursos: La cuantificación de 3 bits facilita la ejecución de modelos grandes en una configuración típica de 32 GB de RAM.
Estable y rápido: Este modelo ofrece resultados fiables y velocidades de inferencia constantes, incluso con cargas de trabajo paralelas y multitrayectoria.

Veamos paso a paso el proceso de configuración del modelo GGUF cuantificado para una inferencia local eficiente con LM Studio.

Paso 1: Instalar LM Studio

LM Studio ofrece compatibilidad con GGUF y selecciona automáticamente el backend de inferencia óptimo para tu hardware, ya sea Metal, GPU o CPU.

Si aún no has instalado LM Studio, solo tienes que descargarlo desde lmstudio.ai y seguir las instrucciones de instalación.

Paso 2: Descargar el modelo XBai-o4 GGUF

En LM Studio:

Ve a la pestaña Buscar.
Buscar mradermacher/XBai-o4-GGUF
Descarga la variante XBai-o4.Q3_K_S.gguf (14,39 GB).

Paso 3: Cargar y configurar el modelo

Una vez instalado LM Studio, cargamos y configuramos el modelo XBai o4 para la inferencia local:

Abre LM Studio y ve a la pestaña Servidor local (barra superior de tu Mac).
Selecciona y carga el modelo « XBai-o4.Q3_K_S.gguf » de la lista de modelos descargados.
Establece las siguientes opciones de configuración:

Longitud del contexto: 8192
Temperatura: 0,7 (esto se ajustará dinámicamente en nuestra demostración)
Máximo de tokens: 1024
Capas de GPU: Detección automática (LM Studio lo optimizará automáticamente en función de las capacidades de tu hardware)

Inicia el servidor local, que por defecto se ejecuta en http://localhost:1234.

Una vez en funcionamiento, tu sistema estará listo para el razonamiento multitrayectoria con XBai o4.

Demostración: Razonamiento reflexivo interactivo XBai-o4

Ahora crearemos una aplicación Streamlit que muestra las capacidades de razonamiento reflexivo de XBai o4 con una comparación de rendimiento en tiempo real.

Paso 1: Instalar dependencias

Comienza instalando las dependencias:

pip install streamlit plotly pandas numpy requests

Este comando garantiza que tengas todas las dependencias básicas para la interfaz de usuario, el manejo de datos, el gráfico y las solicitudes de API.

Paso 2: Importa las bibliotecas y configura la página.

A continuación, importa todas las bibliotecas necesarias y configura el diseño de la página de Streamlit y los ajustes básicos.

import streamlit as st
import time
import requests
import numpy as np
import pandas as pd
import plotly.express as px
from typing import List, Dict, Any
LM_STUDIO_URL = "http://localhost:1234/v1"   # change as per your server
REASONING_MODES = {"Low (k=2)": 2, "Medium (k=8)": 8, "High (k=32)": 8}  
st.set_page_config(page_title="MetaStone-XBai-o4 Reflective Reasoning Demo", layout="wide")
st.markdown("""
<style>
    .main-header {
        background: linear-gradient(90deg, #1e3c72 0%, #2a5298 100%);
        
        border-radius: 10px;
        color: white;
        text-align: center;
        
    }
</style>
""", unsafe_allow_html=True)

Este bloque de código importa todas las bibliotecas principales necesarias para nuestra demostración, incluyendo Streamlit para la interfaz de usuario web, así como otras bibliotecas básicas como time, requests, numpy, pandas, plotly.express y herramientas de tipado.

A continuación, establece el punto final de la API del modelo LM_STUDIO_URL para que la aplicación sepa dónde enviar las solicitudes, y define los modos de razonamiento (REASONING_MODES) para que los usuarios puedan seleccionar fácilmente cuántas ramas de solución generar.

Por último, utilizamos st.set_page_config() para configurar la interfaz de usuario de Streamlit con un título personalizado, un diseño amplio y un encabezado con degradado en estilo CSS.

Nota: LM_STUDIO_URL es la URL base del servidor LLM, que puedes copiar desde LM Studio. Normalmente es «http://localhost:1234/v1&quot», pero puede variar. Además, elige los modos de razonamiento según la capacidad de tu servidor.

Paso 3: Funciones auxiliares

Ahora, creemos un conjunto de funciones auxiliares que impulsen la lógica central de «razonamiento reflexivo» de nuestra aplicación. Estas funciones facilitan el trabajo con múltiples trayectorias, la selección de la mejor solución y la puntuación de cada respuesta.

Paso 3.1: Comprobación de la compatibilidad del modelo con el muestreo multitrayectoria

Este paso introduce una función auxiliar sencilla que comprueba automáticamente si nuestro servidor LM Studio puede gestionar el muestreo multitrayectoria. Algunos servidores admiten la solicitud de completado asíncrono ( n parameter), lo que nos permite solicitar varias completaciones independientes en una sola llamada a la API, lo que acelera considerablemente el proceso.

def supports_n_param():
    payload = {
        "messages": [{"role": "user", "content": "What is 1+1?"}],
        "max_tokens": 80,
        "temperature": 0.1,
        "n": 2,
        "stream": False
    }
    try:
        resp = requests.post(f"{LM_STUDIO_URL}/chat/completions", json=payload, timeout=120)
        if resp.status_code == 200 and len(resp.json().get("choices", [])) == 2:
            return True
    except Exception:
        pass
    return False

Esta función comprueba si tu servidor LM Studio admite la generación de múltiples respuestas («trayectorias») en una sola llamada API utilizando el parámetro n. Envía una solicitud de prueba rápida y devuelve True si la función está disponible, lo que permite un muestreo «Best-of-N» real para un razonamiento más rápido y escalable.

Paso 3.2: Generación de trayectorias

Una vez que hayamos determinado si nuestro backend admite el muestreo multitrayectoria, el siguiente paso es generar múltiples rutas de razonamiento para un problema determinado. Esta sección presenta un conjunto de funciones auxiliares que utilizan el multimuestreo del lado del servidor (cuando está disponible) o paralelizan de manera eficiente las finalizaciones individuales, lo que garantiza que la aplicación siga siendo rápida y escalable.

def lm_studio_generate_multiple(problem, k, temperature=0.8, seed=2025):
    prompt = f"<think> {problem}\n</think>"
    payload = {
        "messages": [{"role": "user", "content": prompt}],
        "max_tokens": 196,
        "temperature": temperature,
        "top_p": 0.9,
        "top_k": 30,
        "n": k,
        "stream": False,
        "seed": seed
    }
    start = time.time()
    resp = requests.post(f"{LM_STUDIO_URL}/chat/completions", json=payload, timeout=120)
    latency = time.time() - start
    if resp.status_code == 200:
        result = resp.json()
        return [{
            "content": choice["message"]["content"].strip(),
            "latency": latency / k,  
            "success": True,
        } for choice in result.get("choices", [])]
    else:
        raise RuntimeError(f"LM Studio error: {resp.status_code}: {resp.text}")
def lm_studio_generate_single(problem, temperature, seed=None):
    prompt = f"<think> {problem}\n</think>"
    payload = {
        "messages": [{"role": "user", "content": prompt}],
        "max_tokens": 196,
        "temperature": temperature,
        "top_p": 0.9,
        "top_k": 30,
        "stream": False,
        "seed": seed
    }
    start = time.time()
    resp = requests.post(f"{LM_STUDIO_URL}/chat/completions", json=payload, timeout=120)
    latency = time.time() - start
    if resp.status_code == 200:
        content = resp.json()["choices"][0]["message"]["content"].strip()
        return {"content": content, "latency": latency, "success": True}
    else:
        return {"success": False, "error": f"HTTP {resp.status_code}: {resp.text}", "latency": latency}
def parallel_candidate_generation(problem, k, progress_cb=None):
    import concurrent.futures
    temperatures = np.linspace(0.1, 1.0, k)
    results = []
    with concurrent.futures.ThreadPoolExecutor(max_workers=min(8, k)) as executor:
        futures = []
        for i in range(k):
            seed = 2025 + i * 31
            futures.append(executor.submit(lm_studio_generate_single, problem, temperatures[i], seed))
        for i, future in enumerate(concurrent.futures.as_completed(futures)):
            res = future.result()
            res["trajectory_id"] = i + 1
            results.append(res)
            if progress_cb:
                progress_cb(i + 1, k)
    results.sort(key=lambda x: x.get("trajectory_id", 0))
    return results

A continuación se explica cómo encaja cada función en el proceso de múltiples trayectorias:

lm_studio_generate_multiple() función: Cuando el servidor LM Studio admite el parámetro n, esta función envía una única solicitud API para generar k soluciones diversas a la vez. Este es el modo más eficiente, ya que permite una verdadera escalabilidad en tiempo de prueba.
lm_studio_generate_single() función: Si el servidor no admite el muestreo múltiple, esta función proporciona una alternativa que genera una trayectoria de solución por solicitud, lo que permite diferentes temperaturas y reproducibilidad mediante semillas.
parallel_candidate_generation() función: Para mantener el rendimiento en modo de reserva, esta utilidad activa varias llamadas a lm_studio_generate_single() en paralelo, cada una con diferentes temperaturas de muestreo, y luego agrega todas las respuestas. Esto garantiza que sigamos obteniendo una amplia gama de soluciones rápidamente, incluso si no se dispone de un muestreo múltiple real.

Paso 3.3: Mejor trayectoria

Después de generar múltiples vías de razonamiento, necesitamos una forma estructurada de identificar la solución más sólida. Este paso introduce herramientas de puntuación y selección que imitan las técnicas de modelado de recompensas (SPRM) utilizadas en el artículo MetaStone Reflective Reasoning.

def step_tokenize(trajectory: str) -> List[str]:
    steps = [step.strip() for step in trajectory.split('.\n\n') if step.strip()]
    return steps
def dummy_sprm_score(trajectory: str, problem: str) -> float:
    steps = step_tokenize(trajectory)
    n = len(steps)
    def step_score(step):
        s = 0.2
        if any(x in step.lower() for x in ["therefore", "thus", "so", "finally", "conclude"]): s += 0.15
        if any(sym in step for sym in ["=", "+", "-", "*", "/", "(", ")"]): s += 0.1
        if len(step.split()) > 10: s += 0.1
        return min(1.0, s)
    step_scores = [step_score(s) for s in steps] or [0.01]
    geometric_mean = np.exp(np.mean(np.log(np.maximum(step_scores, 1e-3))))
    return min(1.0, geometric_mean + 0.05 * np.log1p(n))
def best_of_n_selection(candidates: List[Dict]) -> int:
    best_idx = int(np.argmax([c["sprm_score"] for c in candidates]))
    return best_idx

Esto es lo que hace cada función:

step_tokenize() función: Esta función divide una trayectoria de razonamiento en pasos o segmentos lógicos, lo que permite realizar un análisis y una puntuación paso a paso.
dummy_sprm_score() función: Esta función asigna una puntuación de recompensa a cada trayectoria candidata y fomenta las respuestas que constan de varios pasos, están bien estructuradas y utilizan el razonamiento matemático. Actúa como sustituto del Modelo de Recompensa por Procesos Compartidos (SPRM) del periódico, que evalúa internamente sus soluciones.

Nota: Esta función de puntuación solo se aproxima al SPRM original descrito en el artículo original. El SPRM real es un modelo de recompensa aprendido, entrenado con grandes conjuntos de datos para proporcionar información detallada y paso a paso, y requiere recursos considerables y datos propios.

best_of_n_selection() function: Dado un lote de respuestas candidatas, esta función selecciona la mejor trayectoria única basándose en la puntuación SPRM más alta, al igual que el modelo reflexivo del artículo elige automáticamente la respuesta más sólida en el momento de la prueba.

Paso 4: Flujo principal de la aplicación Streamlit

En este paso, reunimos todas las piezas para crear una demostración interactiva de razonamiento con Streamlit.

st.markdown("""
<div class="main-header">
    <h1> MetaStone XBai-o4 Reflective Reasoning Demo</h1>
</div>
""", unsafe_allow_html=True)
st.sidebar.header("Reasoning Mode")
mode = st.sidebar.selectbox("Reasoning effort (k candidates):", list(REASONING_MODES.keys()))
k = REASONING_MODES[mode]
st.sidebar.header("Problem Input")
problem = st.sidebar.text_area("Enter your math/logic problem:", "Prove that the square root of 2 is irrational")
if st.sidebar.button("Run Reflective Reasoning"):
    st.session_state.run = True
    st.session_state.results = None
    st.session_state.best_idx = None
if "run" not in st.session_state:
    st.session_state.run = False
if st.session_state.run:
    st.info(f"Generating {k} reasoning trajectories in parallel...")
    progress = st.progress(0)
    def update_progress(done, total):
        progress.progress(done / total)
    try:
        if supports_n_param():
            results = lm_studio_generate_multiple(problem, k, temperature=0.7)
            for idx, res in enumerate(results):
                res["trajectory_id"] = idx + 1
        else:
            results = parallel_candidate_generation(problem, k, progress_cb=update_progress)
        for res in results:
            if res.get("success"):
                res["sprm_score"] = dummy_sprm_score(res["content"], problem)
            else:
                res["sprm_score"] = 0.0
        best_idx = best_of_n_selection(results)
        st.session_state.results = results
        st.session_state.best_idx = best_idx
        st.session_state.run = False
    except Exception as e:
        st.error(f"Failed to generate trajectories: {str(e)}")
        st.session_state.run = False
if st.session_state.get("results"):
    results = st.session_state.results
    best_idx = st.session_state.best_idx
    st.success(f"Selected trajectory #{best_idx+1} (highest SPRM score)")
    df = pd.DataFrame({
        "Trajectory": [f"T{i+1}" for i in range(len(results))],
        "SPRM Score": [r["sprm_score"] for r in results],
        "Latency (s)": [r.get("latency", 0.0) for r in results],
        "Success": [r.get("success", False) for r in results]
    })
    for i, res in enumerate(results):
        is_best = (i == best_idx)
        st.markdown(f"### {'' if is_best else ''} Trajectory {i+1} {'(SELECTED)' if is_best else ''}")
        if res.get("success"):
            st.info(f"SPRM Score: {res['sprm_score']:.3f} | Latency: {res['latency']:.1f}s")
            st.code(res["content"])
        else:
            st.error(f"Failed: {res.get('error', 'Unknown error')}")
    fig = px.bar(df, x="Trajectory", y="SPRM Score", color="Success", title="SPRM Scores for Each Trajectory")
    st.plotly_chart(fig, use_container_width=True)
    st.dataframe(df)

El flujo principal de la aplicación cumple varios objetivos clave:

Configuración de la barra lateral: La barra lateral presenta controles dinámicos para configurar elesfuerzo de razonamiento de la máquina de reglas ( ) (es decir, el número de trayectorias muestreadas por consulta) y permite a los usuarios enviar problemas matemáticos o lógicos personalizados. Cada modo (k=2, 8, 32) corresponde a un presupuesto de inferencia en tiempo de prueba diferente, lo que te permite analizar los efectos de la escalabilidad en la calidad de la solución.
Desencadenante de la ejecución: El botón« » (Ejecutar razonamiento reflexivo) actúa como punto de entrada de canalización, que activa la generación eficiente de múltiples muestras en el servidor (parámetro n) o el muestreo paralelo a través de solicitudes simultáneas (si no es compatible con el backend).
Seguimiento del progreso: A medida que se generan las trayectorias, una barra de progreso proporciona información en tiempo real, aprovechando la reactividad con estado de Streamlit.
Postprocesamiento y puntuación: Una vez completada, cada trayectoria se evalúa utilizando el modelo de recompensa proxy (dummy_sprm_score), que imita el modelo de recompensa por proceso compartido (SPRM).
Selección y visualización: Se destaca la mejor trayectoria en función de la puntuación de recompensa (best_of_n_selection). Todas las soluciones generadas, junto con sus respectivas puntuaciones SPRM y latencias de generación, se presentan en formato textual y gráfico para poder analizarlas en paralelo.

Para probarlo tú mismo, guarda el código como xbai_demo.py y ejecútalo:

streamlit run xbai_demo.py

Conclusión

En este tutorial, hemos creado una demostración interactiva de razonamiento multitrayectoria utilizando el modelo XBai o4 de MetaStone. Exploramos:

Cómo XBai o4 introduce el razonamiento generativo reflexivo al permitir que el modelo genere, evalúe y seleccione múltiples rutas de solución por problema.
El uso del escalado paralelo en tiempo de prueba para muestrear de manera eficiente diversas trayectorias de razonamiento.
Implementación de un modelo de recompensa proxy para puntuar la calidad de las soluciones y seleccionar automáticamente la mejor respuesta.
Visualización, comparación y análisis de múltiples trayectorias en una única interfaz Streamlit.

Author

Aashi Dutt

Temas

Inteligencia Artificial

Grandes modelos lingüísticos

¡Aprende IA con estos cursos!

Curso

Building Agentic Workflows with LlamaIndex

2 h

530

Build AI agentic workflows that can plan, search, remember, and collaborate, using LlamaIndex.

Ver detalles

Comienza el curso

Curso

Building AI Agents with Google ADK

1 h

3.3K

Build a customer-support assistant step-by-step with Google’s Agent Development Kit (ADK).

Ver detalles

Comienza el curso

Curso

Sistemas multiagente con LangGraph

2 h 45 min

2.9K

Crea potentes sistemas multiagente aplicando patrones de diseño agentico emergentes en el marco LangGraph.

Ver detalles

Comienza el curso

Relacionado

blog

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

Aprende a utilizar modelos de IA generativa para crear un editor de imágenes, un chatbot similar a ChatGPT con pocos recursos y una aplicación clasificadora de aprobación de préstamos y a automatizar interacciones PDF y un asistente de voz con GPT.

Abid Ali Awan

10 min

blog

7 proyectos de IA para todos los niveles

Desarrolla tu portafolio y mejora tus habilidades para crear soluciones innovadoras a problemas complejos trabajando en proyectos de IA.

Abid Ali Awan

8 min

Tutorial

IA explicable - Comprender y confiar en los modelos de aprendizaje automático

Sumérjase en la IA explicable (XAI) y aprenda a generar confianza en los sistemas de IA con LIME y SHAP para la interpretabilidad de modelos. Comprender la importancia de la transparencia y la equidad en las decisiones basadas en la IA.

Zoumana Keita

Tutorial

Visión GPT-4: Guía completa para principiantes

Este tutorial le presentará todo lo que necesita saber sobre GPT-4 Vision, desde cómo acceder a él hasta ejemplos prácticos del mundo real y sus limitaciones.

Arunn Thevapalan

Tutorial

Tutorial FLAN-T5: Guía y puesta a punto

Una guía completa para afinar un modelo FLAN-T5 para una tarea de respuesta a preguntas utilizando la biblioteca de transformadores, y ejecutando la inferencia optmizada en un escenario del mundo real.

Zoumana Keita

Tutorial

Tutorial sobre cómo crear aplicaciones LLM con LangChain

Explore el potencial sin explotar de los grandes modelos lingüísticos con LangChain, un marco Python de código abierto para crear aplicaciones avanzadas de IA.

Moez Ali

Ver más Ver más

¿Qué es XBai-o4?

Cómo configurar XBai o4 localmente con LM Studio

¿Por qué utilizar la versión cuantificada de GGUF?

Paso 1: Instalar LM Studio

Paso 2: Descargar el modelo XBai-o4 GGUF

Paso 3: Cargar y configurar el modelo

Demostración: Razonamiento reflexivo interactivo XBai-o4

Paso 1: Instalar dependencias

Paso 2: Importa las bibliotecas y configura la página.

Paso 3: Funciones auxiliares

Paso 3.1: Comprobación de la compatibilidad del modelo con el muestreo multitrayectoria

Paso 3.2: Generación de trayectorias

Paso 3.3: Mejor trayectoria

Paso 4: Flujo principal de la aplicación Streamlit

Conclusión

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

7 proyectos de IA para todos los niveles

IA explicable - Comprender y confiar en los modelos de aprendizaje automático

Visión GPT-4: Guía completa para principiantes

Tutorial FLAN-T5: Guía y puesta a punto

Tutorial sobre cómo crear aplicaciones LLM con LangChain

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Building Agentic Workflows with LlamaIndex

Building AI Agents with Google ADK

Sistemas multiagente con LangGraph

Cinco proyectos que puedes crear con modelos de IA generativa (con ejemplos)

7 proyectos de IA para todos los niveles

IA explicable - Comprender y confiar en los modelos de aprendizaje automático

Visión GPT-4: Guía completa para principiantes

Tutorial FLAN-T5: Guía y puesta a punto

Tutorial sobre cómo crear aplicaciones LLM con LangChain

Building Agentic Workflows with LlamaIndex