Categoría
Technologies
Tutorías LLM
Mantente al día de las últimas noticias, técnicas y recursos para los Grandes Modelos Lingüísticos. Nuestros tutoriales están llenos de ejemplos prácticos y casos de uso que puedes utilizar para mejorar tus conocimientos.
Otras tecnologías:
¿Formar a 2 o más personas?Probar DataCamp for Business
Cómo acelerar LLM locales con DFlash y decodificación especulativa
Aprende a acelerar la inferencia local de Gemma 4 31B en una única RTX 4090 usando decodificación especulativa DFlash y Flash Attention frente a una configuración de referencia.
Abid Ali Awan
17 de junio de 2026
Formato GGUF: guía completa para la inferencia local de LLM
GGUF empaqueta los pesos del modelo, los datos del tokenizador y los metadatos en un único archivo portátil. Aprende a elegir el nivel de cuantización adecuado y a empezar con Ollama.
Austin Chia
17 de junio de 2026
Rutinas de Claude Code: ejecuta tu agente de código con una programación en la nube
Descubre cómo las rutinas de Claude Code ejecutan tu agente de código en la nube con una programación o un evento de GitHub, para que las revisiones de PR y auditorías terminen con el portátil cerrado.
Bex Tuychiev
17 de junio de 2026
Tutorial de SGLang: sirve Mistral Medium 3.5 en local
Configura un entorno Docker multi‑GPU con paralelismo tensorial y decodificación especulativa EAGLE para servir Mistral Medium 3.5 128B mediante una API compatible con OpenAI.
Abid Ali Awan
1 de junio de 2026
Tutorial de Claude Code: configuración, refactorización y depuración en la práctica
Aprende a usar Claude Code de Anthropic para mejorar los flujos de desarrollo de software con un ejemplo práctico usando la biblioteca de Python de Supabase.
Aashi Dutt
28 de mayo de 2026
Tutorial de Multi-Token Prediction: cómo acelerar los LLM
Ejecuta Qwen3.6 27B en una RTX 3090 y descubre cómo Multi-Token Prediction (MTP) con llama.cpp puede casi duplicar la inferencia local de LLM sin cambiar de GPU.
Abid Ali Awan
14 de mayo de 2026
Tutorial de la API GPT-Realtime-2: tres pruebas, tres veredictos
Aprende en qué se diferencian gpt-realtime-2, gpt-realtime-translate y gpt-realtime-whisper de OpenAI, y pon a prueba cada uno con código WebSocket de Python totalmente funcional.
Khalid Abdelaty
12 de mayo de 2026
Cómo ejecutar DeepSeek V4 Flash en local
Aprende a ejecutar el modelo completo DeepSeek V4 Flash en una sola GPU usando una build modificada de llama.cpp y un archivo GGUF compatible en este tutorial práctico.
Abid Ali Awan
5 de mayo de 2026
Ajuste fino de NVIDIA Nemotron-3-Nano con datos de Q&A de psicología
Aprende a ajustar NVIDIA Nemotron-3-Nano-4B con un dataset de Q&A de psicología en una GPU RTX 3090 usando LoRA y TRL tras descargar el modelo de Hugging Face.
Abid Ali Awan
29 de abril de 2026
Tutorial de la API de Qwen 3.6 Plus: crea una canalización de procesamiento de facturas en Python
Aprende a usar Qwen 3.6 Plus de Alibaba, Python y el SDK de OpenAI para crear una canalización automática de procesamiento de facturas con visión nativa y llamadas a herramientas.
Bex Tuychiev
27 de abril de 2026
Nano Banana 2: guía completa con Python
Descubre todo lo que necesitas saber sobre el nuevo modelo de generación de imágenes de Google, Nano Banana 2, incluido cómo crear un editor de imágenes conversacional e iterativo usando la API con Python.
François Aubry
22 de abril de 2026
Ejecuta GLM-5 en local para programación con agentes
Ejecuta GLM-5, el mejor modelo de IA de pesos abiertos, en una sola GPU con llama.cpp y conéctalo a Aider para convertirlo en un potente agente de programación local.
Abid Ali Awan
22 de abril de 2026