Kategorie
Technologien
LLM Tutorien
Bleib auf dem Laufenden über die neuesten Nachrichten, Techniken und Ressourcen für große Sprachmodelle. Unsere Tutorials sind voller praktischer Beispiele und Anwendungsfälle, die du nutzen kannst, um dich weiterzubilden.
Andere Technologien:
Training für 2 oder mehr Personen?Probiere es mit DataCamp for Business
So beschleunigst du lokale LLMs mit DFlash Speculative Decoding
Lerne, wie du die lokale Gemma 4 31B-Inferenz auf einer einzelnen RTX 4090 mit DFlash Speculative Decoding und Flash Attention im Vergleich zur Baseline beschleunigst.
Abid Ali Awan
17. Juni 2026
GGUF-Format: Der komplette Guide zur lokalen LLM-Inferenz
GGUF bündelt Modellgewichte, Tokenizer-Daten und Metadaten in einer einzigen portablen Datei. Erfahre, wie du den passenden Quantisierungsgrad wählst und mit Ollama startest.
Austin Chia
17. Juni 2026
Claude Code-Routinen: Deinen Coding-Agenten nach Zeitplan in der Cloud ausführen
Erfahre, wie Claude Code-Routinen deinen Coding-Agenten in der Cloud nach Zeitplan oder bei einem GitHub-Event ausführen, sodass PR-Reviews und Audits fertig werden, während dein Laptop zugeklappt ist.
Bex Tuychiev
17. Juni 2026
SGLang-Tutorial: Mistral Medium 3.5 lokal bereitstellen
Richte eine Multi-GPU-Docker-Umgebung mit Tensor-Parallelisierung und EAGLE Speculative Decoding ein, um Mistral Medium 3.5 128B über eine OpenAI-kompatible API zu serven.
Abid Ali Awan
1. Juni 2026
Claude Code Tutorial: Setup, Refactoring und Debugging in der Praxis
Lerne, wie du Anthropics Claude Code nutzt, um Software-Workflows anhand eines Praxisbeispiels mit der Supabase-Python-Bibliothek zu verbessern.
Aashi Dutt
28. Mai 2026
Multi-Token Prediction Tutorial: So beschleunigst du LLMs
Lass Qwen3.6 27B auf einer RTX 3090 laufen und lerne, wie Multi-Token Prediction (MTP) mit llama.cpp die lokale LLM-Inferenz fast verdoppeln kann – ganz ohne GPU-Upgrade.
Abid Ali Awan
14. Mai 2026
GPT-Realtime-2 API-Tutorial: Drei Tests, drei Urteile
Lerne, wie sich OpenAIs gpt-realtime-2, gpt-realtime-translate und gpt-realtime-whisper unterscheiden, und teste jedes Modell mit funktionierendem Python-WebSocket-Code.
Khalid Abdelaty
12. Mai 2026
DeepSeek V4 API Tutorial: Eine Arena für Denkmodi bauen
Lerne, wie die drei Denkmodi von DeepSeek V4 funktionieren, und baue mit Streamlit eine Vergleichs-App, die zeigt, wann welcher Modus bei Qualität, Geschwindigkeit und Kosten gewinnt.
Aashi Dutt
12. Mai 2026
DeepSeek V4 Flash lokal ausführen: So geht’s
Lerne in diesem praxisnahen Tutorial, wie du das komplette DeepSeek V4 Flash Modell auf einer einzelnen GPU mit einer modifizierten llama.cpp-Version und einer kompatiblen GGUF-Datei lokal betreibst.
Abid Ali Awan
5. Mai 2026
Feintuning von NVIDIA Nemotron-3-Nano mit Psychologie-Q&A-Daten
Lerne, NVIDIA Nemotron-3-Nano-4B mit einem Psychologie-Q&A-Datensatz auf einer RTX 3090 mit LoRA und TRL zu feintunen, nachdem du das Modell von Hugging Face heruntergeladen hast.
Abid Ali Awan
29. April 2026
Qwen 3.6 Plus API-Tutorial: Eine Pipeline zur Rechnungsverarbeitung in Python bauen
Lerne, wie du Alibabas Qwen 3.6 Plus, Python und das OpenAI SDK nutzt, um eine automatisierte Pipeline zur Rechnungsverarbeitung mit nativer Vision und Tool-Aufrufen zu erstellen.
Bex Tuychiev
27. April 2026
Nano Banana 2: Der komplette Guide mit Python
Erfahre alles über Googles neuestes Bildgenerierungsmodell Nano Banana 2 – inklusive Anleitung, wie du mit der API und Python einen iterativen Chat‑Bildeditor baust.
François Aubry
22. April 2026