Weiter zum Inhalt
Kategorie
Technologien

LLM Tutorien

Bleib auf dem Laufenden über die neuesten Nachrichten, Techniken und Ressourcen für große Sprachmodelle. Unsere Tutorials sind voller praktischer Beispiele und Anwendungsfälle, die du nutzen kannst, um dich weiterzubilden.
Andere Technologien:
AWSAzureBusiness IntelligenceChatGPTDatabricksdbtDockerExcelGenerative KIGitGoogle Cloud PlatformJavaKafkaKI-AgentenKubernetesKünstliche IntelligenzMongoDBMySQLNoSQLOpenAIPostgreSQLPower BIPySparkPythonR SnowflakeSQLSQLiteTabellenkalkulationenTableauUmarmendes Gesicht
GroupTraining für 2 oder mehr Personen?Probiere es mit DataCamp for Business

So beschleunigst du lokale LLMs mit DFlash Speculative Decoding

Lerne, wie du die lokale Gemma 4 31B-Inferenz auf einer einzelnen RTX 4090 mit DFlash Speculative Decoding und Flash Attention im Vergleich zur Baseline beschleunigst.
Abid Ali Awan's photo

Abid Ali Awan

17. Juni 2026

GGUF-Format: Der komplette Guide zur lokalen LLM-Inferenz

GGUF bündelt Modellgewichte, Tokenizer-Daten und Metadaten in einer einzigen portablen Datei. Erfahre, wie du den passenden Quantisierungsgrad wählst und mit Ollama startest.
Austin Chia's photo

Austin Chia

17. Juni 2026

SGLang-Tutorial: Mistral Medium 3.5 lokal bereitstellen

Richte eine Multi-GPU-Docker-Umgebung mit Tensor-Parallelisierung und EAGLE Speculative Decoding ein, um Mistral Medium 3.5 128B über eine OpenAI-kompatible API zu serven.
Abid Ali Awan's photo

Abid Ali Awan

1. Juni 2026

Claude Code Tutorial: Setup, Refactoring und Debugging in der Praxis

Lerne, wie du Anthropics Claude Code nutzt, um Software-Workflows anhand eines Praxisbeispiels mit der Supabase-Python-Bibliothek zu verbessern.
Aashi Dutt's photo

Aashi Dutt

28. Mai 2026

Multi-Token Prediction Tutorial: So beschleunigst du LLMs

Lass Qwen3.6 27B auf einer RTX 3090 laufen und lerne, wie Multi-Token Prediction (MTP) mit llama.cpp die lokale LLM-Inferenz fast verdoppeln kann – ganz ohne GPU-Upgrade.
Abid Ali Awan's photo

Abid Ali Awan

14. Mai 2026

GPT-Realtime-2 API-Tutorial: Drei Tests, drei Urteile

Lerne, wie sich OpenAIs gpt-realtime-2, gpt-realtime-translate und gpt-realtime-whisper unterscheiden, und teste jedes Modell mit funktionierendem Python-WebSocket-Code.
Khalid Abdelaty's photo

Khalid Abdelaty

12. Mai 2026

DeepSeek V4 API Tutorial: Eine Arena für Denkmodi bauen

Lerne, wie die drei Denkmodi von DeepSeek V4 funktionieren, und baue mit Streamlit eine Vergleichs-App, die zeigt, wann welcher Modus bei Qualität, Geschwindigkeit und Kosten gewinnt.
Aashi Dutt's photo

Aashi Dutt

12. Mai 2026

DeepSeek V4 Flash lokal ausführen: So geht’s

Lerne in diesem praxisnahen Tutorial, wie du das komplette DeepSeek V4 Flash Modell auf einer einzelnen GPU mit einer modifizierten llama.cpp-Version und einer kompatiblen GGUF-Datei lokal betreibst.
Abid Ali Awan's photo

Abid Ali Awan

5. Mai 2026

Feintuning von NVIDIA Nemotron-3-Nano mit Psychologie-Q&A-Daten

Lerne, NVIDIA Nemotron-3-Nano-4B mit einem Psychologie-Q&A-Datensatz auf einer RTX 3090 mit LoRA und TRL zu feintunen, nachdem du das Modell von Hugging Face heruntergeladen hast.
Abid Ali Awan's photo

Abid Ali Awan

29. April 2026

Qwen 3.6 Plus API-Tutorial: Eine Pipeline zur Rechnungsverarbeitung in Python bauen

Lerne, wie du Alibabas Qwen 3.6 Plus, Python und das OpenAI SDK nutzt, um eine automatisierte Pipeline zur Rechnungsverarbeitung mit nativer Vision und Tool-Aufrufen zu erstellen.
Bex Tuychiev's photo

Bex Tuychiev

27. April 2026

Nano Banana 2: Der komplette Guide mit Python

Erfahre alles über Googles neuestes Bildgenerierungsmodell Nano Banana 2 – inklusive Anleitung, wie du mit der API und Python einen iterativen Chat‑Bildeditor baust.
François Aubry's photo

François Aubry

22. April 2026