Hoppa till huvudinnehållet
Kategori
Tekniker

LLM-handledningar

Håll dig uppdaterad med de senaste nyheterna, teknikerna och resurserna för Large Language Models. Våra handledningar är fulla av praktiska genomgångar och användningsfall som hjälper dig att utveckla dina färdigheter.
Andra tekniker:
GroupUtbilda 2 eller fler personer?Testa DataCamp for Business

Hur du snabbar upp lokala LLM:er med DFlash spekulativ avkodning

Lär dig hur du accelererar lokal inferens för Gemma 4 31B på en enskild RTX 4090 med DFlash spekulativ avkodning och Flash Attention jämfört med en baslinjeuppsättning.

17 juni 2026

GGUF-format: en komplett guide till lokal LLM-inferens

GGUF paketerar modellvikter, tokeniserardata och metadata i en enda portabel fil. Lär dig hur du väljer rätt kvantiseringsnivå och kommer igång med Ollama.

17 juni 2026

Claude Code-rutiner: Kör din kodagent enligt schema i molnet

Lär dig hur Claude Code-rutiner kör din kodagent i molnet enligt schema eller en GitHub-händelse, så att PR-granskningar och revisioner blir klara medan din laptop är stängd.

17 juni 2026

SGLang-handledning: Kör Mistral Medium 3.5 lokalt

Ställ in en Docker-miljö med flera GPU:er, tensorparallellism och EAGLE spekulativ avkodning för att serva Mistral Medium 3.5 128B via ett OpenAI-kompatibelt API.

1 juni 2026

Claude Code-handledning: Installation, refaktorisering och felsökning i praktiken

Lär dig använda Anthropics Claude Code för att förbättra arbetsflöden i programvaruutveckling genom ett praktiskt exempel med Python-biblioteket Supabase.

28 maj 2026

Handledning i Multi-Token Prediction: Så snabbar du upp LLM:er

Kör Qwen3.6 27B på en RTX 3090 och lär dig hur Multi-Token Prediction (MTP) med llama.cpp kan nästan fördubbla lokal LLM-inferens utan att uppgradera ditt GPU.

14 maj 2026

Så kör du DeepSeek V4 Flash lokalt

Lär dig köra hela DeepSeek V4 Flash-modellen på ett enda GPU med en modifierad llama.cpp-build och en kompatibel GGUF-fil i denna praktiska guide.

5 maj 2026

Finjustering av NVIDIA Nemotron-3-Nano på psykologi-data för frågor och svar

Lär dig finjustera NVIDIA Nemotron-3-Nano-4B på en psykologi-dataset för frågor och svar med ett RTX 3090‑GPU med LoRA och TRL efter att ha laddat ner modellen från Hugging Face.

29 april 2026

Qwen 3.6 Plus API-handledning: Bygg ett flöde för fakturahantering i Python

Lär dig hur du använder Alibabas Qwen 3.6 Plus, Python och OpenAI SDK för att bygga ett automatiserat flöde för fakturahantering med inbyggd bildförståelse och verktygsanrop.

27 april 2026

Nano Banana 2: En komplett guide med Python

Lär dig allt du behöver om Googles senaste bildgenereringsmodell, Nano Banana 2, inklusive hur du bygger en iterativ chattbaserad bildredigerare med API:et i Python.

22 april 2026