Chuyển đến nội dung chính
Loại
Công nghệ

Hướng dẫn LLM

Cập nhật những tin tức, kỹ thuật và tài nguyên mới nhất cho Mô hình Ngôn ngữ Lớn. Các hướng dẫn của chúng tôi có nhiều phần thực hành từng bước và tình huống sử dụng để bạn nâng cao kỹ năng.
Công nghệ khác:
GroupĐào tạo từ 2 người trở lên?Hãy thử DataCamp for Business

OpenRouter: Hướng dẫn kèm ví dụ thực tiễn

Tìm hiểu cách sử dụng API thống nhất của OpenRouter để truy cập nhiều mô hình AI, triển khai các tính năng như streaming, reasoning tokens hoặc structured outputs.
Bex Tuychiev's photo

Bex Tuychiev

5 tháng 6, 2026

Fine-Tuning LLMs: Hướng Dẫn Kèm Ví Dụ

Tìm hiểu cách fine-tuning các mô hình ngôn ngữ lớn (LLM) giúp cải thiện hiệu suất trong các tác vụ như dịch ngôn ngữ, phân tích cảm xúc và tạo văn bản.
Josep Ferrer's photo

Josep Ferrer

5 tháng 6, 2026

Giải mã LLM Benchmark: Hướng dẫn so sánh các mô hình AI hàng đầu

Gạt bỏ ồn ào. Học cách diễn giải LLM benchmark, điều hướng bảng xếp hạng mở, và tự chạy đánh giá để tìm mô hình AI phù hợp với nhu cầu của bạn.
Bex Tuychiev's photo

Bex Tuychiev

5 tháng 6, 2026

Chạy GLM-5 Cục Bộ Cho Lập Trình Tác Tử

Chạy GLM-5, mô hình AI open-weight tốt nhất, trên một GPU duy nhất với llama.cpp, và kết nối với Aider để biến nó thành một tác tử lập trình mạnh mẽ chạy cục bộ.
Abid Ali Awan's photo

Abid Ali Awan

5 tháng 6, 2026

Cách cài đặt và chạy Qwen3 cục bộ với Ollama

Tìm hiểu cách cài đặt, thiết lập và chạy Qwen3 cục bộ với Ollama và xây dựng một ứng dụng đơn giản dựa trên Gradio.
Aashi Dutt's photo

Aashi Dutt

5 tháng 6, 2026

Model Context Protocol (MCP): Hướng dẫn kèm dự án demo

Tìm hiểu cách xây dựng máy chủ MCP bằng Model Context Protocol của Anthropic để kết nối Claude với GitHub và Notion.
Aashi Dutt's photo

Aashi Dutt

5 tháng 6, 2026

Sử dụng Claude Code với các mô hình cục bộ Ollama

Chạy GLM 4.7 Flash cục bộ (RTX 3090) với Claude Code và Ollama chỉ trong vài phút, không đám mây, không ràng buộc, chỉ tốc độ và quyền kiểm soát.
Abid Ali Awan's photo

Abid Ali Awan

5 tháng 6, 2026

Hướng dẫn SGLang: Triển khai Mistral Medium 3.5 cục bộ

Thiết lập môi trường Docker đa GPU với song song tensor và EAGLE speculative decoding để phục vụ Mistral Medium 3.5 128B qua API tương thích OpenAI.
Abid Ali Awan's photo

Abid Ali Awan

1 tháng 6, 2026

Hướng dẫn Claude Code: Thiết lập, Tái cấu trúc và Gỡ lỗi trong Thực tiễn

Tìm hiểu cách dùng Claude Code của Anthropic để cải thiện quy trình phát triển phần mềm qua ví dụ thực tế với thư viện Supabase Python.
Aashi Dutt's photo

Aashi Dutt

28 tháng 5, 2026

Hướng dẫn Multi-Token Prediction: Cách tăng tốc LLM

Chạy Qwen3.6 27B trên RTX 3090 và tìm hiểu cách Multi-Token Prediction (MTP) với llama.cpp có thể tăng gần gấp 2 lần tốc độ suy luận LLM cục bộ mà không cần nâng cấp GPU.
Abid Ali Awan's photo

Abid Ali Awan

14 tháng 5, 2026

Cách chạy DeepSeek V4 Flash cục bộ

Học cách chạy toàn bộ mô hình DeepSeek V4 Flash trên một GPU duy nhất bằng bản dựng llama.cpp đã chỉnh sửa và tệp GGUF tương thích trong hướng dẫn thực hành này.
Abid Ali Awan's photo

Abid Ali Awan

5 tháng 5, 2026

Tinh chỉnh NVIDIA Nemotron-3-Nano trên dữ liệu Hỏi & Đáp Tâm lý học

Tìm hiểu cách tinh chỉnh NVIDIA Nemotron-3-Nano-4B trên bộ dữ liệu Hỏi & Đáp tâm lý học bằng GPU RTX 3090 với LoRA và TRL sau khi tải mô hình từ Hugging Face.
Abid Ali Awan's photo

Abid Ali Awan

29 tháng 4, 2026