Tracks
Các agent AI không còn chỉ là giao diện trò chuyện tạo văn bản. Chúng là các động cơ thực thi, và lý do chúng trở nên mạnh mẽ đến vậy là nhờ kỹ năng agent.
Kỹ năng agent là các gói năng lực dạng mô-đun, được định nghĩa thông qua tệp SKILL.md có cấu trúc, mang lại cho agent AI các hành động trong thế giới thực.
Thay vì chỉ phản hồi bằng văn bản, một agent được trang bị kỹ năng có thể tìm kiếm web, chạy mã, truy vấn cơ sở dữ liệu, triển khai hạ tầng, tinh chỉnh mô hình, gửi email, tự động hóa quy trình công việc, và hơn thế nữa. Bạn có thể hình dung kỹ năng như các ứng dụng dành cho agent AI. Mỗi kỹ năng bổ sung một năng lực có trọng tâm, có thể thực thi, được ghi chép trong tài liệu markdown riêng, biến mô hình ngôn ngữ thành một hệ thống thực sự có thể làm việc.
Trong bài viết này, chúng tôi tuyển chọn danh sách hơn 100 kỹ năng agent có thể dùng với OpenClaw, Claude Code, OpenAI Codex, các agent Cursor CLI, và những môi trường ưu tiên agent khác. Những kỹ năng này bao quát nghiên cứu, lập trình, hạ tầng, machine learning, bảo mật, giao tiếp và sáng tạo nội dung. Mục tiêu rất rõ ràng: cung cấp cho bạn một bản đồ thực tiễn về những gì có thể khi agent chuyển từ đối thoại sang thực thi.
Cuối bài, chúng tôi có thêm phần bonus nêu bật các kỹ năng được tải xuống nhiều nhất trên ClawHub, để bạn thấy cộng đồng đang tích cực sử dụng những công cụ nào với OpenClaw.
1. Các kỹ năng Agent hàng đầu cho Tìm kiếm và Nghiên cứu
Các kỹ năng giúp agent khám phá thông tin, truy vấn nguồn có cấu trúc và rút trích insight tin cậy từ dữ liệu kỹ thuật và khoa học.
- arxiv-watcher: Tìm kiếm và tóm tắt bài báo từ ArXiv.
- pubmed-edirect: Truy vấn PubMed cho tài liệu khoa học và y sinh đã bình duyệt.
- wikipedia: Tìm kiếm, truy xuất và tóm tắt nội dung từ Wikipedia tiếng Anh
- google-search: Tìm kiếm web bằng Google Custom Search Engine (PSE).
- google-search-grounding: Tìm kiếm web Google qua Gemini Search Grounding.
- serper-search: Google Search qua API Serper.dev.
- web-scraper-as-a-service: Xây scraper web sẵn sàng cho khách hàng với đầu ra dữ liệu sạch.
- exa-web-search-free : Tìm kiếm AI miễn phí qua Exa.
- newsapi-search: Truy vấn nguồn tin toàn cầu để theo dõi xu hướng và phân tích tín hiệu.
- brightdata: Web scraping và tìm kiếm qua Bright Data API.
2. Các kỹ năng Orchestration lập trình và Copilot cho nhà phát triển hàng đầu
Kỹ năng để chạy dự án lập trình nhiều bước và điều phối “đội ngũ agent” từ đầu đến cuối.
- buildlog: Ghi lại và xuất phiên lập trình thành “build log” có thể chia sẻ.
- cc-godmode: Điều phối công việc phần mềm đa-agent với tự quản lý phối hợp.
- codebuddy-code: Cài đặt/cấu hình trợ lý CLI lập trình kiểu CodeBuddy.
- debug-pro: Phương pháp gỡ lỗi có hệ thống và gỡ lỗi theo ngôn ngữ.
- coder-workspaces: Quản lý workspace Coder cho quy trình làm việc dạng remote/devcontainer.
- cursor-agent: Kỹ năng toàn diện để sử dụng agent Cursor CLI.
- ec-task-orchestrator: Orchestration tác vụ đa-agent tự động.
- codex-orchestration: Cung cấp lớp orchestration tổng quát cho các agent kiểu Codex.
- codex-quota: Kiểm tra quota/giới hạn tốc độ của Codex để tránh dừng đột ngột.
- coding-agent: Chạy các agent/CLI lập trình phổ biến (Codex, Claude Code, v.v.) từ một kỹ năng.
3. Các kỹ năng Agent về Git, GitHub, PR và hiểu biết kho mã
Kỹ năng cho kiểm soát phiên bản, tự động hóa PR và hiểu điều gì đã thay đổi trong repo.
- auto-pr-merger: Tự động kiểm tra và hợp nhất PR khi đáp ứng quy tắc.
- backup: Sao lưu và khôi phục cấu hình/kỹ năng/cài đặt của agent.
- bat-cat: Cung cấp trình xem tệp kiểu “bat” với đầu ra nhận thức git.
- bitbucket-automation: Tự động hóa quy trình repo và PR trên Bitbucket.
- commit-analyzer: Phân tích mẫu commit để hiểu rủi ro và hành vi thay đổi.
- conventional-commits: Định dạng thông điệp commit theo chuẩn Conventional Commits.
- deepwiki: Truy vấn tài liệu/wiki của repo qua giao diện “deep wiki” được hỗ trợ MCP.
- gitclassic: Dùng trình duyệt GitHub nhẹ, phù hợp cho agent.
- gitclaw: Đồng bộ workspace của agent vào repo GitHub như một bản sao lưu/gương.
- github: Vận hành GitHub qua gh cho issues, PR và hành động trên repo.
4. Kỹ năng Agent về DevOps và vận hành đám mây
Kỹ năng cho cấp phát, triển khai, giám sát và bảo mật hạ tầng đám mây.
- docker-essentials: Build, gắn thẻ và chạy container bằng quy trình Docker sạch, sẵn sàng sản xuất.
- k8-multicluster: Quản lý nhiều cụm Kubernetes và chuyển ngữ cảnh an toàn.
- nginx-config-creator: Tạo cấu hình reverse proxy cho triển khai Nginx/OpenResty.
- appdeploy: Triển khai ứng dụng web, bao gồm backend và cơ sở dữ liệu.
- aws-infra: Hướng dẫn công việc hạ tầng AWS bằng CLI và thực tiễn tốt nhất.
- aws-ecs-monitor: Giám sát dịch vụ ECS và tín hiệu CloudWatch cho sức khỏe sản xuất.
- aws-security-scanner: Quét môi trường AWS tìm vấn đề bảo mật thường gặp.
- azd-deployment: Triển khai ứng dụng container lên Azure Container Apps bằng azd.
- azure-cli: Quản lý tài nguyên Azure qua lệnh và luồng Azure CLI.
- hetzner: Kiểm soát tài nguyên Hetzner Cloud bằng hcloud.
5. Kỹ năng Agent hàng đầu cho Khoa học dữ liệu và Machine Learning
Kỹ năng cho tiền xử lý dữ liệu, xây dựng quy trình huấn luyện, theo dõi thí nghiệm, và đưa mô hình ML vào sử dụng thực tế.
- peft: Tinh chỉnh LLM với bộ điều hợp LoRA/QLoRA, hợp nhất/hoán đổi bộ điều hợp và chạy quy trình hậu huấn luyện gọn nhẹ.
- wandb-monitor: Giám sát và so sánh các lần chạy Weights & Biases để nhanh chóng phát hiện lỗi huấn luyện và thoái lui hiệu năng.
- senior-computer-vision: Xây pipeline CV đầu-cuối (tập dữ liệu → huấn luyện → đánh giá → triển khai) kèm hướng dẫn xuất/tối ưu (ONNX/TensorRT/CoreML).
- senior-data-engineer: Xây pipeline ETL/ELT có khả năng mở rộng và hạ tầng dữ liệu hiện đại (Spark/Airflow/dbt/Kafka).
- hugging-face-model-trainer: Huấn luyện/tinh chỉnh LLM với các phương pháp TRL (SFT/DPO/GRPO) trên Hugging Face Jobs và xuất GGUF.
- duckdb: Phân tích nhanh trên CSV/Parquet/JSON bằng DuckDB CLI.
- senior-data-scientist: Kỹ năng khoa học dữ liệu đẳng cấp thế giới.
- data-analyst: Phân tích dữ liệu qua SQL/bảng tính, tạo biểu đồ và lập báo cáo sẵn sàng cho quyết định.
- hugging-face-datasets: Tạo/quản lý tập dữ liệu trên Hub, gồm truy vấn/chuyển đổi dựa trên SQL với DuckDB.
- hugging-face-evaluation: Thêm kết quả đánh giá có cấu trúc vào thẻ mô hình và chạy/nhập benchmark (vLLM/lighteval, v.v.).
6. Kỹ năng Agent về Bảo mật, Quản trị và An toàn
Kỹ năng bổ sung rào chắn, quét, kiểm tra chính sách và mặc định an toàn cho agent.
- agentguard: Thêm giám sát/rào chắn để giảm hành vi rủi ro của agent.
- agentmemory: Cung cấp bộ nhớ đám mây mã hóa cho agent trên nhiều thiết bị.
- clawscan: Quét gói kỹ năng tìm cờ đỏ trước khi cài/ dùng.
- clawsec-feed: Kéo cảnh báo bảo mật/tín hiệu CVE để cập nhật liên tục.
- clawskillshield: Chạy trình quét ưu tiên cục bộ để phát hiện hành vi đáng ngờ của kỹ năng.
- config-guardian: Xác thực thay đổi cấu hình để ngăn cập nhật lỗi hoặc không an toàn.
- prompt-guard: Phòng chống tấn công chèn prompt và tuân thủ hướng dẫn không an toàn.
- skill-flag: Phát hiện mẫu độc hại/cửa hậu trong mã/hướng dẫn của kỹ năng.
- skill-scanner: Quét kỹ năng/máy chủ MCP tìm hành vi giống spyware và rủi ro.
- skills-audit: Kiểm toán các kỹ năng đã cài theo chính sách và kiểm tra bảo mật.
7. Kỹ năng Agent về Giao tiếp, Nhắn tin và Cộng đồng
Kỹ năng giúp agent đăng bài, phản hồi và quản lý hội thoại trên các nền tảng chat.
- discord-voice: Cho phép hội thoại thoại thời gian thực ngay trong kênh thoại Discord.
- giphy: Tìm và gửi GIF phù hợp ngữ cảnh trong hội thoại.
- mailchannels: Gửi email qua MailChannels và xử lý luồng tiếp nhận có ký chữ ký.
- google-messages-openclaw-skill: Kích hoạt gửi/nhận SMS/RCS qua tích hợp Google Messages.
- lark-integration: Kết nối nhắn tin Lark/Feishu vào quy trình agent qua webhook.
- clawsignal: Thêm nhắn tin thời gian thực cho agent để cảnh báo và phối hợp.
- olvid-channel: Tích hợp trình nhắn tin bảo mật Olvid làm kênh của agent.
- disclawd: Kết nối tới môi trường kiểu Discord ưu tiên agent.
- agent-mail: Hộp thư email cho agent AI.
- whatsapp-styling-guide: Đảm bảo tin nhắn WhatsApp của agent tuân theo quy tắc định dạng nhất quán.
8. Kỹ năng Agent cho Ghi chú, Tri thức và Quản lý Tri thức cá nhân
Kỹ năng để lưu trữ bộ nhớ bền vững, viết ghi chú và truy xuất thông tin từ hệ thống tri thức của bạn.
- logseq: Cho phép agent đọc/ghi ghi chú trong vault Logseq cục bộ.
- notesctl-skill-for-openclaw: Điều khiển Apple Notes qua các thao tác kiểu CLI có tính quyết định.
- openclaw-confluence-skill: Sử dụng Confluence Cloud REST API để tìm kiếm và chỉnh sửa trang.
- openclaw-nextcloud: Kết nối tệp/ghi chú/nhiệm vụ/lịch Nextcloud vào agent.
- git-notes-memory: Lưu trữ bộ nhớ bền vững bằng git-notes qua nhiều phiên.
- memory-hygiene: Làm sạch và tối ưu bộ nhớ vector để giảm lệch/ồn.
- openclaw-feeds: Tổng hợp nguồn RSS phục vụ nghiên cứu và theo dõi hằng ngày.
- hardcover: Lấy danh sách đọc và metadata sách từ Hardcover qua API.
- get-tldr: Tóm tắt nội dung dài qua API tóm tắt TL;DR.
- essence-distiller: Trích xuất ý chính và “điều quan trọng” từ nội dung lộn xộn.
9. Kỹ năng Agent cho Marketing, Xuất bản và Tăng trưởng mạng xã hội
Kỹ năng để xuất bản nội dung, chạy quảng cáo, tạo liên kết/mã QR và tự động hóa quy trình mạng xã hội.
- wordpress-publishing-skill-for-claude: Xuất bản nội dung lên WordPress từ quy trình agent.
- wp-multi-tool: Kiểm tra sức khỏe/hiệu năng WordPress và đề xuất cách khắc phục.
- social-scheduler-extended: Lên lịch và quản lý bài đăng mạng xã hội.
- microsoft-ads-mcp: Tạo và quản lý chiến dịch Microsoft Ads qua công cụ MCP.
- go2gg: Rút gọn liên kết, theo dõi lượt nhấp và tạo mã QR.
- jo4: Tạo liên kết ngắn + mã QR kèm phân tích.
- aisa-twitter-api: Tìm kiếm X (Twitter) theo thời gian thực và trích xuất bài đăng liên quan.
- glasses-to-social: Biến ảnh từ kính thông minh thành chú thích sẵn sàng đăng mạng xã hội.
- share-usecase: Xuất bản trường hợp sử dụng agent của bạn lên danh bạ công khai để dễ được khám phá.
- openclaw-postsyncer: Tự động hóa quy trình đăng mạng xã hội với thói quen “đồng bộ bài đăng”.
10. Kỹ năng Agent cho Media, Hình ảnh, Video và Sản xuất sáng tạo
Kỹ năng tạo hình ảnh/video, chỉnh sửa tài sản số, sản xuất sản phẩm sáng tạo và sơ đồ.
- image-router: Tạo hình ảnh qua API có thể định tuyến tới nhiều mô hình.
- imagemagick: Xử lý hình ảnh (đổi kích thước/chuyển đổi/kết hợp) bằng công cụ ImageMagick.
- avatar-video-messages: Tạo video dạng avatar từ prompt văn bản.
- video-agent: Sản xuất video avatar AI bằng HeyGen’s Video Agent API.
- video-cog: Hỗ trợ sản xuất video AI dạng dài với lập kế hoạch nhiều bước.
- voice-reply: Tạo phản hồi giọng nói text-to-speech cục bộ (thân thiện ngoại tuyến).
- artifacts-builder: Xây dựng hiện vật nhiều phần (tài liệu/tài sản) từ một kế hoạch agent.
- excalidraw-diagrams: Tạo sơ đồ kiểu Excalidraw và phác thảo kiến trúc.
- manim-composer: Sản xuất cảnh toán/hình động bằng cách kết hợp kiểu Manim.
- morfeo-remotion-style: Áp dụng phong cách/mẫu Remotion nhất quán cho video đầu ra.
Bonus: Các kỹ năng ClawHub được tải xuống nhiều nhất
Đây là những kỹ năng được tải xuống và sử dụng rộng rãi nhất trên ClawHub, dựa trên xếp hạng thị trường hiện tại và thống kê tải xuống công khai (chính xác tại thời điểm viết):
- gog: CLI Google Workspace cho tự động hóa Gmail, Drive, Docs và Sheets | ~29,4 nghìn lượt tải.
- tavily-search: Tìm kiếm web thời gian thực tối ưu bởi AI cho truy xuất thông tin cập nhật | ~23,8 nghìn lượt tải.
- summarize: Tóm tắt URL, PDF, tài liệu và âm thanh thành đầu ra súc tích | ~22,4 nghìn lượt tải.
- github: Tích hợp đầy đủ GitHub CLI cho issues, PR, repo và workflow | ~21,6 nghìn lượt tải.
- sonoscli: Điều khiển loa Sonos, gồm phát, âm lượng và quản lý phòng | ~18,6 nghìn lượt tải.
- weather: Lấy điều kiện thời tiết thời gian thực và dự báo cho bất kỳ địa điểm nào | ~18,6 nghìn lượt tải.
- ontology: Kích hoạt khám phá đồ thị tri thức có cấu trúc và suy luận ngữ nghĩa | ~18,1 nghìn lượt tải.
- notion: Đọc/ghi trang và cơ sở dữ liệu Notion trực tiếp từ agent của bạn | ~11,9 nghìn lượt tải.
- api-gateway: Lớp gọi API quản lý hợp nhất cho tích hợp bên thứ ba an toàn | ~11,7 nghìn lượt tải.
- nano-banana-pro: Công cụ tạo ảnh và tự động hóa sáng tạo nâng cao | ~11,6 nghìn lượt tải.
Lời kết
Tôi bắt đầu say mê kỹ năng agent khi hoàn toàn chuyển quy trình lập trình từ IDE sang OpenAI Codex. Codex rất xuất sắc trong việc tạo và sử dụng kỹ năng, nhưng lúc đầu, tôi chưa thực sự hiểu cách tối ưu chúng. Tôi không chắc tệp SKILL.md nên được cấu trúc ra sao, điều gì khiến một cách triển khai tốt hơn cách khác, và làm thế nào để thiết kế kỹ năng sạch, tái sử dụng và sẵn sàng cho sản xuất.
Sau đó, tôi phát hiện ClawHub, một chợ trung tâm cho kỹ năng agent hoạt động vượt ra ngoài hệ sinh thái OpenClaw. Nó hỗ trợ các công cụ như OpenAI Code, OpenCode, Claude Code và các môi trường ưu tiên agent khác. Kể từ đó, tôi cài đặt kỹ năng trực tiếp từ hub bằng các lệnh npx đơn giản sau khi xem xét chúng trên trang web ClawHub.
Trong bài viết này, chúng ta đã điểm qua các kỹ năng agent hàng đầu theo danh mục và tình huống thực tế. Lời khuyên của tôi rất đơn giản: hãy bắt đầu với phần bonus và cài trước các kỹ năng ClawHub được tải nhiều nhất. Chúng được áp dụng rộng rãi, được cộng đồng tin tưởng và là nền tảng vững chắc để xây dựng hệ thống agent nghiêm túc.
Câu hỏi thường gặp về Kỹ năng Agent
Kỹ năng agent AI là gì?
Hãy hình dung kỹ năng agent như một "gói npm" hoặc một ứng dụng cho AI của bạn. Thay vì chỉ đưa cho AI một prompt văn bản, một kỹ năng là một thư mục độc lập đóng gói hướng dẫn, script có thể thực thi và tài liệu tham khảo. Trọng tâm là tệp SKILL.md chứa metadata và quy trình từng bước. Điều này cho phép các agent (như OpenClaw, Claude Code hoặc Cursor) nạp động chuyên môn theo lĩnh vực—như cách triển khai lên AWS, chạy kiểm toán bảo mật, hoặc truy vấn cơ sở dữ liệu—chính xác vào lúc cần.
Kỹ năng agent khác gì so với prompt tiêu chuẩn hoặc máy chủ MCP?
- Prompt hoàn toàn dựa vào kiến thức chung của LLM và có thể cho kết quả không nhất quán. Kỹ năng đóng gói hướng dẫn kèm mã và quy tắc có thể thực thi, đảm bảo agent thực hiện tác vụ nhất quán (idempotent) mỗi lần.
- Máy chủ MCP (Model Context Protocol) xử lý việc tích hợp kỹ thuật giữa hệ thống AI và API bên thứ ba (như kết nối tới Slack hoặc Postgres).
- Kỹ năng nằm ở lớp cao hơn. Chúng chứa tri thức quy trình hoặc logic nghiệp vụ, cho agent biết khi nào dùng các công cụ đó, cách sắp xếp chuỗi hành động và cách định dạng đầu ra.
Tải kỹ năng agent từ chợ công khai có an toàn không?
Bạn phải xử lý chúng cẩn trọng. Vì kỹ năng là mã thực thi, chúng chạy với đúng quyền hạn như agent AI của bạn, tức có thể truy cập hệ thống tệp, đọc biến môi trường và chạy lệnh shell. Gần đây, các nhà nghiên cứu bảo mật đã cảnh báo về lỗ hổng chuỗi cung ứng trên các chợ mở như ClawHub, nơi các tệp SKILL.md độc hại hoặc script ẩn tìm cách đánh cắp khóa API hoặc cài phần mềm độc hại.
Luôn xem xét SKILL.md và script trước khi cài kỹ năng bên thứ ba, và cân nhắc chạy agent trong môi trường sandbox nếu chúng dùng công cụ cộng đồng chưa được xác minh.
Làm sao agent AI biết khi nào cần dùng một kỹ năng cụ thể?
Kỹ năng agent dùng kiến trúc gọi là "tiết lộ dần" để tiết kiệm chi phí token.
- Khám phá: Khi agent khởi động, nó chỉ đọc YAML metadata (tên kỹ năng và mô tả ngắn) của tất cả kỹ năng đã cài.
- Khớp ngữ nghĩa: Khi bạn đặt câu hỏi hoặc giao nhiệm vụ, agent kiểm tra xem yêu cầu của bạn có khớp với mô tả kỹ năng nào không.
- Thực thi: Nếu có khớp, agent nạp đầy đủ hướng dẫn
SKILL.mdvà mọi script liên quan vào cửa sổ ngữ cảnh để thực thi tác vụ. Bạn cũng có thể kích hoạt trực tiếp bằng lệnh gạch chéo (ví dụ,/deploy-app).

Là một nhà khoa học dữ liệu được chứng nhận, tôi đam mê tận dụng công nghệ tiên tiến để tạo ra các ứng dụng học máy đổi mới. Với nền tảng vững chắc về nhận dạng giọng nói, phân tích và báo cáo dữ liệu, MLOps, AI hội thoại và NLP, tôi đã rèn giũa kỹ năng phát triển các hệ thống thông minh có thể tạo ra tác động thực sự. Bên cạnh chuyên môn kỹ thuật, tôi cũng là một người truyền đạt tốt, có khả năng chắt lọc các khái niệm phức tạp thành ngôn ngữ rõ ràng, súc tích. Nhờ đó, tôi trở thành một blogger được nhiều người quan tâm trong lĩnh vực khoa học dữ liệu, chia sẻ góc nhìn và kinh nghiệm với cộng đồng các chuyên gia dữ liệu ngày càng lớn. Hiện tại, tôi tập trung vào sáng tạo và biên tập nội dung, làm việc với các mô hình ngôn ngữ lớn để phát triển nội dung mạnh mẽ và hấp dẫn, giúp doanh nghiệp và cá nhân tận dụng tối đa dữ liệu của mình.