khóa học
LLM Application Evaluation with LangSmith
Tạo tài khoản miễn phí của bạn
hoặc
Bằng việc tiếp tục, bạn đồng ý với Điều khoản sử dụng, Chính sách quyền riêng tư của chúng tôi và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.Được người học tại hàng ngàn công ty yêu thích.
Đào tạo từ 2 người trở lên?
Hãy thử DataCamp for BusinessMô tả khóa học
Điều kiện tiên quyết
Khóa học này không yêu cầu điều kiện tiên quyết nào.LLM Application Evaluation
Evaluation Fundamentals
You will learn to design comprehensive AI application evaluation systems that measure performance across accuracy, cost, and latency dimensions using evaluation datasets and multiple evaluator types — from algorithmic matching to LLM-as-judge approaches — enabling you to establish success criteria upfront and measure progress toward release-ready applications.
Evaluation Implementation
You will learn to implement evaluation systems in practice using LangSmith for dataset creation, evaluator definition, and experiment execution — building algorithmic evaluators for objective comparisons, LLM-as-judge evaluators for subjective assessments, and multi-metric evaluators for comprehensive quality analysis.
Conversation Evaluation
You will learn to evaluate conversational AI applications using online evaluation with criteria-based assessment — implementing turn-level and full-conversation evaluation patterns through LLM-as-judge evaluators — enabling you to systematically measure chatbot quality across coherence, task completeness, and efficiency.
học
Giấy chứng nhận hoàn thành khóa học
Thêm chứng chỉ này vào hồ sơ LinkedIn, sơ yếu lý lịch hoặc CV của bạn.Hãy chia sẻ điều đó trên mạng xã hội và trong bản đánh giá hiệu suất của bạn.
Bao gồmCao cấp or Đội nhóm
Đăng Ký NgayHãy tham gia cùng chúng tôi 19 triệu người học và bắt đầu LLM Application Evaluation with LangSmith ngay hôm nay!
Tạo tài khoản miễn phí của bạn
hoặc
Bằng việc tiếp tục, bạn đồng ý với Điều khoản sử dụng, Chính sách quyền riêng tư của chúng tôi và việc dữ liệu của bạn được lưu trữ tại Hoa Kỳ.