Kurs
LLM Application Evaluation with LangSmith
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.Beliebt bei Lernenden in Tausenden Unternehmen
Training für 2 oder mehr Personen?
Probiere es mit DataCamp for BusinessKursbeschreibung
Voraussetzungen
Es gibt keine Voraussetzungen für diesen KursLLM Application Evaluation
Evaluation Fundamentals
You will learn to design comprehensive AI application evaluation systems that measure performance across accuracy, cost, and latency dimensions using evaluation datasets and multiple evaluator types — from algorithmic matching to LLM-as-judge approaches — enabling you to establish success criteria upfront and measure progress toward release-ready applications.
Evaluation Implementation
You will learn to implement evaluation systems in practice using LangSmith for dataset creation, evaluator definition, and experiment execution — building algorithmic evaluators for objective comparisons, LLM-as-judge evaluators for subjective assessments, and multi-metric evaluators for comprehensive quality analysis.
Conversation Evaluation
You will learn to evaluate conversational AI applications using online evaluation with criteria-based assessment — implementing turn-level and full-conversation evaluation patterns through LLM-as-judge evaluators — enabling you to systematically measure chatbot quality across coherence, task completeness, and efficiency.
abgeschlossen
Leistungsnachweis verdienen
Füge diesen Fähigkeitsnachweis zu Deinem LinkedIn-Profil, Anschreiben oder Lebenslauf hinzuTeile es auf Social Media und in Deiner Leistungsbeurteilung
Im Lieferumfang enthalten beiPremium or Teams
Jetzt anmeldenSchließe dich 19 Millionen Lernenden an und starte LLM Application Evaluation with LangSmith heute!
Kostenloses Konto erstellen
oder
Durch Klick auf die Schaltfläche akzeptierst du unsere Nutzungsbedingungen, unsere Datenschutzrichtlinie und die Speicherung deiner Daten in den USA.