コース
LLM Application Evaluation with LangSmith
中級スキルレベル
更新日 2026/03PythonArtificial Intelligence1時間 - 3時間3,500 XP達成証明書
数千の企業の学習者に愛されています
2名以上のトレーニングをお考えですか?
DataCamp for Businessを試すコース説明
前提条件
LLM Application Fundamentals with LangChain1
LLMアプリケーションの評価
評価の基礎
精度、コスト、レイテンシの各側面からパフォーマンスを測定する、包括的なAIアプリケーション評価システムの設計方法を学びます。評価データセットと、アルゴリズムによるマッチングからLLM-as-a-judgeのアプローチまで、複数のエバリュエータータイプを活用することで、事前に成功基準を確立し、リリース可能なアプリケーションに向けた進捗を測定できるようになります。
評価の実装
LangSmithを使用したデータセットの作成、評価器の定義、実験の実行を通じて、評価システムを実践的に実装する方法を学びます。客観的な比較のためのアルゴリズム評価器、主観的な評価のためのLLM-as-judge評価器、そして網羅的な品質分析のためのマルチメトリクス評価器を構築していきます。
対話の評価
基準ベースのアセスメントを用いたオンライン評価による、会話型AIアプリケーションの評価方法を学びます。 — LLM-as-judgeエバリュエーターを通じてターンレベルおよび会話全体の評価パターンを実装することで — 一貫性、タスク完了度、効率性にわたるチャットボットの品質を体系的に測定できるようになります。
LLM Application Evaluation with LangSmith
コース完了 19百万人を超える学習者と一緒にLLM Application Evaluation with LangSmithを今日から始めましょう!
DataCamp for Mobileでデータスキルを磨きましょう
モバイル コースと毎日の 5 分間のコーディング チャレンジで、外出先でも進歩できます。