课程
LLM Application Evaluation with LangSmith
中级技能水平
更新时间 2026年3月
PythonArtificial Intelligence1小时 - 3小时3,500 XP成就证明
创建您的免费帐户
继续使用 Google显示更多选项或
继续操作即表示您接受我们的《使用条款》和《隐私政策》,并同意您的数据存储在美国。
深受数千家公司学习者的喜爱
需要团队培训?
企业版试用课程描述
先决条件
LLM Application Fundamentals with LangChain1
LLM 应用评估
评估基础
您将学习如何设计全面的 AI 应用评估系统,从准确度、成本和延迟维度衡量性能。利用评估数据集和多种评估器类型(从算法匹配到 LLM-as-judge 方法),您将能够预先建立成功标准,并衡量在开发可发布应用过程中的进展。
评估实现
你将学习如何在实践中实现评估系统,使用 LangSmith 进行数据集创建、评估器定义和实验执行——构建用于客观比较的算法评估器,用于主观评估的 LLM-as-judge 评估器,以及用于全面质量分析的多指标评估器。
对话评估
你将学习如何使用基于准则的线上评估来评估对话式人工智能应用——通过 LLM-as-judge 评估器实现轮次级和全对话评估模式——使你能够从连贯性、任务完成度以及效率等方面系统地衡量聊天机器人的质量。
LLM Application Evaluation with LangSmith
课程完成 加入超过19百万学习者,今天就开始LLM Application Evaluation with LangSmith!
创建您的免费帐户
继续使用 Google显示更多选项或
继续操作即表示您接受我们的《使用条款》和《隐私政策》,并同意您的数据存储在美国。
通过 DataCamp for Mobile 提升您的数据技能
随时随地通过我们的移动课程和每日 5 分钟编程挑战提升技能。