Course
LLM Application Evaluation with LangSmith
Пользуется популярностью среди обучающихся в тысячах компаний.
Обучение двух или более человек?
Попробуйте DataCamp for BusinessОписание курса
Предварительные требования
LLM Application Fundamentals with LangChainОценка LLM-приложений
Основы оценки
Вы научитесь проектировать комплексные системы оценки ИИ-приложений, измеряющие производительность по параметрам точности, стоимости и latency с использованием оценочных датасетов и различных типов оценщиков — от алгоритмического сопоставления до подходов LLM-as-judge. Это позволит вам заранее устанавливать критерии успеха и отслеживать прогресс в разработке приложений, готовых к релизу.
Реализация оценки
Вы научитесь на практике внедрять системы оценки, используя LangSmith для создания датасетов, определения оценщиков и выполнения экспериментов — создавая алгоритмические оценщики для объективного сравнения, LLM-as-judge для субъективной оценки и мультиметрические оценщики для комплексного анализа качества.
Оценка диалогов
Вы научитесь оценивать приложения на базе разговорного ИИ, используя онлайн-оценивание с оценкой на основе критериев — внедряя паттерны оценки на уровне отдельных реплик и всего диалога с помощью оценщиков LLM-as-judge — что позволит вам систематически измерять качество работы чат-бота по таким показателям, как связность, полнота выполнения задачи и эффективность.
завершен
Получите свидетельство о достижениях
Добавьте эти данные в свой профиль LinkedIn, резюме или CV.Поделитесь этим в социальных сетях и в своем отчете об оценке эффективности работы.Запишитесь Прямо Сейчас
Развивайте свои навыки работы с данными с помощью DataCamp для мобильных устройств.
Успевайте в обучении на ходу с помощью наших мобильных курсов и ежедневных 5-минутных заданий по программированию.