คอร์ส
LLM Application Evaluation with LangSmith
สร้างบัญชีฟรีของคุณ
ดำเนินการต่อด้วย Googleแสดงตัวเลือกเพิ่มเติมหรือ
เป็นที่รักของผู้เรียนในบริษัทหลายพันแห่ง
กำลังฝึกอบรมทีม?
ลองใช้สำหรับธุรกิจคำอธิบายคอร์ส
ข้อกำหนดเบื้องต้น
LLM Application Fundamentals with LangChainการประเมินผลแอปพลิเคชัน LLM
พื้นฐานการประเมินผล
คุณจะได้เรียนรู้วิธีการออกแบบระบบประเมินผลแอปพลิเคชัน AI ที่ครอบคลุม เพื่อวัดผลประสิทธิภาพในมิติต่าง ๆ ทั้งความแม่นยำ (accuracy), ต้นทุน (cost) และความหน่วง (latency) โดยใช้ชุดข้อมูลสำหรับการประเมิน (evaluation datasets) และตัวประเมินหลากหลายประเภท ตั้งแต่การใช้ algorithmic matching ไปจนถึงแนวทางแบบ LLM-as-judge ซึ่งจะช่วยให้คุณสามารถกำหนดเกณฑ์ความสำเร็จ (success criteria) ได้ล่วงหน้า และวัดผลความคืบหน้าในการพัฒนาแอปพลิเคชันให้พร้อมสำหรับการใช้งานจริง (release-ready)
การดำเนินการประเมินผล
คุณจะได้เรียนรู้วิธีการนำระบบการประเมินไปใช้งานจริงโดยใช้ LangSmith สำหรับการสร้าง dataset, การกำหนดตัวประเมิน (evaluator definition) และการดำเนินการทดลอง (experiment execution) — โดยครอบคลุมตั้งแต่การสร้างตัวประเมินแบบอัลกอริทึม (algorithmic evaluators) เพื่อการเปรียบเทียบเชิงวัตถุวิสัย (objective comparisons), ตัวประเมินแบบ LLM-as-judge สำหรับการประเมินเชิงอัตวิสัย (subjective assessments) และตัวประเมินแบบหลายตัวชี้วัด (multi-metric evaluators) เพื่อการวิเคราะห์คุณภาพอย่างครอบคลุม
การประเมินการสนทนา
คุณจะได้เรียนรู้วิธีการประเมินแอปพลิเคชัน Conversational AI โดยใช้ online evaluation ร่วมกับการประเมินตามเกณฑ์ (criteria-based assessment) — ผ่านการนำรูปแบบการประเมินระดับ turn-level และแบบทั้งการสนทนา (full-conversation) มาปรับใช้ด้วยตัวประเมินแบบ LLM-as-judge — ซึ่งจะช่วยให้คุณสามารถวัดผลคุณภาพของแชทบอทในด้านความสอดคล้อง (coherence), ความสำเร็จของงาน (task completeness) และประสิทธิภาพ (efficiency) ได้อย่างเป็นระบบ
รับใบรับรองความสำเร็จ
เพิ่มใบรับรองนี้ไปยังโปรไฟล์ LinkedIn เรซูเม่ หรือ CV ของคุณแชร์บน social media และในการรีวิวผลการปฏิบัติงานของคุณลงทะเบียนทันที
ร่วมกับผู้เรียนกว่า 19 ล้านคนและเริ่มต้น LLM Application Evaluation with LangSmith วันนี้!
สร้างบัญชีฟรีของคุณ
ดำเนินการต่อด้วย Googleแสดงตัวเลือกเพิ่มเติมหรือ
พัฒนาทักษะด้านข้อมูลของคุณด้วย DataCamp for Mobile
พัฒนาทักษะได้ทุกที่ทุกเวลาด้วยคอร์สเรียนบนมือถือและแบบฝึกหัดเขียนโค้ดประจำวัน 5 นาทีของเรา