Giới thiệu về giá trị SHAP và khả năng diễn giải trong Học máy

Các mô hình học máy rất mạnh mẽ nhưng khó diễn giải. Tuy nhiên, giá trị SHAP có thể giúp bạn hiểu cách các đặc trưng của mô hình tác động đến dự đoán.

Đã cập nhật 5 thg 6, 2026 · 9 phút đọc

Khám phá với AI

Mở trong ChatGPT Mở trong Claude Mở trong Perplexity

Các mô hình học máy ngày càng trở nên phức tạp, mạnh mẽ và có thể đưa ra dự đoán chính xác. Tuy nhiên, khi các mô hình này trở thành những "hộp đen", việc hiểu cách chúng đi đến những dự đoán đó càng khó hơn. Điều này dẫn đến sự tập trung ngày càng tăng vào khả năng diễn giải và giải thích trong học máy.

Ví dụ, bạn nộp đơn vay vốn tại ngân hàng nhưng bị từ chối. Bạn muốn biết lý do, nhưng nhân viên chăm sóc khách hàng trả lời rằng một thuật toán đã loại đơn và họ không thể xác định lý do. Thật bực bội, đúng không? Bạn xứng đáng nhận được lời giải thích cho quyết định ảnh hưởng đến mình. Đó là lý do các công ty cố gắng làm cho mô hình học máy của họ minh bạch và dễ hiểu hơn.

Một trong những công cụ đầy hứa hẹn cho quy trình này là giá trị SHAP, đo lường mức độ mỗi đặc trưng (như thu nhập, tuổi, điểm tín dụng, v.v.) đóng góp vào dự đoán của mô hình. Giá trị SHAP có thể giúp bạn thấy đặc trưng nào quan trọng nhất đối với mô hình và chúng ảnh hưởng đến kết quả như thế nào.

Trong hướng dẫn này, chúng ta sẽ tìm hiểu về giá trị SHAP và vai trò của chúng trong việc diễn giải mô hình học máy. Chúng ta cũng sẽ sử dụng gói Python Shap để tạo và phân tích các biểu đồ khác nhau nhằm diễn giải mô hình.

Giá trị SHAP là gì?

SHAP (SHapley Additive exPlanations) là một cách để giải thích đầu ra của bất kỳ mô hình học máy nào. Nó sử dụng cách tiếp cận lý thuyết trò chơi để đo lường đóng góp của mỗi người chơi vào kết quả cuối cùng. Trong học máy, mỗi đặc trưng được gán một giá trị tầm quan trọng thể hiện đóng góp của nó vào đầu ra của mô hình.

Giá trị SHAP cho thấy mỗi đặc trưng ảnh hưởng đến từng dự đoán cuối cùng như thế nào, mức độ quan trọng của từng đặc trưng so với các đặc trưng khác, và mức độ mô hình phụ thuộc vào tương tác giữa các đặc trưng.

Giá trị SHAP trong học máy

Giá trị SHAP là cách phổ biến để có được lời giải thích nhất quán và khách quan về việc mỗi đặc trưng tác động đến dự đoán của mô hình như thế nào.

Giá trị SHAP dựa trên lý thuyết trò chơi và gán một giá trị tầm quan trọng cho mỗi đặc trưng trong mô hình. Các đặc trưng có giá trị SHAP dương tác động tích cực đến dự đoán, trong khi các giá trị âm có tác động tiêu cực. Độ lớn thể hiện mức độ mạnh của hiệu ứng.

Giá trị SHAP độc lập với mô hình, nghĩa là có thể dùng để diễn giải bất kỳ mô hình học máy nào, bao gồm:

Hồi quy tuyến tính
Cây quyết định
Rừng ngẫu nhiên
Các mô hình tăng cường dốc
Mạng nơ-ron

Các tính chất của giá trị SHAP

Giá trị SHAP có một số tính chất hữu ích giúp chúng hiệu quả trong việc diễn giải mô hình:

Tính cộng

Giá trị SHAP mang tính cộng, nghĩa là đóng góp của mỗi đặc trưng vào dự đoán cuối cùng có thể được tính độc lập rồi cộng lại. Tính chất này cho phép tính toán hiệu quả giá trị SHAP, ngay cả với các tập dữ liệu có số chiều lớn.

Độ chính xác cục bộ

Giá trị SHAP cộng lại thành chênh lệch giữa đầu ra kỳ vọng của mô hình và đầu ra thực tế cho một đầu vào nhất định. Điều này có nghĩa giá trị SHAP cung cấp diễn giải chính xác và cục bộ cho dự đoán của mô hình đối với một đầu vào cụ thể.

Tính thiếu vắng

Giá trị SHAP bằng không đối với các đặc trưng thiếu hoặc không liên quan cho một dự đoán. Điều này giúp giá trị SHAP vững vàng trước dữ liệu thiếu và bảo đảm các đặc trưng không liên quan không làm sai lệch diễn giải.

Tính nhất quán

Giá trị SHAP không thay đổi khi mô hình thay đổi trừ khi đóng góp của một đặc trưng thay đổi. Điều này có nghĩa giá trị SHAP cung cấp diễn giải nhất quán về hành vi của mô hình, ngay cả khi kiến trúc hoặc tham số mô hình thay đổi.

Tổng thể, giá trị SHAP cung cấp một cách nhất quán và khách quan để hiểu mô hình học máy đưa ra dự đoán như thế nào và những đặc trưng nào có ảnh hưởng lớn nhất.

Cách triển khai giá trị SHAP trong Python

Trong phần này, chúng ta sẽ tính giá trị SHAP và trực quan hóa tầm quan trọng đặc trưng, phụ thuộc đặc trưng, biểu đồ lực và biểu đồ quyết định.

Chạy và chỉnh sửa mã từ hướng dẫn trực tuyến này.

Chạy mã

Thiết lập

Cài đặt SHAP bằng PyPI hoặc conda-forge:

pip install shap

hoặc

conda install -c conda-forge shap

Tải Telecom Customer Churn. Tập dữ liệu trông khá sạch và cột đích là “Churn”.

import shap
import pandas as pd
import numpy as np
shap.initjs()

customer = pd.read_csv("data/customer_churn.csv")
customer.head()

Huấn luyện và đánh giá mô hình

Tạo X và y sử dụng cột đích và chia tập dữ liệu thành train và test.
Huấn luyện Random Forest Classifier trên tập huấn luyện.
Thực hiện dự đoán bằng tập kiểm tra.
Hiển thị báo cáo phân loại.

from sklearn.metrics import classification_report
from sklearn.model_selection import train_test_split

X = customer.drop("Churn", axis=1) # Independent variables
y = customer.Churn # Dependent variable

# Split into train and test 
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=1)

# Train a machine learning model
from sklearn.ensemble import RandomForestClassifier
clf = RandomForestClassifier()
clf.fit(X_train, y_train)

# Make prediction on the testing data
y_pred = clf.predict(X_test)

# Classification Report
print(classification_report(y_pred, y_test))

Mô hình thể hiện tốt hơn với nhãn “0” so với “1” do tập dữ liệu mất cân bằng. Nhìn chung, đây là kết quả chấp nhận được với độ chính xác 94%.

              precision    recall  f1-score   support

           0       0.97      0.96      0.97       815
           1       0.79      0.82      0.80       130

    accuracy                           0.94       945
   macro avg       0.88      0.89      0.88       945
weighted avg       0.94      0.94      0.94       945

Xem hướng dẫn Phân loại trong Học máy để tìm hiểu về phân loại trong học máy với các ví dụ Python.

Thiết lập SHAP Explainer

Bây giờ đến phần giải thích mô hình.

Trước tiên, chúng ta sẽ tạo một đối tượng explainer bằng cách cung cấp mô hình phân loại rừng ngẫu nhiên, sau đó tính giá trị SHAP bằng tập kiểm tra.

explainer = shap.Explainer(clf)
shap_values = explainer.shap_values(X_test)

Biểu đồ tổng quan (Summary Plot)

Hiển thị summary_plot sử dụng giá trị SHAP và tập kiểm tra.

shap.summary_plot(shap_values, X_test)

Biểu đồ tổng quan cho thấy tầm quan trọng của từng đặc trưng trong mô hình. Kết quả cho thấy “Status”, “Complaints” và “Frequency of use” đóng vai trò chính trong việc quyết định kết quả.

Hiển thị summary_plot của nhãn “0”.

shap.summary_plot(shap_values[0], X_test)

Trục Y hiển thị tên các đặc trưng theo thứ tự tầm quan trọng từ trên xuống.
Trục X biểu diễn giá trị SHAP, cho biết mức độ thay đổi trong log-odds.
Màu sắc của mỗi điểm trên biểu đồ biểu thị giá trị của đặc trưng tương ứng, đỏ là giá trị cao và xanh là giá trị thấp.
Mỗi điểm đại diện cho một dòng dữ liệu từ tập dữ liệu gốc.

Nếu bạn nhìn vào đặc trưng “Complaints”, bạn sẽ thấy phần lớn có giá trị cao cùng giá trị SHAP âm. Điều này nghĩa là số lượng khiếu nại cao hơn có xu hướng ảnh hưởng tiêu cực đến đầu ra.

Lưu ý: với nhãn “1” trực quan hóa sẽ đảo chiều.

Biểu đồ phụ thuộc (Dependence Plot)

Trực quan hóa dependence_plot giữa đặc trưng “Subscription Length” và “Age”.

shap.dependence_plot("Subscription Length", shap_values[0], X_test,interaction_index="Age")

Biểu đồ phụ thuộc là dạng biểu đồ phân tán thể hiện dự đoán của mô hình bị ảnh hưởng bởi một đặc trưng cụ thể (Subscription Length) như thế nào. Trung bình, thời hạn thuê bao có tác động chủ yếu là tích cực lên mô hình.

Biểu đồ lực (Force Plot)

Chúng ta sẽ xem xét mẫu đầu tiên trong tập kiểm tra để xác định những đặc trưng nào góp phần dẫn đến kết quả "0". Để làm điều này, chúng ta sẽ sử dụng biểu đồ lực và cung cấp giá trị kỳ vọng, giá trị SHAP và mẫu kiểm tra.

shap.plots.force(explainer.expected_value[0], shap_values[0][0,:], X_test.iloc[0, :], matplotlib = True)

Chúng ta có thể thấy rõ rằng số khiếu nại bằng 0 và số lần gọi thất bại bằng 0 đã góp phần làm giảm khả năng mất khách hàng.

Hãy xem các mẫu rời bỏ khách hàng với nhãn “1”.

shap.plots.force(explainer.expected_value[1], shap_values[1][6, :], X_test.iloc[6, :],matplotlib = True)

Bạn có thể thấy tất cả các đặc trưng với giá trị và độ lớn đã góp phần vào việc mất khách hàng. Có vẻ như chỉ một khiếu nại chưa được giải quyết cũng có thể khiến công ty viễn thông tổn thất.

Biểu đồ quyết định (Decision Plot)

Bây giờ chúng ta sẽ hiển thị decision_plot. Nó mô tả trực quan các quyết định của mô hình bằng cách ánh xạ các giá trị SHAP tích lũy cho mỗi dự đoán.

shap.decision_plot(explainer.expected_value[1], shap_values[1], X_test.columns)

Mỗi đường vẽ trên biểu đồ quyết định cho thấy các đặc trưng riêng lẻ đã đóng góp mạnh mẽ như thế nào vào một dự đoán cụ thể của mô hình, qua đó giải thích những giá trị đặc trưng nào đã đẩy dự đoán theo hướng đó.

Lưu ý: Biểu đồ quyết định của nhãn đích “1” nghiêng về phía “1”.

Hiển thị biểu đồ quyết định cho nhãn đích “0”

shap.decision_plot(explainer.expected_value[0], shap_values[0], X_test.columns)

Đối với biểu đồ quyết định này, nó nghiêng về phía “0”.

Ứng dụng của giá trị SHAP

Ngoài khả năng diễn giải và giải thích trong học máy, giá trị SHAP còn có thể được dùng cho:

Gỡ lỗi mô hình. Bằng cách xem xét giá trị SHAP, chúng ta có thể xác định bất kỳ thiên lệch hoặc ngoại lệ nào trong dữ liệu có thể khiến mô hình mắc lỗi.
Tầm quan trọng đặc trưng. Xác định và loại bỏ các đặc trưng có tác động thấp có thể tạo ra mô hình tối ưu hơn.
Giải thích theo điểm tựa. Chúng ta có thể dùng giá trị SHAP để giải thích các dự đoán cá nhân bằng cách làm nổi bật những đặc trưng then chốt dẫn đến dự đoán đó. Điều này giúp người dùng hiểu và tin tưởng các quyết định của mô hình.
Tóm tắt mô hình. Có thể cung cấp bản tóm tắt tổng quát của mô hình dưới dạng biểu đồ tổng quan giá trị SHAP, cho cái nhìn tổng thể về các đặc trưng quan trọng nhất trên toàn bộ tập dữ liệu.
Phát hiện thiên lệch. Phân tích giá trị SHAP giúp xác định liệu một số đặc trưng có ảnh hưởng không tương xứng đến các nhóm cụ thể hay không. Nó cho phép phát hiện và giảm thiểu sự phân biệt trong mô hình.
Kiểm toán công bằng. Có thể dùng để đánh giá mức độ công bằng và các hàm ý đạo đức của mô hình.
Phê duyệt theo quy định. Giá trị SHAP có thể giúp đạt được sự chấp thuận của cơ quan quản lý bằng cách giải thích các quyết định của mô hình.

Kết luận

Chúng ta đã khám phá giá trị SHAP và cách sử dụng chúng để mang lại khả năng diễn giải cho các mô hình học máy. Mặc dù độ chính xác là quan trọng, các công ty cần vượt ra ngoài độ chính xác và tập trung vào khả năng diễn giải và minh bạch để giành được niềm tin của người dùng và cơ quan quản lý.

Khả năng giải thích vì sao mô hình đưa ra một dự đoán cụ thể giúp gỡ lỗi các thiên lệch tiềm ẩn, xác định vấn đề dữ liệu và biện minh cho các quyết định của mô hình.

Nếu bạn mới bắt đầu với học máy và muốn sẵn sàng cho công việc, hãy cân nhắc theo học lộ trình nghề nghiệp Machine Learning Scientist with Python. Chương trình này sẽ giúp bạn nắm vững các kỹ năng Python cần thiết để trở thành một nhà khoa học học máy và tìm được việc làm.

Author

Abid Ali Awan

Là một nhà khoa học dữ liệu được chứng nhận, tôi đam mê tận dụng công nghệ tiên tiến để tạo ra các ứng dụng học máy đổi mới. Với nền tảng vững chắc về nhận dạng giọng nói, phân tích và báo cáo dữ liệu, MLOps, AI hội thoại và NLP, tôi đã rèn giũa kỹ năng phát triển các hệ thống thông minh có thể tạo ra tác động thực sự. Bên cạnh chuyên môn kỹ thuật, tôi cũng là một người truyền đạt tốt, có khả năng chắt lọc các khái niệm phức tạp thành ngôn ngữ rõ ràng, súc tích. Nhờ đó, tôi trở thành một blogger được nhiều người quan tâm trong lĩnh vực khoa học dữ liệu, chia sẻ góc nhìn và kinh nghiệm với cộng đồng các chuyên gia dữ liệu ngày càng lớn. Hiện tại, tôi tập trung vào sáng tạo và biên tập nội dung, làm việc với các mô hình ngôn ngữ lớn để phát triển nội dung mạnh mẽ và hấp dẫn, giúp doanh nghiệp và cá nhân tận dụng tối đa dữ liệu của mình.

Chủ đề

Machine Learning