Algoritma Apriori Dijelaskan: Panduan Langkah demi Langkah dengan Implementasi Python

Pelajari cara kerja algoritma Apriori, konsep utamanya, dan cara menggunakannya secara efektif untuk analisis data dan pengambilan keputusan.

Diperbarui 4 Jun 2026

Jelajahi dengan AI

Buka di ChatGPT Buka di Claude Buka di Perplexity

Penambangan aturan asosiasi menjadi penting bagi bisnis yang ingin memahami perilaku pelanggan dan pola pembelian. Teknik ini mengidentifikasi item yang sering dibeli bersama, membantu perusahaan mengoptimalkan penempatan produk, promosi, dan rekomendasi. Analisis semacam ini meningkatkan strategi bisnis dengan mengungkap tren tersembunyi dalam data transaksi.

Algoritma Apriori adalah metode populer untuk menambang aturan asosiasi ini karena kesederhanaan dan hasilnya yang praktis. Berbeda dengan metode lain yang kompleks, Apriori langsung dan mudah dipahami, sehingga cocok untuk pemula serta efektif di aplikasi dunia nyata.

Artikel ini menjelaskan algoritma Apriori, menggambarkan alurnya dengan contoh yang jelas, dan menunjukkan cara menggunakannya secara efektif. Jika Anda ingin praktik langsung dengan konsep machine learning, lihat Machine Learning Scientist in Python career track kami.

Apa itu Algoritma Apriori?

Seperti yang akan Anda temukan dari Tutorial Association Rule Mining in Python kami, Apriori adalah algoritma yang dirancang untuk mengekstrak himpunan item sering (frequent itemsets) dari basis data transaksional dan menghasilkan aturan asosiasi. Algoritma ini didasarkan pada prinsip bahwa jika suatu itemset sering muncul, maka semua subset-nya juga harus sering. Asumsi ini membantu mengurangi jumlah kemungkinan itemset yang perlu diperiksa, sehingga proses menjadi efisien.

Itemset dan transaksi

Dataset untuk Apriori biasanya terdiri dari transaksi, di mana setiap transaksi adalah kumpulan item yang dibeli bersamaan. Misalnya, data penjualan supermarket dapat berisi transaksi seperti:

Susu, Roti, Mentega
Susu, Popok, Bir, Roti
Popok, Bir, Mentega

Setiap transaksi ini mewakili keranjang item yang dibeli dalam satu kali pembelian. Kursus Market Basket Analysis in Python kami membahas lebih detail tentang penerapan konsep ini di Python.

Support, confidence, dan lift

Penambangan aturan asosiasi bergantung pada tiga metrik utama:

Support: Frekuensi kemunculan suatu item dalam dataset. Dihitung sebagai:

Confidence: Kemungkinan item B dibeli ketika item A dibeli, diberikan oleh:

Lift: Kekuatan suatu aturan, mengukur seberapa jauh item B lebih mungkin dibeli ketika item A dibeli dibandingkan saat dibeli secara independen:

Nilai lift lebih dari 1 menunjukkan asosiasi positif yang kuat antar item.

Cara Kerja Algoritma Apriori

Mari kita lihat bagaimana algoritma Apriori bekerja.

Proses langkah demi langkah

Membuat kandidat itemset: Algoritma dimulai dengan mengidentifikasi item individual dan menghitung kemunculannya untuk menentukan item yang sering.
Pemangkasan berdasarkan minimum support: Itemset yang muncul kurang dari ambang support minimum dihapus.
Menghasilkan itemset sering: Algoritma membentuk itemset yang lebih besar dengan menggabungkan itemset kecil yang sering, mengiterasi hingga tidak ada lagi itemset sering yang dapat dibentuk.
Menurunkan aturan asosiasi: Algoritma mengekstrak aturan berdasarkan nilai confidence dan lift untuk menentukan hubungan yang bermakna.

Contoh langkah kerja

Pertimbangkan dataset dengan transaksi:

Susu, Roti
Susu, Mentega
Susu, Roti, Mentega
Roti, Mentega

Dengan minimum support 50%, algoritma mengidentifikasi itemset sering dan mengekstrak aturan seperti:

Susu → Roti: Confidence: 66,7%
Roti → Mentega: Confidence: 66,7%

Aturan-aturan ini membantu bisnis memahami perilaku pembelian dan mengoptimalkan persediaan.

Mengimplementasikan Algoritma Apriori di Python

Pada bagian ini, Anda mempelajari cara mengimplementasikan algoritma Apriori di Python.

Menyiapkan lingkungan

Untuk menggunakan Apriori di Python, pasang pustaka yang diperlukan:

pip install mlxtend pandas

Memuat dan menyiapkan data

Langkah berikutnya adalah memuat paket dan menyiapkan data:

import pandas as pd
from mlxtend.frequent_patterns import apriori, association_rules

# Expanded dataset
data = {
    'Milk': [1, 1, 0, 1, 0, 1, 0, 1, 1, 0],
    'Bread': [1, 0, 1, 1, 1, 0, 1, 0, 1, 1],
    'Butter': [0, 1, 1, 1, 1, 1, 0, 1, 1, 0],
    'Eggs': [1, 0, 0, 1, 1, 1, 1, 0, 0, 1],
    'Cheese': [0, 1, 1, 0, 1, 1, 0, 1, 0, 1],
    'Diaper': [0, 1, 0, 1, 0, 1, 1, 1, 0, 0],
    'Beer': [1, 0, 1, 0, 1, 0, 1, 0, 1, 1]
}
df = pd.DataFrame(data)

Menerapkan algoritma Apriori

Berikutnya, terapkan algoritmanya.

# Generating frequent itemsets
frequent_itemsets = apriori(df, min_support=0.5, use_colnames=True)

Lalu, kita memperoleh aturan asosiasi:

# Generating frequent itemsets
frequent_itemsets = apriori(df, min_support=0.5, use_colnames=True)

# Generating association rules
rules = association_rules(frequent_itemsets, metric='confidence', min_threshold=0.6)
print(rules[['antecedents', 'consequents', 'support', 'confidence', 'lift']])
 antecedents consequents  support  confidence      lift
0    (Butter)      (Milk)      0.5    0.714286  1.190476
1      (Milk)    (Butter)      0.5    0.833333  1.190476
2     (Bread)      (Eggs)      0.5    0.714286  1.190476
3      (Eggs)     (Bread)      0.5    0.833333  1.190476
4     (Bread)      (Beer)      0.6    0.857143  1.428571
5      (Beer)     (Bread)      0.6    1.000000  1.428571
6    (Butter)    (Cheese)      0.5    0.714286  1.190476
7    (Cheese)    (Butter)      0.5    0.833333  1.190476

Nilai support (0,5 hingga 0,6) menunjukkan bahwa asosiasi ini muncul dalam 50–60% dari seluruh transaksi.

Skor confidence (0,71 hingga 1,0) menunjukkan keandalan aturan, dengan beberapa aturan seperti Bir → Roti yang pasti (confidence 100%).

Nilai lift (~1,2 hingga 1,4) menunjukkan asosiasi yang moderat namun bermakna, mengindikasikan pasangan item ini muncul bersama sedikit lebih sering daripada kebetulan acak.

Menginterpretasikan hasil

Untuk lebih memahami aturan asosiasi yang dihasilkan oleh algoritma Apriori, kita dapat memvisualisasikannya menggunakan Matplotlib. Scatter plot membantu menelaah hubungan antara confidence dan lift, sementara heatmap menunjukkan support untuk berbagai kombinasi item.

import matplotlib.pyplot as plt
import networkx as nx
# Scatter plot of confidence vs lift
plt.figure(figsize=(8,6))
plt.scatter(rules['confidence'], rules['lift'], alpha=0.7, color='b')
plt.xlabel('Confidence')
plt.ylabel('Lift')
plt.title('Confidence vs Lift in Association Rules')
plt.grid()
plt.show()
# Visualizing association rules as a network graph
G = nx.DiGraph()
for _, row in rules.iterrows():
    G.add_edge(tuple(row['antecedents']), tuple(row['consequents']), weight=row['confidence'])
plt.figure(figsize=(10, 6))
pos = nx.spring_layout(G)
nx.draw(G, pos, with_labels=True, node_color='lightblue', edge_color='gray', node_size=3000, font_size=10)
edge_labels = {(tuple(row['antecedents']), tuple(row['consequents'])): f"{row['confidence']:.2f}" 
               for _, row in rules.iterrows()}
nx.draw_networkx_edge_labels(G, pos, edge_labels=edge_labels)

plt.title("Association Rules Network")
plt.show()

Scatter plot membantu mengidentifikasi aturan dengan hubungan yang kuat, sementara grafik jaringan merepresentasikan secara visual bagaimana item berbeda saling terkait. Wawasan ini memandu pengambilan keputusan di ritel, rekomendasi, dan deteksi kecurangan.

Scatter plot menunjukkan hubungan antara confidence dan lift untuk aturan asosiasi yang dihasilkan. Pengamatan utama adalah:

Titik data tersebar pada rentang confidence 0,7 hingga 1,0.
Nilai lift sebagian besar berada di antara 1,19 dan 1,43, menunjukkan bahwa aturan yang diidentifikasi memberikan tingkat asosiasi yang bermakna, meskipun tidak sangat kuat.
Nilai confidence 1,0 dengan lift 1,43 (Bir → Roti) menunjukkan bahwa setiap kali bir dibeli, roti selalu ada dalam transaksi, menjadikannya aturan yang sangat andal.

Grafik jaringan merepresentasikan secara visual asosiasi antar berbagai item:

Susu dan Mentega memiliki asosiasi kuat, artinya pelanggan yang membeli salah satunya cenderung membeli yang lain.
Roti dan Telur memiliki hubungan serupa, menunjukkan pola pembelian umum.
Bir dan Roti menunjukkan confidence terkuat (1,0), artinya pada semua transaksi yang memuat Bir, Roti selalu hadir.

Aplikasi Algoritma Apriori

Bisnis secara luas menerapkan algoritma Apriori untuk menyelesaikan berbagai masalah. Mari kita temukan di bawah ini.

Market basket analysis

Pengecer menggunakan Apriori untuk menganalisis pola pembelian, membantu mereka menata produk guna mendorong pembelian gabungan. Misalnya, jika roti dan mentega sering muncul bersama, toko dapat menempatkannya berdekatan untuk meningkatkan penjualan. Pelajari lebih lanjut tentang market basket analysis dari tutorial market basket analysis menggunakan R kami.

Sistem rekomendasi

Platform online menggunakan Apriori untuk menyarankan produk berdasarkan pembelian sebelumnya. Jika pelanggan membeli laptop, rekomendasi mungkin mencakup aksesori seperti tetikus atau papan ketik.

Deteksi anomali

Dalam deteksi kecurangan, Apriori mengidentifikasi transaksi tidak biasa dengan membandingkannya dengan pola yang diharapkan. Jika transaksi kartu kredit menyimpang secara signifikan dari aturan yang sudah mapan, hal tersebut dapat memicu pemeriksaan keamanan. Dalam deteksi anomali, meskipun Apriori tidak digunakan secara langsung untuk mengidentifikasi anomali, algoritma ini dapat membantu mendeteksi kombinasi item yang jarang atau tidak terduga yang menyimpang secara signifikan dari pola pembelian umum.

Kelebihan dan Keterbatasan

Ada beberapa kelebihan dan kekurangan dalam menggunakan algoritma Apriori, seperti yang akan Anda temukan di bawah ini.

Kelebihan

Apriori mudah dipahami dan efektif untuk menemukan itemset sering dalam dataset terstruktur. Algoritma ini banyak digunakan di industri seperti ritel dan layanan kesehatan untuk penemuan pola.

Keterbatasan

Algoritma menjadi lambat saat bekerja dengan dataset besar karena menghasilkan banyak kandidat itemset. Dalam kasus dengan volume data tinggi, metode alternatif seperti FP-Growth menawarkan kinerja yang lebih baik.

Kesimpulan

Apriori tetap menjadi salah satu teknik paling berguna untuk menemukan asosiasi dalam data. Terlepas dari tantangan komputasinya, algoritma ini memberikan wawasan berharga yang digunakan bisnis untuk meningkatkan pengalaman pelanggan dan meningkatkan penjualan.

Meskipun mungkin bukan pendekatan tercepat untuk dataset besar, Apriori tetap menjadi alat penting di bidang penambangan data, analitik, dan machine learning. Untuk mempelajari lebih lanjut, jelajahi machine learning dengan Python dan capai tujuan menjadi machine learning scientist melalui Machine Learning Scientist in Python career track kami.

Untuk apa algoritma Apriori digunakan?

Bagaimana cara kerja algoritma Apriori?

Apa itu support, confidence, dan lift dalam Apriori?

Apa keterbatasan algoritma Apriori?

Apa perbedaan antara Apriori dan FP-Growth?

Topik

Machine Learning

Python

Kursus Teratas DataCamp

Program

Dasar-Dasar Pembelajaran Mesin dalam Python

16 Hr

Pelajari seni Machine Learning dan kuasai prediksi, pengenalan pola, serta dasar-dasar Deep Learning dan Reinforcement Learning.

Lihat Detail

Mulai Kursus

Program

Ilmuwan Pembelajaran Mesin dalam Python

85 Hr

Pelajari machine learning dengan Python dan mulailah perjalanan Anda untuk menjadi seorang ilmuwan machine learning. Jelajahi pembelajaran terawasi, pembelajaran tanpa pengawasan, dan pembelajaran mendalam.

Lihat Detail

Mulai Kursus

Kursus

Machine Learning untuk Bisnis

2 Hr

46.7K

Pahami dasar-dasar Machine Learning dan bagaimana penerapannya di dunia bisnis.

Lihat Detail

Mulai Kursus

Lihat Lebih Banyak

Terkait

blogs

Tutorial Korelasi di R

Dapatkan pengenalan dasar-dasar korelasi di R: pelajari lebih lanjut tentang koefisien korelasi, matriks korelasi, plotting korelasi, dan sebagainya.

David Woods

13 mnt

blogs

Spaghetti Plot dan Jalur Badai

Temukan alasan mengapa Anda sebaiknya (tidak) menggunakan spaghetti plot untuk menyampaikan ketidakpastian jalur prediksi badai serta dampaknya terhadap interpretasi.

Hugo Bowne-Anderson

13 mnt

blogs

40 Pertanyaan Wawancara DBMS Teratas di 2026

Kuasai pertanyaan wawancara basis data, dari konsep SQL dasar hingga skenario desain sistem tingkat lanjut. Panduan mendalam ini mencakup semua yang Anda perlukan untuk sukses di wawancara DBMS dan meraih peran berikutnya.

Dario Radečić

15 mnt

blogs

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Artikel ini menyajikan daftar alternatif ChatGPT yang akan meningkatkan produktivitas Anda.

Javier Canales Luna

14 mnt

Lihat Lebih Banyak Lihat Lebih Banyak

Apa itu Algoritma Apriori?

Itemset dan transaksi

Support, confidence, dan lift

Cara Kerja Algoritma Apriori

Proses langkah demi langkah

Contoh langkah kerja

Mengimplementasikan Algoritma Apriori di Python

Menyiapkan lingkungan

Memuat dan menyiapkan data

Menerapkan algoritma Apriori

Menginterpretasikan hasil

Aplikasi Algoritma Apriori

Market basket analysis

Sistem rekomendasi

Deteksi anomali

Kelebihan dan Keterbatasan

Kelebihan

Keterbatasan

Kesimpulan

FAQ Algoritma Apriori

Apa itu support, confidence, dan lift dalam Apriori?

Apa keterbatasan algoritma Apriori?

Apa perbedaan antara Apriori dan FP-Growth?

Tutorial Korelasi di R

Spaghetti Plot dan Jalur Badai

40 Pertanyaan Wawancara DBMS Teratas di 2026

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Dasar-Dasar Pembelajaran Mesin dalam Python

Ilmuwan Pembelajaran Mesin dalam Python

Machine Learning untuk Bisnis

Tutorial Korelasi di R

Spaghetti Plot dan Jalur Badai

40 Pertanyaan Wawancara DBMS Teratas di 2026

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Dasar-Dasar Pembelajaran Mesin dalam Python