Rekayasa Konteks: Panduan dengan Contoh

Pelajari apa itu rekayasa konteks, cara kerjanya, beberapa kegagalan konteks yang umum, dan cara menguranginya.

Diperbarui 12 Mei 2026 · 6 mnt baca

Anda mungkin mahir membuat prompt, tetapi seiring percakapan berlangsung, chatbot Anda sering melupakan bagian paling awal dan terpenting dari instruksi Anda, asisten kode Anda kehilangan jejak arsitektur proyek, dan alat RAG Anda tidak dapat menghubungkan informasi lintas dokumen dan domain yang kompleks.

Seiring kasus penggunaan AI menjadi semakin kompleks, menulis prompt yang cerdas hanyalah satu bagian kecil dari tantangan yang jauh lebih besar: rekayasa konteks.

Dalam tutorial ini, saya akan menjelaskan apa itu rekayasa konteks, cara kerjanya, kapan menggunakannya alih-alih rekayasa prompt biasa, serta teknik-teknik praktis yang membuat sistem AI lebih cerdas dan lebih peka konteks.

Jika Anda lebih suka mengikuti lewat video, lihat pelajaran ini:

Apa Itu Rekayasa Konteks?

Rekayasa konteks adalah praktik merancang sistem yang memutuskan informasi apa yang dilihat model AI sebelum menghasilkan respons.

Meskipun istilahnya baru, prinsip di balik rekayasa konteks telah ada cukup lama. Abstraksi baru ini memungkinkan kita menalar isu paling penting dan selalu hadir: merancang alur informasi yang masuk dan keluar dari sistem AI.

Alih-alih menulis prompt sempurna untuk setiap permintaan, Anda membuat sistem yang mengumpulkan detail relevan dari berbagai sumber dan menyusunnya dalam jendela konteks model. Artinya, sistem Anda menggabungkan riwayat percakapan, data pengguna, dokumen eksternal, dan alat yang tersedia, lalu memformatnya agar dapat diproses oleh model.

Sumber: 12-factor-agents

Pendekatan ini memerlukan pengelolaan beberapa jenis informasi berbeda yang membentuk konteks penuh:

Instruksi sistem yang menetapkan perilaku dan aturan
Riwayat percakapan dan preferensi pengguna
Informasi yang diambil dari dokumen atau basis data
Alat yang tersedia beserta definisinya
Format dan skema keluaran terstruktur
Data waktu nyata dan respons API eksternal

Tantangan utama adalah bekerja dalam keterbatasan jendela konteks sambil mempertahankan percakapan yang koheren dari waktu ke waktu. Sistem Anda perlu memutuskan apa yang paling relevan untuk setiap permintaan, yang biasanya berarti membangun sistem pengambilan yang menemukan detail tepat saat Anda membutuhkannya.

Ini melibatkan pembuatan sistem memori yang melacak alur percakapan jangka pendek dan preferensi pengguna jangka panjang, serta menghapus informasi usang untuk memberi ruang bagi kebutuhan saat ini.

Manfaat nyata muncul ketika berbagai jenis konteks bekerja bersama untuk menciptakan sistem AI yang terasa lebih cerdas dan lebih sadar. Ketika asisten AI Anda dapat merujuk percakapan sebelumnya, mengakses kalender Anda, dan memahami gaya komunikasi Anda secara bersamaan, interaksi tidak lagi terasa berulang dan mulai terasa seperti Anda bekerja dengan sesuatu yang mengingat Anda.

Rekayasa Konteks vs. Rekayasa Prompt

Jika Anda meminta ChatGPT untuk “menulis email profesional,” itu adalah rekayasa prompt — Anda menulis instruksi untuk satu tugas. Namun jika Anda membangun bot layanan pelanggan yang perlu mengingat tiket sebelumnya, mengakses detail akun pengguna, dan mempertahankan riwayat percakapan di banyak interaksi, itu adalah rekayasa konteks.

Andrej Karpathy menjelaskan ini dengan baik:

Orang mengasosiasikan prompt dengan deskripsi tugas singkat yang Anda berikan kepada LLM dalam penggunaan sehari-hari. Padahal, di setiap aplikasi LLM kelas industri, rekayasa konteks adalah seni dan ilmu yang cermat untuk mengisi jendela konteks dengan informasi yang tepat untuk langkah berikutnya.
Andrej Karpathy

Sebagian besar aplikasi AI menggunakan baik rekayasa prompt maupun rekayasa konteks. Anda tetap memerlukan prompt yang ditulis dengan baik di dalam sistem rekayasa konteks Anda. Bedanya, prompt tersebut kini bekerja dengan informasi latar yang dikelola cermat alih-alih selalu mulai dari nol.

Pendekatan	Terbaik Digunakan Untuk
Rekayasa Prompt	Tugas sekali jalan, pembuatan konten, keluaran dengan format spesifik
Rekayasa Konteks	AI percakapan, alat analisis dokumen, asisten coding
Keduanya Bersama	Aplikasi AI produksi yang membutuhkan kinerja konsisten dan andal

Rekayasa Konteks dalam Praktik

Rekayasa konteks bergerak dari teori ke realitas ketika Anda mulai membangun aplikasi AI yang perlu bekerja dengan informasi yang kompleks dan saling terhubung. Pertimbangkan bot layanan pelanggan yang perlu mengakses tiket dukungan sebelumnya, memeriksa status akun, dan merujuk dokumentasi produk, sembari tetap menjaga nada percakapan yang membantu. Di sinilah pendekatan prompt tradisional gagal dan rekayasa konteks menjadi perlu.

Sistem RAG

Rekayasa konteks dapat dikatakan dimulai dengan retrieval augmented generation (RAG). RAG adalah salah satu teknik pertama yang memungkinkan Anda memperkenalkan LLM pada informasi yang tidak termasuk dalam data pelatihan awalnya.

Sistem RAG menggunakan teknik rekayasa konteks tingkat lanjut untuk mengatur dan menyajikan informasi secara lebih efektif. Mereka memecah dokumen menjadi bagian bermakna, memberi peringkat informasi berdasarkan relevansi, dan memasukkan detail paling berguna dalam batas token.

Sebelum RAG, jika Anda ingin AI menjawab pertanyaan tentang dokumen internal perusahaan Anda, Anda harus melatih ulang atau melakukan fine-tune seluruh model. RAG mengubah ini dengan membangun sistem yang dapat menelusuri dokumen Anda, menemukan potongan relevan, dan memasukkannya ke jendela konteks bersamaan dengan pertanyaan Anda.

Ini berarti LLM tiba-tiba dapat menganalisis banyak dokumen dan sumber untuk menjawab pertanyaan kompleks yang biasanya mengharuskan manusia membaca ratusan halaman.

Agen AI

Sistem RAG membuka pintu untuk informasi eksternal, tetapi agen AI melangkah lebih jauh dengan membuat konteks menjadi dinamis dan responsif. Alih-alih hanya mengambil dokumen statis, agen menggunakan alat eksternal selama percakapan.

AI memutuskan alat mana yang paling tepat menyelesaikan masalah saat ini. Seorang agen dapat memulai percakapan, menyadari ia membutuhkan data saham terkini, memanggil API finansial, lalu menggunakan informasi segar itu untuk melanjutkan percakapan.

Turunnya biaya token LLM juga memungkinkan sistem multi-agen. Alih-alih memaksakan semuanya ke jendela konteks satu model, Anda dapat memiliki agen-agen khusus yang menangani aspek berbeda dari suatu masalah dan saling berbagi informasi melalui protokol seperti A2A atau MCP.

Untuk mempelajari lebih lanjut tentang agen AI, lihat lembar contekan agen AI ini.

Asisten coding AI

Asisten coding AI—seperti Cursor atau Windsurf—merupakan salah satu penerapan rekayasa konteks paling maju karena menggabungkan prinsip RAG dan agen sekaligus bekerja dengan informasi yang sangat terstruktur dan saling terhubung.

Sistem ini perlu memahami bukan hanya file individual, tetapi juga seluruh arsitektur proyek, ketergantungan antarmodul, dan pola pengodean di seluruh basis kode Anda.

Ketika Anda meminta asisten coding untuk merapikan (refactor) sebuah fungsi, ia memerlukan konteks tentang di mana fungsi itu digunakan, tipe data yang diharapkan, dan bagaimana perubahan dapat memengaruhi bagian lain dari proyek Anda.

Rekayasa konteks menjadi krusial di sini karena kode memiliki relasi yang melintasi banyak file bahkan banyak repositori. Asisten coding yang baik mempertahankan konteks tentang struktur proyek Anda, perubahan terbaru yang Anda buat, gaya pengodean Anda, dan kerangka kerja yang Anda gunakan.

Inilah mengapa alat seperti Cursor bekerja lebih baik semakin lama Anda menggunakannya dalam sebuah proyek. Mereka membangun konteks tentang basis kode spesifik Anda dan dapat memberikan saran yang lebih relevan berdasarkan pola dan preferensi Anda.

Kegagalan Konteks dan Teknik untuk Menguranginya

Saat membaca artikel ini, Anda mungkin berpikir bahwa rekayasa konteks tidak perlu atau akan menjadi tidak perlu dalam waktu dekat karena jendela konteks model terdepan terus bertambah. Ini asumsi yang wajar karena jika konteks cukup besar, Anda bisa saja memasukkan semuanya ke dalam prompt (alat, dokumen, instruksi, dan lainnya) dan membiarkan model mengurus sisanya.

Namun, artikel yang sangat baik ini yang ditulis oleh Drew Breunig menunjukkan empat cara mengejutkan bagaimana konteks bisa lepas kendali, bahkan ketika model yang dimaksud mendukung jendela konteks 1 juta token. Pada bagian ini, saya akan dengan cepat menjelaskan masalah yang diuraikan oleh Drew Breunig dan pola rekayasa konteks yang menyelesaikannya—saya sangat merekomendasikan membaca artikel Breunig untuk detail lebih lanjut.

Peracunan konteks

Peracunan konteks terjadi ketika sebuah halusinasi atau kesalahan masuk ke dalam konteks sistem AI Anda dan kemudian dirujuk berulang kali dalam respons di masa mendatang. Tim DeepMind mengidentifikasi masalah ini dalam laporan teknis Gemini 2.5 saat membangun agen yang memainkan Pokémon. Ketika agen sesekali berhalusinasi tentang status permainan, informasi palsu ini meracuni bagian “tujuan” dari konteksnya, menyebabkan agen mengembangkan strategi yang tidak masuk akal dan mengejar tujuan yang mustahil dalam waktu lama.

Masalah ini menjadi sangat buruk dalam alur kerja agen di mana informasi menumpuk. Setelah konteks yang teracuni terbentuk, butuh waktu lama untuk memperbaikinya karena model terus merujuk informasi palsu seolah-olah benar.

Perbaikan terbaik adalah validasi dan karantina konteks. Anda dapat mengisolasi berbagai jenis konteks dalam thread terpisah dan memvalidasi informasi sebelum ditambahkan ke memori jangka panjang. Karantina konteks berarti memulai thread baru saat Anda mendeteksi potensi peracunan, yang mencegah informasi buruk menyebar ke interaksi selanjutnya.

Gangguan konteks

Gangguan konteks terjadi ketika konteks Anda tumbuh begitu besar sehingga model mulai terlalu fokus pada riwayat yang menumpuk alih-alih menggunakan apa yang dipelajarinya saat pelatihan. Agen Gemini yang memainkan Pokémon menunjukkan ini — begitu konteks melampaui 100.000 token, agen mulai mengulangi tindakan dari sejarahnya yang luas daripada mengembangkan strategi baru.

Sebuah studi Databricks (studi yang sangat menarik; sangat layak dibaca) menemukan bahwa ketepatan model mulai turun sekitar 32.000 token untuk Llama 3.1 405b, dengan model yang lebih kecil mencapai batasnya jauh lebih awal. Ini berarti model mulai membuat kesalahan jauh sebelum jendela konteks benar-benar penuh, yang membuat kita mempertanyakan nilai sebenarnya dari jendela konteks yang sangat besar untuk tugas penalaran kompleks.

Sumber: Databricks

Pendekatan terbaik adalah peringkasan konteks. Alih-alih membiarkan konteks tumbuh tanpa batas, Anda dapat memadatkan informasi yang terkumpul menjadi ringkasan lebih pendek yang mempertahankan detail penting sambil menghapus riwayat yang redundan. Ini membantu ketika Anda mencapai ambang gangguan — Anda dapat merangkum percakapan sejauh ini dan memulai kembali sambil menjaga konsistensi.

Kebingungan konteks

Kebingungan konteks terjadi ketika Anda menyertakan informasi tambahan dalam konteks yang kemudian digunakan model untuk menghasilkan respons buruk, meskipun informasi itu tidak relevan dengan tugas saat ini. Papan Peringkat Function-Calling Berkeley menunjukkan hal ini — setiap model berkinerja lebih buruk ketika diberi lebih dari satu alat, dan model terkadang memanggil alat yang tidak ada hubungannya dengan tugas.

Masalahnya semakin buruk pada model yang lebih kecil dan semakin banyak alat. Sebuah studi terbaru menemukan bahwa Llama 3.1 8b yang di-kuantisasi gagal pada benchmark GeoEngine ketika diberi semua 46 alat yang tersedia, meski konteks masih jauh di dalam batas jendela 16k. Namun ketika peneliti hanya memberikan 19 alat pada model yang sama, hasilnya baik.

Solusinya adalah pengelolaan perbekalan alat menggunakan teknik RAG. Riset oleh Tiantian Gan dan Qiyao Sun menunjukkan bahwa menerapkan RAG pada deskripsi alat benar-benar dapat meningkatkan kinerja. Dengan menyimpan deskripsi alat dalam sebuah basis data vektor, Anda dapat memilih hanya alat yang paling relevan untuk setiap tugas. Studi mereka menemukan bahwa menjaga pilihan alat di bawah 30 alat memberikan akurasi pemilihan alat tiga kali lebih baik dan prompt yang jauh lebih pendek.

Benturan konteks

Benturan konteks terjadi ketika Anda mengumpulkan informasi dan alat dalam konteks yang secara langsung bertentangan dengan informasi lain yang sudah ada. Sebuah studi Microsoft dan Salesforce menunjukkan hal ini dengan mengambil prompt benchmark dan “membagi” informasinya ke beberapa giliran percakapan alih-alih memberikan semuanya sekaligus. Hasilnya besar — penurunan kinerja rata-rata 39%, dengan model o3 OpenAI turun dari 98,1 menjadi 64,1.

Sumber: Laban et. al, 2025

Masalah ini terjadi karena ketika informasi datang bertahap, konteks yang tersusun berisi upaya awal model untuk menjawab pertanyaan sebelum memiliki semua informasi. Jawaban awal yang keliru ini tetap berada dalam konteks dan memengaruhi model saat menghasilkan respons akhir.

Perbaikan terbaik adalah pemangkasan konteks dan offloading. Pemangkasan konteks berarti menghapus informasi yang usang atau bertentangan saat detail baru datang. Offloading konteks, seperti alat “think” Anthropic, memberi model ruang kerja terpisah untuk memproses informasi tanpa mengacaukan konteks utama. Pendekatan catatan coret ini dapat memberikan peningkatan hingga 54% pada benchmark agen khusus dengan mencegah kontradiksi internal mengacaukan penalaran.

Kesimpulan

Rekayasa konteks mewakili fase berikutnya dalam pengembangan AI, di mana fokus bergeser dari menyusun prompt sempurna ke membangun sistem yang mengelola aliran informasi dari waktu ke waktu. Kemampuan mempertahankan konteks yang relevan di banyak interaksi menentukan apakah AI Anda terasa cerdas atau hanya memberi respons sekali jalan yang bagus.

Teknik yang dibahas dalam tutorial ini — dari sistem RAG hingga validasi konteks dan pengelolaan alat — sudah digunakan dalam sistem produksi yang menangani jutaan pengguna.

Jika Anda membangun sesuatu yang lebih kompleks daripada sekadar pembuat konten sederhana, Anda mungkin memerlukan teknik rekayasa konteks. Kabar baiknya, Anda bisa mulai dari yang kecil dengan implementasi RAG dasar dan secara bertahap menambahkan manajemen memori dan alat yang lebih canggih sesuai kebutuhan yang berkembang.

Untuk belajar lebih lanjut, saya merekomendasikan sumber berikut:

Tutorial Cursor AI Code Editor — Pelajari bagaimana rekayasa konteks bekerja dalam praktik dengan asisten coding AI
Perbandingan Cursor vs. Windsurf—Pelajari perbedaan antara Cursor dan Windsurf
Asisten Coding AI Terbaik — Bandingkan berbagai alat dan pendekatan manajemen konteksnya
Kursus Retrieval Augmented Generation (RAG) dengan LangChain — Kursus praktis untuk membangun sistem RAG
Apa itu Retrieval Augmented Generation (RAG)? — Konsep dasar untuk rekayasa konteks
Tutorial Agentic RAG — Teknik lanjutan untuk manajemen konteks dinamis
Apa itu Rekayasa Prompt? — Memahami perbedaan antara rekayasa prompt dan konteks
Kursus Multi-Agent Systems dengan LangGraph—Pelajari cara membangun sistem multi-agen dengan LangGraph
Kursus Introduction to AI Agents — Membangun sistem yang menggunakan alat dan mempertahankan konteks dari waktu ke waktu

Kapan saya harus mulai menggunakan rekayasa konteks alih-alih hanya prompt?

Apa perbedaan utama antara rekayasa konteks dan rekayasa prompt?

Bisakah saya menggunakan jendela konteks yang lebih besar alih-alih rekayasa konteks?

Mengapa model AI berkinerja lebih buruk ketika saya memberikan lebih banyak alat atau informasi?

Author

Bex Tuychiev

Saya adalah pembuat konten ilmu data dengan pengalaman lebih dari 2 tahun dan salah satu dengan jumlah pengikut terbesar di Medium. Saya suka menulis artikel mendetail tentang AI dan ML dengan sedikit gaya sarkastik karena harus ada sesuatu untuk membuatnya sedikit kurang membosankan. Saya telah menghasilkan lebih dari 130 artikel dan satu kursus DataCamp, dengan satu lagi sedang dalam proses. Konten saya telah dilihat oleh lebih dari 5 juta pasang mata, dengan 20 ribu di antaranya menjadi pengikut di Medium dan LinkedIn.

Topik

Kecerdasan Buatan

AI Generatif

Pelajari AI dengan kursus-kursus ini!

Kursus

Model AI yang Dapat Diskalakan dengan PyTorch Lightning

3 Hr

1.1K

Optimalkan proyek AI Anda dengan membangun model modular dan menguasai optimasi lanjutan menggunakan PyTorch Lightning!

Lihat Detail

Mulai Kursus

Kursus

Deploying AI into Production with FastAPI

4 Hr

4.5K

Learn how to use FastAPI to develop APIs that support AI models, built to meet real-world demands.

Lihat Detail

Mulai Kursus

Kursus

Pengantar Agen Kecerdasan Buatan

1 Hr 30 Min

105.7K

Pelajari dasar-dasar agen AI, komponennya, serta penerapannya di dunia nyata — tanpa perlu coding.

Lihat Detail

Mulai Kursus

Lihat Lebih Banyak

Apa Itu Rekayasa Konteks?

Rekayasa Konteks vs. Rekayasa Prompt

Rekayasa Konteks dalam Praktik

Sistem RAG

Agen AI

Asisten coding AI

Kegagalan Konteks dan Teknik untuk Menguranginya

Peracunan konteks

Gangguan konteks

Kebingungan konteks

Benturan konteks

Kesimpulan

FAQs

Bisakah saya menggunakan jendela konteks yang lebih besar alih-alih rekayasa konteks?

Mengapa model AI berkinerja lebih buruk ketika saya memberikan lebih banyak alat atau informasi?

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}Model AI yang Dapat Diskalakan dengan PyTorch Lightning

Deploying AI into Production with FastAPI

Pengantar Agen Kecerdasan Buatan

Model AI yang Dapat Diskalakan dengan PyTorch Lightning