Lewati ke konten utama

Rekayasa Konteks: Panduan dengan Contoh

Pelajari apa itu rekayasa konteks, cara kerjanya, beberapa kegagalan konteks yang umum, dan cara menguranginya.
Diperbarui 12 Mei 2026  · 6 mnt baca

Anda mungkin mahir membuat prompt, tetapi seiring percakapan berlangsung, chatbot Anda sering melupakan bagian paling awal dan terpenting dari instruksi Anda, asisten kode Anda kehilangan jejak arsitektur proyek, dan alat RAG Anda tidak dapat menghubungkan informasi lintas dokumen dan domain yang kompleks.

Seiring kasus penggunaan AI menjadi semakin kompleks, menulis prompt yang cerdas hanyalah satu bagian kecil dari tantangan yang jauh lebih besar: rekayasa konteks.

Dalam tutorial ini, saya akan menjelaskan apa itu rekayasa konteks, cara kerjanya, kapan menggunakannya alih-alih rekayasa prompt biasa, serta teknik-teknik praktis yang membuat sistem AI lebih cerdas dan lebih peka konteks.

Jika Anda lebih suka mengikuti lewat video, lihat pelajaran ini:

Apa Itu Rekayasa Konteks?

Rekayasa konteks adalah praktik merancang sistem yang memutuskan informasi apa yang dilihat model AI sebelum menghasilkan respons.

Meskipun istilahnya baru, prinsip di balik rekayasa konteks telah ada cukup lama. Abstraksi baru ini memungkinkan kita menalar isu paling penting dan selalu hadir: merancang alur informasi yang masuk dan keluar dari sistem AI.

Alih-alih menulis prompt sempurna untuk setiap permintaan, Anda membuat sistem yang mengumpulkan detail relevan dari berbagai sumber dan menyusunnya dalam jendela konteks model. Artinya, sistem Anda menggabungkan riwayat percakapan, data pengguna, dokumen eksternal, dan alat yang tersedia, lalu memformatnya agar dapat diproses oleh model.

What is context engineering diagram

Sumber: 12-factor-agents

Pendekatan ini memerlukan pengelolaan beberapa jenis informasi berbeda yang membentuk konteks penuh:

  • Instruksi sistem yang menetapkan perilaku dan aturan
  • Riwayat percakapan dan preferensi pengguna
  • Informasi yang diambil dari dokumen atau basis data
  • Alat yang tersedia beserta definisinya
  • Format dan skema keluaran terstruktur
  • Data waktu nyata dan respons API eksternal

Tantangan utama adalah bekerja dalam keterbatasan jendela konteks sambil mempertahankan percakapan yang koheren dari waktu ke waktu. Sistem Anda perlu memutuskan apa yang paling relevan untuk setiap permintaan, yang biasanya berarti membangun sistem pengambilan yang menemukan detail tepat saat Anda membutuhkannya.

Ini melibatkan pembuatan sistem memori yang melacak alur percakapan jangka pendek dan preferensi pengguna jangka panjang, serta menghapus informasi usang untuk memberi ruang bagi kebutuhan saat ini.

Manfaat nyata muncul ketika berbagai jenis konteks bekerja bersama untuk menciptakan sistem AI yang terasa lebih cerdas dan lebih sadar. Ketika asisten AI Anda dapat merujuk percakapan sebelumnya, mengakses kalender Anda, dan memahami gaya komunikasi Anda secara bersamaan, interaksi tidak lagi terasa berulang dan mulai terasa seperti Anda bekerja dengan sesuatu yang mengingat Anda.

Rekayasa Konteks vs. Rekayasa Prompt

Jika Anda meminta ChatGPT untuk “menulis email profesional,” itu adalah rekayasa prompt — Anda menulis instruksi untuk satu tugas. Namun jika Anda membangun bot layanan pelanggan yang perlu mengingat tiket sebelumnya, mengakses detail akun pengguna, dan mempertahankan riwayat percakapan di banyak interaksi, itu adalah rekayasa konteks.

Andrej Karpathy menjelaskan ini dengan baik:

Orang mengasosiasikan prompt dengan deskripsi tugas singkat yang Anda berikan kepada LLM dalam penggunaan sehari-hari. Padahal, di setiap aplikasi LLM kelas industri, rekayasa konteks adalah seni dan ilmu yang cermat untuk mengisi jendela konteks dengan informasi yang tepat untuk langkah berikutnya.

Andrej Karpathy

Sebagian besar aplikasi AI menggunakan baik rekayasa prompt maupun rekayasa konteks. Anda tetap memerlukan prompt yang ditulis dengan baik di dalam sistem rekayasa konteks Anda. Bedanya, prompt tersebut kini bekerja dengan informasi latar yang dikelola cermat alih-alih selalu mulai dari nol.

Pendekatan

Terbaik Digunakan Untuk

Rekayasa Prompt

Tugas sekali jalan, pembuatan konten, keluaran dengan format spesifik

Rekayasa Konteks

AI percakapan, alat analisis dokumen, asisten coding

Keduanya Bersama

Aplikasi AI produksi yang membutuhkan kinerja konsisten dan andal

Rekayasa Konteks dalam Praktik

Rekayasa konteks bergerak dari teori ke realitas ketika Anda mulai membangun aplikasi AI yang perlu bekerja dengan informasi yang kompleks dan saling terhubung. Pertimbangkan bot layanan pelanggan yang perlu mengakses tiket dukungan sebelumnya, memeriksa status akun, dan merujuk dokumentasi produk, sembari tetap menjaga nada percakapan yang membantu. Di sinilah pendekatan prompt tradisional gagal dan rekayasa konteks menjadi perlu.

Sistem RAG

Rekayasa konteks dapat dikatakan dimulai dengan retrieval augmented generation (RAG). RAG adalah salah satu teknik pertama yang memungkinkan Anda memperkenalkan LLM pada informasi yang tidak termasuk dalam data pelatihan awalnya.

Sistem RAG menggunakan teknik rekayasa konteks tingkat lanjut untuk mengatur dan menyajikan informasi secara lebih efektif. Mereka memecah dokumen menjadi bagian bermakna, memberi peringkat informasi berdasarkan relevansi, dan memasukkan detail paling berguna dalam batas token.

Sebelum RAG, jika Anda ingin AI menjawab pertanyaan tentang dokumen internal perusahaan Anda, Anda harus melatih ulang atau melakukan fine-tune seluruh model. RAG mengubah ini dengan membangun sistem yang dapat menelusuri dokumen Anda, menemukan potongan relevan, dan memasukkannya ke jendela konteks bersamaan dengan pertanyaan Anda.

Ini berarti LLM tiba-tiba dapat menganalisis banyak dokumen dan sumber untuk menjawab pertanyaan kompleks yang biasanya mengharuskan manusia membaca ratusan halaman.

Agen AI

Sistem RAG membuka pintu untuk informasi eksternal, tetapi agen AI melangkah lebih jauh dengan membuat konteks menjadi dinamis dan responsif. Alih-alih hanya mengambil dokumen statis, agen menggunakan alat eksternal selama percakapan.

AI memutuskan alat mana yang paling tepat menyelesaikan masalah saat ini. Seorang agen dapat memulai percakapan, menyadari ia membutuhkan data saham terkini, memanggil API finansial, lalu menggunakan informasi segar itu untuk melanjutkan percakapan.

Turunnya biaya token LLM juga memungkinkan sistem multi-agen. Alih-alih memaksakan semuanya ke jendela konteks satu model, Anda dapat memiliki agen-agen khusus yang menangani aspek berbeda dari suatu masalah dan saling berbagi informasi melalui protokol seperti A2A atau MCP.

Untuk mempelajari lebih lanjut tentang agen AI, lihat lembar contekan agen AI ini.

Asisten coding AI

Asisten coding AI—seperti Cursor atau Windsurf—merupakan salah satu penerapan rekayasa konteks paling maju karena menggabungkan prinsip RAG dan agen sekaligus bekerja dengan informasi yang sangat terstruktur dan saling terhubung.

Sistem ini perlu memahami bukan hanya file individual, tetapi juga seluruh arsitektur proyek, ketergantungan antarmodul, dan pola pengodean di seluruh basis kode Anda.

Ketika Anda meminta asisten coding untuk merapikan (refactor) sebuah fungsi, ia memerlukan konteks tentang di mana fungsi itu digunakan, tipe data yang diharapkan, dan bagaimana perubahan dapat memengaruhi bagian lain dari proyek Anda.

Rekayasa konteks menjadi krusial di sini karena kode memiliki relasi yang melintasi banyak file bahkan banyak repositori. Asisten coding yang baik mempertahankan konteks tentang struktur proyek Anda, perubahan terbaru yang Anda buat, gaya pengodean Anda, dan kerangka kerja yang Anda gunakan.

Inilah mengapa alat seperti Cursor bekerja lebih baik semakin lama Anda menggunakannya dalam sebuah proyek. Mereka membangun konteks tentang basis kode spesifik Anda dan dapat memberikan saran yang lebih relevan berdasarkan pola dan preferensi Anda.

Kegagalan Konteks dan Teknik untuk Menguranginya

Saat membaca artikel ini, Anda mungkin berpikir bahwa rekayasa konteks tidak perlu atau akan menjadi tidak perlu dalam waktu dekat karena jendela konteks model terdepan terus bertambah. Ini asumsi yang wajar karena jika konteks cukup besar, Anda bisa saja memasukkan semuanya ke dalam prompt (alat, dokumen, instruksi, dan lainnya) dan membiarkan model mengurus sisanya.

Namun, artikel yang sangat baik ini yang ditulis oleh Drew Breunig menunjukkan empat cara mengejutkan bagaimana konteks bisa lepas kendali, bahkan ketika model yang dimaksud mendukung jendela konteks 1 juta token. Pada bagian ini, saya akan dengan cepat menjelaskan masalah yang diuraikan oleh Drew Breunig dan pola rekayasa konteks yang menyelesaikannya—saya sangat merekomendasikan membaca artikel Breunig untuk detail lebih lanjut.

Peracunan konteks

Peracunan konteks terjadi ketika sebuah halusinasi atau kesalahan masuk ke dalam konteks sistem AI Anda dan kemudian dirujuk berulang kali dalam respons di masa mendatang. Tim DeepMind mengidentifikasi masalah ini dalam laporan teknis Gemini 2.5 saat membangun agen yang memainkan Pokémon. Ketika agen sesekali berhalusinasi tentang status permainan, informasi palsu ini meracuni bagian “tujuan” dari konteksnya, menyebabkan agen mengembangkan strategi yang tidak masuk akal dan mengejar tujuan yang mustahil dalam waktu lama.

Masalah ini menjadi sangat buruk dalam alur kerja agen di mana informasi menumpuk. Setelah konteks yang teracuni terbentuk, butuh waktu lama untuk memperbaikinya karena model terus merujuk informasi palsu seolah-olah benar.

Perbaikan terbaik adalah validasi dan karantina konteks. Anda dapat mengisolasi berbagai jenis konteks dalam thread terpisah dan memvalidasi informasi sebelum ditambahkan ke memori jangka panjang. Karantina konteks berarti memulai thread baru saat Anda mendeteksi potensi peracunan, yang mencegah informasi buruk menyebar ke interaksi selanjutnya.

Gangguan konteks

Gangguan konteks terjadi ketika konteks Anda tumbuh begitu besar sehingga model mulai terlalu fokus pada riwayat yang menumpuk alih-alih menggunakan apa yang dipelajarinya saat pelatihan. Agen Gemini yang memainkan Pokémon menunjukkan ini — begitu konteks melampaui 100.000 token, agen mulai mengulangi tindakan dari sejarahnya yang luas daripada mengembangkan strategi baru.

Sebuah studi Databricks (studi yang sangat menarik; sangat layak dibaca) menemukan bahwa ketepatan model mulai turun sekitar 32.000 token untuk Llama 3.1 405b, dengan model yang lebih kecil mencapai batasnya jauh lebih awal. Ini berarti model mulai membuat kesalahan jauh sebelum jendela konteks benar-benar penuh, yang membuat kita mempertanyakan nilai sebenarnya dari jendela konteks yang sangat besar untuk tugas penalaran kompleks.

Sumber: Databricks

Pendekatan terbaik adalah peringkasan konteks. Alih-alih membiarkan konteks tumbuh tanpa batas, Anda dapat memadatkan informasi yang terkumpul menjadi ringkasan lebih pendek yang mempertahankan detail penting sambil menghapus riwayat yang redundan. Ini membantu ketika Anda mencapai ambang gangguan — Anda dapat merangkum percakapan sejauh ini dan memulai kembali sambil menjaga konsistensi.

Kebingungan konteks

Kebingungan konteks terjadi ketika Anda menyertakan informasi tambahan dalam konteks yang kemudian digunakan model untuk menghasilkan respons buruk, meskipun informasi itu tidak relevan dengan tugas saat ini. Papan Peringkat Function-Calling Berkeley menunjukkan hal ini — setiap model berkinerja lebih buruk ketika diberi lebih dari satu alat, dan model terkadang memanggil alat yang tidak ada hubungannya dengan tugas.

Masalahnya semakin buruk pada model yang lebih kecil dan semakin banyak alat. Sebuah studi terbaru menemukan bahwa Llama 3.1 8b yang di-kuantisasi gagal pada benchmark GeoEngine ketika diberi semua 46 alat yang tersedia, meski konteks masih jauh di dalam batas jendela 16k. Namun ketika peneliti hanya memberikan 19 alat pada model yang sama, hasilnya baik.

Solusinya adalah pengelolaan perbekalan alat menggunakan teknik RAG. Riset oleh Tiantian Gan dan Qiyao Sun menunjukkan bahwa menerapkan RAG pada deskripsi alat benar-benar dapat meningkatkan kinerja. Dengan menyimpan deskripsi alat dalam sebuah basis data vektor, Anda dapat memilih hanya alat yang paling relevan untuk setiap tugas. Studi mereka menemukan bahwa menjaga pilihan alat di bawah 30 alat memberikan akurasi pemilihan alat tiga kali lebih baik dan prompt yang jauh lebih pendek.

Benturan konteks

Benturan konteks terjadi ketika Anda mengumpulkan informasi dan alat dalam konteks yang secara langsung bertentangan dengan informasi lain yang sudah ada. Sebuah studi Microsoft dan Salesforce menunjukkan hal ini dengan mengambil prompt benchmark dan “membagi” informasinya ke beberapa giliran percakapan alih-alih memberikan semuanya sekaligus. Hasilnya besar — penurunan kinerja rata-rata 39%, dengan model o3 OpenAI turun dari 98,1 menjadi 64,1.

Sumber: Laban et. al, 2025

Masalah ini terjadi karena ketika informasi datang bertahap, konteks yang tersusun berisi upaya awal model untuk menjawab pertanyaan sebelum memiliki semua informasi. Jawaban awal yang keliru ini tetap berada dalam konteks dan memengaruhi model saat menghasilkan respons akhir.

Perbaikan terbaik adalah pemangkasan konteks dan offloading. Pemangkasan konteks berarti menghapus informasi yang usang atau bertentangan saat detail baru datang. Offloading konteks, seperti alat “think” Anthropic, memberi model ruang kerja terpisah untuk memproses informasi tanpa mengacaukan konteks utama. Pendekatan catatan coret ini dapat memberikan peningkatan hingga 54% pada benchmark agen khusus dengan mencegah kontradiksi internal mengacaukan penalaran.

Kesimpulan

Rekayasa konteks mewakili fase berikutnya dalam pengembangan AI, di mana fokus bergeser dari menyusun prompt sempurna ke membangun sistem yang mengelola aliran informasi dari waktu ke waktu. Kemampuan mempertahankan konteks yang relevan di banyak interaksi menentukan apakah AI Anda terasa cerdas atau hanya memberi respons sekali jalan yang bagus.

Teknik yang dibahas dalam tutorial ini — dari sistem RAG hingga validasi konteks dan pengelolaan alat — sudah digunakan dalam sistem produksi yang menangani jutaan pengguna.

Jika Anda membangun sesuatu yang lebih kompleks daripada sekadar pembuat konten sederhana, Anda mungkin memerlukan teknik rekayasa konteks. Kabar baiknya, Anda bisa mulai dari yang kecil dengan implementasi RAG dasar dan secara bertahap menambahkan manajemen memori dan alat yang lebih canggih sesuai kebutuhan yang berkembang.

Untuk belajar lebih lanjut, saya merekomendasikan sumber berikut:

FAQs

Kapan saya harus mulai menggunakan rekayasa konteks alih-alih hanya prompt?

Mulailah menggunakan rekayasa konteks saat AI Anda perlu mengingat hal-hal antar percakapan, bekerja dengan banyak sumber informasi, atau mempertahankan tugas yang berjalan lama. Jika Anda membangun sesuatu yang lebih kompleks daripada pembuat konten sederhana, Anda kemungkinan memerlukan teknik ini.

Apa perbedaan utama antara rekayasa konteks dan rekayasa prompt?

Rekayasa prompt berfokus pada penulisan instruksi untuk tugas tunggal, sementara rekayasa konteks merancang sistem yang mengelola aliran informasi di banyak interaksi. Rekayasa konteks membangun sistem memori dan pengambilan, sedangkan rekayasa prompt menyusun permintaan individual.

Bisakah saya menggunakan jendela konteks yang lebih besar alih-alih rekayasa konteks?

Jendela konteks yang lebih besar tidak menyelesaikan masalah inti. Riset menunjukkan kinerja model turun sekitar 32.000 token, bahkan dengan jendela berjuta token, karena gangguan dan kebingungan konteks. Anda tetap memerlukan teknik seperti peringkasan, pemangkasan, dan pemilihan informasi yang cerdas terlepas dari ukuran konteks.

Mengapa model AI berkinerja lebih buruk ketika saya memberikan lebih banyak alat atau informasi?

Ini disebut kebingungan konteks—model terdistraksi oleh informasi yang tidak relevan dan mungkin menggunakan alat yang tidak sesuai dengan tugas. Solusinya adalah pengelolaan perbekalan alat: gunakan teknik RAG untuk memilih hanya alat yang paling relevan untuk setiap tugas spesifik, dengan menjaga pilihan di bawah 30 alat.


Bex Tuychiev's photo
Author
Bex Tuychiev
LinkedIn

Saya adalah pembuat konten ilmu data dengan pengalaman lebih dari 2 tahun dan salah satu dengan jumlah pengikut terbesar di Medium. Saya suka menulis artikel mendetail tentang AI dan ML dengan sedikit gaya sarkastik karena harus ada sesuatu untuk membuatnya sedikit kurang membosankan. Saya telah menghasilkan lebih dari 130 artikel dan satu kursus DataCamp, dengan satu lagi sedang dalam proses. Konten saya telah dilihat oleh lebih dari 5 juta pasang mata, dengan 20 ribu di antaranya menjadi pengikut di Medium dan LinkedIn. 

Topik

Pelajari AI dengan kursus-kursus ini!

Kursus

Model AI yang Dapat Diskalakan dengan PyTorch Lightning

3 Hr
956
Optimalkan proyek AI Anda dengan membangun model modular dan menguasai optimasi lanjutan menggunakan PyTorch Lightning!
Lihat DetailRight Arrow
Mulai Kursus
Lihat Lebih BanyakRight Arrow