Lewati ke konten utama

Composer 2: Tolok Ukur, Harga, dan Perbandingannya

Model proprietari terbaru milik Cursor, Composer 2, memperkenalkan continued pretraining, self-summarization yang dilatih RL, dan penurunan besar pada harga token.
Diperbarui 17 Apr 2026  · 15 mnt baca

Cursor merilis Composer 2 pada 19 Maret 2026, generasi ketiga dari model pengodeannya yang bersifat proprietari. Rilis ini hadir hanya enam minggu setelah Composer 1.5, yang menskalakan reinforcement learning 20x pada model dasar yang sama tanpa mengubah arsitektur dasarnya. Peningkatan skala RL itu bahkan melampaui anggaran komputasi pretraining awal, yang menunjukkan upaya mendorong fondasi yang ada sejauh mungkin. Composer 2 mengambil pendekatan berbeda: melanjutkan pretraining terlebih dahulu untuk membangun basis yang lebih kuat, lalu RL di atasnya. Itulah mengapa lonjakan tolok ukur sebesar itu meskipun jedanya singkat.

Model ini juga hadir dengan jendela konteks 200.000 token dan dua varian harga: Standard seharga $0,50 per satu juta token input (sekitar 86% lebih murah daripada Composer 1.5) dan Fast untuk sesi interaktif waktu nyata.

Dalam artikel ini, kami akan membahas apa itu Composer 2, bagaimana perbandingannya dengan Composer 1.5 pada tolok ukur dan biaya, serta bagaimana posisinya dibandingkan Claude Opus 4.6 dan GPT-5.4. Kami juga akan menunjukkan cara menggunakannya di dalam Cursor serta keterbatasan yang diketahui.

Jika Anda tertarik dengan model frontier yang bersaing dengan Composer 2, lihat panduan kami untuk:

Apa Itu Composer?

Composer adalah keluarga model AI pengodean proprietari milik Cursor, dirancang untuk pengodean agentik di dalam Cursor IDE. Berbeda dengan model serbaguna seperti Claude Opus 4.6 atau GPT-5.4, model Composer dibuat khusus untuk pengeditan multi-berkas, eksekusi perintah terminal, dan refaktorisasi di seluruh basis kode. Model ini tidak ditujukan untuk menulis email, menjawab trivia, atau tugas non-kode apa pun.

Garis keturunannya dimulai dengan prototipe internal bernama Cheetah, lalu berkembang melalui tiga rilis publik:

Model

Tanggal Rilis

Inovasi Utama

Composer 1

29 Oktober 2025

Model in-house pertama; arsitektur MoE dengan pelatihan RL

Composer 1.5

9 Februari 2026

Komputasi RL 20x lebih besar pada basis yang sama; pemikiran adaptif; perkenalan self-summarization

Composer 2

19 Maret 2026

Sesi continued pretraining pertama yang menciptakan basis baru; self-summarization ditingkatkan; biaya jauh lebih rendah

Setiap generasi dibangun di atas generasi sebelumnya, namun Composer 2 menandai pergeseran arsitektur terbesar sejauh ini.

Garis waktu yang menunjukkan evolusi model Cursor Composer dari prototipe Cheetah hingga Composer 2 antara Oktober 2025 dan Maret 2026

Visualisasi garis waktu evolusi model Composer. Gambar oleh Penulis.

Apa Itu Composer 2?

Composer 2 adalah model pengodean agentik proprietari generasi ketiga dari Cursor, dan yang pertama dalam keluarga ini yang menjalani continued pretraining.

Arsitektur dan pendekatan pelatihan

Model Composer sebelumnya dibangun dengan menumpuk reinforcement learning di atas model dasar yang dibekukan. Anggap saja seperti mengajarkan keterampilan baru tanpa meningkatkan pemahaman fundamentalnya. Composer 2 mengubah ini dengan terlebih dahulu memperbarui bobot fundamental model dasar menggunakan data khusus pengodean, lalu menerapkan RL di atasnya.

Model ini menggunakan arsitektur Mixture-of-Experts (MoE), yang berarti hanya sebagian parameter model yang aktif untuk setiap input. Ini menjaga inferensi tetap cepat sambil mempertahankan jumlah parameter total yang besar. Cursor tidak memublikasikan jumlah parameter pastinya.

Identitas model dasar tidak diungkap saat peluncuran, namun menjadi publik pada 20 Maret 2026 setelah seorang pengguna menemukannya di header permintaan API. Lee Robinson, VP of Developer Education di Cursor, mengonfirmasi bahwa Composer 2 dibangun di atas Kimi K2.5, model open-source dari Moonshot AI. Ia mencatat bahwa sekitar tiga perempat dari total komputasi berasal dari pelatihan Cursor sendiri (continued pretraining dan RL), bukan dari model dasar, yang menurutnya menjelaskan mengapa hasil evaluasi terlihat berbeda dari hasil Kimi K2.5 mentah.

Moonshot AI kemudian mengonfirmasi pengaturan tersebut sebagai kemitraan komersial resmi melalui Fireworks AI, yang menangani infrastruktur pelatihan RL dan inferensi. Co-founder Aman Sanger mengatakan tim mengevaluasi beberapa model dasar menggunakan tolok ukur berbasis perplexity sebelum memilih Kimi K2.5, dan menggambarkan pelatihan pasca-basis sebagai continued pretraining yang diikuti dengan peningkatan skala komputasi RL sebesar 4x.

Infrastruktur pelatihan berjalan di PyTorch dan Ray, menggunakan kernel kuantisasi MXFP8 kustom yang dioptimalkan untuk GPU NVIDIA Blackwell.

Self-summarization

Self-summarization, atau yang disebut Cursor sebagai "compaction-in-the-loop RL," bekerja seperti ini: Saat jendela konteks 200.000 token milik model mulai terisi, model berhenti sejenak, memampatkan konteksnya sendiri menjadi sekitar 1.000 token, lalu melanjutkan pekerjaan. Karena perilaku kompresi ini menjadi bagian dari fungsi reward RL, model belajar variabel, keputusan arsitektur, dan log kesalahan mana yang perlu dipertahankan dan mana yang bisa diabaikan.

Blog riset Cursor melaporkan bahwa pendekatan ini mengurangi kesalahan kompaksi sebesar 50% dibandingkan ringkasan berbasis prompt sambil menggunakan sekitar seperlima jumlah token. Dalam demonstrasi praktis, Composer 2 memecahkan masalah "make-doom-for-mips" dari Terminal-Bench 2.0 dalam 170 giliran, sambil memampatkan lebih dari 100.000 token konteks.

Kemampuan inti

Selama sebuah sesi, Composer 2 memiliki akses ke:

  • Pencarian semantik di seluruh basis kode untuk menemukan kode relevan di sebuah proyek
  • Pembacaan, pengeditan, dan pembuatan multi-berkas dengan presisi pada tingkat baris
  • Eksekusi perintah terminal dengan interpretasi output
  • MCP (Model Context Protocol) untuk integrasi layanan eksternal
  • Alat peramban native untuk menguji perubahan UI langsung di editor

Secara bersama-sama, ini memungkinkan agen bekerja lintas banyak berkas dan langkah dalam satu sesi.

Varian Composer 2

Cursor menghadirkan Composer 2 dalam dua varian, keduanya berbagi kecerdasan yang sama.

Composer 2 Fast

Varian Fast adalah default saat Anda memilih Composer 2 di dropdown model. Varian ini dibangun untuk sesi interaktif berlatensi rendah ketika Anda ngoding secara real time dan menginginkan respons nyaris instan.

Composer 2 Standard

Varian Standard berjalan pada kecepatan lebih rendah tetapi biaya per token jauh lebih murah, menjadikannya lebih cocok untuk tugas latar belakang, refaktorisasi batch, atau loop agentik yang berjalan lama di mana Anda tidak memerlukan umpan balik segera.

Berikut rinciannya soal harga:

Varian

Input (per 1M token)

Baca Cache (per 1M token)

Output (per 1M token)

Composer 2 Standard

$0.50

$0.20

$2.50

Composer 2 Fast (default)

$1.50

$0.35

$7.50

Anda dapat menggunakan varian Fast saat aktif ngoding dan beralih ke Standard untuk operasi semalam atau dalam jumlah besar guna menekan konsumsi kredit. Kami akan membahas lebih jauh perbedaan harga nanti.

Tolok Ukur Composer 2

Cursor mengevaluasi Composer 2 pada tiga tolok ukur, masing-masing mencakup aspek berbeda dari performa pengodean.

Memahami tolok ukur

CursorBench adalah tolok ukur internal proprietari milik Cursor, saat ini pada versi CursorBench-3. Tugas-tugasnya berasal dari sesi Cursor nyata dan diambil menggunakan alat bernama Cursor Blame, yang melacak kode yang dikomit kembali ke permintaan agen yang menghasilkannya. Tolok ukur ini mengukur kebenaran solusi, kualitas kode, efisiensi, dan perilaku interaksi, serta ruang lingkup masalah kira-kira meningkat dua kali lipat dari versi awal ke CursorBench-3 dalam jumlah baris kode dan jumlah berkas. Cursor juga melengkapi CursorBench dengan eksperimen lalu lintas langsung terkontrol untuk menangkap regresi yang tidak dapat terlihat hanya dengan penilaian offline. Catatan jelasnya: CursorBench tidak dapat direproduksi secara publik, sehingga skor ini tidak dapat diverifikasi secara independen.

Terminal-Bench 2.0 dikelola oleh Laude Institute dan menguji kemampuan agen AI untuk melakukan tugas dunia nyata di lingkungan terminal. Ini mencakup navigasi direktori, menjalankan skrip, menafsirkan error, dan beriterasi menuju solusi. Cursor menggunakan kerangka evaluasi Harbor resmi dengan pengaturan default dan menjalankan lima iterasi per model, melaporkan nilai rata-ratanya.

SWE-bench Multilingual adalah subset SWE-bench yang menampilkan 300 tugas di 9 bahasa pemrograman. Ini mengukur kemampuan menyelesaikan isu GitHub nyata, menjadikannya uji yang masuk akal untuk pengodean lintas bahasa.

Hasil tolok ukur lintas generasi Composer

Skor meningkat di setiap generasi:

Tolok Ukur

Composer 1

Composer 1.5

Composer 2

CursorBench

38.0

44.2

61.3

Terminal-Bench 2.0

40.0

47.9

61.7

SWE-bench Multilingual

56.9

65.9

73.7

Bagan batang yang membandingkan skor CursorBench, Terminal-Bench 2.0, dan SWE-bench Multilingual di antara Composer 1, Composer 1.5, dan Composer 2

Skor tolok ukur di tiga generasi Composer. Gambar oleh Penulis.

Catatan tentang keterbatasan tolok ukur

  • CursorBench bersifat closed-source dan tidak dapat direproduksi secara independen. Cursor tidak memublikasikan skor pada tolok ukur mapan seperti SWE-bench Verified, yang menurut beberapa anggota komunitas tidak konsisten.
  • SWE-bench Verified tidak lagi dilaporkan oleh OpenAI setelah menemukan bahwa model frontier dapat mereproduksi patch uji dari memori dan hampir 60% masalah yang tidak terselesaikan memiliki pengujian yang cacat.
  • Terminal-Bench mencakup tugas bergaya teka-teki (seperti mencari langkah catur terbaik dari posisi papan) yang tidak mencerminkan pekerjaan pengembangan nyata. Namun ini tetap yang paling transparan di antara ketiganya karena menggunakan kerangka publik dengan metode evaluasi yang terdokumentasi.

Seberapa Jauh Peningkatan Composer 2 Dibandingkan Composer 1.5?

Peningkatan dari Composer 1.5 ke Composer 2 lebih besar daripada generasi sebelumnya, mencakup performa dan biaya.

Seperti terlihat pada tabel di atas, Composer 2 mencetak 61,3 pada CursorBench dibanding 44,2 milik Composer 1.5, kira-kira peningkatan 39%. Kesenjangan Terminal-Bench 2.0 sekitar 29% (61,7 dibanding 47,9), dan SWE-bench Multilingual meningkat sekitar 12% (73,7 dibanding 65,9).

Penurunan biaya lebih besar daripada kenaikan tolok ukur. Menurut blog peluncuran Cursor, Composer 2 Standard sekitar 86% lebih murah daripada Composer 1.5 pada token input dan sekitar 57% lebih murah bahkan pada varian Fast. Cursor belum memublikasikan halaman harga mandiri untuk Composer 1.5, jadi persentase ini berasal dari perbandingan Cursor sendiri saat peluncuran.

Perbedaan teknis kunci adalah:

  • Pendekatan pelatihan: Composer 1.5 menskalakan RL 20x lebih jauh pada basis yang dibekukan sama, dan komputasi RL pascapelatihan sebenarnya melampaui komputasi yang digunakan untuk pretraining model dasar itu sendiri. Composer 2 mengambil jalur berbeda: terlebih dahulu menciptakan basis baru yang lebih kuat melalui continued pretraining, lalu menerapkan peningkatan skala komputasi RL 4x di atasnya.
  • Kualitas self-summarization: Composer 1.5 memperkenalkan self-summarization namun menggunakan kompresi berbasis prompt dengan ribuan token instruksi, menghasilkan ringkasan rata-rata sekitar 5.000 token. Kompaksi yang dilatih RL pada Composer 2 menghasilkan sekitar 1.000 token dengan 50% lebih sedikit kesalahan dan juga menggunakan kembali KV cache dari token sebelumnya, sehingga menurunkan biaya inferensi lebih jauh.
  • Kemampuan long-horizon: Composer 2 menangani tugas yang memerlukan ratusan aksi berurutan. Seperti disebutkan sebelumnya, ini melampaui apa yang dapat dikelola 1.5 secara andal.

Penerimaan komunitas terhadap Composer 1.5 beragam. Beberapa pengembang menggambarkannya hanya berguna untuk tugas kecil seperti commit dan edit sederhana. Angka tolok ukur menunjukkan peningkatan pada area yang paling banyak dikeluhkan pengembang.

Composer 2 vs. Claude Opus 4.6 vs. GPT-5.4

Inilah perbandingan yang paling banyak dicari orang. Composer 2 mengungguli Claude Opus 4.6 pada beberapa tolok ukur pengodean, tertinggal dari GPT-5.4 pada sebagian besar, dan biayanya jauh lebih rendah daripada keduanya.

Perbandingan tolok ukur

Angka-angka yang berbicara:

Tolok Ukur

Composer 2

Claude Opus 4.6

GPT-5.4

CursorBench

61.3

~58.2

~63.9

Terminal-Bench 2.0

61.7

58.0

75.1

SWE-bench Verified

Tidak dilaporkan

~80.8%

~80.0%

Composer 2 vs. Claude Opus 4.6 vs. GPT-5.4

Composer 2 sedikit unggul atas Opus 4.6 pada CursorBench dan Terminal-Bench 2.0, tetapi GPT-5.4 memimpin pada keduanya dengan margin yang jelas. Kesenjangan Terminal-Bench 2.0 antara Composer 2 (61,7) dan GPT-5.4 (75,1) adalah 13 poin.

Satu hal yang perlu dicatat: skor Terminal-Bench 2.0 mengukur pasangan agen-plus-model, bukan model mentah. Cursor menggunakan kerangka evaluasi Harbor untuk skornya, sementara 75,1 milik GPT-5.4 sesuai dengan entri harness Simple Codex pada papan peringkat resmi. Harness berbeda dapat menghasilkan hasil berbeda untuk model yang sama.

Perbandingan harga

Berikut perbandingan harganya:

Model

Input (per 1M token)

Output (per 1M token)

Composer 2 Standard

$0.50

$2.50

Composer 2 Fast

$1.50

$7.50

Claude Opus 4.6

$5.00

$25.00

GPT-5.4

$2.50

$15.00

Bagan gabungan yang menampilkan skor CursorBench dan Terminal-Bench 2.0 untuk Composer 2, Claude Opus 4.6, dan GPT-5.4, dengan bagan batang horizontal yang membandingkan biaya input per juta token

Membandingkan skor tolok ukur dan harga token. Gambar oleh Penulis.

Composer 2 Standard sekitar 90% lebih murah daripada Opus 4.6 dan sekitar 80% lebih murah daripada GPT-5.4 per token. Bagi tim yang menjalankan ribuan permintaan agentik per hari, perbedaan itu cepat terasa akumulasinya.

Kelebihan masing-masing model

Composer 2 adalah model khusus kode yang terkunci pada Cursor IDE. Model ini menangani tugas pengodean rutin dengan cepat dan biaya rendah, namun tidak dapat melakukan apa pun di luar kode.

Claude Opus 4.6 memiliki jendela konteks 200.000 token (dengan beta 1M token berbiaya lebih tinggi), unggul dalam perencanaan arsitektur multi-berkas, dan mendukung orkestrasi multi-agen melalui Agent Teams. Ini adalah model serbaguna yang kebetulan sangat mahir dalam kode.

GPT-5.4 memimpin pada tolok ukur pengodean tersulit, memiliki kemampuan penggunaan komputer native, dan mendukung jendela konteks eksperimental 1,05 juta token. Ini adalah model tunggal yang paling mumpuni namun juga paling mahal untuk dijalankan dalam skala besar.

Penawaran Cursor adalah nilai per tugas di dalam IDE, bukan kepemimpinan tolok ukur mentah.

Composer 2 vs. Claude Code vs. GitHub Copilot

Bagian di atas membandingkan Composer 2 dengan model mentah. Berikut tampilannya pada tingkat produk.

Claude Code adalah agen pengodean berbasis terminal milik Anthropic. Menurut survei pengembang 2026, alat ini kini memimpin sebagai alat pengodean AI yang paling banyak digunakan di kalangan profesional, dengan 46% menyebutnya alat yang paling mereka sukai dibanding 19% untuk Cursor. Banyak pengembang menggunakan Cursor untuk pengeditan IDE sehari-hari dan beralih ke Claude Code untuk tugas otonom yang kompleks. Kedua alat ini lebih saling melengkapi daripada bersaing.

GitHub Copilot tetap menjadi alat dengan adopsi terluas dengan lebih dari 20 juta pengguna sepanjang masa dan harga masuk yang lebih rendah sebesar $10/bulan. Baru-baru ini menambahkan mode Agent untuk aksi multi-langkah, namun banyak pengembang melaporkan bahwa pengeditan multi-berkas milik Cursor lebih dalam.

Sekitar 70% pengembang kini menggunakan dua hingga empat alat AI secara bersamaan. Pertanyaannya bukan lagi "alat yang mana?" melainkan "kombinasi yang mana?"

Cara Menggunakan Composer 2

Composer 2 sepenuhnya berada di dalam Cursor IDE, jadi tidak ada yang perlu diinstal secara terpisah.

Penyiapan langkah demi langkah

Untuk mulai menggunakan Composer 2, unduh atau perbarui Cursor dari cursor.com. Composer 2 tersedia di semua paket berbayar (Pro, Pro+, Ultra, Teams, Enterprise). Buka panel agen menggunakan Cmd+I di Mac atau Ctrl+I di Windows dan Linux, lalu pilih "Composer 2" atau "Composer 2 Fast" dari dropdown model. Varian Fast dipilih secara default.

Tangkapan layar antarmuka Cursor IDE yang menampilkan dropdown pemilihan model dengan Composer 2 Fast dipilih sebagai opsi default

Menemukan dropdown pemilihan model Cursor. Gambar oleh Penulis.

Dari sana, ketik deskripsi tugas dalam bahasa alami yang ingin Anda selesaikan. Composer 2 berjalan dalam mode Agent secara default, artinya ia dapat secara otonom menelusuri basis kode Anda, membuat perubahan, menjalankan perintah terminal, dan menggunakan semua alat yang tersedia. Anda meninjau dan menerima atau menolak perubahan saat agen bekerja.

Pintasan kunci

Berikut pintasan yang paling sering Anda gunakan saat bekerja dengan Composer 2:

Aksi

Mac

Windows/Linux

Buka Agent/Composer

Cmd+I

Ctrl+I

Percakapan baru

Cmd+N

Ctrl+N

Beralih mode (Agent/Ask/Edit)

Cmd+.

Ctrl+.

Mode Ask (read-only)

Cmd+L

Ctrl+L

Edit inline

Cmd+K

Ctrl+K

Buka riwayat

Cmd+Opt+L

Ctrl+Alt+L

Bekerja dengan konteks

Composer 2 mendukung beberapa cara untuk mengontrol konteks yang dilihatnya. Ketik @ diikuti nama berkas, folder, atau URL untuk menyuntikkan konteks spesifik ke dalam prompt. Simbol # memfokuskan pada berkas tertentu. Context pill di bagian atas obrolan menunjukkan apa yang sedang dirujuk agen.

Untuk proyek besar, mengaktifkan Autocontext di Settings memungkinkan Cursor secara otomatis menarik kode relevan melalui embeddings. Anda juga dapat menambahkan dokumentasi kustom melalui Settings untuk konteks khusus framework.

Self-summarization dalam praktik

Untuk tugas yang berjalan lama, self-summarization aktif otomatis saat jendela konteks penuh. Anda juga dapat memicu kompresi secara manual dengan perintah /compress . Jika agen menyarankan memulai percakapan baru, itu biasanya berarti konteks menjadi terlalu besar untuk diringkas secara efektif.

Harga Composer 2

Saya telah membahas biaya per token di bagian Varian, jadi saya tidak akan mengulang angkanya. Sebagai gantinya, berikut cara kerja harga dalam praktik.

Tingkat langganan Cursor

Cursor menggunakan sistem langganan bertingkat dengan kredit yang menentukan seberapa banyak Anda dapat menggunakan model pihak ketiga. Berikut rincian saat ini:

Paket

Harga

Termasuk Utama

Hobby

Gratis

Permintaan agen dan tab completion terbatas

Pro

$20/bulan ($16/bulan ditagih tahunan)

Kolam kredit $20, tab completion tak terbatas, cloud agents

Pro+

$60/bulan ($48/bulan ditagih tahunan)

Penggunaan 3x pada semua model

Ultra

$200/bulan

Penggunaan 20x pada semua model, akses prioritas

Teams

$40/pengguna/bulan ($32 ditagih tahunan)

Penagihan terpusat, SSO SAML/OIDC, analitik

Enterprise

Kustom

SOC 2, tinjauan legal, kontrol keamanan lanjutan

Cara kerja kredit dengan Composer 2

Ini bagian yang sering membingungkan. Penggunaan Composer pada paket individual mengambil dari kolam penggunaan mandiri yang terpisah dari kolam kredit yang digunakan untuk model pihak ketiga seperti Claude atau GPT. Cursor menggambarkan kolam ini sebagai memiliki "penggunaan inklusif yang murah hati," meski mereka belum memublikasikan batas pastinya.

Saat Anda menggunakan mode "Auto", yang memungkinkan Cursor memilih model untuk setiap permintaan, penggunaan dari model Composer tidak terbatas pada paket berbayar tanpa pengurangan kredit. Memilih model premium pihak ketiga secara manual akan mengambil dari kolam kredit bulanan Anda. Setelah kolam itu habis, Anda dapat mengaktifkan kelebihan pemakaian pay-as-you-go.

Konteks harga

Harga Cursor mengalami beberapa perubahan sepanjang tahun lalu. Pada Juni 2025, mereka mengganti sistem flat "500 permintaan cepat per bulan" dengan penagihan berbasis kredit, yang secara efektif menurunkan permintaan dari sekitar 500 menjadi sekitar 225 per bulan pada tingkat Pro.

Per Maret 2026, model frontier seperti GPT-5.4 dan Opus 4.6 ditagihkan terhadap kolam kredit bulanan Anda dengan harga dinamis berbasis token. Penggunaan Composer 2 tetap berada di kolam terpisah. Jika Anda membuat anggaran untuk tim, gunakan default Composer 2 untuk pekerjaan rutin dan simpan kredit pihak ketiga untuk tugas yang memerlukan lebih banyak.

Keterbatasan yang Diketahui pada Composer 2

Seperti disebutkan pada bagian perbandingan, Composer 2 hanya untuk kode. Co-founder Aman Sanger menyatakannya secara langsung: "Ini tidak akan membantu Anda mengurus pajak. Ini tidak bisa menulis puisi." Untuk tugas serbaguna, Anda tetap memerlukan Claude atau GPT di dalam Cursor.

Pengguna melaporkan bahwa pada rencana eksekusi yang kaku dan multi-langkah, Composer 2 terkadang melewati langkah verifikasi perantara dan terburu-buru menuju implementasi. Ini kemungkinan artefak pelatihan di mana model terdorong untuk menyelesaikan alih-alih memverifikasi.

Beberapa pengguna melaporkan bahwa di macOS, file watcher latar belakang Cursor mengabaikan arahan .gitignore pada monorepo yang sangat besar, menyebabkan agen mengindeks folder dependensi seperti node_modules dan menghabiskan alokasi token secara tak terduga.

CursorBench tetap closed-source. Untuk Terminal-Bench 2.0, Cursor mengambil "skor maksimum antara skor papan peringkat resmi dan skor yang dicatat saat berjalan di infrastruktur kami" untuk model non-Composer, sebuah pilihan metodologi yang perlu diketahui.

Tentang transparansi: Cursor tidak mengungkap model dasar Kimi K2.5 dalam posting blog peluncurannya. Kelalaian ini terungkap pada 20 Maret 2026 ketika seorang pengguna menemukan ID model di header permintaan API, yang sempat memicu perdebatan publik tentang kepatuhan lisensi. Lin Qiao, CEO Fireworks AI, memperjelas bahwa Cursor telah patuh sejak hari pertama melalui platform Fireworks. Moonshot AI mengonfirmasi pengaturan tersebut sebagai kemitraan komersial resmi. Baik Lee Robinson maupun co-founder Aman Sanger mengakui bahwa tidak adanya pengungkapan adalah "sebuah kekhilafan" dan berkomitmen untuk lebih transparan tentang model dasar ke depannya.

Kesimpulan

Cursor telah menyatakannya secara langsung: Composer 2 tidak berusaha menjadi model paling mumpuni secara keseluruhan. Fokusnya adalah biaya lebih rendah untuk pekerjaan IDE sehari-hari.

Tolok ukur yang dibahas sebelumnya mendukung hal itu: Composer 2 melampaui Claude Opus 4.6 pada Terminal-Bench 2.0 dengan biaya per token sekitar 90% lebih rendah, tetapi masih tertinggal dari GPT-5.4 pada tolok ukur yang lebih sulit.

Pasar bergerak menuju alur kerja multi-model, dan cara Cursor memberi harga pada Composer 2 menunjukkan bahwa mereka membangun dengan asumsi tersebut.

Jika Anda ingin mempelajari lebih lanjut tentang alat AI yang membentuk lanskap pengembangan perangkat lunak, lihat perbandingan kami tentang GPT-5.4 vs. Claude Opus 4.6.


Khalid Abdelaty's photo
Author
Khalid Abdelaty
LinkedIn

Saya seorang data engineer dan pembangun komunitas yang bekerja lintas pipeline data, cloud, dan perkakas AI sambil menulis tutorial praktis dan berdampak tinggi untuk DataCamp dan pengembang yang sedang berkembang.

Composer 2 FAQs

Apakah Composer 2 tersedia pada paket gratis?

Blog Cursor menyebut "paket individual" tanpa menjelaskan apakah tier Hobby termasuk. Dalam praktiknya, paket Hobby memiliki kolam permintaan agen yang terbatas dan cepat habis, jadi Anda mungkin bisa mencoba beberapa tugas sebelum mencapai batas. Jika ingin menggunakan Composer 2 untuk lebih dari sekadar eksperimen singkat, Pro seharga $20/bulan adalah titik awal yang realistis.

Seberapa cepat Composer 2 dibandingkan Composer asli?

Cursor belum memublikasikan angka token-per-detik yang pasti untuk Composer 2. Composer 1 berjalan sekitar 250 TPS saat peluncuran. Untuk Composer 2, varian Fast terasa lebih cepat untuk sesi interaktif, sedangkan Standard menukar kecepatan dengan biaya lebih rendah dan lebih cocok untuk tugas latar belakang yang lebih lama saat Anda tidak menunggu secara real time. Angka perbandingan resmi belum dirilis.

Bisakah saya menjalankan Composer 2 pada beberapa berkas sekaligus?

Ya, pengeditan multi-berkas adalah salah satu penggunaan intinya. Dalam satu sesi, Composer 2 dapat membaca, membuat, dan memodifikasi berkas di seluruh basis kode Anda. Jika Anda perlu mengerjakan dua atau tiga fitur independen secara bersamaan, Cursor juga mendukung menjalankan hingga 8 agen secara paralel menggunakan git worktrees, masing-masing bekerja di cabangnya sendiri yang terisolasi. Itu berguna ketika tugas tidak saling bergantung.

Apa yang terjadi saat jendela konteks Composer 2 penuh?

Self-summarization aktif otomatis. Model memampatkan konteks kerjanya menjadi sekitar 1.000 token dan terus berjalan. Anda juga dapat memicu ini secara manual dengan /compress jika ingin mengosongkan ruang konteks di tengah tugas. Jika agen menyarankan memulai percakapan baru, itu biasanya berarti tugas telah berkembang melampaui apa yang dapat ditangani kompresi dengan bersih, dan sesi baru akan lebih andal.

Haruskah saya menggunakan Composer 2 atau Claude Opus 4.6 di dalam Cursor?

Aturan kasar: jika tugasnya muat dalam beberapa berkas dan dapat Anda jelaskan dengan jelas, Composer 2 lebih cepat dan biayanya hanya sebagian kecil dari Opus 4.6. Jika Anda mengerjakan sesuatu yang memerlukan penalaran di seluruh basis kode besar, menimbang trade-off desain, atau menghasilkan output di mana presisi lebih penting daripada kecepatan, Opus 4.6 sepadan dengan biaya tambahan. Banyak pengembang akhirnya menggunakan keduanya tergantung tugas, yang memang menjadi tujuan switcher model milik Cursor.

Topik

Belajar bersama DataCamp

Kursus

Mengimplementasikan Solusi AI dalam Bisnis

2 Hr
49.8K
Pelajari cara mendapat nilai bisnis dari AI: identifikasi peluang, buat POC, terapkan solusi, dan kembangkan strategi AI.
Lihat DetailRight Arrow
Mulai Kursus
Lihat Lebih BanyakRight Arrow
Terkait

blogs

Tutorial Korelasi di R

Dapatkan pengenalan dasar-dasar korelasi di R: pelajari lebih lanjut tentang koefisien korelasi, matriks korelasi, plotting korelasi, dan sebagainya.
David Woods's photo

David Woods

13 mnt

blogs

40 Pertanyaan Wawancara DBMS Teratas di 2026

Kuasai pertanyaan wawancara basis data, dari konsep SQL dasar hingga skenario desain sistem tingkat lanjut. Panduan mendalam ini mencakup semua yang Anda perlukan untuk sukses di wawancara DBMS dan meraih peran berikutnya.
Dario Radečić's photo

Dario Radečić

15 mnt

blogs

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Artikel ini menyajikan daftar alternatif ChatGPT yang akan meningkatkan produktivitas Anda.
Javier Canales Luna's photo

Javier Canales Luna

12 mnt

blogs

Spaghetti Plot dan Jalur Badai

Temukan alasan mengapa Anda sebaiknya (tidak) menggunakan spaghetti plot untuk menyampaikan ketidakpastian jalur prediksi badai serta dampaknya terhadap interpretasi.
Hugo Bowne-Anderson's photo

Hugo Bowne-Anderson

13 mnt

Lihat Lebih BanyakLihat Lebih Banyak