Kursus
OpenAI belum menyerah dalam upayanya menjadikan model GPT default sebagai sesuatu yang benar-benar ingin diajak pengguna untuk bercakap-cakap.
Untuk itu, pembaruan baru OpenAI berfokus pada percakapan yang lebih baik dengan
- jawaban yang lebih kuat dan lebih rapat di seluruh
- nada yang lebih natural, dan
- pemanfaatan konteks yang lebih baik
Jika hanya itu, mungkin tidak banyak yang perlu dibahas. Namun ada beberapa bagian menarik lain dari rilis ini. GPT-5.5 Instant juga meningkatkan skor tolok ukur pada beberapa pengujian paling terkenal, dan pembaruan ini juga memperkenalkan fitur memori baru.
Untuk ikhtisar model AI canggih lainnya, kami sarankan membaca panduan kami tentang LLM berikut:
Apa Itu GPT-5.5 Instant?
GPT-5.5 Instant adalah versi default baru dengan respons cepat dari the GPT-5.5 model yang digunakan di ChatGPT. Model ini dirancang untuk tugas sehari-hari—menjawab pertanyaan, menulis, coding, dll.—dengan tetap memprioritaskan kecepatan dan daya tanggap.
- GPT-5.5 mengacu pada versi model dasar. Di sinilah peningkatan terjadi, seperti penalaran yang lebih baik, lebih sedikit kesalahan faktual, dan kinerja yang lebih kuat dalam matematika, dll.
- Instant mengacu pada mode atau varian dari model tersebut. Model ini dioptimalkan untuk memberikan jawaban dengan cepat dan efisien, sehingga cocok untuk sebagian besar interaksi sehari-hari.
Jadi ketika Anda melihat GPT-5.5 Instant, itu adalah kombinasi spesifik: model GPT-5.5 yang berjalan dalam konfigurasi cepat serba guna.
Dalam praktiknya, versi ini menyempurnakan rilis sebelumnya seperti GPT-5.3 Instant dengan menghasilkan jawaban yang lebih akurat, respons yang lebih rapat, dan penanganan pertanyaan kompleks yang lebih baik.
Jika Anda bertanya-tanya mengapa kami tidak menyebut GPT-5.4 Instant, itu karena varian Instant melewati versi 5.4—tidak ada.
Mengapa ini bisa terasa membingungkan di ChatGPT
Anda mungkin memperhatikan bahwa di antarmuka ChatGPT, pemilih model sering kali hanya menampilkan “Instant” alih-alih nama lengkapnya. Artinya:
- Anda mungkin sedang menggunakan GPT-5.5 Instant
- Namun UI hanya memberi tahu Anda “Instant”
- Meski begitu, Anda mungkin telah ditingkatkan secara diam-diam dari sesuatu seperti GPT-5.3 Instant
Ada sedikit ketidaksinkronan:
- UI produk: menekankan tingkatan kecepatan (“Instant”)
- Catatan rilis: menekankan nama model lengkap (“GPT-5.5 Instant”)
Apa yang Baru di GPT-5.5 Instant?
Secara keseluruhan, pembaruan ini bertujuan membuat model default ChatGPT lebih membantu. Mari kita lihat apa artinya.
Lebih sedikit halusinasi, terutama pada prompt berisiko tinggi
Menurut evaluasi internal, GPT-5.5 Instant menghasilkan sekitar 50% lebih sedikit klaim halusinasi dibanding GPT-5.3 Instant pada yang disebutnya prompt berisiko tinggi, yaitu prompt di mana jawaban yang salah dapat berdampak negatif nyata, seperti nasihat medis, hukum, atau keuangan. Terkait hal itu: Klaim yang tidak akurat berkurang sekitar sepertiga.
Jawaban lebih rapat dengan lebih sedikit “hiasan”
GPT-5.5 Instant dirancang untuk menyampaikan informasi yang sama dengan kata-kata yang lebih sedikit. Model ini juga seharusnya tidak berlebihan dalam pemformatan.
OpenAI memberikan contoh berupa prompt santai tentang rekan kerja yang cerewet, lalu untuk evaluasinya mereka menghitung jumlah kata (kami ragu mereka mengandalkan model itu sendiri untuk menghitung) dan mendapati ia menggunakan 30,2% lebih sedikit kata.
Penalaran STEM dan visual yang lebih kuat
OpenAI menonjolkan peningkatan percakapan ini, tetapi model tersebut juga tampil lebih baik pada tes tolok ukur, dan lompatan dari GPT-5.3 Instant terbilang bagus.
- AIME 2025 (65,4% → 81,2%)
- GPQA (78,5% → 85,6%).
Jawaban lebih personal dari obrolan Anda sebelumnya dan aplikasi terhubung
Yang satu ini berpotensi menjadi perubahan besar. GPT-5.5 Instant kini secara bermakna lebih baik dalam menarik konteks dari hal-hal yang Anda pilih untuk dibagikan. Ini mencakup:
- Percakapan sebelumnya: Model lebih cepat menelusuri riwayat chat Anda dan lebih baik memutuskan kapan sesuatu dari utas lama relevan.
- Berkas yang diunggah: Dokumen yang pernah Anda bagikan sebelumnya dalam percakapan (atau percakapan yang lampau, tergantung) ditarik masuk dengan lebih andal.
- Aplikasi terhubung, khususnya Gmail: Jika Anda telah menghubungkan Gmail, Instant dapat menggunakan konteks itu juga untuk mempertajam respons.
Koneksi Gmail bukan hal baru, meski banyak orang tidak mengetahuinya. Namun sebelumnya, jika Gmail terhubung, informasi Gmail ditarik saat Anda secara eksplisit menanyakan hal terkait kotak masuk. Kini, GPT-5.5 Instant akan memutuskan sendiri (lagi-lagi, jika Gmail terhubung) kapan konteks email dapat mempertajam jawaban.
Untuk menghubungkan Gmail, buka saja sidebar dan klik Apps. Seharusnya ada tepat di bagian atas.
Sumber memori baru demi transparansi dan kendali
Jika personalisasi adalah fiturnya, sumber memori adalah jendelanya. Fitur ini diluncurkan di semua model ChatGPT, bukan hanya Instant.
Saat respons dipersonalisasi, kini Anda dapat melihat konteks apa yang membentuknya — memori tersimpan, chat sebelumnya, aplikasi terhubung seperti Gmail, yang saya sebutkan di atas — dan menghapus atau membetulkan apa pun yang sudah usang.
Sumber memori tetap privat saat Anda membagikan chat, dan OpenAI mencatat bahwa tampilan tersebut mungkin tidak menampilkan setiap faktor di balik sebuah respons. Meski begitu, ini perubahan yang menarik.
Hasil Tolok Ukur GPT-5.5 Instant
Mari kita lihat tolok ukur yang mulai kita sebutkan tadi. Dari rilisnya, OpenAI menunjukkan bahwa GPT-5.5 Instant melampaui GPT-5.3 Instant pada berbagai pengujian tolok ukur:
- AIME 2025 (65,4% → 81,2%) — matematika kompetisi
- GPQA (78,5% → 85,6%) — sains tingkat PhD
- MMMU-Pro (69,2% → 76,0%) — penalaran multimodal tingkat ahli
- CharXiv-reasoning (75,0% → 81,6%) — penalaran grafik ilmiah
- OmniDocBench (14,6% → 12,5%, semakin rendah semakin baik) — parsing dokumen
Jika Anda memperhatikan rilis OpenAI lain baru-baru ini, seperti untuk GPT-5.5 atau GPT-5.4, Anda mungkin sudah melihat model GPT meraih angka lebih tinggi pada tes seperti MMMU Pro dan GPQA. Jadi, jika Anda terkesan, itu sepenuhnya bergantung pada apa yang Anda inginkan dari tier Instant — kecepatan atau skor. Instant memang tidak ditujukan untuk menang di skor.

Menguji GPT-5.5 Instant
Kami menguji model baru ini dalam penalaran, penelusuran web, dan penghindaran halusinasi pada pertanyaan medis, area yang diidentifikasi OpenAI sebagai peningkatan besar.
Menguji penalaran yang peka konteks
Kami menggunakan prompt ini dalam artikel GPT-5.3 Instant kami, dan ini menjadi tolok ukur pembanding yang berguna. Pertanyaannya terdengar sederhana: “Haruskah Anda berjalan atau mengemudi ke tempat cuci mobil yang satu blok jauhnya?” Namun, ini menuntut transfer mental yang gagal dipenuhi model-model sebelumnya. GPT-5.2 Thinking menyarankan berjalan kaki. GPT-5.3 Instant menjawab dengan benar.
Prompt-nya:
I want to wash my car at the car wash. The car wash is one block away. Should I walk or drive?
Mari bandingkan GPT-5.5 dengan pendahulunya. Ini tanggapan GPT-5.3 Instant:

Dan berikut cara GPT-5.5 Instant menjawab:

Keduanya sangat ringkas (50 vs 49 kata), tetapi GPT-5.5 lebih percaya diri, karena tidak memberikan penyangga yang sama (“Hanya berjalan jika…”). Menurut selera pribadi saya, penalaran GPT-5.3 Instant terdengar sedikit lebih masuk akal dibanding GPT-5.5 Instant, karena “Anda tidak mendapatkan apa-apa” lebih mendekati kebenaran daripada “menghemat mungkin 2 menit”. Meski demikian, keduanya sampai pada kesimpulan yang tepat.
Menguji penghindaran halusinasi pada prompt berisiko tinggi
Karena rilis 5.5 secara khusus mengklaim sekitar 50% lebih sedikit halusinasi pada "prompt berisiko tinggi", kami menggunakan pertanyaan medis yang masuk akal namun memiliki jawaban benar yang spesifik. Kami bertanya:
Can I take ibuprofen and aspirin together?
Ini adalah jebakan klasik bagi LLM. Jawaban sebenarnya bernuansa: keduanya adalah NSAID, meminumnya bersamaan meningkatkan risiko perdarahan saluran cerna, dan yang penting, ibuprofen dapat mengganggu efek kardioprotektif aspirin jika waktunya tidak tepat.
Model sering kali berkata “ya, tidak masalah” atau memberi larangan menyeluruh yang terlalu berhati-hati “jangan pernah lakukan ini, temui dokter.” Kami memeriksa apakah 5.5 benar-benar memberikan jawaban yang tepat dan akurat alih-alih berhalusinasi atau sekadar berhati-hati.
Akurasi responsnya tinggi: menyebutkan risiko perdarahan saluran cerna, interaksi efek, dan panduan waktu dari FDA. Kami tidak menemukan halusinasi, dan nadanya terkalibrasi dengan baik. Namun, pemformatannya agak berat. Ada banyak poin dan bagian terstruktur untuk sesuatu yang bisa dibuat lebih singkat atau lebih percakapan.

Secara keseluruhan, untuk uji halusinasi, ini lolos. Jawabannya akurat, bernuansa, dan tidak mengada-ada. Mari bandingkan dengan respons GPT-5.3 Instant:

Keduanya menghindari halusinasi dan memberikan jawaban yang akurat serta berguna, tetapi sangat berat dalam pemformatan. Bedanya, 5.5 sedikit lebih menyeluruh (misalnya, dengan menyertakan daftar lengkap faktor risiko), sementara 5.3 lebih ringkas.
Menguji penelusuran web dengan pertanyaan Liga Champions
Untuk menguji seberapa baik GPT-5.5 Instant menggabungkan hasil penelusuran web dengan penalarannya sendiri, kami menanyakannya tentang ajang olahraga berlapis yang baru terjadi: kemenangan semifinal Liga Champions Arsenal atas Atléticó Madrid.
Jawaban yang baik di sini memerlukan pengumpulan fakta yang tepat dari berbagai sumber dan merangkainya menjadi narasi yang koheren, bukan sekadar menumpuk potongan hasil penelusuran.
Prompt-nya:
What happened in the Champions League semifinal second leg yesterday, and what does the result mean for Arsenal historically?

Jawaban GPT-5.5 Instant sangat kuat. Model ini menilai dengan benar apa yang terjadi kemarin, termasuk agregat skor dan pencetak gol penentu, dan menyajikan informasi dalam konteks yang persis saya maksudkan.
Sebagai perbandingan, berikut respons GPT-5.3 Instant:

Kita kembali melihat pola berulang: Keduanya tidak tepat; 5.3 lebih cepat ke inti; 5.5 menambahkan konteks tambahan pada jawaban inti.
Bagaimana Cara Mengakses GPT-5.5 Instant?
GPT-5.5 sedang diluncurkan sebagai model default baru ChatGPT untuk semua pengguna dan akan dapat diakses sebagai chat-latest di API. GPT-5.3 Instant akan dihentikan dalam tiga bulan dan hingga saat itu dapat diakses oleh pengguna berbayar.
Beberapa fitur akan diluncurkan secara bertahap:
- Fitur personalisasi yang ditingkatkan yang kami sebutkan di atas awalnya hanya tersedia untuk pengguna Plus dan Pro di UI web. OpenAI berencana membawanya ke aplikasi seluler segera, dengan akses untuk semua paket pengguna lain (termasuk Gratis dan Enterprise) menyusul “dalam beberapa minggu mendatang.”
- Sumber memori sudah mulai diluncurkan di UI web untuk semua tingkatan pengguna dan akan segera ditambahkan ke aplikasi seluler juga.
Kesimpulan
Inilah yang mungkin benar-benar Anda rasakan: lebih sedikit jawaban yang jelas salah pada pertanyaan-pertanyaan yang kesalahannya berdampak, dan balasan yang lebih menyeluruh tanpa harus lebih singkat.
Dalam pengujian kami, GPT-5.5 Instant menambahkan detail yang benar-benar berguna (misalnya, faktor risiko yang lebih lengkap untuk pertanyaan medis), tetapi GPT-5.3 Instant kadang lebih lugas, meski ada klaim OpenAI tentang “jawaban lebih rapat.”
Bagian personalisasi adalah soal selera. Ini bisa terasa seperti ChatGPT akhirnya mengingat hal-hal dengan berguna, atau seperti melampaui batas ke wilayah yang tidak sepenuhnya Anda setujui. Fitur sumber memori setidaknya bertujuan memberi Anda gambaran tentang apa yang digunakan model untuk responsnya.
Bagi Anda yang tertarik mengembangkan aplikasi bertenaga AI, kami sangat merekomendasikan mendaftar ke AI Engineering with LangChain skill track kami. Kursus-kursusnya AI-native, sehingga menawarkan pengalaman belajar yang dipersonalisasi, membawa Anda dari level saat ini menjadi mahir.

Saya penulis dan editor data science dengan kontribusi pada artikel riset di jurnal ilmiah. Saya sangat tertarik pada aljabar linear, statistika, R, dan sejenisnya. Saya juga cukup sering bermain catur!

Tom adalah seorang ilmuwan data dan pendidik teknis. Ia menulis dan mengelola tutorial serta artikel blog ilmu data DataCamp. Sebelumnya, Tom bekerja di bidang ilmu data di Deutsche Telekom.

