Lewati ke konten utama

GPT 5.5 Instant: Peningkatan untuk Model Default OpenAI

Model default terbaru OpenAI memprioritaskan keandalan fakta, jawaban ringkas, dan memori yang dapat Anda audit.
Diperbarui 6 Mei 2026  · 8 mnt baca

OpenAI belum menyerah dalam upayanya menjadikan model GPT default sebagai sesuatu yang benar-benar ingin diajak pengguna untuk bercakap-cakap.

Untuk itu, pembaruan baru OpenAI berfokus pada percakapan yang lebih baik dengan

  • jawaban yang lebih kuat dan lebih rapat di seluruh
  • nada yang lebih natural, dan 
  • pemanfaatan konteks yang lebih baik

Jika hanya itu, mungkin tidak banyak yang perlu dibahas. Namun ada beberapa bagian menarik lain dari rilis ini. GPT-5.5 Instant juga meningkatkan skor tolok ukur pada beberapa pengujian paling terkenal, dan pembaruan ini juga memperkenalkan fitur memori baru. 

Untuk ikhtisar model AI canggih lainnya, kami sarankan membaca panduan kami tentang LLM berikut:

Apa Itu GPT-5.5 Instant?

GPT-5.5 Instant adalah versi default baru dengan respons cepat dari the GPT-5.5 model yang digunakan di ChatGPT. Model ini dirancang untuk tugas sehari-hari—menjawab pertanyaan, menulis, coding, dll.—dengan tetap memprioritaskan kecepatan dan daya tanggap.

  • GPT-5.5 mengacu pada versi model dasar. Di sinilah peningkatan terjadi, seperti penalaran yang lebih baik, lebih sedikit kesalahan faktual, dan kinerja yang lebih kuat dalam matematika, dll.
  • Instant mengacu pada mode atau varian dari model tersebut. Model ini dioptimalkan untuk memberikan jawaban dengan cepat dan efisien, sehingga cocok untuk sebagian besar interaksi sehari-hari.

Jadi ketika Anda melihat GPT-5.5 Instant, itu adalah kombinasi spesifik: model GPT-5.5 yang berjalan dalam konfigurasi cepat serba guna.

Dalam praktiknya, versi ini menyempurnakan rilis sebelumnya seperti GPT-5.3 Instant dengan menghasilkan jawaban yang lebih akurat, respons yang lebih rapat, dan penanganan pertanyaan kompleks yang lebih baik.

Jika Anda bertanya-tanya mengapa kami tidak menyebut GPT-5.4 Instant, itu karena varian Instant melewati versi 5.4—tidak ada.

Mengapa ini bisa terasa membingungkan di ChatGPT

Anda mungkin memperhatikan bahwa di antarmuka ChatGPT, pemilih model sering kali hanya menampilkan “Instant” alih-alih nama lengkapnya. Artinya:

  • Anda mungkin sedang menggunakan GPT-5.5 Instant 
  • Namun UI hanya memberi tahu Anda “Instant”
  • Meski begitu, Anda mungkin telah ditingkatkan secara diam-diam dari sesuatu seperti GPT-5.3 Instant

Ada sedikit ketidaksinkronan:

  • UI produk: menekankan tingkatan kecepatan (“Instant”)
  • Catatan rilis: menekankan nama model lengkap (“GPT-5.5 Instant”)

Apa yang Baru di GPT-5.5 Instant?

Secara keseluruhan, pembaruan ini bertujuan membuat model default ChatGPT lebih membantu. Mari kita lihat apa artinya.

Lebih sedikit halusinasi, terutama pada prompt berisiko tinggi 

Menurut evaluasi internal, GPT-5.5 Instant menghasilkan sekitar 50% lebih sedikit klaim halusinasi dibanding GPT-5.3 Instant pada yang disebutnya prompt berisiko tinggi, yaitu prompt di mana jawaban yang salah dapat berdampak negatif nyata, seperti nasihat medis, hukum, atau keuangan. Terkait hal itu: Klaim yang tidak akurat berkurang sekitar sepertiga. 

Jawaban lebih rapat dengan lebih sedikit “hiasan” 

GPT-5.5 Instant dirancang untuk menyampaikan informasi yang sama dengan kata-kata yang lebih sedikit. Model ini juga seharusnya tidak berlebihan dalam pemformatan.

OpenAI memberikan contoh berupa prompt santai tentang rekan kerja yang cerewet, lalu untuk evaluasinya mereka menghitung jumlah kata (kami ragu mereka mengandalkan model itu sendiri untuk menghitung) dan mendapati ia menggunakan 30,2% lebih sedikit kata.

Penalaran STEM dan visual yang lebih kuat 

OpenAI menonjolkan peningkatan percakapan ini, tetapi model tersebut juga tampil lebih baik pada tes tolok ukur, dan lompatan dari GPT-5.3 Instant terbilang bagus. 

  • AIME 2025 (65,4% → 81,2%) 
  • GPQA (78,5% → 85,6%).

Jawaban lebih personal dari obrolan Anda sebelumnya dan aplikasi terhubung

Yang satu ini berpotensi menjadi perubahan besar. GPT-5.5 Instant kini secara bermakna lebih baik dalam menarik konteks dari hal-hal yang Anda pilih untuk dibagikan. Ini mencakup:

  • Percakapan sebelumnya: Model lebih cepat menelusuri riwayat chat Anda dan lebih baik memutuskan kapan sesuatu dari utas lama relevan. 
  • Berkas yang diunggah: Dokumen yang pernah Anda bagikan sebelumnya dalam percakapan (atau percakapan yang lampau, tergantung) ditarik masuk dengan lebih andal.
  • Aplikasi terhubung, khususnya Gmail: Jika Anda telah menghubungkan Gmail, Instant dapat menggunakan konteks itu juga untuk mempertajam respons.

Koneksi Gmail bukan hal baru, meski banyak orang tidak mengetahuinya. Namun sebelumnya, jika Gmail terhubung, informasi Gmail ditarik saat Anda secara eksplisit menanyakan hal terkait kotak masuk. Kini, GPT-5.5 Instant akan memutuskan sendiri (lagi-lagi, jika Gmail terhubung) kapan konteks email dapat mempertajam jawaban.

Untuk menghubungkan Gmail, buka saja sidebar dan klik Apps. Seharusnya ada tepat di bagian atas.

Sumber memori baru demi transparansi dan kendali

Jika personalisasi adalah fiturnya, sumber memori adalah jendelanya. Fitur ini diluncurkan di semua model ChatGPT, bukan hanya Instant.

Saat respons dipersonalisasi, kini Anda dapat melihat konteks apa yang membentuknya — memori tersimpan, chat sebelumnya, aplikasi terhubung seperti Gmail, yang saya sebutkan di atas — dan menghapus atau membetulkan apa pun yang sudah usang.

Sumber memori tetap privat saat Anda membagikan chat, dan OpenAI mencatat bahwa tampilan tersebut mungkin tidak menampilkan setiap faktor di balik sebuah respons. Meski begitu, ini perubahan yang menarik.

Hasil Tolok Ukur GPT-5.5 Instant

Mari kita lihat tolok ukur yang mulai kita sebutkan tadi. Dari rilisnya, OpenAI menunjukkan bahwa GPT-5.5 Instant melampaui GPT-5.3 Instant pada berbagai pengujian tolok ukur:

  • AIME 2025 (65,4% → 81,2%) — matematika kompetisi
  • GPQA (78,5% → 85,6%) — sains tingkat PhD
  • MMMU-Pro (69,2% → 76,0%) — penalaran multimodal tingkat ahli
  • CharXiv-reasoning (75,0% → 81,6%) — penalaran grafik ilmiah
  • OmniDocBench (14,6% → 12,5%, semakin rendah semakin baik) — parsing dokumen

Jika Anda memperhatikan rilis OpenAI lain baru-baru ini, seperti untuk GPT-5.5 atau GPT-5.4, Anda mungkin sudah melihat model GPT meraih angka lebih tinggi pada tes seperti MMMU Pro dan GPQA. Jadi, jika Anda terkesan, itu sepenuhnya bergantung pada apa yang Anda inginkan dari tier Instant — kecepatan atau skor. Instant memang tidak ditujukan untuk menang di skor.

Menguji GPT-5.5 Instant

Kami menguji model baru ini dalam penalaran, penelusuran web, dan penghindaran halusinasi pada pertanyaan medis, area yang diidentifikasi OpenAI sebagai peningkatan besar.

Menguji penalaran yang peka konteks

Kami menggunakan prompt ini dalam artikel GPT-5.3 Instant kami, dan ini menjadi tolok ukur pembanding yang berguna. Pertanyaannya terdengar sederhana: “Haruskah Anda berjalan atau mengemudi ke tempat cuci mobil yang satu blok jauhnya?” Namun, ini menuntut transfer mental yang gagal dipenuhi model-model sebelumnya. GPT-5.2 Thinking menyarankan berjalan kaki. GPT-5.3 Instant menjawab dengan benar.

Prompt-nya:

I want to wash my car at the car wash. The car wash is one block away. Should I walk or drive?

Mari bandingkan GPT-5.5 dengan pendahulunya. Ini tanggapan GPT-5.3 Instant:

1.png

Dan berikut cara GPT-5.5 Instant menjawab:

2.png

Keduanya sangat ringkas (50 vs 49 kata), tetapi GPT-5.5 lebih percaya diri, karena tidak memberikan penyangga yang sama (“Hanya berjalan jika…”). Menurut selera pribadi saya, penalaran GPT-5.3 Instant terdengar sedikit lebih masuk akal dibanding GPT-5.5 Instant, karena “Anda tidak mendapatkan apa-apa” lebih mendekati kebenaran daripada “menghemat mungkin 2 menit”. Meski demikian, keduanya sampai pada kesimpulan yang tepat.

Menguji penghindaran halusinasi pada prompt berisiko tinggi

Karena rilis 5.5 secara khusus mengklaim sekitar 50% lebih sedikit halusinasi pada "prompt berisiko tinggi", kami menggunakan pertanyaan medis yang masuk akal namun memiliki jawaban benar yang spesifik. Kami bertanya:

Can I take ibuprofen and aspirin together?

Ini adalah jebakan klasik bagi LLM. Jawaban sebenarnya bernuansa: keduanya adalah NSAID, meminumnya bersamaan meningkatkan risiko perdarahan saluran cerna, dan yang penting, ibuprofen dapat mengganggu efek kardioprotektif aspirin jika waktunya tidak tepat. 

Model sering kali berkata “ya, tidak masalah” atau memberi larangan menyeluruh yang terlalu berhati-hati “jangan pernah lakukan ini, temui dokter.” Kami memeriksa apakah 5.5 benar-benar memberikan jawaban yang tepat dan akurat alih-alih berhalusinasi atau sekadar berhati-hati.

Akurasi responsnya tinggi: menyebutkan risiko perdarahan saluran cerna, interaksi efek, dan panduan waktu dari FDA. Kami tidak menemukan halusinasi, dan nadanya terkalibrasi dengan baik. Namun, pemformatannya agak berat. Ada banyak poin dan bagian terstruktur untuk sesuatu yang bisa dibuat lebih singkat atau lebih percakapan.

3.png

Secara keseluruhan, untuk uji halusinasi, ini lolos. Jawabannya akurat, bernuansa, dan tidak mengada-ada. Mari bandingkan dengan respons GPT-5.3 Instant:

4.png

Keduanya menghindari halusinasi dan memberikan jawaban yang akurat serta berguna, tetapi sangat berat dalam pemformatan. Bedanya, 5.5 sedikit lebih menyeluruh (misalnya, dengan menyertakan daftar lengkap faktor risiko), sementara 5.3 lebih ringkas.

Menguji penelusuran web dengan pertanyaan Liga Champions

Untuk menguji seberapa baik GPT-5.5 Instant menggabungkan hasil penelusuran web dengan penalarannya sendiri, kami menanyakannya tentang ajang olahraga berlapis yang baru terjadi: kemenangan semifinal Liga Champions Arsenal atas Atléticó Madrid. 

Jawaban yang baik di sini memerlukan pengumpulan fakta yang tepat dari berbagai sumber dan merangkainya menjadi narasi yang koheren, bukan sekadar menumpuk potongan hasil penelusuran.

Prompt-nya:

What happened in the Champions League semifinal second leg yesterday, and what does the result mean for Arsenal historically?

5.png

Jawaban GPT-5.5 Instant sangat kuat. Model ini menilai dengan benar apa yang terjadi kemarin, termasuk agregat skor dan pencetak gol penentu, dan menyajikan informasi dalam konteks yang persis saya maksudkan.

Sebagai perbandingan, berikut respons GPT-5.3 Instant:

6.png

Kita kembali melihat pola berulang: Keduanya tidak tepat; 5.3 lebih cepat ke inti; 5.5 menambahkan konteks tambahan pada jawaban inti.

Bagaimana Cara Mengakses GPT-5.5 Instant?

GPT-5.5 sedang diluncurkan sebagai model default baru ChatGPT untuk semua pengguna dan akan dapat diakses sebagai chat-latest di API. GPT-5.3 Instant akan dihentikan dalam tiga bulan dan hingga saat itu dapat diakses oleh pengguna berbayar.

Beberapa fitur akan diluncurkan secara bertahap:

  • Fitur personalisasi yang ditingkatkan yang kami sebutkan di atas awalnya hanya tersedia untuk pengguna Plus dan Pro di UI web. OpenAI berencana membawanya ke aplikasi seluler segera, dengan akses untuk semua paket pengguna lain (termasuk Gratis dan Enterprise) menyusul “dalam beberapa minggu mendatang.”
  • Sumber memori sudah mulai diluncurkan di UI web untuk semua tingkatan pengguna dan akan segera ditambahkan ke aplikasi seluler juga.

Kesimpulan

Inilah yang mungkin benar-benar Anda rasakan: lebih sedikit jawaban yang jelas salah pada pertanyaan-pertanyaan yang kesalahannya berdampak, dan balasan yang lebih menyeluruh tanpa harus lebih singkat.

Dalam pengujian kami, GPT-5.5 Instant menambahkan detail yang benar-benar berguna (misalnya, faktor risiko yang lebih lengkap untuk pertanyaan medis), tetapi GPT-5.3 Instant kadang lebih lugas, meski ada klaim OpenAI tentang “jawaban lebih rapat.”

Bagian personalisasi adalah soal selera. Ini bisa terasa seperti ChatGPT akhirnya mengingat hal-hal dengan berguna, atau seperti melampaui batas ke wilayah yang tidak sepenuhnya Anda setujui. Fitur sumber memori setidaknya bertujuan memberi Anda gambaran tentang apa yang digunakan model untuk responsnya.

Bagi Anda yang tertarik mengembangkan aplikasi bertenaga AI, kami sangat merekomendasikan mendaftar ke AI Engineering with LangChain skill track kami. Kursus-kursusnya AI-native, sehingga menawarkan pengalaman belajar yang dipersonalisasi, membawa Anda dari level saat ini menjadi mahir.


Josef Waples's photo
Author
Josef Waples

Saya penulis dan editor data science dengan kontribusi pada artikel riset di jurnal ilmiah. Saya sangat tertarik pada aljabar linear, statistika, R, dan sejenisnya. Saya juga cukup sering bermain catur! 


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Tom adalah seorang ilmuwan data dan pendidik teknis. Ia menulis dan mengelola tutorial serta artikel blog ilmu data DataCamp. Sebelumnya, Tom bekerja di bidang ilmu data di Deutsche Telekom.

Topik

Belajar bersama DataCamp

Kursus

Memahami Kecerdasan Buatan

2 Hr
392.6K
Pelajari konsep dasar Kecerdasan Buatan seperti machine learning, deep learning, NLP, AI generatif, dan lainnya.
Lihat DetailRight Arrow
Mulai Kursus
Lihat Lebih BanyakRight Arrow
Terkait

blogs

12 Alternatif ChatGPT Terbaik yang Bisa Anda Coba pada 2026

Artikel ini menyajikan daftar alternatif ChatGPT yang akan meningkatkan produktivitas Anda.
Javier Canales Luna's photo

Javier Canales Luna

12 mnt

blogs

40 Pertanyaan Wawancara DBMS Teratas di 2026

Kuasai pertanyaan wawancara basis data, dari konsep SQL dasar hingga skenario desain sistem tingkat lanjut. Panduan mendalam ini mencakup semua yang Anda perlukan untuk sukses di wawancara DBMS dan meraih peran berikutnya.
Dario Radečić's photo

Dario Radečić

15 mnt

blogs

Spaghetti Plot dan Jalur Badai

Temukan alasan mengapa Anda sebaiknya (tidak) menggunakan spaghetti plot untuk menyampaikan ketidakpastian jalur prediksi badai serta dampaknya terhadap interpretasi.
Hugo Bowne-Anderson's photo

Hugo Bowne-Anderson

13 mnt

blogs

Tutorial Korelasi di R

Dapatkan pengenalan dasar-dasar korelasi di R: pelajari lebih lanjut tentang koefisien korelasi, matriks korelasi, plotting korelasi, dan sebagainya.
David Woods's photo

David Woods

13 mnt

Lihat Lebih BanyakLihat Lebih Banyak