Artificial Intelligence

Review Claude Sonnet 5: Harga Murah, Performa Mendekati Opus 4.8

Oleh Alfian Dimas • 1 July 2026

Anthropic merilis Claude Sonnet 5 pada 30 Juni 2026. Model ini langsung menjadi default untuk pengguna Free dan Pro, dan tersedia di Claude Code, Claude Platform, serta API dengan identifier claude-sonnet-5.

Anthropic mengklaim Sonnet 5 mendekati performa Opus 4.8, model flagship mereka, dengan harga jauh lebih murah. Jika klaim ini terbukti di pemakaian nyata, tim yang selama ini membayar harga Opus demi kualitas punya opsi baru yang lebih hemat.

Pertanyaannya bukan apakah Sonnet 5 lebih baik dari versi sebelumnya. Pertanyaannya: kapan Anda harus migrasi, dan kapan Opus 4.8 tetap pilihan yang lebih tepat?

Artikel ini membahas apa yang berubah di Sonnet 5, seberapa dekat performanya dengan Opus 4.8, hitungan biaya yang perlu Anda perhatikan sebelum migrasi (termasuk soal tokenizer baru yang sering terlewat), dan situasi di mana Opus 4.8 masih layak dipertahankan.

Apa yang Sebenarnya Berubah dari Sonnet 5?

Sonnet 5 menggantikan Sonnet 4.6 sebagai model Sonnet utama Anthropic. Perubahan terbesar ada di empat area: reasoning, tool use, coding, dan knowledge work.

Anthropic menguji kedua model pada tugas agentic search (BrowseComp) dan penggunaan komputer (OSWorld-Verified). Sonnet 5 mengungguli Sonnet 4.6 di kedua evaluasi ini, dan pada beberapa kasus di effort level tertinggi, hasilnya menyamai Opus 4.8.

Perbedaan paling jelas muncul di cara model menyelesaikan tugas. Mitra early access Anthropic melaporkan tiga pola:

Sonnet 5 menyelesaikan tugas kompleks sampai tuntas, bukan berhenti di tengah jalan seperti versi Sonnet sebelumnya. Model ini memeriksa hasil kerjanya sendiri tanpa diminta. Dan model ini melakukan semua ini dengan harga yang tetap terjangkau.

Anthropic juga menambahkan empat effort level: low, medium, high, dan xhigh (extra high). Effort level menentukan berapa banyak token yang model pakai untuk bernalar sebelum menjawab. Effort rendah menghasilkan jawaban cepat dan murah untuk tugas sederhana. Effort tinggi memakan lebih banyak token tapi mendekatkan kualitas jawaban ke level Opus 4.8 untuk tugas yang lebih berat.

Anda mengatur effort level sendiri, per tugas. Ini mengubah cara Anda memakai model: bukan lagi pilih satu model untuk semua kebutuhan, tapi geser satu tombol untuk menyesuaikan biaya dengan tingkat kesulitan tugas yang sedang Anda kerjakan.

Satu perubahan teknis yang mendasari semua ini: Sonnet 5 memakai tokenizer baru, sama seperti yang diperkenalkan di Opus 4.7. Tokenizer ini memecah teks jadi token dengan cara berbeda dari Sonnet 4.6. Dampaknya masuk ke perhitungan biaya, dan akan dibahas di bagian selanjutnya.

Angka yang Perlu Anda Perhatikan

Anthropic merilis banyak angka benchmark untuk Sonnet 5. Tapi tidak semua angka itu berguna untuk keputusan Anda. Berikut yang paling relevan.

Agentic search (BrowseComp) dan penggunaan komputer (OSWorld-Verified)

Ini dua tes yang paling mendekati pekerjaan agentic sehari-hari: model mencari informasi di web, atau mengoperasikan komputer lewat browser dan terminal. Sonnet 5 mengungguli Sonnet 4.6 di kedua tes ini. Di effort level tinggi, hasilnya mendekati Opus 4.8.

Artinya, untuk tugas jenis ini, Anda bisa naikkan effort level Sonnet 5 dan mendapat kualitas mirip Opus, dengan biaya yang tetap lebih rendah.

Cybersecurity

Anthropic sengaja tidak melatih Sonnet 5 untuk tugas keamanan siber. Model ini bisa mengerjakan tugas cyber ringan yang tidak berbahaya, tapi gagal total pada tes yang lebih berat, seperti membuat exploit untuk kerentanan software. Pada satu tes yang dibuat bersama Mozilla untuk kerentanan Firefox, Sonnet 5 tidak pernah berhasil membuat exploit yang berfungsi penuh.

Kalau pekerjaan Anda melibatkan security research atau red-teaming, Sonnet 5 bukan pilihan yang tepat. Opus 4.8 jauh lebih mampu di area ini.

Perilaku berisiko (misaligned behavior)

misaligned behavior Sonnet 5 Benchmark | Sumber: Anthropic

Anthropic menguji model dengan audit perilaku otomatis, mencakup hal-hal seperti kecenderungan model membantu penyalahgunaan atau berbohong. Sonnet 5 mendapat skor lebih rendah (lebih aman) dibanding Sonnet 4.6. Tapi skornya masih lebih tinggi dibanding Opus 4.8 dan Mythos Preview.

Jadi Sonnet 5 lebih aman dari pendahulunya, tapi belum seaman model kelas Opus.

Angka yang tidak perlu Anda pusingkan

Anthropic merilis banyak skor benchmark lain di system card. Kecuali Anda mengerjakan riset AI atau membangun produk yang butuh detail teknis penuh, tiga angka di atas cukup untuk membantu Anda memutuskan: apakah tugas Anda cocok dipindah ke Sonnet 5, dan effort level mana yang perlu Anda pakai.

Berapa Sebenarnya Biaya yang Anda Bayar

Sonnet 5 punya dua tahap harga.

Sampai 31 Agustus 2026, Anda membayar harga promo: $2 per juta token input, $10 per juta token output. Setelah tanggal itu, harga naik ke $3 per juta token input dan $15 per juta token output.

Sebagai pembanding, Opus 4.8 dihargai $5 per juta token input dan $25 per juta token output.

Di harga standar, Sonnet 5 sekitar 40% lebih murah dari Opus 4.8. Di harga promo, selisihnya lebih besar lagi.

Tapi ada satu hal yang bisa membuat perhitungan Anda salah

Sonnet 5 memakai tokenizer baru. Tokenizer ini memecah teks yang sama menjadi lebih banyak token dibanding Sonnet 4.6, sekitar 1,0 sampai 1,35 kali lipat, tergantung jenis kontennya.

Artinya, harga per token yang lebih murah tidak otomatis membuat total biaya Anda lebih murah. Kalau tugas Anda menghasilkan 35% lebih banyak token, sebagian penghematan dari harga promo bisa habis di sana.

Anthropic sendiri mengatakan harga promo sengaja dibuat kira-kira cost-neutral untuk transisi ini. Artinya, harga promo dirancang untuk menutup kenaikan jumlah token, bukan untuk membuat Anda hemat besar-besaran sejak hari pertama.

Cara mengecek biaya Anda sendiri

Jangan hanya bandingkan angka $2/$10 dengan harga model lama Anda. Jalankan beberapa tugas nyata di Sonnet 5, cek jumlah token yang terpakai, lalu bandingkan total biayanya dengan yang Anda keluarkan sebelumnya. Baru dari situ Anda tahu penghematan sebenarnya untuk kasus pemakaian Anda.

Setelah 31 Agustus 2026

Ingat, harga $2/$10 itu sementara. Kalau Anda merencanakan migrasi jangka panjang, hitung biayanya berdasarkan harga standar $3/$15, bukan harga promo. Ini mencegah Anda kaget saat harga naik di bulan September.

Kapan Anda Tetap Harus Pakai Opus 4.8

Cybersecurity dan security research. Sonnet 5 sengaja tidak dilatih untuk tugas ini. Opus 4.8 jauh lebih mampu, dan sudah masuk Cyber Verification Program untuk kerja dengan guardrail yang dikurangi.
Tugas yang butuh akurasi maksimal. Kalau kesalahan kecil berdampak besar, misalnya kode produksi yang langsung dipakai tanpa review, atau keputusan berbasis reasoning yang tidak boleh salah, Opus 4.8 masih lebih andal.
Perilaku berisiko jadi pertimbangan penting. Opus 4.8 mendapat skor lebih rendah di audit misaligned behavior dibanding Sonnet 5. Untuk pekerjaan yang sensitif terhadap perilaku model, ini beda yang terasa.
Anda sudah memakai effort xhigh dan tetap kurang. Kalau Sonnet 5 di effort tertinggi belum mencapai kualitas yang Anda butuhkan, menaikkan effort lebih jauh hanya membuat biaya naik tanpa hasil yang cukup. Di titik ini, Opus 4.8 kemungkinan lebih efisien.
Volume rendah, tapi dampak tinggi. Kalau Anda menjalankan sedikit request tapi tiap request harus benar, selisih harga antar model jadi tidak signifikan dibanding risiko hasil yang meleset.

Kalau tidak masuk salah satu poin di atas, Sonnet 5 layak dicoba dulu.

Kesimpulan

Sonnet 5 tidak menggantikan Opus 4.8 sepenuhnya, tapi mempersempit jarak di banyak tugas agentic dengan biaya yang lebih rendah. Anda mendapat kontrol lewat effort level: naikkan saat tugas Anda butuh kualitas lebih, turunkan saat tugas Anda sederhana.

Sebelum migrasi penuh, cek dua hal. Pertama, jalankan tugas nyata Anda di Sonnet 5 dan hitung biaya sebenarnya, bukan cuma bandingkan harga per token, karena tokenizer baru bisa mengubah perhitungan Anda. Kedua, cek apakah pekerjaan Anda masuk kategori yang masih butuh Opus 4.8, seperti security research atau tugas dengan toleransi kesalahan yang rendah.

Kalau pekerjaan Anda coding harian, automasi, atau tugas agentic umum, Sonnet 5 di harga promo saat ini layak dicoba sekarang. Kalau Anda menunggu sampai harga naik di September, hitungan biayanya akan berubah, jadi lakukan pengujian Anda lebih awal.

Referensi: