Kamu pernah galat "rate limit exceeded" atau tiba-tiba token habis sebelum project selesai? Itu pertanda kamu belum pakai Claude dengan hemat. Token bukan cuma "jumlah karakter" — sistemnya lebih nuansa, dan ada blind spots yang sering terlewat developer.
Artikel ini adalah hasil compile dari pengalaman real pengguna Claude yang berhasil stretch token mereka 2-3x lebih lama. Kita bahas teknik-teknik yang tidak akan kamu baca di docs resmi, plus contoh before/after yang konkret.
1. Manfaatkan Projects untuk Context Persistent
Ini trick paling underrated. Kebanyakan orang cuma pakai "New Chat" terus, padahal setiap chat baru = context kosong = kamu harus re-explain konteks.
Solusinya: pakai Projects di Claude. Saat kamu buat project, kamu bisa:
- Upload file referensi sekali (dokumentasi, codebase, design doc) — sistem menyimpannya dan re-menggunakan token mereka lebih efisien untuk multiple conversations dalam project itu
- Write system instructions satu kali di project level — jangan di setiap prompt
- Semua chat dalam project auto-linked ke context yang sama, tanpa kamu perlu repeat
Hasilnya: kamu hemat 20-30% token per conversation karena tidak perlu re-upload atau re-explain hal yang sama.
2. Letakkan System Instructions di Awal Conversation, Bukan di Setiap Prompt
Mistake umum: copy-paste instruksi sistem yang panjang di setiap prompt. Contoh:
Prompt 1: "You are a senior code reviewer. Check this code..."
Prompt 2: "You are a senior code reviewer. Refactor this function..."
Prompt 3: "You are a senior code reviewer. Write tests for..."
Itu buang token 3x lipat. Cara yang benar:
Prompt 1 saja: "You are a senior code reviewer. Dari sekarang, semua conversation ini adalah code review session."
Prompt 2: "Check this code..."
Prompt 3: "Refactor this function..."
Prompt 4: "Write tests for..."
Claude maintain konteks instruksi dari prompt pertama tanpa kamu perlu repeat. Hemat 15-20% token untuk session panjang.
3. Batasi Upload File — Hanya Upload yang Benar-Benar Dipakai
Upload PDF 50 halaman, tapi kamu cuma butuh chapter 3? Token kamu terpakai penuh untuk semua 50 halaman. Solusi:
- Extract atau copy-paste hanya section yang relevan ke prompt
- Kalau harus upload file lengkap, reference bagian spesifik di prompt: "Fokus ke section 3.2 di file yang di-upload"
- Untuk codebase besar, upload hanya folder/file yang dibutuhkan, bukan seluruh repo
- Hindari upload image berkualitas tinggi — gunakan screenshot PNG optimal atau deskripsi teks kalau bisa
Pro tip: pakai .txt atau markdown biasa untuk structured data — lebih token-efficient daripada PDF atau DOCX.
4. Gunakan "Continue" Conversation, Jangan Buat Chat Baru Terus-terusan
Tiap kali kamu buat chat baru, token counter reset — tapi konteks lama hilang. Untuk task panjang, tetap di chat yang sama dan gunakan "continue" atau "go further".
Contoh:
Chat 1: "Generate database schema untuk e-commerce app"
Chat 2 (same): "Add migration files untuk users table"
Chat 3 (same): "Create seed data untuk testing"
Jangan: buat Chat 2 baru, buat Chat 3 baru — pakai "continue dalam chat yang sama".
Alasannya: konteks conversation satu file = Claude paham apa udah kita bicarain, tidak perlu re-explain. Chat baru = konteks kosong = buang token untuk intro ulang.
5. Prompt Engineering: Spesifik dan Terstruktur, Bukan Panjang
Mistake: "Tolong buatkan saya aplikasi, yang bisa login, punya dashboard, bisa upload file, ada notifikasi, dan bisa export ke Excel."
Better:
"Buatkan boilerplate React app dengan 3 fitur:
1. Login page (form validation)
2. Protected dashboard route
3. File upload ke S3
Tech stack: React 18, TypeScript, Tailwind CSS.
Jangan: ORM setup, database migration. Fokus ke frontend logic saja."
Prompt kedua lebih pendek, lebih jelas scope-nya = Claude lebih fokus = output lebih relevan = kamu hemat token untuk iterasi fix-fix yang tidak perlu.
6. Pakai Conversation Snapshots untuk Reference, Jangan Copy-Paste Panjang
Kalau kamu udah punya conversation A yang bagus, dan mau pakai hasilnya sebagai starting point conversation B:
- Jangan: copy-paste seluruh output A ke prompt conversation B
- Pakai: "Berdasarkan conversation sebelumnya tentang [topik], kita lanjut ke..."
- Atau: tangkap key insights dari A dan summarize (paraphrase singkat) di B
Ini hemat token karena kamu hanya reference hasil, bukan re-feed seluruh isi ke Claude.
7. Reset Conversation Strategy — Tahu Kapan Harus "Clean Slate"
Konteks panjang bisa jadi blessing dan curse. Kalau conversation kamu udah mencapai 20+ turn, dan topic mulai berubah, konteks tua mulai "noise" — Claude mulai bingung detail mana yang masih relevan.
Strategy:
- Kalau masih topic sama: lanjut conversation (jangan reset)
- Kalau topic berubah drastis (misalnya dari "code review" jadi "writing" mode): mulai chat baru, tapi reference conversation lama dengan link atau summary singkat
- Tiap 30-40 turn: pertimbangkan reset untuk clarity, terutama kalau konteks jadi kacau
Timing yang tepat untuk reset = hemat token dalam jangka panjang karena output lebih fokus dan error-free (fewer iterations).
Before & After Example
Scenario: Kamu mau Claude refactor Django function dan generate test cases. Token yang dipakai:
Approach Lama (tidak efisien):
Chat 1: "I need your help with Django. I have this function..." + paste 80-line function + full context
Chat 2: "Now please write tests for it" + repeat context + paste function again
Chat 3: "Add documentation" + repeat function again
Token: ~3000 tokens (banyak duplikat)
Approach Baru (hemat):
Project: "Django Refactoring"
System instruction (once): "You are a Django best-practice reviewer. Fokus ke performance dan readability."
Chat 1: "Refactor this function: [paste function saja, jangan uraian panjang]"
Chat 2: "Write unit tests for the refactored version"
Chat 3: "Add docstring and type hints"
Token: ~1500 tokens (50% lebih hemat)
Perbedaan: chatbot paham konteks dari sistem instruction + project setting, tidak perlu panjang-panjang di setiap prompt.
Kesimpulan
Token Claude adalah sumber daya terbatas, tapi dengan 7 strategi di atas, kamu bisa stretch penggunaan kamu 2-3x lebih lama. Kunci utamanya: leverage Projects untuk context persistent, manfaatkan system instructions dengan smart, jangan berlebihan upload file, dan gunakan prompt engineering yang spesifik bukan panjang.
Start dengan tips #1 dan #2 (Projects + system instructions) — itu bakal impact paling besar. Kombinasikan dengan tips lainnya sesuai workflow kamu, dan kamu bakal kerasa perbedaannya dalam hitungan hari. Happy optimizing!