Claude AI #2: 7 Cara Hemat Token agar Tidak Cepat Habis

Token Claude terbatas, dan biaya per input/output bisa naik cepat kalau kamu tidak strategis. Di episode pertama series "Kuasai Claude AI", kita udah kenalan sama Claude dan gimana kerja sistem tokennya secara umum. Kali ini kita masuk lebih dalam: bukan cuma "singkat-singkatin prompt" — tapi 7 strategi non-obvious yang bakal mengubah cara kamu pakai Claude. Dari memanfaatkan Projects untuk persistent context, batasi upload file yang tidak perlu, sampai timing yang tepat untuk reset conversation. Semua sudah ditest dan siap langsung kamu aplikasikan.

Kamu pernah galat "rate limit exceeded" atau tiba-tiba token habis sebelum project selesai? Itu pertanda kamu belum pakai Claude dengan hemat. Token bukan cuma "jumlah karakter" — sistemnya lebih nuansa, dan ada blind spots yang sering terlewat developer.

Artikel ini adalah hasil compile dari pengalaman real pengguna Claude yang berhasil stretch token mereka 2-3x lebih lama. Kita bahas teknik-teknik yang tidak akan kamu baca di docs resmi, plus contoh before/after yang konkret.

1. Manfaatkan Projects untuk Context Persistent

Ini trick paling underrated. Kebanyakan orang cuma pakai "New Chat" terus, padahal setiap chat baru = context kosong = kamu harus re-explain konteks.

Solusinya: pakai Projects di Claude. Saat kamu buat project, kamu bisa:

Upload file referensi sekali (dokumentasi, codebase, design doc) — sistem menyimpannya dan re-menggunakan token mereka lebih efisien untuk multiple conversations dalam project itu
Write system instructions satu kali di project level — jangan di setiap prompt
Semua chat dalam project auto-linked ke context yang sama, tanpa kamu perlu repeat

Hasilnya: kamu hemat 20-30% token per conversation karena tidak perlu re-upload atau re-explain hal yang sama.

2. Letakkan System Instructions di Awal Conversation, Bukan di Setiap Prompt

Mistake umum: copy-paste instruksi sistem yang panjang di setiap prompt. Contoh:

Prompt 1: "You are a senior code reviewer. Check this code..."
Prompt 2: "You are a senior code reviewer. Refactor this function..."
Prompt 3: "You are a senior code reviewer. Write tests for..."

Itu buang token 3x lipat. Cara yang benar:

Prompt 1 saja: "You are a senior code reviewer. Dari sekarang, semua conversation ini adalah code review session."
Prompt 2: "Check this code..."
Prompt 3: "Refactor this function..."
Prompt 4: "Write tests for..."

Claude maintain konteks instruksi dari prompt pertama tanpa kamu perlu repeat. Hemat 15-20% token untuk session panjang.

3. Batasi Upload File — Hanya Upload yang Benar-Benar Dipakai

Upload PDF 50 halaman, tapi kamu cuma butuh chapter 3? Token kamu terpakai penuh untuk semua 50 halaman. Solusi:

Extract atau copy-paste hanya section yang relevan ke prompt
Kalau harus upload file lengkap, reference bagian spesifik di prompt: "Fokus ke section 3.2 di file yang di-upload"
Untuk codebase besar, upload hanya folder/file yang dibutuhkan, bukan seluruh repo
Hindari upload image berkualitas tinggi — gunakan screenshot PNG optimal atau deskripsi teks kalau bisa

Pro tip: pakai .txt atau markdown biasa untuk structured data — lebih token-efficient daripada PDF atau DOCX.

4. Gunakan "Continue" Conversation, Jangan Buat Chat Baru Terus-terusan

Tiap kali kamu buat chat baru, token counter reset — tapi konteks lama hilang. Untuk task panjang, tetap di chat yang sama dan gunakan "continue" atau "go further".

Contoh:

Chat 1: "Generate database schema untuk e-commerce app"
Chat 2 (same): "Add migration files untuk users table"
Chat 3 (same): "Create seed data untuk testing"

Jangan: buat Chat 2 baru, buat Chat 3 baru — pakai "continue dalam chat yang sama".

Alasannya: konteks conversation satu file = Claude paham apa udah kita bicarain, tidak perlu re-explain. Chat baru = konteks kosong = buang token untuk intro ulang.

5. Prompt Engineering: Spesifik dan Terstruktur, Bukan Panjang

Mistake: "Tolong buatkan saya aplikasi, yang bisa login, punya dashboard, bisa upload file, ada notifikasi, dan bisa export ke Excel."

Better:

"Buatkan boilerplate React app dengan 3 fitur:
1. Login page (form validation)
2. Protected dashboard route
3. File upload ke S3

Tech stack: React 18, TypeScript, Tailwind CSS.
Jangan: ORM setup, database migration. Fokus ke frontend logic saja."

Prompt kedua lebih pendek, lebih jelas scope-nya = Claude lebih fokus = output lebih relevan = kamu hemat token untuk iterasi fix-fix yang tidak perlu.

6. Pakai Conversation Snapshots untuk Reference, Jangan Copy-Paste Panjang

Kalau kamu udah punya conversation A yang bagus, dan mau pakai hasilnya sebagai starting point conversation B:

Jangan: copy-paste seluruh output A ke prompt conversation B
Pakai: "Berdasarkan conversation sebelumnya tentang [topik], kita lanjut ke..."
Atau: tangkap key insights dari A dan summarize (paraphrase singkat) di B

Ini hemat token karena kamu hanya reference hasil, bukan re-feed seluruh isi ke Claude.

7. Reset Conversation Strategy — Tahu Kapan Harus "Clean Slate"

Konteks panjang bisa jadi blessing dan curse. Kalau conversation kamu udah mencapai 20+ turn, dan topic mulai berubah, konteks tua mulai "noise" — Claude mulai bingung detail mana yang masih relevan.

Strategy:

Kalau masih topic sama: lanjut conversation (jangan reset)
Kalau topic berubah drastis (misalnya dari "code review" jadi "writing" mode): mulai chat baru, tapi reference conversation lama dengan link atau summary singkat
Tiap 30-40 turn: pertimbangkan reset untuk clarity, terutama kalau konteks jadi kacau

Timing yang tepat untuk reset = hemat token dalam jangka panjang karena output lebih fokus dan error-free (fewer iterations).

Before & After Example

Scenario: Kamu mau Claude refactor Django function dan generate test cases. Token yang dipakai:

Approach Lama (tidak efisien):

Chat 1: "I need your help with Django. I have this function..." + paste 80-line function + full context
Chat 2: "Now please write tests for it" + repeat context + paste function again
Chat 3: "Add documentation" + repeat function again
Token: ~3000 tokens (banyak duplikat)

Approach Baru (hemat):

Project: "Django Refactoring"
System instruction (once): "You are a Django best-practice reviewer. Fokus ke performance dan readability."

Chat 1: "Refactor this function: [paste function saja, jangan uraian panjang]"
Chat 2: "Write unit tests for the refactored version"
Chat 3: "Add docstring and type hints"
Token: ~1500 tokens (50% lebih hemat)

Perbedaan: chatbot paham konteks dari sistem instruction + project setting, tidak perlu panjang-panjang di setiap prompt.

Kesimpulan

Token Claude adalah sumber daya terbatas, tapi dengan 7 strategi di atas, kamu bisa stretch penggunaan kamu 2-3x lebih lama. Kunci utamanya: leverage Projects untuk context persistent, manfaatkan system instructions dengan smart, jangan berlebihan upload file, dan gunakan prompt engineering yang spesifik bukan panjang.

Start dengan tips #1 dan #2 (Projects + system instructions) — itu bakal impact paling besar. Kombinasikan dengan tips lainnya sesuai workflow kamu, dan kamu bakal kerasa perbedaannya dalam hitungan hari. Happy optimizing!