Opus 4.7 Survival

Claude Code kostet seit Opus 4.7 einfach 35% mehr als davor. Gleicher Prompt, gleiche Antwort — nur mehr Tokens. Hier ist warum und fünf Settings die es sofort wieder runterbringen.

Was passiert ist

Anthropic hat Opus 4.7 gelauncht. Klingt erstmal wie ein normales Upgrade, aber damit wurde auch ein neuer Tokenizer ausgerollt. Ergebnis: Du schreibst denselben Prompt wie letzte Woche, bekommst auch dieselbe Antwort — verbrauchst aber einfach 35% mehr Tokens.

Das Limit war sowieso schon ein Problem. Viele — ich auch — haben sich schon den 200$-Plan geholt um überhaupt arbeiten zu können. Jetzt ist es noch schlimmer. Wenn sich dein Claude Code gerade komisch anfühlt — das ist wahrscheinlich der Grund.

Setting 1 — Haiku für den Kleinkram

Claude Code lässt dich das teuerste Modell laufen — auch für Aufgaben bei denen Haiku locker reichen würde: Files lesen, kleine Edits, Grep-Durchläufe, Recherche.

Der Trick: Claude selbst entscheiden lassen wann Haiku reicht. Du brauchst eine Regel in deiner CLAUDE.md die Claude sagt: "Sag mir bei simplen Tasks Bescheid damit ich auf Haiku switchen kann."

Ab dem Moment kommt bei jedem Kleinkram-Task die Ansage: "Kleinkram — switch auf /model haiku bevor ich loslege." Du tippst den Befehl, Task läuft auf Haiku, danach /model opus zurück.

Option 1 — CLAUDE.md manuell ergänzen:

Füge in deine CLAUDE.md (im Projekt-Root oder global in ~/.claude/CLAUDE.md) ein:

## Modell-Switching
Wenn du einen Task als simpel einstufst (Files lesen, Grep, kleine Edits, Recherche ohne Architektur-Impact), sag mir BEVOR du loslegst: "Kleinkram — switch auf Haiku mit /model haiku."

Nach dem Task erinnere mich: "Zurueck auf Opus mit /model opus."

Bei komplexen Tasks (Architektur, Debug, Multi-File-Refactor) bleib auf Opus und fang direkt an.

Option 2 — Prompt an Claude Code (trägt's für dich ein):

Trag in meine CLAUDE.md eine Regel ein: Wenn du einen Task als simpel einstufst (Files lesen, Grep, kleine Edits, Recherche ohne Architektur-Impact), sag mir VORHER Bescheid dass ich auf Haiku switchen soll mit /model haiku. Nach dem Task erinnerst du mich wieder zurück auf Opus zu switchen. Bei komplexen Tasks bleibst du auf Opus.

Ersparnis: ~15% — wenn du die Switches konsequent durchziehst.

Setting 2 — Unnötige MCPs raus

Jeder MCP den du installiert hast schickt bei JEDER Nachricht seine kompletten Tool-Schemas mit. Auch wenn du ihn in der Session nie nutzt. Das sind schnell 5-10k Tokens Grundlast pro Nachricht — Playwright, Figma, Notion, Supabase summiert.

Option 1 — Terminal:

/mcp

Zeigt dir alle aktiven MCP-Server. Alles was du gerade nicht brauchst — deaktivieren.

Option 2 — Prompt an Claude Code:

Zeig mir alle aktiven MCP-Server in meinem aktuellen Projekt (/mcp) und empfiehl welche ich fuer meinen Workflow gerade nicht brauche. Danach hilfst du mir die nicht benoetigten zu deaktivieren.

Pro-Tipp: Beim Installieren neuer MCPs --scope project statt --scope user — so laden sie nur im Projekt wo du sie brauchst, nicht global überall.

Ersparnis: ~10-15%

Setting 3 — MAX_THINKING_TOKENS cappen

Der versteckteste Kostenfresser. Default ist unbegrenzt. Opus kann für eine einzige Antwort 50.000+ Thinking-Tokens verbrennen — die siehst du nie, zahlst aber voll.

Option 1 — Prompt an Claude Code:

Begrenze mein Thinking-Token-Budget auf 8000. Setz MAX_THINKING_TOKENS in meiner .claude/settings.json unter env — falls die Datei noch nicht existiert, leg sie an. Pruef danach ob es richtig uebernommen wurde.

Option 2 — Manuell:

In .claude/settings.json ergänzen:

{
  "env": {
    "MAX_THINKING_TOKENS": "8000"
  }
}

8.000 Tokens reichen für die meisten Tasks. Für komplexe Architektur-Entscheidungen kannst du punktuell höher gehen.

Ersparnis: ~20-30% bei komplexen Tasks

Setting 4 — /model opusplan

Der beste Kompromiss aus Qualität und Kosten. Opus plant (teuer, aber gut), Sonnet führt aus (günstig).

Option 1 — Terminal:

/model opusplan

Ab jetzt: Plan-Mode läuft auf Opus — da wo komplexe Architektur-Entscheidungen fallen. Sobald es ans Implementieren geht, schaltet Claude automatisch auf Sonnet um.

Option 2 — Prompt an Claude Code:

Aktivier /model opusplan fuer mich. Erklaer mir kurz wann Opus laeuft und wann Sonnet uebernimmt, damit ich weiss was das fuer meine Kosten und Antwort-Qualitaet heisst.

Du zahlst Opus-Preis nur für die Planung. Die gesamte Umsetzung — Code generieren, Files editieren, Tests schreiben — läuft auf Sonnet.

Ersparnis: bis zu 68% bei planungs-intensiven Tasks

Setting 5 — /effort je nach Task

Default ist hohes Thinking-Budget für alles. Für "refactor diese eine Funktion" komplett overkill. Die meisten User lassen's auf default (max) — und zahlen 3x mehr als nötig für simple Tasks.

Option 1 — Terminal:

/effort minimal    # einzelne Files, simple Edits
/effort medium     # mehrere Files, Logik-Aenderungen
/effort max        # Architektur, Debug, Design

Option 2 — Prompt an Claude Code:

Passe den /effort-Level automatisch an meine Aufgabe an: minimal fuer kleine Edits, medium fuer Multi-File-Aenderungen, max nur wenn ich Architektur oder Debug sage. Frag nach wenn du dir unsicher bist welcher Level passt.

Ein bewusster Switch vor jeder größeren Aktion spart massiv.

Ersparnis: ~20-30%

Was das zusammen bringt

Setting	Ersparnis
Haiku für Kleinkram	15%
Unnötige MCPs raus	10-15%
MAX_THINKING_TOKENS	20-30%
opusplan statt pure Opus	bis 68%
/effort bewusst	20-30%

Kumuliert landest du realistisch bei 40-70% weniger Tokens — ohne Qualitätsverlust bei den Tasks wo's drauf ankommt.

💸 Das sind die Settings die ich selbst nutze seit Opus 4.7. Wenn du noch tiefer in Token-Optimierung willst — in der Community zeige ich welche MCPs sich wirklich lohnen, wie ich CLAUDE.md-Rules baue die Claude zur Kürze zwingen, und welche Hook-Setups Bash-Output automatisch klein halten. → Zur Claude Code Mastery Community