13 Tricks gegen Claude Code Limits

Die 13 Tricks

Drei Settings im Video. Zehn weitere, die du auch nutzen solltest.

Sortiert nach Schwierigkeit. Von Slash Commands die in einer Sekunde laufen bis zum Modell-Wechsel, der dir 5x weniger Kosten beschert. Klick auf jeden Trick für die Setup-Anleitung.

Slash Commands5 Tricks · sofort einsetzbar

opusplan — das richtige Modell für den richtigen Job

Slash Command·5 Sekunden Setup·Impact: hoch

Claude Code nutzt im opusplan-Modus automatisch Opus 4.7 fürs Planen und das günstigere Sonnet 4.6 fürs eigentliche Coden. Opus verbrennt Tokens wie verrückt, Sonnet 4.6 reicht für etwa 95% der Aufgaben komplett aus.

Setup

Im Terminal /model eingeben
Aus der Liste opusplan wählen
Fertig — gilt ab sofort für die ganze Session

/compact — lange Chats komprimieren

Slash Command·1 Sekunde Setup·Impact: hoch

Sobald deine Konversation lang wird, zieht jeder neue Prompt den ganzen alten Verlauf mit. /compact packt den kompletten Chat in eine kurze Zusammenfassung und du arbeitest mit einem Bruchteil der Tokens weiter.

Setup

Bei ungefähr 60% Context-Auslastung einfach /compact eintippen
Claude erstellt automatisch eine Zusammenfassung und du arbeitest weiter

ultrathink — vor dem Coden durchdenken

Magic Word·1 Sekunde Setup·Impact: mittel

Magic Word, das Claude zwingt erst die komplette Lösung durchzudenken bevor er eine Zeile Code schreibt. Heisst weniger Fehler, weniger Retries und damit weniger verbrannte Tokens.

Setup

Schreib ultrathink ans Ende deines Prompts wenn die Aufgabe komplex ist
Beispiel: „Refactor das ganze Auth-System ultrathink"

/clear — sauberer Reset zwischen Tasks

Slash Command·1 Sekunde Setup·Impact: hoch

Jeder neue Task verdient einen sauberen Context. Wenn du den alten Chat mitschleifst, wird er bei jeder Nachricht wieder mitgeladen und frisst Tokens für nichts.

Setup

Sobald du mit einer Aufgabe fertig bist /clear eingeben
Faustregel: alle 1 bis 2 Stunden Arbeit oder beim Task-Wechsel

Plan Mode — Plan reviewen bevor Code geschrieben wird

Toggle · Shift+Tab·1 Sekunde Setup·Impact: mittel

Claude schreibt erst einen Plan, du reviewst ihn, kürzt Unnötiges raus und dann wird erst gecodet. Verhindert das grösste Token-Loch: Trial-and-Error-Execution.

Setup

Shift+Tab drücken um Plan Mode zu aktivieren
Claude liefert nur den Plan, ohne Code zu schreiben
Plan reviewen, nochmal Shift+Tab für Execution

Konfiguration3 Tricks · einmaliges Setup

CLAUDE.md kürzen und richtig aufsetzen

Konfiguration·5 Minuten Setup·Impact: hoch

Die CLAUDE.md in deinem Projekt wird bei jeder Nachricht mitgeladen. Wenn die 1000 Zeilen lang ist, frisst sie konstant Tokens — egal was du fragst.

Setup

CLAUDE.md im Projekt-Root öffnen
Auf unter 200 Zeilen kürzen
Drin lassen: Tech-Stack, Build-Commands, harte Coding-Regeln, Ordner-Struktur
Raus: Meeting-Notizen, History, lange Erklärungen, To-Dos

User-Memory aufräumen

Konfiguration·3 Minuten Setup·Impact: mittel

Deine globale User-Memory wird in jedem Projekt geladen. Wenn die voll ist, wird jeder Chat unnötig belastet — egal an welchem Projekt du arbeitest.

Setup

In Claude Code /memory eingeben um User-Memory zu öffnen
Alles raus was projekt-spezifisch ist (gehört in die Projekt-CLAUDE.md)
Drin lassen: Sprache, Stil, allgemeine Präferenzen

Ungenutzte MCPs disconnecten

Konfiguration·1 Minute Setup·Impact: hoch

Jeder verbundene MCP-Server lädt seine Tool-Definitionen bei jeder Nachricht in den Context — bis zu 18.000 Tokens pro Server, auch wenn du ihn gerade gar nicht nutzt.

Setup

Temporär in der Session: /mcp disconnect <name>
Persistent im Terminal: claude mcp remove <name>
Faustregel: nur die MCPs aktiv halten, die du täglich nutzt

Skills & Plugins3 Tricks · Installation nötig

Caveman Skill installieren

Skill·1 Minute Setup·Impact: mittel

Claude antwortet im „Höhlenmensch-Stil" — keine Höflichkeiten, keine langen Erklärungen. Spart bis zu 65% Output-Tokens. Real über eine ganze Session sind das ungefähr 25% weniger Tokens.

Setup für macOS / Linux

curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash

Setup für Windows (PowerShell)

irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

Aktivieren im Chat mit /caveman, stoppen mit „normal mode".

github.com/JuliusBrussee/caveman

claude-mem für Persistent Memory installieren

Plugin·2 Minuten Setup·Impact: mittel

Persistent Memory über alle Sessions hinweg. Claude erinnert sich an alles, was du in vorherigen Sessions gemacht hast — keine ständigen „erklär nochmal was wir letztens gemacht haben"-Rebuilds.

Setup im Terminal

npx claude-mem install

Alternativ direkt in Claude Code

/plugin marketplace add thedotmack/claude-mem

/plugin install claude-mem

Danach Claude Code neu starten. Dashboard läuft lokal auf localhost:37777.

github.com/thedotmack/claude-mem

Subagents nutzen statt selber durchsuchen

Workflow·kein Setup·Impact: mittel

Statt Claude selber durch deinen Code stöbern zu lassen, schickst du einen Sub-Agent los. Der recherchiert isoliert, kommt mit fertigem Ergebnis zurück — dein Haupt-Context bleibt sauber und Token-arm.

Setup

Im Prompt sagen: „Spawne einen Subagent der XYZ recherchiert"
Oder explizit: „Nutz den Task-Tool dafür"
Kein Setup nötig — ist standardmässig in Claude Code drin

Workflow & Modell-Wechsel2 Tricks · grösster Hebel

Keine PDFs hochladen — vorher zu Markdown konvertieren

Workflow·30 Sekunden pro Dokument·Impact: mittel

PDFs sind extrem token-hungrig — Whitespace, Seitenzahlen, kaputte Formatierung verbrennen Tokens für nichts. Markdown ist bis zu 10 bis 20-mal token-effizienter bei gleichem Inhalt.

Setup mit MarkItDown (Microsoft)

uvx markitdown deine-datei.pdf > deine-datei.md

Danach die .md-Datei statt der PDF an Claude geben. Bei wiederkehrender Nutzung: einmal im Projekt-Ordner ablegen und referenzieren.

PDF-to-Markdown Skill installieren

Kimi K2.6 nutzen — 5x günstigeres Modell

Modell-Wechsel·5 Minuten Setup·Impact: sehr hoch

Moonshot AIs neues Modell. 5-mal günstiger beim Input, 6-mal günstiger beim Output als Sonnet 4.6 — bei vergleichbarer Coding-Performance. Perfekt für lange Coding-Sessions wo du auf Kosten achten musst.

Setup über Atlas Cloud (einfachste Methode)

API-Key holen bei atlascloud.ai
Im Terminal die folgenden 4 Variables setzen (einmalig)
Claude Code normal starten — läuft jetzt über Kimi K2.6

export ANTHROPIC_BASE_URL="https://api.atlascloud.ai"

export ANTHROPIC_AUTH_TOKEN="dein-api-key"

export ANTHROPIC_MODEL="moonshot/kimi-k2.6"

export ANTHROPIC_SMALL_FAST_MODEL="moonshot/kimi-k2.6"

Preis: $0.60 pro Million Input-Tokens, $2.50 pro Million Output-Tokens. Alternative über die offizielle Moonshot API: platform.moonshot.ai.

platform.moonshot.ai

Claude Code Limits, mit 13 Tricks endgültig vorbei.

Drei Settings im Video. Zehn weitere, die du auch nutzen solltest.

opusplan — das richtige Modell für den richtigen Job

/compact — lange Chats komprimieren

ultrathink — vor dem Coden durchdenken

/clear — sauberer Reset zwischen Tasks

Plan Mode — Plan reviewen bevor Code geschrieben wird

CLAUDE.md kürzen und richtig aufsetzen

User-Memory aufräumen

Ungenutzte MCPs disconnecten

Caveman Skill installieren

claude-mem für Persistent Memory installieren

Subagents nutzen statt selber durchsuchen

Keine PDFs hochladen — vorher zu Markdown konvertieren

Kimi K2.6 nutzen — 5x günstigeres Modell

Werde Teil der SKAILE Community.

Early Access sichern

Du stehst auf der Liste.