Early Access sichern
Token-Guide · 13 Tricks · Mai 2026

Claude Code Limits, mit 13 Tricks endgültig vorbei.

Ich baue gerade eine Community für alle, die Claude Code richtig lernen wollen. Trag dich ein für Early Access.

Drei Settings im Video. Zehn weitere, die du auch nutzen solltest.

Sortiert nach Schwierigkeit. Von Slash Commands die in einer Sekunde laufen bis zum Modell-Wechsel, der dir 5x weniger Kosten beschert. Klick auf jeden Trick für die Setup-Anleitung.

Slash Commands5 Tricks · sofort einsetzbar
01

opusplan — das richtige Modell für den richtigen Job

Slash Command·5 Sekunden Setup·Impact: hoch

Claude Code nutzt im opusplan-Modus automatisch Opus 4.7 fürs Planen und das günstigere Sonnet 4.6 fürs eigentliche Coden. Opus verbrennt Tokens wie verrückt, Sonnet 4.6 reicht für etwa 95% der Aufgaben komplett aus.

Setup
  1. Im Terminal /model eingeben
  2. Aus der Liste opusplan wählen
  3. Fertig — gilt ab sofort für die ganze Session
02

/compact — lange Chats komprimieren

Slash Command·1 Sekunde Setup·Impact: hoch

Sobald deine Konversation lang wird, zieht jeder neue Prompt den ganzen alten Verlauf mit. /compact packt den kompletten Chat in eine kurze Zusammenfassung und du arbeitest mit einem Bruchteil der Tokens weiter.

Setup
  1. Bei ungefähr 60% Context-Auslastung einfach /compact eintippen
  2. Claude erstellt automatisch eine Zusammenfassung und du arbeitest weiter
03

ultrathink — vor dem Coden durchdenken

Magic Word·1 Sekunde Setup·Impact: mittel

Magic Word, das Claude zwingt erst die komplette Lösung durchzudenken bevor er eine Zeile Code schreibt. Heisst weniger Fehler, weniger Retries und damit weniger verbrannte Tokens.

Setup
  1. Schreib ultrathink ans Ende deines Prompts wenn die Aufgabe komplex ist
  2. Beispiel: „Refactor das ganze Auth-System ultrathink"
04

/clear — sauberer Reset zwischen Tasks

Slash Command·1 Sekunde Setup·Impact: hoch

Jeder neue Task verdient einen sauberen Context. Wenn du den alten Chat mitschleifst, wird er bei jeder Nachricht wieder mitgeladen und frisst Tokens für nichts.

Setup
  1. Sobald du mit einer Aufgabe fertig bist /clear eingeben
  2. Faustregel: alle 1 bis 2 Stunden Arbeit oder beim Task-Wechsel
05

Plan Mode — Plan reviewen bevor Code geschrieben wird

Toggle · Shift+Tab·1 Sekunde Setup·Impact: mittel

Claude schreibt erst einen Plan, du reviewst ihn, kürzt Unnötiges raus und dann wird erst gecodet. Verhindert das grösste Token-Loch: Trial-and-Error-Execution.

Setup
  1. Shift+Tab drücken um Plan Mode zu aktivieren
  2. Claude liefert nur den Plan, ohne Code zu schreiben
  3. Plan reviewen, nochmal Shift+Tab für Execution
Konfiguration3 Tricks · einmaliges Setup
06

CLAUDE.md kürzen und richtig aufsetzen

Konfiguration·5 Minuten Setup·Impact: hoch

Die CLAUDE.md in deinem Projekt wird bei jeder Nachricht mitgeladen. Wenn die 1000 Zeilen lang ist, frisst sie konstant Tokens — egal was du fragst.

Setup
  1. CLAUDE.md im Projekt-Root öffnen
  2. Auf unter 200 Zeilen kürzen
  3. Drin lassen: Tech-Stack, Build-Commands, harte Coding-Regeln, Ordner-Struktur
  4. Raus: Meeting-Notizen, History, lange Erklärungen, To-Dos
07

User-Memory aufräumen

Konfiguration·3 Minuten Setup·Impact: mittel

Deine globale User-Memory wird in jedem Projekt geladen. Wenn die voll ist, wird jeder Chat unnötig belastet — egal an welchem Projekt du arbeitest.

Setup
  1. In Claude Code /memory eingeben um User-Memory zu öffnen
  2. Alles raus was projekt-spezifisch ist (gehört in die Projekt-CLAUDE.md)
  3. Drin lassen: Sprache, Stil, allgemeine Präferenzen
08

Ungenutzte MCPs disconnecten

Konfiguration·1 Minute Setup·Impact: hoch

Jeder verbundene MCP-Server lädt seine Tool-Definitionen bei jeder Nachricht in den Context — bis zu 18.000 Tokens pro Server, auch wenn du ihn gerade gar nicht nutzt.

Setup
  1. Temporär in der Session: /mcp disconnect <name>
  2. Persistent im Terminal: claude mcp remove <name>
  3. Faustregel: nur die MCPs aktiv halten, die du täglich nutzt
Skills & Plugins3 Tricks · Installation nötig
09

Caveman Skill installieren

Skill·1 Minute Setup·Impact: mittel

Claude antwortet im „Höhlenmensch-Stil" — keine Höflichkeiten, keine langen Erklärungen. Spart bis zu 65% Output-Tokens. Real über eine ganze Session sind das ungefähr 25% weniger Tokens.

Setup für macOS / Linux
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bash
Setup für Windows (PowerShell)
irm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iex

Aktivieren im Chat mit /caveman, stoppen mit „normal mode".

github.com/JuliusBrussee/caveman
10

claude-mem für Persistent Memory installieren

Plugin·2 Minuten Setup·Impact: mittel

Persistent Memory über alle Sessions hinweg. Claude erinnert sich an alles, was du in vorherigen Sessions gemacht hast — keine ständigen „erklär nochmal was wir letztens gemacht haben"-Rebuilds.

Setup im Terminal
npx claude-mem install
Alternativ direkt in Claude Code
/plugin marketplace add thedotmack/claude-mem
/plugin install claude-mem

Danach Claude Code neu starten. Dashboard läuft lokal auf localhost:37777.

github.com/thedotmack/claude-mem
11

Subagents nutzen statt selber durchsuchen

Workflow·kein Setup·Impact: mittel

Statt Claude selber durch deinen Code stöbern zu lassen, schickst du einen Sub-Agent los. Der recherchiert isoliert, kommt mit fertigem Ergebnis zurück — dein Haupt-Context bleibt sauber und Token-arm.

Setup
  1. Im Prompt sagen: „Spawne einen Subagent der XYZ recherchiert"
  2. Oder explizit: „Nutz den Task-Tool dafür"
  3. Kein Setup nötig — ist standardmässig in Claude Code drin
Workflow & Modell-Wechsel2 Tricks · grösster Hebel
12

Keine PDFs hochladen — vorher zu Markdown konvertieren

Workflow·30 Sekunden pro Dokument·Impact: mittel

PDFs sind extrem token-hungrig — Whitespace, Seitenzahlen, kaputte Formatierung verbrennen Tokens für nichts. Markdown ist bis zu 10 bis 20-mal token-effizienter bei gleichem Inhalt.

Setup mit MarkItDown (Microsoft)
uvx markitdown deine-datei.pdf > deine-datei.md

Danach die .md-Datei statt der PDF an Claude geben. Bei wiederkehrender Nutzung: einmal im Projekt-Ordner ablegen und referenzieren.

PDF-to-Markdown Skill installieren
13

Kimi K2.6 nutzen — 5x günstigeres Modell

Modell-Wechsel·5 Minuten Setup·Impact: sehr hoch

Moonshot AIs neues Modell. 5-mal günstiger beim Input, 6-mal günstiger beim Output als Sonnet 4.6 — bei vergleichbarer Coding-Performance. Perfekt für lange Coding-Sessions wo du auf Kosten achten musst.

Setup über Atlas Cloud (einfachste Methode)
  1. API-Key holen bei atlascloud.ai
  2. Im Terminal die folgenden 4 Variables setzen (einmalig)
  3. Claude Code normal starten — läuft jetzt über Kimi K2.6
export ANTHROPIC_BASE_URL="https://api.atlascloud.ai"
export ANTHROPIC_AUTH_TOKEN="dein-api-key"
export ANTHROPIC_MODEL="moonshot/kimi-k2.6"
export ANTHROPIC_SMALL_FAST_MODEL="moonshot/kimi-k2.6"

Preis: $0.60 pro Million Input-Tokens, $2.50 pro Million Output-Tokens. Alternative über die offizielle Moonshot API: platform.moonshot.ai.

platform.moonshot.ai
SKAILE Community · Early Access

Workshops, Q&A und alle meine Skills und Magic-Prompts an einem Ort. Trag dich ein für Early Access in die Community.

Community · Early Access

Werde Teil der SKAILE Community.

Ich baue gerade eine Community für alle, die Claude Code richtig lernen wollen. Workshops, Q&A, alle Skills und Magic-Prompts an einem Ort. Trag dich ein für Early Access.