Ich baue gerade eine Community für alle, die Claude Code richtig lernen wollen. Trag dich ein für Early Access.
Sortiert nach Schwierigkeit. Von Slash Commands die in einer Sekunde laufen bis zum Modell-Wechsel, der dir 5x weniger Kosten beschert. Klick auf jeden Trick für die Setup-Anleitung.
Claude Code nutzt im opusplan-Modus automatisch Opus 4.7 fürs Planen und das günstigere Sonnet 4.6 fürs eigentliche Coden. Opus verbrennt Tokens wie verrückt, Sonnet 4.6 reicht für etwa 95% der Aufgaben komplett aus.
Sobald deine Konversation lang wird, zieht jeder neue Prompt den ganzen alten Verlauf mit. /compact packt den kompletten Chat in eine kurze Zusammenfassung und du arbeitest mit einem Bruchteil der Tokens weiter.
Magic Word, das Claude zwingt erst die komplette Lösung durchzudenken bevor er eine Zeile Code schreibt. Heisst weniger Fehler, weniger Retries und damit weniger verbrannte Tokens.
Jeder neue Task verdient einen sauberen Context. Wenn du den alten Chat mitschleifst, wird er bei jeder Nachricht wieder mitgeladen und frisst Tokens für nichts.
Claude schreibt erst einen Plan, du reviewst ihn, kürzt Unnötiges raus und dann wird erst gecodet. Verhindert das grösste Token-Loch: Trial-and-Error-Execution.
Die CLAUDE.md in deinem Projekt wird bei jeder Nachricht mitgeladen. Wenn die 1000 Zeilen lang ist, frisst sie konstant Tokens — egal was du fragst.
Deine globale User-Memory wird in jedem Projekt geladen. Wenn die voll ist, wird jeder Chat unnötig belastet — egal an welchem Projekt du arbeitest.
Jeder verbundene MCP-Server lädt seine Tool-Definitionen bei jeder Nachricht in den Context — bis zu 18.000 Tokens pro Server, auch wenn du ihn gerade gar nicht nutzt.
Claude antwortet im „Höhlenmensch-Stil" — keine Höflichkeiten, keine langen Erklärungen. Spart bis zu 65% Output-Tokens. Real über eine ganze Session sind das ungefähr 25% weniger Tokens.
curl -fsSL https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.sh | bashirm https://raw.githubusercontent.com/JuliusBrussee/caveman/main/install.ps1 | iexAktivieren im Chat mit /caveman, stoppen mit „normal mode".
github.com/JuliusBrussee/cavemanPersistent Memory über alle Sessions hinweg. Claude erinnert sich an alles, was du in vorherigen Sessions gemacht hast — keine ständigen „erklär nochmal was wir letztens gemacht haben"-Rebuilds.
npx claude-mem install/plugin marketplace add thedotmack/claude-mem/plugin install claude-memDanach Claude Code neu starten. Dashboard läuft lokal auf localhost:37777.
github.com/thedotmack/claude-memStatt Claude selber durch deinen Code stöbern zu lassen, schickst du einen Sub-Agent los. Der recherchiert isoliert, kommt mit fertigem Ergebnis zurück — dein Haupt-Context bleibt sauber und Token-arm.
PDFs sind extrem token-hungrig — Whitespace, Seitenzahlen, kaputte Formatierung verbrennen Tokens für nichts. Markdown ist bis zu 10 bis 20-mal token-effizienter bei gleichem Inhalt.
uvx markitdown deine-datei.pdf > deine-datei.mdDanach die .md-Datei statt der PDF an Claude geben. Bei wiederkehrender Nutzung: einmal im Projekt-Ordner ablegen und referenzieren.
PDF-to-Markdown Skill installierenMoonshot AIs neues Modell. 5-mal günstiger beim Input, 6-mal günstiger beim Output als Sonnet 4.6 — bei vergleichbarer Coding-Performance. Perfekt für lange Coding-Sessions wo du auf Kosten achten musst.
export ANTHROPIC_BASE_URL="https://api.atlascloud.ai"export ANTHROPIC_AUTH_TOKEN="dein-api-key"export ANTHROPIC_MODEL="moonshot/kimi-k2.6"export ANTHROPIC_SMALL_FAST_MODEL="moonshot/kimi-k2.6"Preis: $0.60 pro Million Input-Tokens, $2.50 pro Million Output-Tokens. Alternative über die offizielle Moonshot API: platform.moonshot.ai.
platform.moonshot.aiWorkshops, Q&A und alle meine Skills und Magic-Prompts an einem Ort. Trag dich ein für Early Access in die Community.
Ich baue gerade eine Community für alle, die Claude Code richtig lernen wollen. Workshops, Q&A, alle Skills und Magic-Prompts an einem Ort. Trag dich ein für Early Access.