Open SourceFeatured

SEO Audit CLI

Crawl-basierte technische SEO-Audits mit JS-Rendering, Lighthouse, CrUX, Berichten und CI-Diffing.

TypeScriptPlaywrightLighthouseCrUXCheerioVitest

Ich habe dieses Tool als Open-Source-Alternative für wiederholbare technische SEO-Audits gebaut. Es crawlt Websites, findet Probleme mit Metadaten, Canonicals, hreflang, internen Links und strukturierten Daten, kann JavaScript-lastige Seiten mit Playwright rendern, reichert Ergebnisse mit CrUX- und Lighthouse-Daten an und erzeugt JSON-, HTML-, Text- und PDF-Berichte, die in CI verglichen werden können.

Das Problem

SEO-Teams flicken einen Crawler, Lighthouse, Search Console und GA4 zusammen, um zu diagnostizieren, warum eine Site nicht rankt. Sie korrelieren Traffic manuell mit technischen Problemen, übersehen Probleme bei der internen Linkverteilung, bekommen Fehlalarme auf Seiten ohne Traffic und können zwischen Audits keine Regressionstests machen. SEO Audit liefert all das in einem CLI.

Der Ansatz

Ein TypeScript-CLI auf Basis von Playwright und Lighthouse. Der Crawler handhabt Sitemaps, Retries, Redirects und JS-Rendering für SPAs. Über fünfzig Prüfungen decken Metadaten, Canonicals, strukturierte Daten, Core Web Vitals, Linkverteilung und Content-Duplikation ab. Optionale Anreicherung mit CrUX, Search Console und GA4 ordnet Befunde nach realem Traffic-Impact.

Bemerkenswerte Entscheidungen

  • Auto-persistierte Crawls. Jeder Lauf schreibt nach ~/.config/seo-audit/crawls/<host>/ für Diff- und Regressionsprüfungen.
  • PageRank-Berechnung (Damping 0.85, 20 Iterationen) bringt wichtige Seiten ans Licht, die nur einen internen Link bekommen.
  • MinHash-Near-Duplicate-Erkennung (Jaccard >= 0.85) gruppiert Inhalte über Seiten hinweg.
  • Log-Analyse-Subcommand parst Access-Logs, verifiziert Bots über Reverse-DNS und joint sie mit dem persistierten Crawl für Findings zu verwaisten Seiten und veraltetem Cache.
  • GitHub Action und --fail-on-Flag für CI-Gates gegen Regressionen.

Status

Veröffentlicht auf npm als @davo20019/seo-audit. v0.8.0 erschienen im April 2026. Jüngste Arbeiten an Log-Analyse, GA4-Support, Content-Dedup und Link-Graph-PageRank.

Want similar work for your team?

AI-native senior engineering for AI, cloud, and web. Open to consulting engagements and full-time roles.