Open SourceFeatured

SEO Audit CLI

Crawl-gebaseerde technische SEO-audits met JS-rendering, Lighthouse, CrUX, rapporten en CI-diffing.

TypeScriptPlaywrightLighthouseCrUXCheerioVitest

Ik heb deze tool gebouwd als open-source alternatief voor herhaalbare technische SEO-audits. Hij crawlt sites, markeert problemen met metadata, canonicals, hreflang, interne links en gestructureerde data, kan JavaScript-zware pagina's renderen met Playwright, verrijkt resultaten met CrUX- en Lighthouse-data en maakt JSON-, HTML-, tekst- en PDF-rapporten die in CI kunnen worden vergeleken.

Het probleem

SEO-teams plakken een crawler, Lighthouse, Search Console en GA4 aan elkaar om te diagnosticeren waarom een site niet rankt. Ze correleren handmatig traffic met technische problemen, missen problemen rond interne link equity, krijgen vals alarm op pagina's zonder traffic en kunnen tussen audits geen regressietests doen. SEO Audit levert dat alles in één CLI.

De aanpak

Een TypeScript-CLI gebouwd op Playwright en Lighthouse. De crawler handelt sitemaps, retries, redirects en JS-rendering voor SPA's af. Meer dan vijftig checks dekken metadata, canonicals, gestructureerde data, Core Web Vitals, link equity en content-duplicatie. Optionele verrijking met CrUX, Search Console en GA4 sorteert findings op echte traffic-impact.

Opmerkelijke keuzes

  • Auto-gepersisteerde crawls. Elke run schrijft naar ~/.config/seo-audit/crawls/<host>/ voor diff en regressie-checks.
  • PageRank-berekening (damping 0.85, 20 iteraties) brengt belangrijke pagina's die maar één interne link krijgen aan het licht.
  • MinHash near-duplicate detectie (Jaccard >= 0.85) clustert content over pagina's heen.
  • Log-analyse subcommand parseert access logs, verifieert bots via reverse-DNS en voegt ze samen met de gepersisteerde crawl voor findings rond verweesde pagina's en stale cache.
  • GitHub Action en --fail-on flag voor CI-gates tegen regressies.

Status

Gepubliceerd op npm als @davo20019/seo-audit. v0.8.0 uitgebracht in april 2026. Recent werk aan log-analyse, GA4-ondersteuning, content-deduplicatie en link-graph PageRank.

Want similar work for your team?

AI-native senior engineering for AI, cloud, and web. Open to consulting engagements and full-time roles.