SEO Audit CLI
Audit SEO tecnici basati su crawl con rendering JS, Lighthouse, CrUX, report e diff in CI.
Ho creato questo strumento come alternativa open source per audit SEO tecnici ripetibili. Esegue il crawl dei siti, segnala problemi di metadati, canonical, hreflang, link interni e dati strutturati, può renderizzare pagine ricche di JavaScript con Playwright, arricchisce i risultati con dati CrUX e Lighthouse e produce report JSON, HTML, testo e PDF confrontabili in CI.
Il problema
I team SEO assemblano un crawler, Lighthouse, Search Console e GA4 per diagnosticare perché un sito non posiziona. Correlano traffico e problemi tecnici a mano, perdono problemi di equity di link interni, ricevono falsi allarmi su pagine senza traffico e non possono fare test di regressione tra un audit e l'altro. SEO Audit consegna tutto in un singolo CLI.
L'approccio
Un CLI TypeScript costruito su Playwright e Lighthouse. Il crawler gestisce sitemap, retry, redirect e rendering JS per SPA. Oltre cinquanta controlli coprono metadati, canonical, dati strutturati, Core Web Vitals, equity di link e duplicazione di contenuto. L'arricchimento opzionale con CrUX, Search Console e GA4 ordina i finding per impatto reale sul traffico.
Decisioni notevoli
- Crawl auto-persistiti. Ogni esecuzione scrive in ~/.config/seo-audit/crawls/<host>/ per diff e check di regressione.
- Calcolo del PageRank (damping 0.85, 20 iterazioni) che fa emergere pagine importanti che ricevono un solo link interno.
- Rilevamento di quasi-duplicati con MinHash (Jaccard >= 0.85) che raggruppa contenuti tra pagine.
- Sottocomando di analisi log che parsifica access log, verifica bot via reverse DNS e li unisce al crawl persistito per finding di pagine orfane e cache obsoleta.
- GitHub Action e flag --fail-on per gate CI contro le regressioni.
Stato
Pubblicato su npm come @davo20019/seo-audit. v0.8.0 rilasciata ad aprile 2026. Lavoro recente su analisi log, supporto GA4, deduplica di contenuto e PageRank del grafo di link.
Want similar work for your team?
AI-native senior engineering for AI, cloud, and web. Open to consulting engagements and full-time roles.