Open SourceFeatured

SEO Audit CLI

Auditorías técnicas SEO basadas en rastreo con renderizado JS, Lighthouse, CrUX, reportes y diffing en CI.

TypeScriptPlaywrightLighthouseCrUXCheerioVitest

Construí esta herramienta como una alternativa de código abierto para auditorías técnicas SEO repetibles. Rastrea sitios, detecta problemas de metadatos, canonicals, hreflang, enlaces internos y datos estructurados, puede renderizar páginas con mucho JavaScript usando Playwright, enriquece resultados con datos de CrUX y Lighthouse, y genera reportes JSON, HTML, texto y PDF que se pueden comparar en CI.

El problema

Los equipos de SEO unen un crawler, Lighthouse, Search Console y GA4 para diagnosticar por qué un sitio no posiciona. Correlacionan tráfico con problemas técnicos a mano, pasan por alto problemas de equity de enlaces internos, reciben falsas alarmas en páginas sin tráfico y no pueden hacer pruebas de regresión entre auditorías. SEO Audit entrega todo eso en un solo CLI.

El enfoque

Un CLI de TypeScript construido sobre Playwright y Lighthouse. El crawler maneja sitemaps, reintentos, redirecciones y renderizado de JS para SPAs. Más de cincuenta verificaciones cubren metadatos, canonicals, datos estructurados, Core Web Vitals, equity de enlaces y duplicación de contenido. El enriquecimiento opcional con CrUX, Search Console y GA4 ordena los hallazgos por impacto real en el tráfico.

Decisiones destacadas

  • Crawls auto-persistidos. Cada ejecución escribe en ~/.config/seo-audit/crawls/<host>/ para diff y revisiones de regresión.
  • Cálculo de PageRank (damping 0.85, 20 iteraciones) que saca a la luz páginas importantes con un solo enlace interno.
  • Detección de casi-duplicados con MinHash (Jaccard >= 0.85) que agrupa contenido entre páginas.
  • Subcomando de análisis de logs que parsea logs de acceso, verifica bots vía DNS inverso y los une al crawl persistido para hallazgos de páginas huérfanas y caché obsoleta.
  • GitHub Action y flag --fail-on para gates de CI contra regresiones.

Estado

Publicado en npm como @davo20019/seo-audit. v0.8.0 lanzada en abril de 2026. Trabajo reciente en análisis de logs, soporte para GA4, deduplicación de contenido y PageRank de grafo de enlaces.

Want similar work for your team?

AI-native senior engineering for AI, cloud, and web. Open to consulting engagements and full-time roles.