Auditoría del sitio de Ahrefstambién disponible como parte del paquete gratuito Herramientas para webmasters de Ahrefsle permite buscar a través del código HTML sin formato o el código renderizado JS en todo páginas rastreadas del sitio web.
Esta característica es particularmente útil cuando necesita verificar etiquetas de análisis, identificar páginas que llaman a ciertos scripts u hojas de estilo, detectar inyecciones no deseadas en el código de la página o investigar las tecnologías de la competencia.
Es importante comprender que en la era de los sitios web basados en JavaScript, el código de la página puede existir en dos formas:
Crudo (Fuente): el código HTML antes de que se haya ejecutado cualquier JavaScript en la página. Esto es lo que ves usando el “Ver código fuente”Función en el navegador.
Renderizado: el código HTML final después de ser modificado/generado por JavaScript. Es visible en el “InspeccionarModo ”en el navegador.
Las versiones fuente y renderizada pueden ser significativamente diferentes, por lo que es importante asegurarse de buscar la versión correcta del código de la página.
Cómo buscar a través del código renderizado de las páginas
Si necesita buscar en el código HTML renderizado en JS de todas las páginas del sitio web, ejecute un rastreo en Site Audit o Ahrefs Webmaster Tools. Asegúrese de que la opción “Ejecutar JavaScript” esté activada en la configuración de rastreo.
Una vez que se complete el rastreo, vaya a la Explorador de páginas y acceder al Filtro avanzado. Seleccione “Fuente de la página” seguido de “Contiene” en el menú desplegable. Luego, ingrese el fragmento de código específico que está buscando.
El ejemplo anterior encuentra todas las páginas de nuestro blog que contienen una tabla incrustada.
Cómo buscar a través del HTML sin formato de las páginas
La búsqueda en HTML sin formato (también llamado HTML fuente) requiere algunas acciones adicionales:
1. Deshabilite la representación de JavaScript en la configuración de rastreo.
2. Garantizar la visibilidad de todas las páginas por parte del rastreador.
Esto es crucial para los sitios web donde el contenido de la página (incluidos los enlaces internos) se genera a través de JavaScript, ya que es posible que el bot AhrefsSiteAudit no descubra automáticamente todas las páginas a través del código HTML sin formato.
Es por eso que debe proporcionar a la herramienta Auditoría del sitio una lista de URL de entrada que llamamos “Semillas”.
La forma más sencilla de hacerlo es asegurarse de que los mapas del sitio se utilicen en las “Fuentes URL”. Si eso no es posible, utilice la lista de URL personalizadas.
Cuando finalice el rastreo, utilice el filtro avanzado para buscar en el código fuente de todas las páginas rastreadas.