Se dice que una página está huérfana cuando no tiene ningún enlace que lleve a ella. De lo contrario, se trata de una página inaccesible en el sentido de que no hay enlaces internos que lleven a los usuarios o a los rastreadores a ella
Muchos negocios en línea pierden clientes potenciales debido a simples errores de SEO.
Uno de estos errores es la existencia de páginas que no tienen enlaces con otras páginas del sitio.
Se trata de las llamadas páginas huérfanas cuya presencia en un sitio representa una oportunidad perdida para llegar a nuevos clientes con su contenido. Además, estas páginas pueden afectar en mayor o menor medida al SEO de su sitio web.
Afortunadamente, en este artículo le mostraremos cómo lidiar con las páginas huérfanas en su sitio web.
Capítulo 1: ¿Qué significa una página huérfana?
Hablando del significado de una página huérfana, hemos definido brevemente lo que es, pero en este capítulo lo descubriremos en profundidad.
1.¿Qué significa una página huérfana?
Como se ha mencionado anteriormente, una página huérfana o de contenido huérfano es una página que no está vinculada a ninguna otra página de su sitio web, ni tiene ningún enlace hacia ella.
Fuente : affde
De hecho, el funcionamiento de los motores de búsqueda a la hora de encontrar una página es bastante sencillo. Los rastreadores detectan un enlace de una página y lo utilizan para acceder a otra
Otra forma es que un rastreador encuentre la URL en su mapa del sitio XML. Pero cuando no hay un enlace a una página, los rastreadores no podrán encontrarla, rastrearla e indexarla.
Esto dificulta la aparición en las SERPs y el posicionamiento de su sitio web en las palabras clave presentes en el contenido de la página.
Pero, ¿por qué existen estas páginas?
De hecho, los webmasters crean páginas privadas para compartir con una persona concreta o puede ser una página promocional de temporada
Por otro lado, las páginas huérfanas también pueden crearse por accidente debido a un error de diseño o de publicación.
Sea cual sea la razón de la existencia de una página huérfana, es una mala señal para el SEP del sitio
He aquí algunos casos
- Páginas nunca añadidas a la estructura del sitio:
A menudo, cuando se publica una página, se añade a la estructura de un sitio y se enlaza con otras páginas del mismo
Una página de producto puede pertenecer a varias categorías y debe estar vinculada a las correspondientes páginas de categoría y de menú
Una entrada del blog puede tener diferentes categorías y etiquetas, por lo que esta página recibirá enlaces de todas ellas
Pero, si una página no tiene una categoría o no se añade a la estructura de alguna otra manera, nunca recibe enlaces y, de hecho, no es accesible desde ninguna parte. Cuando estas páginas no están enlazadas internamente y no forman parte de la arquitectura de su sitio, los motores de búsqueda no tienen forma de encontrarlas.
- Páginas perdidas durante una migración del sitio:
Sin duda, todos sabemos cómo funciona la migración del contenido de un sitio. En general, es un proceso algo complejo
Y uno de los problemas más comunes en las migraciones de sitios es acabar con páginas huérfanas.
Por eso se necesita un experto en SEO para completar con éxito el proceso de migración del sitio.
1.¿Cuáles son las características de una página huérfana?
Aunque hay muchas razones para una página huérfana, es posible que se confunda a la hora de distinguir una en su sitio.
He aquí algunas características comunes que le ayudarán a identificar rápidamente las páginas huérfanas de su sitio:
Una página huérfana no tiene enlaces entrantes: Esta es la primera característica de una página huérfana. Si su página tiene al menos un enlace que apunta a ella, ya sea desde la página de inicio o desde una antigua entrada del blog, no está huérfana en este caso
Sin embargo, si tiene páginas en el sitio que sólo tienen un enlace, sólo es aconsejable añadir más.
Una página huérfana es también una página activa: las páginas de prueba y de sandboxing suelen considerarse páginas huérfanas. La principal diferencia es que las páginas huérfanas están en línea y pueden aportar valor a los usuarios. El único defecto significativo es que son inaccesibles
Aunque tengan el estado de servidor 200, el hecho de que los usuarios no tengan forma de acceder a ellos los deja huérfanos.
Una página indexada también puede ser huérfana: Una página puede ser huérfana aunque esté indexada o si una herramienta indica que no lo está. Esta es la característica más difícil de verificar, ya que requiere un esfuerzo de investigación
Es posible que algunas herramientas no detecten la naturaleza huérfana de una página debido al funcionamiento impreciso de algunas herramientas
1.3 ¿Por qué las páginas huérfanas son un problema?
Cuando un visitante aterriza en su sitio, ya sea desde los resultados de la búsqueda o a través de otros canales, sin duda quiere que pase bastante tiempo en él.
Las páginas huérfanas son una oportunidad perdida para aumentar el tráfico y los ingresos de su sitio web.
Por cierto, PageRank es un algoritmo que Google utiliza para clasificar las páginas web en sus resultados de búsqueda
Según este algoritmo, el link juice de Google sólo puede llegar a una página si está enlazada con otras páginas del sitio
En otras palabras, cuando un sitio web no tiene enlaces internos, las arañas de los motores de búsqueda tendrán dificultades para tenerlo en cuenta al rastrear e indexar
Capítulo 2: ¿Cómo gestionar las páginas huérfanas?
Antes de hablar de la gestión de las páginas huérfanas en su sitio web, veamos cómo puede detectarlas:
2.1. ¿Cómo identificar las páginas huérfanas?
Hay diferentes enfoques que puede adoptar para identificar las páginas huérfanas de su sitio.
La forma más fácil de identificar las páginas huérfanas es realizar un rastreo completo de su sitio.
Existen varios rastreadores desarrollados por las principales empresas de marketing web como
- SEMRush
- Ahrefs
- Moz ;
- Y Screaming Frog.
Estos rastreadores son capaces de rastrear todo su sitio web de la misma manera que lo hacen las arañas de los motores de búsqueda.
Después de rastrear el sitio, cada una de estas herramientas genera informes que puede consultar. Estos informes le dan una idea clara de algunas informaciones valiosas sobre su sitio web.
Uno de los resultados es el número de páginas huérfanas en su sitio y la URL de la página. He aquí un ejemplo de un informe de este tipo realizado por Ahrefs.
Fuente : i.stack
Bajo el título »Indexable», tiene una columna para las páginas huérfanas. Sólo tiene que hacer clic en el enlace para ver todas las páginas sin enlaces internos de su sitio.
2.2 ¿Cómo evitar las páginas huérfanas?
En esta sección veremos las formas de gestionar o evitar las páginas huérfanas en su sitio web.
2.2.1. Crear un mapa del sitio
Como su nombre indica, un mapa del sitio es un mapa de su sitio. De hecho, se trata de un documento en formato XML que indica a los rastreadores dónde deben ir.
El rastreador examina su página XML para comprender mejor su sitio en general y en particular:
- El tamaño del sitio
- Las páginas importantes del sitio
- Y la localización de nuevos contenidos
De hecho, el mapa del sitio XML es un elemento importante en la indexación de un sitio, ya que proporciona un camino para las arañas de los motores de búsqueda.
Además, un mapa del sitio XML permite a Google saber con qué frecuencia debe buscar cambios y nuevas publicaciones en su sitio
2.2.1.1. Creación de un mapa del sitio con Screaming Frog
Una de las mejores opciones para crear un mapa del sitio XML es hacerlo con la herramienta Screaming Frog.
Para utilizar Screaming Frog, primero debe descargar su herramienta SEO Spider. Puede utilizarlo gratuitamente si su sitio tiene menos de 500 páginas.
Pero si su sitio es más grande, tendrá que adquirir una licencia, lo que puede merecer la pena teniendo en cuenta el tiempo que le llevaría buscar y listar manualmente más de 500 URLs.
Una vez que haya instalado el programa, escriba su URL en la casilla «Introducir URL para la araña» y haga clic en «Iniciar».
A continuación, simplemente haga clic en la opción sitemaps > Crear mapa del sitio XML.
Fuente : tortoisedigital
Pero antes de crear su mapa del sitio, debe tener en cuenta algunos parámetros:
- En primer lugar, tendrá que determinar qué páginas quiere incluir y cuáles quiere excluir;
- Por defecto, sólo se incluirán las páginas con una respuesta de rastreo »200» OK, por lo que no tendrá que preocuparse por las redirecciones o los enlaces rotos.
Sin embargo, puede desplazarse por su lista de páginas y buscar contenido duplicado. Por ejemplo, no es normal tener versiones WWW y no WWW de las URL en su mapa del sitio.
Puede resolver este problema haciendo clic con el botón derecho del ratón en la versión que desea eliminar y, a continuación, haciendo clic en «Eliminar».
Si sus páginas varían en importancia, puede optar por establecer valores de prioridad para diferentes URLs. Sus URLs pueden oscilar entre 0,0 y 1,0, siendo el valor por defecto 0,5.
Esto indica a Google qué páginas son más importantes, para que pueda indexarlas más a menudo.
2.2.1.2. Creación de un mapa del sitio con Google XML
Google XML Sitemaps es otro plugin gratuito para sitios de WordPress. Si no está utilizando Yoast, también es una forma fácil de generar un mapa del sitio con ajustes personalizados.
Al igual que en Screaming Frog, también podrá definir estos ajustes.
2.2.2. Envíe su mapa del sitio a Google Search Console
Ahora que ha creado un mapa del sitio, debe enviarlo a Search Console.
Esto es lo que permitirá a Google conocer todas sus páginas y encontrar las más importantes gracias a sus robots.
Para empezar, vaya a su página de inicio de Search Console, luego en la barra lateral izquierda, haga clic en «Índice», luego en «mapas de sitio».
Haga clic en el botón Añadir/Probar mapa del sitio en la parte superior derecha e introduzca la URL de su mapa del sitio.
En la mayoría de los casos, la URL de su mapa del sitio será simplemente http://votreurl.com/sitemap.xml. Si está utilizando un plugin de WordPress, la URL estará en la configuración del plugin
Después de hacer clic en «Enviar», verá que su mapa del sitio quedará pendiente.
Una vez aprobado, podrá ver el número de páginas que ha enviado en comparación con el número que se ha indexado.
Esto puede darle una buena idea de la cantidad de información sobre su sitio que almacena Google.
También es posible averiguar exactamente dónde se encuentra su mapa del sitio web escribiéndolo en un navegador web, debería tener este aspecto:
2.2.3. Crear un archivo robots.txt
Hablando de robots.txt, este es un archivo que dirige a los motores de búsqueda sobre qué páginas deben indexar y cuáles deben ignorar.
En otras palabras, el archivo robots.txt define las directrices que cada robot auténtico debe seguir en el sitio web
Por lo tanto, es muy importante que su archivo robots.txt permita a Google rastrear el sitio
La creación de un archivo robots.txt es aún más fácil si se utilizan los editores predeterminados de su ordenador, como el Bloc de notas para los usuarios de Windows y TextEdit para los de Mac.
Antes de empezar, compruebe su FTP (Protocolo de transferencia de archivos) para ver si ya tiene un archivo robots.txt
Si lo hace, debería estar almacenado en su carpeta raíz bajo algo como http://votredomaine.com/robots.txt.
Ahora sólo tiene que descargarlo para tener un punto de partida, si no, puede empezar a crear un archivo robots.txt desde cero.
Google tiene un recursoútil de robots.txtpara esto:
Para crear su archivo, necesita saber algunas cosas como:
- Agente de usuario: El bot al que se aplica la siguiente regla;
- Disallow: Indica que quiere bloquear una ruta de URL;
- Permitir: La ruta de la URL en un directorio bloqueado que desea desbloquear.
También es importante tener en cuenta que un asterisco hace que el comando »User-agent» se aplique a todos los rastreadores web
Por lo tanto, si se crean reglas con »Agente de usuario: *», se aplicarán a Google, Bing y todos los demás rastreadores web que rastreen su sitio.
2.2.4. Crear enlaces internos
Una de las formas más eficaces de fomentar el rastreo y aumentar la indexación de su sitio es utilizar los enlaces internos.
Los enlaces son los caminos que toman las arañas en Internet, cuando una página está enlazada con otra, las arañas siguen los enlaces.
Naturalmente, los enlaces se crean cuando se organiza correctamente la arquitectura de su sitio web.
Además de evitar las páginas huérfanas, una buena arquitectura ofrece varias ventajas en las siguientes áreas
- Experiencia del usuario: Desde el punto de vista del usuario, una arquitectura del sitio y una navegación coherentes hacen que su sitio sea mucho más fácil de navegar. Un usuario no debería tener que adivinar dónde está la información que busca, debería encontrarla siguiendo sus enlaces. También es una buena idea mantener la estructura de su sitio web lo más sencilla posible. Los megamenús complejos pueden tener un aspecto elegante y a veces son necesarios para los sitios extremadamente grandes;
- Camino para los rastreadores: Más allá de sus usuarios humanos, una buena estructura del sitio facilita a los rastreadores el acceso y la indexación de su contenido. Una arquitectura del sitio bien planificada establece una jerarquía entre sus páginas. Esto ayuda a los rastreadores a entender las páginas más importantes del sitio y cómo se relacionan entre sí. Los enlaces internos envían a los rastreadores a otras páginas de su sitio y les ayudan a descubrir nuevos contenidos.
2.2.5. Ganar enlaces entrantes
Los enlaces internos ayudan a las arañas a entender la estructura de su sitio y a encontrar nuevas páginas, pero los enlaces más importantes son los de otros sitios.
Cuantos más enlaces tenga de sitios creíbles, más creíble parecerá a Google y más probable será que clasifique bien su sitio.
Los enlaces de otros sitios envían a los rastreadores a sus páginas. Así, si otro sitio enlaza con una de sus nuevas páginas, es probable que esa página sea rastreada e indexada mucho antes.
Y aunque algunos de estos vínculos pueden producirse de forma natural, es mejor adoptar un enfoque más proactivo.
Por supuesto, si tiene experiencia en la construcción de enlaces, sabrá que ganar enlaces es a menudo más fácil de decir que de hacer.
Pero si crea una estrategia de promoción con antelación, sabrá exactamente qué hacer una vez que se publique su nuevo contenido y tendrá más posibilidades de que esa página se indexe rápidamente.
Si puede encontrar lugares para sindicar su contenido, ésta es una de las formas más fáciles de asegurar una audiencia para cada nuevo contenido que publique.
La sindicación es el proceso por el cual su contenido se vuelve a publicar en otros sitios, dando crédito a su sitio.
En algunos casos, los propietarios de sitios incluso encuentran que las versiones sindicadas de su contenido superan a su propio sitio.
Pero cuando se hace bien, puede ayudarle a mejorar su alcance y a obtener más enlaces de sus publicaciones.
Conclusión
En general, las páginas huérfanas perjudican su clasificación y le hacen perder dinero, por lo que es importante encontrarlas y arreglarlas.
En este artículo, hemos desarrollado no sólo el concepto general de las páginas huérfanas, sino también las formas correctas de manejarlas.
Si tiene otras formas de evitar las páginas huérfanas en el sitio, no dude en compartirlas con nosotros en los comentarios.
¡Hasta pronto!