Es una práctica de SEO que indica a los motores de búsqueda la eliminación o desestimación de determinadas páginas. Este puede ser contenido considerado de baja calidad (debido a la falta de texto) o contenido considerado privado y no debe aparecer en los resultados del motor de búsqueda. En pocas palabras, elimina de Google todas las páginas que son inútiles para el usuario de Internet. La implementación de este proceso hace que las páginas de su sitio web sean confiables y cualitativas a los ojos de Google.
Más de 10 millones de piezas de contenido se publican en la web cada día, y esta cifra crece cada día
Para destacar entre esta masa, es importante revisar su estrategia de SEO, que incluye varios tipos de técnicas, entre ellas la desindexación. Así que :
- Desindexación: ¿Qué es?
- ¿Cuáles son los diferentes métodos de desindexación?
- ¿Cómo y cuándo desindexa Google las páginas web?
Estas son algunas de las preguntas a las que responderé en esta guía.
Capítulo 1: Desindexación, ¿qué es?
¡Para crear, a veces es necesario destruir, dicen! El deseo de ver su página en la parte superior de los resultados del motor de búsqueda empuja a los SEO a realizar ajustes válidos.
Pero antes de entrar en el concepto de desindexación, es importante que tenga una idea de lo que es la indexación.
1.1 ¿Qué es la indexación SEO?
Históricamente se le conoce como «la fase de registro de un sitio web, l’indexación La indexación de Google es el conjunto de procesos por los que un robot de Google (arañas) elabora, procesa y luego clasifica los contenidos y páginas de un sitio web con el fin de para presentarlos en una página de resultados.
Sin esta intervención, los sitios buscados por los internautas no se mostrarán
En efecto, la indexación es una parte de la referenciación natural que tiene por objeto poner en el índice de un buscador las páginas de un sitio web. Es uno de los requisitos previos para el posicionamiento justo de un sitio en las páginas de resultados de un motor de búsqueda
1.2. El tiempo que puede tardar Google en indexar una página
Un sitio web no es indexado inmediatamente por Google una vez que está en línea. En efecto, puede ocurrir que el robots encargados de explorar de los sitios y las páginas aún no están al nivel de su sitio, lo que a menudo lleva tiempo
Así que, para acelerar las cosas, puede facilitar la indexación a las arañas de los motores de búsqueda mediante
- Corregir los factores que bloquean la indexación por parte de Google;
- Solicitando solicitar la inspección de una URL por el Consola de búsqueda de Google ;
- Comprobación diaria de los informes de rastreo existentes en Search Console para identificar y corregir cualquier problema;
- Crear nuevos contenidos que muestren que su sitio está creciendo;
- Estructurar cada página de forma que sea más fácil para los robots navegar por ella.
Por lo tanto, es necesario implementar ciertas estrategias para asegurar que su sitio web sea indexado eficientemente por los bots
Esto comienza con la eliminación de las páginas que no cumplen con las normas de Google de su sitio web.
1.3. ¿Qué significa desindexar?
Desde la aparición de Panda que es un filtro algorítmico que castiga a los sitios web por ofrecer una baja calidad contenido de baja calidad, se ha vuelto muy importante presentar a los motores de búsqueda sólo aquellas páginas que son de valor para los usuarios de Internet
Aunque la desindexación ya estaba en uso, será la normativa penalizadora de Google sobre los contenidos de calidad la que lleve a muchos a descubrir un nuevo compartimento del mundo SEO: El desindexación de contenidos de baja calidad
Esta expresión, creada como contrapartida a la palabra » indexación esta expresión, creada como contrapartida a la palabra «indexación», representa todos los procedimientos aplicados para eliminar ciertas páginas web del índice de los motores de búsqueda con el fin de presentar las de mejor calidad
Para satisfacer adecuadamente a sus usuarios, Google empuja a los SEO a producir únicamente contenidos que aporten un verdadero valor añadido. Esto implica a veces la eliminación de contenidos no concluyentes. Entre estos últimos, podemos distinguir :
1.3.1. Páginas de resultados del motor interno
Es normal que un buscador interno se haga necesario cuando un sitio web empieza a crecer en número de páginas con contenidos de muy bajo valor
Estas páginas deben ser desindexadas, no porque contener spamsino porque es probable que desperdicien el presupuesto de arrastre. Como resultado, Google puede dedicar su tiempo a rastrear las páginas de resultados internas y puede descuidar las páginas de contenido del sitio.
De hecho, las páginas de resultados internos del motor son las de menor calidad en cuanto a contenido. Para más aclaraciones, siga este vídeo YouTube sobre el tema: https://youtu.be/k-MmQS98bCE
1.3.2. Páginas de contenido duplicado
El contenido duplicado se refiere a las páginas que se duplican dentro o fuera de un sitio web. De hecho, pueden ser páginas con un contenido muy similar o idéntico.
A continuación, el motor de búsqueda filtra sus resultados para seleccionar la versión que consideraoriginal
Las otras páginas no son necesariamente desindexadas y pueden seguir conservando su PageRank y su índice en los motores de búsqueda. Aunque suelen ser ignoradas por los motores de búsqueda, son páginas que son rastreadas por los bots
Si tiene muchas de estas páginas, pueden consumir una buena parte de su presupuesto de rastreo. Tenga en cuenta que hay tres tipos de contenido duplicado:
- Páginas totalmente idénticas
Este es el ejemplo de los sitios espejo. Aquí, el motor de búsqueda de Google selecciona según el PageRank. El sitio espejo es el hecho de reproducir textualmente otro sitio web
Es una copia exacta de otro sitio web, por lo que las páginas que salen del sitio espejo son copias perfectas de las páginas de otro sitio web
Su función es permitir que la misma información se difunda en varios lugares y así distribuir mejor el tráfico generado en el sitio original
- Páginas similares, pero con diferentes etiquetas TITLE y META DESCRIPTION
En este caso de contenido duplicado, todas las páginas originales serán indexadas y estarán bien posicionadas en detrimento de las que no lo estén. Las que no sean originales tendrán un rendimiento mucho menor en las páginas de resultados (SERP)
- Páginas diferentes pero con etiquetas TITLE y META DESCRIPTION similares
Son las etiquetas idénticas de estas páginas las que las hacen similares. En el peor de los casos, incluso es posible que el contenido no sea indexado por Google
Para evitar esta situación, es necesario que todas las páginas de su sitio web estén compuestas por etiquetas del título y etiquetas de meta descripción tags.
He aquí algunos consejos para ayudarle a identificar el contenido duplicado:
- Haga una búsqueda en Google con la sintaxis «…»: es un método muy sencillo, ya que consiste en comprobar si las frases se repiten en varias páginas de su sitio o en la web. Para obtener un rendimiento satisfactorio, sea específico en sus búsquedas. Véase mi artículo sobre el 26 operadores de Google.
- Utilizar herramientas especializadas: Estas herramientas son sitios cuyo la especificidad es detectar el contenido duplicado. Tenemos Copyscape, Quetext, La Rana Gritona, Duplichecker, Siteliner. Son rápidas y fáciles de usar, sólo tiene que introducir la URL de la página y la herramienta detectará el contenido duplicado.
1.3.3. Formularios no conformes
El contenido de baja calidad también puede afectar a ciertas formas. Hay en primer lugar :
- Formularios que conducen a contenidos que ya están disponibles en otra página indexada.
- Formularios que conducen a páginas que no necesariamente muestran contenido. Ejemplos de ello son el formulario de compra en un sitio de comercio electrónico y el formulario de acceso a un área de miembros.
1.3.4. Páginas que ofrecen contenido hilado (repetido)
El hilado de contenidos es una técnica que permite reescribir el contenido varias veces para obtener diferentes textos similares que hablen del mismo tema
Este proceso, desarrollado por especialistas, permite al escritor crear un texto original y obtener varias versiones de diferentes formulaciones, pero todas con el mismo significado.
Además del trabajo del escritor, también debe incluirse el uso de programas informáticos de hilado para la producción automática de textos.
Sin embargo, cuando el hilado de contenidos está mal desarrollado por el escritor, puede deteriorarse en texto hilado o un texto hilado de mala calidad.
Esto se convierte en una desorientación para los motores de búsqueda y en una experiencia decepcionante para los lectores. Por ello, este tipo de contenidos deben ser desindexados.
1.3.5. Páginas de la importación de un tema de demostración
Son páginas creadas automáticamente durante la importación de un tema de demostración. Páginas innecesarias que deben ser desindexadas.
1.3.6. Otras páginas a desindexar
Además de los 05 tipos de contenido enumerados hasta ahora, que deben ser desindexados lo antes posible, podemos añadir :
- El PDF que ofrecen un contenido similar al de una página HTML;
- El contenido estacional, páginas obsoletasantiguos servicios que ya no se ofrecen;
- Todo lo que representa pre-prod así como información confidencial.
En definitiva, los contenidos que no aportan un valor real deben ser desindexados
Capítulo 2: Métodos y técnicas de desindexación
La desindexación puede realizarse mediante varias técnicas. Éstas varían en función de si desea mantener disponible el contenido que quiere hacer accesible a los lectores
Si desea eliminar o borrar páginas del índice de Google, deberá realizar acciones específicas
Para evitar confusiones, es importante entender la distinción entre la prohibición de rastreo a Google y la desindexación.
De hecho, añadir un »desestimar» en robot.txt no pretende desindexar las páginas, sino evitar que Google las rastree. Esta opción en robots.txt no se utiliza para desindexar páginas
Las técnicas de desindexación que le presentaré son todas eficaces. Sin embargo, no tiene sentido intentar utilizar todas las técnicas al mismo tiempo:
2.1. Uso de la metaetiqueta robots
El etiqueta meta robots se encuentra entre las etiquetas . Se utiliza para indicar las pautas de indexación del contenido de un sitio. Para la desindexación, tiene dos opciones:
- Desindexe el contenido, pero mantenga los enlaces en él accesibles. Esto se recomienda cuando se quiere desindexar un contenido sin borrar sus enlaces.
(…) (…)
- Desindexar las páginas, a la vez que se evita que se sigan los enlaces:
El siguiente paso es crear un mapa del sitio desindexación del mapa del sitio, envíelo a Google a través del robots.txt siguiendo la directiva «sitemap» además de la URL completa de acceso al sitio gracias a la CONSOLA DE BÚSQUEDA.
2.2. Utilizando el comando X-Robots-Tag: Noindex
Este método se utiliza para desindexar archivos o páginas sin cambiar su código fuente:
- Desindexación de PDFs:
- Desindexación de imágenes y archivos:
Es importante recordar en todos los casos, que no debe utilizar dos métodos a la vez. Esto hará que su desindexación sea ineficaz. Para más información, consulte : qué es robots.txt y cómo utilizarlo?
2.3. Desindexación de páginas innecesarias
Para desindexar rápidamente un montón de páginas inútiles, debe :
- Proporcionar un código HTTP 410 código o HTTP 404 código en las páginas eliminadas. Después, deberá esperar a que Google tenga en cuenta la eliminación de la página.
- Generar un mapa del sitio de desindexación en el que encontremos las antiguas URLs eliminadas que remiten a un 404 o a un 410.
2.4. Desindexar las páginas antiguas en detrimento de las nuevas que son más informativas
Si está pensando en desindexar páginas porque otras son más relevantes, he aquí cómo hacerlo
- Preparar 301 de las páginas que considera menos relevantes a las nuevas. La redirección 301 se recomienda especialmente en el caso de que las páginas consideradas menos relevantes sean objeto de vínculos de retroceso. Esto favorece la optimización de las páginas y reduce la pérdida de linkjuice.
- Para que Google tenga en cuenta estos 301 más rápidamente, se recomienda crear un mapa del sitio en el que se encuentren las URL que redirigen a las nuevas páginas y enviarlo a través de robots.txt o de una cuenta de SEARCH console.
Aparte de querer desindexar las páginas usted mismo, puede ocurrir que sus páginas sean desindexadas por Google sin ningún orden.
Capítulo 3: ¿Cómo desindexa Google?
Usted ha realizado un gran esfuerzo para conseguir que su sitio web esté en los primeros puestos de las páginas de resultados de los motores de búsqueda. Sin embargo, después de todos los intentos de búsqueda, no puede encontrar su sitio web en los resultados de búsqueda
¡Esto es confuso! Tendrá que averiguar qué es lo que ha provocado ese inconveniente en primer lugar. De hecho, la misión por la que opera Google se enuncia de la siguiente manera » Organizar la información de todo el mundo para que esté disponible y sea útil«.
La firma tiene como objetivo ofrecer a sus usuarios la más información fiable
Para lograrlo, Google se esfuerza por :
- Constantemente ajustar su búsqueda algoritmo de búsqueda ;
- Garantizar constantemente que los resultados de la búsqueda sean de mejor calidad a través de los datos de evaluación recogidos a varios niveles, incluidos sus evaluadores.
Por lo tanto, es fácil entender por qué el gigante no duda en sancionar ciertas prácticas que considera perjudicial para sus usuarios
Estas son las prácticas que en su mayoría son de sombrero negro y que pueden hacer que su sitio sea desindexado por Google.
3.1. La técnica de encubrimiento
El «cloaking» es un método «Black Hat» para optimizar las posiciones de los sitios en los motores de búsqueda
Este la práctica consiste en presentar al motor de búsqueda un contenido diferente al que se presenta a los internautas. Un verdadero sistema de camuflaje.
Por ejemplo, haga que su sitio aparezca como un sitio que comparte reseñas de celebridades, pero que discretamente y en secreto enlace con un amplio contenido erótico (pornográfico).
El camuflaje se ejecuta publicando contenido de un agente de usuario o incluso de una dirección IP. Al hacerlo, si un rastreador escanea el sistema, la versión limpia del del sitio se muestra.
Por otro lado, si es un buscador humano el que ha sido detectado, es se muestra la versión falsa del sitio.
Además de esto, el enmascaramiento también puede sustituir a
- Imágenes que están camufladas por otras imágenes, y que son diferentes de las que se emitierons ;
- Sitios web que muestran algún contenido a Google, pero que limita el acceso al usuario de Internet ;
No se incluyen los sitios web que requieren un registro o un inicio de sesión para acceder al contenido. Google aplica dos tipos de penalización para el encubrimiento :
- La penalización que sólo afecta parcialmente a su sitio;
- La penalización que afecta a todo su sitio web.
3.2. Spamming
También conocido como contenido no deseadose trata de un contenido sin valor que se muestra con el propósito de publicidad
De hecho, Google ha anunciado la desindexación forzosa de contenido spam, incluyendo
- Envío de consultas automáticas a Google ;
- Diseños de páginas con contenido malicioso como: virus, phishing o malware;
- El uso de afiliación sin suficiente valor añadido;
- Enlaces ocultos;
- Participación en planes de enlace.
También hay otros tipos de spam:
3.2.1. Spam generado por el usuario
El spam también es creado por los usuarios o bots que coloquen comentarios que contengan información de contacto o enlaces a sitios web o perfiles de usuarios:
Fuente: Pipdig
Si quiere distinguir los comentarios de spam, puede tener en cuenta
- Nombres de usuario ;
- El correos electrónicos que parecen irrelevantes o extraños o que simplemente no son de fiar
Para evitar ser penalizado por Google, debe actuar rápidamente borrar todos los comentarios de spam y revisar el contenido de su sitio web. Para evitar el spam, tenga en cuenta también este punto :
3.2.2. Alojamiento gratuito
Es habitual encontrarse con servicios de alojamiento gratuitos. Le aconsejamos que tenga cuidado con estos servicios, porque realmente no son fiables
A cambio de lo que se le prometió, sólo verá anuncios de spam y un mal servicio. Google está tomando medidas para sancionar esta práctica
Para evitar ser penalizado, debe elegir un alojamiento útil y fiable. Pagar por el alojamiento es una de las mejores soluciones que le permiten tener un control total sobre su sitio web. He aquí una solución que puede ayudarle: ¿27 criterios para elegir su alojamiento web?
3.3. Relleno de palabras clave
Relleno de palabras clave palabras clave es una técnica de SEO de sombrero negro que consiste en carga de páginas web con palabras clave en un intento de influir en la clasificación de un sitio web en los motores de búsqueda.
Estas páginas web pueden incluir etiquetas meta etiquetas y meta descripción. El alcance de este método puede ampliarse para incluir :
3.3.1. Añadir palabras clave irrelevantes
Son palabras clave que no tienen relación con el tema. Por ejemplo, su sitio web tiene contenido sobre muebles, pero añade palabras clave sobre jardinería para atraer más tráfico. Google no dudará en sancionar este tipo de páginas.
3.3.2. Repetición excesiva de palabras clave
El gigante de los motores de búsqueda está totalmente en contra de la repetición innecesaria repetido innecesariamente. Esto puede incluir el uso de todos los tipos de palabras clave disponibles.
Por ejemplo, si las palabras clave son «muebles de Etiopía», evítelo: << El "muebles etíopes» es el mejor del mercado. Puede encontrar «Etiopía muebles de Etiopíapuede encontrar «muebles etíopes» en tiendas tanto en línea como en persona. «Etiopía muebles de Etiopía«es cómodo y suave. >>
Para saber si su contenido es denso en palabras clave, eche un vistazo a esta breve guía Definición Densidad de palabras clave l Twaino.
3.3.3. Texto oculto
Otro método de referenciando más o menos menos antiguo es el uso de palabras clave en un sitio web cuya fuente es :
- Similar al fondo de la página web;
- Demasiado pequeño, imposible de leer a simple vista.
En cualquier caso, Google penalizará cuando se dé cuenta del engaño.
3.4. Contenido ligero
Los expertos lo dicen todo el tiempo, escriben a contenido de calidad no es una tarea fácil. Incluso si este criterio puede cumplirse si usted es un excelente escritor, el problema seguirá siendo la frecuencia de publicación
Efectivamente, hay que publicar contenidos de calidad, pero de forma regular. Si sólo publica un artículo una vez al mes, tiene menos probabilidades de obtener buenos resultados que alguien que publica varias veces al mes
Para cosechar los beneficios de la publicación regular, algunas personas no dudan en publicar cualquier tipo de contenido que se les presente.
Otras personas utilizan el atajo de copiar todo o parte del contenido (contenido duplicado como se ve arriba). Google considera que este tipo de contenidos carecen de originalidad y ofrecen poco valor añadido a sus usuarios
Al darles muy poco interés en las SERPs, el motor de búsqueda puede fácilmente desindexar estos contenidos o el sitio entero.
Capítulo 4: Otras preguntas sobre la desindexación
4.1. ¿Qué significa indexar una página?
En términos sencillos, la indexación es el proceso de añadir páginas web a la base de datos de búsqueda de Google. Dependiendo de la metaetiqueta que haya utilizado (indexar o NO indexar), Google rastreará e indexará sus páginas o no. Una etiqueta no-index significa que esta página no se añadirá al índice de búsqueda de la web.
4.2. ¿Qué significa desindexado?
En pocas palabras, desindexado significa: eliminado de un índice o de todo el sistema de indexación
4.3. ¿Cómo se desindexa una página?
En primer lugar, puede utilizar una etiqueta meta robots de no acceso. En segundo lugar, puede hacer una solicitud instantánea en elherramienta de eliminación de URL en Google Search Console
Al final, no olvide comprobar si las páginas están desindexadas.
4.¿Cómo puedo evitar que Google indexe mi sitio?
La forma más eficaz y sencilla de evitar que Google indexe determinadas páginas web es la etiqueta meta «noindex». Básicamente, se trata de una directiva que indica a los rastreadores de Google que no indexen una página web y que, por tanto, no la muestren después en las SERP.
4.5. ¿Qué es una etiqueta noindex?
Una etiqueta «noindex» indica a los motores de búsqueda que no incluyan la página en su índice y, por tanto, en los resultados de búsqueda. El método más común para no indexar una página es añadir una etiqueta en la sección head del HTML o en las cabeceras de respuesta
En resumen
La optimización de un sitio web en los motores de búsqueda depende de uno o varios factores. La indexación es una fase de la optimización de los motores de búsqueda que permite a éstos mostrar el contenido de los sitios web en sus resultados
La desindexación, por su parte, moviliza diversas técnicas que consisten en eliminar del índice ciertos contenidos considerados de baja calidad o privados para que el sitio sea más cualitativo
Hay muchas técnicas de desindexación, pero en este artículo se han citado y detallado algunas. Espero que le haya servido de ayuda o le haya proporcionado algunos consejos más. ¡Hasta pronto!