A desdexação é uma prática de SEO que permite ao senhor indicar aos motores de busca a remoção ou a reparação de certas páginas. Pode ser conteúdo considerado de baixa qualidade (devido à falta de texto) ou conteúdo considerado privado e que não deve aparecer nos resultados dos mecanismos de busca. Em termos simples, ele remove do Google todas as páginas que não são úteis ao usuário. A implementação desse processo torna as páginas de seu site confiáveis e qualitativas aos olhos do Google
Mais de 10 milhões de peças de conteúdo são publicadas todos os dias na rede, e esse número cresce a cada dia
Para se destacar dessa massa, é importante rever sua estratégia de SEO, que inclui vários tipos de técnicas, inclusive a desindexação. Então :
- Desindexação: O que é isso?
- Quais são os diferentes métodos de desindexação?
- Como e quando o Google desindexa as páginas web?
Estas são algumas das perguntas que vou responder neste guia.
Capítulo 1: O que é desindexação?
Para criar, às vezes é preciso destruir, dizem eles! O desejo de ver a própria página no topo dos resultados do mecanismo de busca pressiona os SEOs a fazer ajustes valiosos.
Mas antes de entrarmos no conceito de desindexação, é importante que o senhor tenha uma idéia do que é indexação.
1.1 O que é a indexação SEO?
Historicamente referido como “a “fase de registro de um website, l’indexação A indexação do Google é o conjunto de processos pelos quais um robô Google (aranhas) elabora, processa e depois classifica o conteúdo e páginas de um website, a fim de para apresentá-los em uma página de resultados.
Sem essa intervenção, os sites pesquisados pelos usuários da Internet não serão exibidos
De fato, a indexação é uma parte do referenciamento natural com o objetivo de colocar no índice de um motor de busca as páginas de um website. É um dos pré-requisitos para o posicionamento justo de um site nas páginas de resultados de um mecanismo de busca
1.2. O tempo que pode levar para o Google indexar uma página
Um website não é imediatamente indexado pelo Google uma vez que esteja online. De fato, pode acontecer que o robôs encarregados de explorar de sites e páginas ainda não estão no nível de seu site, o que muitas vezes leva tempo
Assim, para acelerar as coisas, o senhor pode facilitar a indexação das aranhas dos motores de busca por
- Corrigindo fatores que bloqueiam a indexação pelo Google;
- Solicitando solicitação de inspeção de um URL pelo Console de Busca do Google ;
- Verificação diária dos relatórios de rastreamento existentes no Search Console para identificar e corrigir quaisquer problemas;
- A criação de novos conteúdos que mostram que seu site está crescendo;
- Estruturar cada página de maneira que seja mais fácil para os robôs navegarem.
Portanto, o senhor precisa implementar certas estratégias para assegurar que seu website seja indexado eficientemente pelos bots
Isso começa com a remoção de páginas que não estão de acordo com as regras do Google de seu website.
1.3. O que significa De-indexing?
Desde o aparecimento do Panda que é um filtro algorítmico que castiga os websites por oferecer qualidade de baixa qualidade baixo conteúdo de qualidade, tornouse muito importante apresentar aos motores de busca somente aquelas páginas que são de valor para os usuários da Internet
Embora a desindexação já estivesse em uso, será a regulamentação penalizadora do Google sobre conteúdo de qualidade que levará muitos a descobrir um novo compartimento do mundo de SEO: O desindexação de conteúdo de baixa qualidade
Esta expressão, criada como uma contrapartida à palavra ” indexação essa expressão, criada como uma contrapartida à palavra “indexação”, representa todos os procedimentos implementados para remover certas páginas da rede do índice do motor de busca, a fim de apresentar aquelas de melhor qualidade
A fim de satisfazer adequadamente seus usuários, o Google pressiona os SEOs a produzir apenas conteúdo que proporcione um real valor agregado. Isso às vezes envolve a remoção de conteúdo inconclusivo. Entre estes últimos, podemos distinguir :
1.3.1. Páginas de resultados de motores internos
É normal que um mecanismo de busca interna se torne necessário quando um website começa a crescer em termos do número de páginas com conteúdo de valor muito baixo
Estas páginas devem ser desvinculadas, não porque elas conter spammas porque é provável que desperdicem o orçamento de rastejamento. Como resultado, o Google pode passar seu tempo rastejando as páginas internas de resultados e pode negligenciar as páginas de conteúdo do site.
Na verdade, as páginas de resultados do motor interno são as páginas de baixa qualidade em termos de conteúdo. Para mais esclarecimentos, siga este vídeo YouTube sobre o assunto: https://youtu.be/k-MmQS98bCE
1.3.2. Duplicação das páginas de conteúdo
O conteúdo duplicado refere-se a páginas que são duplicadas dentro ou fora de um website. Na verdade, podem ser páginas com conteúdo muito semelhante ou idêntico.
O motor de busca então filtra seus resultados a fim de selecionar a versão que considera ser aoriginal
As outras páginas não são necessariamente de-indexadas e ainda podem reter seu PageRank e seu índice nos motores de busca. Embora geralmente sejam ignoradas pelos motores de busca, estas são páginas que são rastejadas por robôs
Se o senhor tem muitas dessas páginas, elas podem consumir boa parte do seu orçamento de rastejamento. Observe que há três tipos de conteúdo duplicado:
- Páginas totalmente idênticas
Este é o exemplo dos sites espelho. Aqui, o motor de busca do Google seleciona de acordo com o PageRank. O site espelho é o fato de reproduzindo outro website textualmente
É uma cópia exata de outro site, de modo que as páginas que saem do site espelho são cópias perfeitas das páginas de outro site
Seu papel é permitir que as mesmas informações sejam divulgadas em vários lugares e depois distribuir melhor o tráfego gerado no site original
- Páginas semelhantes, mas com etiquetas de TÍTULO e DESCRIÇÃO DE META diferentes
Neste caso de conteúdo duplicado, todas as páginas originais serão indexadas e bem posicionadas, às custas das que não o forem. Aqueles que não são originais terão um desempenho muito pior nas páginas de resultados (SERP)
- Páginas que são diferentes, mas têm etiquetas semelhantes TÍTULO e META DESCRIÇÃO
São as etiquetas idênticas nessas páginas que as tornam semelhantes. No pior dos casos, é até possível que o conteúdo não seja indexado pelo Google
A fim de evitar essa situação, é necessário que todas as páginas de seu website sejam compostas de etiquetas de título e meta descrição tags tags.
Aqui estão algumas dicas para ajudar o senhor a identificar conteúdos duplicados:
- Fazer uma pesquisa no Google com a sintaxe “…”: este é um método muito simples, pois consiste em verificar se as sentenças são repetidas em várias páginas de seu site ou na Internet. Para obter um retorno satisfatório, seja específico em suas buscas. Ver meu artigo sobre o 26 Operadores do Google.
- Uso de ferramentas especializadas: Estas ferramentas são sites cujo a especificidade é detectar conteúdos duplicados. Nós temos Copyscape, Quetext, Sapo gritante, Duplichecker, Siteliner. Eles são rápidos e fáceis de usar, o senhor só precisa entrar no URL da página e a ferramenta detectará conteúdo duplicado.
1.3.3. Formulários não conformes
O conteúdo de baixa qualidade também pode dizer respeito a certas formas. Há, em primeiro lugar :
- Formulários que levam a um conteúdo que já está disponível em outra página indexada.
- Formulários que levam a páginas que não necessariamente exibem conteúdo. Exemplos disso são o formulário de compra em um site de comércio eletrônico e o formulário de login para uma área de membros.
1.3.4. Páginas que oferecem conteúdo fiado (repetidas)
O conteúdo girando é uma técnica que permite que o conteúdo seja reescrito várias vezes a fim de obter diferentes textos semelhantes que falam sobre o mesmo assunto
Esse processo, que foi desenvolvido por especialistas, permite ao escritor criar um texto original e obter várias outras versões de formulações diferentes, mas todas com o mesmo significado.
Além do trabalho do escritor, também deveria ser incluído o uso de software de fiação para a produção automática de textos.
No entanto, quando o conteúdo da fiação é mal desenvolvido pelo escritor, pode se deteriorar em texto fiado ou um texto fiado de má qualidade.
Isso se torna uma desorientação para os motores de busca e uma experiência decepcionante para os leitores. É por isso que esses tipos de conteúdo deveriam ser desvinculados.
1.3.5. Páginas da importação de um tema de demonstração
Estas são páginas criadas automaticamente durante a importação de um tema de demonstração. Páginas desnecessárias que deveriam ser desdexadas.
1.3.6. Outras páginas a serem desindexadas
Além dos 05 tipos de conteúdo listados até agora, que devem ser desindexados o mais rápido possível, podemos acrescentar :
- O PDF que oferecem conteúdo semelhante a uma página HTML;
- O conteúdo sazonal, páginas obsoletasserviços antigos que não são mais oferecidos;
- Tudo o que representa pré-prod bem como informações confidenciais.
Ao todo, o conteúdo que não oferece valor agregado efetivo deve ser desvinculado
Capítulo 2: Métodos e técnicas de desdexação
A desdexação pode ser feita por meio de várias técnicas. Essas variações variam conforme o senhor queira ou não manter disponível o conteúdo que deseja tornar acessível aos leitores
Se o senhor quiser remover ou apagar páginas do índice do Google, precisará tomar medidas específicas
Para evitar confusões, é importante entender a distinção entre a proibição de rastejar para o Google e a desindexação.
De fato, acrescentando um “não autorizar” em robot.txt não tem a intenção de desindexar as páginas, mas sim de evitar que o Google rasteje as páginas. Essa opção em robôs.txt não é usada para desindexar páginas
As técnicas de desindexação que vou apresentar ao senhor são todas eficazes. No entanto, não faz sentido tentar usar todas as técnicas ao mesmo tempo:
2.1. Usando a meta tag dos robôs
O meta-robôs tag a etiqueta está localizada entre as etiquetas . Ele é usado para indicar as diretrizes de indexação do conteúdo de um site. Para a desindexação, o senhor tem duas opções:
- Desindexar o conteúdo, mantendo os links nele contidos acessíveis. Isso é recomendado quando o senhor deseja desindexar um conteúdo sem remover seus links.
>html> (…) (…)