Ladeindicizzazione è una pratica SEO che le consente di indicare ai motori di ricerca la rimozione o il deterioramento di determinate pagine. Può trattarsi di contenuti ritenuti di bassa qualità (a causa della mancanza di testo) o di contenuti considerati privati e che non dovrebbero apparire nei risultati dei motori di ricerca. In parole povere, rimuove da Google tutte le pagine che non sono utili all’utente. L’implementazione di questo processo rende le pagine del suo sito web affidabili e qualitative agli occhi di Google
Più di 10 ogni giorno vengono pubblicati sul web milioni di contenuti e questo numero cresce ogni giorno
Per distinguersi da questa massa, è importante rivedere la sua strategia SEO, che comprende diversi tipi di tecniche, tra cui la deindicizzazione. Quindi :
- Deindicizzazione: cos’è?
- Quali sono i diversi metodi di deindicizzazione?
- Come e quando Google deindicizza le pagine web?
Queste sono alcune delle domande a cui risponderò in questa guida.
Capitolo 1: Che cos’è la deindicizzazione?
Per creare, a volte è necessario distruggere, dicono! Il desiderio di vedere la propria pagina in cima ai risultati dei motori di ricerca spinge i SEO ad apportare modifiche preziose.
Ma prima di addentrarci nel concetto di deindicizzazione, è importante che lei abbia un’idea di cosa sia l’indicizzazione.
1.1 Che cos’è l’indicizzazione SEO?
Storicamente si parla di “la fase di registrazione di un sito web, l’indicizzazione L’indicizzazione di Google è l’insieme dei processi mediante i quali un robot di Google (spider) elabora, elabora e classifica i contenuti e le pagine di un sito web, al fine di per presentarli in una pagina di risultati.
Senza questo intervento, i siti ricercati dagli utenti di Internet non verranno visualizzati
In effetti, l’indicizzazione è una parte della referenziazione naturale che mira a mettere nell’indice di un motore di ricerca le pagine di un sito web. È uno dei prerequisiti per il giusto posizionamento di un sito nelle pagine dei risultati di un motore di ricerca
1.2. Il tempo che Google può impiegare per indicizzare una pagina
Un sito web non viene immediatamente indicizzato da Google una volta che è online. Infatti, può accadere che il robot responsabili dell’esplorazione di siti e pagine non sono ancora al livello del suo sito, il che spesso richiede tempo
Quindi, per accelerare le cose, può facilitare l’indicizzazione per gli spider dei motori di ricerca con
- Correggere i fattori che bloccano l’indicizzazione da parte di Google;
- Richiesta richiedere l’ispezione di un URL da parte del Google Search Console ;
- Controlla quotidianamente i rapporti di crawl esistenti su Search Console per identificare e correggere eventuali problemi;
- Creare nuovi contenuti che mostrino la crescita del suo sito;
- Strutturare ogni pagina in modo che sia più facile per i robot navigare.
Pertanto, deve implementare alcune strategie per garantire che il suo sito web sia indicizzato in modo efficiente dai bot
Questo inizia con la rimozione dal suo sito web delle pagine che non sono conformi alle regole di Google.
1.3. Cosa significa deindicizzazione?
Da quando l’aspetto di Panda che è un filtro algoritmico che punisce i siti web per aver offerto un servizio di bassa qualità contenuti di bassa qualità, è diventato molto importante presentare ai motori di ricerca solo le pagine che hanno un valore per gli utenti di Internet
Sebbene la deindicizzazione fosse già in uso, saranno le norme penalizzanti di Google sui contenuti di qualità che porteranno molti a scoprire un nuovo comparto del mondo SEO: Il deindicizzazione dei contenuti di bassa qualità
Questa espressione, creata come controparte della parola ” indicizzazione questa espressione, nata come controparte della parola “indicizzazione”, rappresenta tutte le procedure attuate per rimuovere determinate pagine web dall’indice del motore di ricerca, al fine di presentare quelle di migliore qualità
Per soddisfare adeguatamente i suoi utenti, Google spinge i SEO a produrre solo contenuti che forniscano un reale valore aggiunto. Questo a volte comporta la rimozione di contenuti inconcludenti. Tra questi ultimi, possiamo distinguere :
1.3.1. Pagine dei risultati dei motori interni
È normale che un motore di ricerca interno diventi necessario quando un sito web inizia a crescere in termini di numero di pagine con contenuti di valore molto basso
Queste pagine dovrebbero essere deindicizzate, non perché contenere spamma perché è probabile che sprechino il budget per le strisciate. Di conseguenza, Google potrebbe dedicare il suo tempo a scansionare le pagine dei risultati interni e trascurare le pagine di contenuto del sito.
Infatti, le pagine dei risultati dei motori interni sono le pagine di bassa qualità in termini di contenuto. Per maggiori chiarimenti, segua questo video YouTube sull’argomento: https://youtu.be/k-MmQS98bCE
1.3.2. Pagine con contenuti duplicati
Il contenuti duplicati si riferisce alle pagine duplicate all’interno o all’esterno di un sito web. In effetti, potrebbero essere pagine con contenuti molto simili o identici.
Il motore di ricerca filtra poi i suoi risultati per selezionare la versione che ritiene essere la miglioreoriginale
Le altre pagine non sono necessariamente deindicizzate e possono ancora mantenere la loro PageRank e il loro indice sui motori di ricerca. Anche se di solito vengono ignorate dai motori di ricerca, si tratta di pagine che vengono strisciate dai bot
Se ha molte di queste pagine, potrebbero consumare una buona parte del suo budget di crawl. Si noti che esistono tre tipi di contenuti duplicati:
- Pagine totalmente identiche
Questo è l’esempio dei siti mirror. Qui, il motore di ricerca Google seleziona in base al PageRank. Il sito specchio è il fatto di riprodurre testualmente un altro sito web
Si tratta di una copia esatta di un altro sito web, quindi le pagine che escono dal sito mirror sono copie perfette delle pagine di un altro sito web
Il loro ruolo è quello di consentire la diffusione della stessa informazione in più luoghi e quindi di distribuire meglio il traffico generato sul sito originale
- Pagine simili, ma con tag TITLE e META DESCRIPTION differenti
In questo caso di contenuti duplicati, tutte le pagine originali saranno indicizzate e ben posizionate a scapito di quelle che non lo sono. Quelli che non sono originali avranno un rendimento molto inferiore nelle pagine dei risultati (SERP)
- Pagine diverse tra loro ma con tag TITLE e META DESCRIPTION simili
Sono i tag identici di queste pagine a renderle simili. Nel peggiore dei casi, è possibile che il contenuto non venga indicizzato da Google
Per evitare questa situazione, è necessario che tutte le pagine del suo sito web siano composte da tag del titolo e tag di descrizione meta tags.
Ecco alcuni suggerimenti per aiutarla a identificare i contenuti duplicati:
- Faccia una ricerca su Google con la sintassi “…”: si tratta di un metodo molto semplice, poiché consiste in controlla se le frasi sono ripetute su diverse pagine del suo sito o sul web. Per ottenere un ritorno soddisfacente, sia specifico nelle sue ricerche. Veda il mio articolo sul 26 Operatori Google.
- Utilizzare strumenti specializzati: questi strumenti sono siti i cui la specificità è quella di rilevare i contenuti duplicati. Abbiamo Copyscape, Quetext, Rana urlante, Duplichecker, Siteliner. Sono veloci e facili da usare, basta inserire l’URL della pagina e lo strumento rileverà i contenuti duplicati.
1.3.3. Moduli non conformi
I contenuti di bassa qualità possono riguardare anche alcune forme. Ci sono in primo luogo :
- Moduli che portano a contenuti già disponibili su un’altra pagina indicizzata.
- Moduli che conducono a pagine che non necessariamente visualizzano contenuti. Ne sono un esempio il modulo di acquisto su un sito di e-commerce e il modulo di login per un’area riservata ai soci.
1.3.4. Pagine che offrono contenuti spun (ripetuti)
Il lo spinning dei contenuti è una tecnica che permette di riscrivere il contenuto più volte, per ottenere diversi testi simili che parlano dello stesso argomento
Questo processo, che è stato sviluppato da specialisti, permette allo scrittore di creare un testo originale e di ottenere diverse altre versioni con formulazioni diverse, ma tutte con lo stesso significato.
Oltre al lavoro dello scrittore, deve essere incluso anche l’uso di un software di filatura per la produzione automatica del testo.
Tuttavia, quando il content spinning è sviluppato male dallo scrittore, può deteriorarsi in testo filato o un testo filato di scarsa qualità.
Questo diventa un disorientamento per i motori di ricerca e un’esperienza deludente per i lettori. Ecco perché questi tipi di contenuti dovrebbero essere deindicizzati.
1.3.5. Pagine dall’importazione di un tema demo
Si tratta di pagine create automaticamente durante l’importazione di un tema demo. Pagine non necessarie che dovrebbero essere deindicizzate.
1.3.6. Altre pagine da deindicizzare
Oltre ai 05 tipi di contenuti elencati finora, che dovrebbero essere deindicizzati il prima possibile, possiamo aggiungere :
- Il PDF che offrono contenuti simili a quelli di una pagina HTML;
- Il contenuti stagionali, pagine obsoletevecchi servizi che non vengono più offerti;
- Tutto ciò che rappresenta pre-produzione nonché informazioni riservate.
In generale, i contenuti che non aggiungono un valore reale dovrebbero essere deindicizzati
Capitolo 2: Metodi e tecniche di deindicizzazione
La deindicizzazione può essere effettuata con diverse tecniche. Questi variano a seconda che lei voglia o meno mantenere disponibili i contenuti che vuole rendere accessibili ai lettori
Se desidera rimuovere o eliminare le pagine dall’indice di Google, dovrà intraprendere azioni specifiche
Per evitare confusione, è importante capire la distinzione tra il divieto di crawling a Google e la deindicizzazione.
Infatti, l’aggiunta di un ”disconoscere” in robot.txt non ha l’obiettivo di deindicizzare le pagine, ma piuttosto di impedire a Google di effettuare il crawling delle pagine. Questa opzione in robots.txt non viene utilizzata per deindicizzare le pagine
Le tecniche di deindicizzazione che le presenterò sono tutte efficaci. Tuttavia, non ha senso cercare di utilizzare tutte le tecniche contemporaneamente:
2.1. Utilizzando il meta tag robots
Il tag meta robots si trova tra i tag . Viene utilizzato per indicare le linee guida per l’indicizzazione dei contenuti di un sito. Per la deindicizzazione, ha due opzioni:
- Deindicizza il contenuto, mantenendo comunque accessibili i link in esso contenuti. Questo è consigliato quando desidera deindicizzare un contenuto senza eliminare i suoi link.
(…) (…)
- Desindicizza le pagine, impedendo al contempo che i link vengano seguiti:
Il passo successivo è quello di creare un mappa del sito la sitemap di deindicizzazione, la invii a Google tramite il robots.txt seguendo la direttiva “sitemap”, oltre all’intero URL che accede al sito grazie alla CONSOLE DI RICERCA.
2.2. Utilizzando il comando X-Robots-Tag: Noindex
Questo metodo viene utilizzato per deindicizzare i file o le pagine senza modificare il loro codice sorgente:
- Deindicizzazione dei PDF:
- Deindicizzazione di immagini e file:
In ogni caso, è importante ricordare che non deve utilizzare due metodi contemporaneamente. Questo renderà la sua deindicizzazione inefficace. Per maggiori informazioni, veda : che cos’è robots.txt e come usarlo?
2.3. Deindicizzazione delle pagine non necessarie
Per deindicizzare rapidamente molte pagine inutili, dovrebbe :
- Fornire un codice HTTP 410 codice o HTTP 404 codice nelle pagine cancellate. In seguito, deve attendere che Google prenda in considerazione la rimozione della pagina.
- Genera una sitemap di deindicizzazione in cui troviamo i vecchi URL cancellati che rimandano a un 404 o a un 410.
2.4. Deindicizzi le vecchie pagine a scapito di quelle nuove che sono più informative
Se sta pensando di deindicizzare delle pagine perché altre sono più rilevanti, ecco come fare
- Impostazione 301 dalle pagine che considera meno rilevanti a quelle nuove. Il reindirizzamento 301 è consigliato soprattutto nel caso in cui le pagine considerate meno rilevanti siano soggette a backlink. Questo favorisce l’ottimizzazione delle pagine e riduce la perdita di linkjuice.
- Affinché Google prenda in considerazione questi 301 più rapidamente, si consiglia di creare una sitemap in cui si trovino gli URL che reindirizzano alle nuove pagine e di inviarla tramite robots.txt o un account SEARCH console.
Oltre a voler deindicizzare le pagine da soli, può accadere che le sue pagine vengano deindicizzate da Google senza alcun ordine.
Capitolo 3: Come fa Google a deindicizzare?
Ha fatto molti sforzi per portare il suo sito web in cima alle pagine dei risultati dei motori di ricerca. Tuttavia, dopo tutti i tentativi di ricerca, non riesce a trovare il suo sito web nei risultati della ricerca
Questo è confuso! Dovrà scoprire cosa ha causato questo inconveniente. Infatti, la missione per cui Google opera è dichiarata come segue “Organizzare le informazioni provenienti da tutto il mondo per renderle disponibili e utili”“.
L’azienda si propone di offrire ai suoi utenti la più informazioni affidabili
Per raggiungere questo obiettivo, Google si impegna a :
- Costantemente regolare la sua ricerca algoritmo di ricerca ;
- Garantire costantemente che i risultati della ricerca siano di migliore qualità attraverso i dati di valutazione raccolti a diversi livelli, compresi i suoi valutatori.
È quindi facile comprendere perché il gigante non esiti a sanzionare alcune pratiche che considera dannosi per i suoi utenti
Ecco le pratiche che sono per lo più black hat e che possono causare la deindicizzazione del suo sito da parte di Google.
3.1. La tecnica di occultamento
Il cloaking è un metodo Black Hat per ottimizzare le posizioni dei siti nei motori di ricerca
Questo la pratica consiste nel presentare al motore di ricerca un contenuto diverso da quello presentato agli utenti di Internet. Un vero e proprio sistema di camuffamento.
Ad esempio, faccia in modo che il suo sito appaia come un sito che condivide recensioni di celebrità, ma che si colleghi in modo discreto e segreto a un ampio contenuto erotico (pornografico).
Il camuffamento viene eseguito pubblicando contenuto da un agente utente o anche da un indirizzo IP. In questo modo, se un crawler esegue una scansione del sistema, la versione pulita del file del sito viene visualizzato.
D’altra parte, se è stato individuato un ricercatore umano, è viene visualizzata la versione falsa del sito.
Oltre a questo, la mascheratura può anche sostituire
- Le immagini che vengono camuffate da altre immagini e che sono diversi da quelli che sono stati trasmessis ;
- I siti web mostrano alcuni contenuti a Google, ma che limita l’accesso all’utente di Internet ;
Questi non includono i siti web che richiedono la registrazione o il login per accedere ai contenuti. Google applica due tipi di pena per l’occultamento:
- La penalizzazione che colpisce solo parzialmente il suo sito;
- La penalizzazione che colpisce l’intero sito web.
3.2. Spamming
Conosciuto anche come contenuti indesideratisi tratta di contenuti privi di valore che vengono visualizzati allo scopo di pubblicità
Infatti, Google ha annunciato la de-indicizzazione forzata dei contenuti di spam, tra cui
- Invio di query automatiche a Google ;
- Disegni di pagine con contenuti dannosi come: virus, phishing o malware;
- L’uso di affiliazione senza un sufficiente valore aggiunto;
- Collegamenti nascosti;
- Partecipazione a schemi di collegamento.
Ci sono anche altri tipi di spam:
3.2.1. Spam generato dagli utenti
Lo spam viene creato anche dagli utenti o bot che inseriscono commenti contenenti informazioni di contatto o link a siti web o profili utente:
Fonte: Pipdig
Se desidera distinguere tra i commenti di spam, può prendere in considerazione
- Nomi utente ;
- Il e-mail che sembrano irrilevanti o strani o che semplicemente non sono affidabili
Per evitare di essere penalizzato da Google, deve agire rapidamente eliminando tutti i commenti di spam e rivedendo i contenuti del suo sito. Per evitare lo spam, consideri anche questo punto:
3.2.2. Hosting gratuito
È comune imbattersi in servizi di hosting gratuiti. Le consigliamo di fare attenzione a questi servizi, perché non sono davvero affidabili
In cambio di ciò che le è stato promesso, vedrà solo annunci di spam e un servizio scadente. Google sta prendendo misure per sanzionare questa pratica
Per evitare di essere penalizzato, dovrebbe scegliere un hosting utile e affidabile. Il pagamento dell’hosting è una delle migliori soluzioni che le consentono di avere il pieno controllo del suo sito web. Ecco una soluzione che può aiutarla: 27 criteri per la scelta del suo host web?
3.3. Imbottimento di parole chiave
Imbottimento di parole chiave parole chiave è una tecnica SEO Black Hat che consiste nel caricare le pagine web con le parole chiave nel tentativo di influenzare il posizionamento sui motori di ricerca di un sito web.
Queste pagine web possono includere meta tag tag e meta descrizione. L’ambito di questo metodo può essere esteso per includere :
3.3.1. Aggiungere parole chiave irrilevanti
Si tratta di parole chiave che non hanno alcuna relazione con l’argomento. Ad esempio, il suo sito web ha contenuti sull’arredamento, ma lei aggiunge parole chiave sul giardinaggio solo per attirare più traffico. Google non esiterà a sanzionare questo tipo di pagina.
3.3.2. Ripetizione eccessiva di parole chiave
Il gigante dei motori di ricerca è totalmente contrario a ripetere inutilmente inutilmente ripetuto. Questo può includere l’uso di tutti i tipi di parole chiave disponibili.
Ad esempio, se le parole chiave sono “mobili dall’Etiopia”, eviti questo: << Il "mobili etiopi” è il migliore sul mercato. Può trovare “Etiopia mobili dall’Etiopiapuò trovare “mobili etiopi” nei negozi sia online che di persona. “L’Etiopia mobili dall’Etiopia“è comodo e morbido. >>
Per scoprire se il suo contenuto è denso di parole chiave, dia un’occhiata a questa breve guida Definizione Densità delle parole chiave l Twaino.
3.3.3. Testo nascosto
Un altro metodo di riferimento più o meno meno antico è l’uso di parole chiave su un sito web il cui carattere è :
- Simile allo sfondo del sito web;
- Troppo piccolo, impossibile da leggere a occhio nudo.
In ogni caso, Google penalizzerà quando si accorgerà dell’inganno.
3.4. Contenuto leggero
Gli esperti lo dicono sempre, scrivono a contenuti di qualità non è un compito facile. Anche se questo criterio può essere soddisfatto se lei è un eccellente scrittore, il problema rimarrà la frequenza di pubblicazione
In effetti, è necessario pubblicare contenuti di qualità, ma con regolarità. Se pubblica un articolo solo una volta al mese, ha meno probabilità di ottenere buoni risultati rispetto a chi pubblica più volte al mese
Per trarre i benefici di una pubblicazione regolare, alcune persone non esitano a pubblicare qualsiasi tipo di contenuto che gli si presenti.
Altre persone utilizzano la scorciatoia copiare tutto o parte del contenuto (contenuto duplicato come visto sopra). Tali contenuti sono visti da Google come privi di originalità e offrono poco valore aggiunto ai suoi utenti
Dando loro poco interesse nelle SERP, il motore di ricerca può facilmente deindicizzare questi contenuti o l’intero sito.
Capitolo 4: Altre domande sulla deindicizzazione
4.1. Cosa significa indicizzare una pagina?
In termini semplici, l’indicizzazione è il processo di aggiunta delle pagine web al database di ricerca di Google. A seconda del Meta tag che ha utilizzato (index o NO-index), Google scansionerà e indicizzerà le sue pagine o meno. Un tag no-index significa che questa pagina non verrà aggiunta all’indice di ricerca web.
4.2. Cosa significa “deindicizzato”?
In poche parole, deindicizzato significa: rimosso da un indice o dall’intero sistema di indicizzazione
4.3. Come si fa a deindicizzare una pagina?
In primo luogo, può utilizzare un tag meta robots senza accesso. In secondo luogo, può fare una richiesta immediata nella sezionestrumento di rimozione degli URL in Google Search Console
Alla fine, non dimentichi di controllare se le pagine sono state deindicizzate.
4.come posso impedire a Google di indicizzare il mio sito?
Il modo più efficace e semplice per impedire a Google di indicizzare determinate pagine web è il meta tag “noindex”. In sostanza, si tratta di una direttiva che indica ai crawler di Google di non indicizzare una pagina web e quindi di non mostrarla successivamente nelle SERP.
4.5. Che cos’è un tag noindex?
Un tag “noindex” indica ai motori di ricerca di non includere la pagina nel loro indice e quindi nei risultati della ricerca. Il metodo più comune per non indicizzare una pagina è quello di aggiungere un tag nella sezione head dell’HTML o nelle intestazioni della risposta
In sintesi
L’ottimizzazione per i motori di ricerca di un sito web dipende da uno o più fattori. L’indicizzazione è una fase dell’ottimizzazione dei motori di ricerca che consente ai motori di ricerca di visualizzare il contenuto dei siti web nei loro risultati
La deindicizzazione, invece, mobilita diverse tecniche che consistono nel rimuovere dall’indice determinati contenuti ritenuti di bassa qualità o privati, al fine di rendere il sito più qualitativo
Esistono molte tecniche di deindicizzazione, ma alcune sono state citate e dettagliate in questo articolo. Spero che l’abbia aiutata o che le abbia fornito altri suggerimenti. A presto!