Descripción Wayback Machine – Internet Archive
A veces puede ser útil averiguar cómo era un sitio web en el pasado o revisar el contenido de una página web antigua que actualmente no está disponible.
Wayback Machine es un servicio en línea ofrecido por Internet Archive que le permite retroceder a través de archivos de Internet y acceder a instantáneas anteriores de sitios web.
Wayback Machine de Internet Archive ya ha rastreado y archivado más de 729 mil millones de páginas web. Para acceder a él, solo debe ingresar el nombre de dominio del sitio que está buscando o una palabra clave correspondiente.
¿Qué es Wayback Machine?
Wayback Machine es uno de los servicios que ofrece Internet Archive. Fue lanzado en 2001 y es el servicio de la organización más utilizado entre los usuarios de Internet.
Es una herramienta que le permite «retroceder en el tiempo» para averiguar cómo era un sitio web en el pasado.
Actualmente, Wayback Machine sigue siendo uno de los archivos digitales más ricos con miles de millones de páginas web archivadas desde 1996.
El objetivo de la organización (Internet Archive) es ayudar a preservar los artefactos digitales y proporcionar una biblioteca de acceso público en Internet para académicos, historiadores e investigadores.
Para esto, la herramienta ofrece una función de agregar páginas para permitir que los propietarios de sitios web autoarchiven sus páginas en la plataforma.
Sin embargo, las páginas pueden tardar entre 6 y 24 meses en aparecer en Wayback Machine después de recopilarlas.
Además, Internet Archive no archiva:
- las páginas que requieren una contraseña para acceder a las
- páginas designadas por sus propietarios como «excluidas de los robots»
- las páginas a las que solo se puede acceder cuando el usuario debe completar un formulario
- y las páginas alojadas en servidores seguros.
Además de las páginas que pueden agregar los propios propietarios de sitios web, Internet Archive también trabaja con instituciones para proporcionar toda la información disponible en su base de datos.
Wayback Machine: ¿Cómo usar la herramienta para encontrar instantáneas históricas de un sitio?
Wayback Machine es una herramienta accesible para todos y muy fácil de usar.
- Para usarlo, simplemente vaya a la Archive.org
- Si conoce la URL completa del sitio que está buscando, puede escribirla en la barra de búsqueda del sitio.
De lo contrario, Wayback Machine también ofrece una función de búsqueda de palabras clave.
- Simplemente ingrese una palabra clave relacionada con la página de inicio del sitio que está buscando y haga clic en iniciar su consulta.
- La plataforma debería mostrarte una lista de resultados que coincidan con tu búsqueda. Haga clic en un resultado para acceder a las imágenes del sitio web correspondiente.
De manera predeterminada, Wayback Machine muestra la instantánea del año en curso, pero también ofrece un sistema de navegación que le permite retroceder en el tiempo y ver rápidamente cómo ha sido el sitio en años anteriores.
Pero para una mejor visualización, tiene un enlace para mostrar la lista de todas las capturas archivadas del sitio con un calendario para acceder más fácilmente a la representación del sitio en una fecha pasada específica.
Al pasar el mouse sobre una fecha determinada, Wayback Machine ofrece automáticamente una lista de horas del día en las que puede hacer clic para acceder a la instantánea del sitio exactamente en ese momento.
Wayback Machine: funciones avanzadas
Wayback Machine es adecuado a priori para los investigadores con una serie de funciones que pueden pasar desapercibidas para los usuarios ocasionales:
Hacer referencia a una página archivada : con Wayback Machine, es posible hacer referencia fácilmente a instantáneas de páginas web archivadas en su propio contenido insertando sus URL.
Guarde sus páginas en el archivo de Wayback Machine: con su función «Guardar página ahora», Wayback Machine también permite a los propietarios de sitios guardar algunas de sus páginas en elarchivo de Internet.
Este es el procedimiento para guardar sus páginas web en Wayback Machine:
- Vaya a la Wayback Machine
- En la parte inferior de la página, tiene un campo llamado «Guardar página ahora». Ingrese la dirección URL de la página que desea guardar, luego haga clic en el botón «Guardar página».
Su página acaba de agregarse al archivo de Wayback Machine.
Use un operador de búsqueda para encontrar rápidamente una página en Wayback Machine: con Wayback Machine, puede buscar contenido específico sin tener que visitar el sitio cada vez.
La herramienta ofrece un operador de búsqueda en el formato « https://web.archive.org/*/www.yoursite.com/* ” que puede ingresar directamente en su navegador y acceder a instantáneas archivadas de un sitio web.
Por ejemplo, para ver las páginas de Twaino guardadas en Wayback Machine, simplemente busque en Google https://web.archive.org/*/www.twaino.com/*
Wayback Machine: API y versiones Aplicaciones móviles y extensiones de navegador
Wayback Machine no es solo una herramienta web. También puedes conseguirlo en versión móvil en tu iOS o androide.
Wayback Machine también existe como una extensión que puede instalar y usar en Chrome, Firefox, Opera y safari_
Para los desarrolladores, la herramienta también ofrece diferentes API para acceder a su base de datos.
En pocas palabras, Wayback Machine es la plataforma perfecta para revisar las apariencias anteriores de sus sitios web favoritos en casi cualquier medio.
También es una herramienta que puede ser útil para estudiantes y profesionales que buscan información sobre la historia de un sitio web.
Wayback Machine: ¿Cómo eliminar tus páginas web del archivo de Wayback Machine?
1. Medida preventiva: bloquear el acceso a Wayback Machine
Es posible eliminar su información de Wayback Machine para que las páginas de su sitio web que están archivadas ya no sean accesibles en Internet Archive.
Sin embargo, es un proceso complicado que puede llevar mucho tiempo. Es por eso que si tiene páginas confidenciales que no desea que Wayback Machine archive, puede tomar medidas ahora para evitar que la herramienta acceda a su sitio web.
Para evitar que Wayback Machine acceda a su dominio, será necesario modificar el contenido robots.txt de su sitio web
La función del archivo robots.txt es controlar cómo los programas externos pueden acceder a su sitio web.
https://www.twaino.com/seo/robots-txt/
Al ser también un programa de terceros, Wayback Machine también debe respetar las indicaciones que proporcionas en tu archivo robots.txt.
- Acceda al archivo robots.txt de su sitio web y luego, utilizando un editor de texto, agregue completamente al final del archivo, las siguientes líneas:
User-agent: ia_archiver Disallow: /
- Luego asegúrese de haber guardado sus cambios (Ctrl + S) antes cerrando el archivo.
Una vez hecho esto, su sitio ahora debería estar protegido contra archive.org y su Wayback Machine.
Sin embargo, recuerda que esta es una medida preventiva. Todas las páginas que Wayback Machine habría archivado seguirán estando disponibles en la plataforma.
Si está particularmente interesado en eliminar estas páginas de Archive.org, estas son sus opciones:
2. Envíe una solicitud de eliminación a la DMCA
Una de las opciones para eliminar sus páginas de los archivos de Wayback Machine es enviar una solicitud de eliminación de DMCA .
Independientemente de su nicho y el contenido de su sitio web, Internet Archive debe cumplir con las normas federales relacionadas con la protección de la propiedad intelectual.
La Ley de derechos de autor del milenio digital (DMCA) es una de las medidas propuestas por el gobierno de los EE. UU. para proteger su propiedad intelectual.
Sin embargo, si no está en el campo, sería mejor que lo acompañe un abogado para redactar correctamente y presentar la solicitud de presentación ante la DCMA.
3. Envíe un correo electrónico a info@archive.org
Para eliminar una página archivada en Archive.org, el mejor método recomendado por la plataforma es enviar un correo electrónico a info@archive.org.
Sin embargo, cuando se envía el correo electrónico, Internet Archive no responde de inmediato. Esto puede deberse a la cantidad de solicitudes de eliminación pendientes que recibe el equipo de Archive.org. Pero después de unos días debería obtener una respuesta.