(js,fjs);}}(document,"script","twitter-wjs");

jueves, 23 de febrero de 2017

Wayback Machine | ¡Viernes RANDOM!

Estoy seguro que pocos conocen el sitio web Wayback Machine y cual es su utilidad, hace tiempo que la conozco pero no hacía uso de la misma y estoy seguro que te encantará conocerla, especialmente si tienes un sitio web o un blog tanto en Wordpress como Blogger. Si quieres conocer de qué va, ¡Te invito a seguir leyendo!


¿Qué es Wayback Machine? 

Desarrollado por Brewster Kahle en 1996 bajo el nombre de "The Internet Archive", es una abismal base de datos que contiene réplicas de una enorme cantidad de páginas de Internet, ¿Que quiero decir con esto?, que si algún sitio fue dado de baja temporalmente o dejó de existir, podrás encontrar rastros acerca de él en Wayback Machine, mediante consultas encontrarás capturas de la página web en su base de datos. Lo curioso de este proyecto es que también se puede consultar dicha página a través de la historia.

Su funcionamiento es sencillo, basta con introducir la dirección (URL) de una página web para ver cúal es la última copia que se encuentra guardada en el archivo, mientras más tiempo existió dicha web más réplicas contendrá la base de datos. En el caso de que queramos ver cómo era la página web en el pasado, entonces Wayback Machine nos pedirá en qué fecha y año queremos visitar la página. En la actualidad disponemos de una nueva barra en la parte superior de la pantalla, que nos permite ver gráficamente esos momentos a lo largo del tiempo y la longitud de las barras del gráfico indica en qué meses se hicieron más copias.

¿Pero cómo almacena todas estas copias?

Es muy sencillo pero no menos ingenioso, almacena todo el contenido html del código fuente y guarda así no las imágenes sino sólo los códigos, esa es la razón por la cual podemos encontrarnos con resultados de páginas web sin imágenes ya que el aspecto multimedia se ocupan otros servidores, y si dicha imagen fue borrada en la base de datos, no podrá verse en los resultados de Wayback Machine, pero sí encontraremos todo el contenido html de la página web (que sería su mayoría).

En 2006 la base de datos ocupaba hasta 2 petabytes de espacio y crecía en torno a 20 terabytes por mes. Si quieren saber lo que equivale 1 Petabyte a otras medidas sigue leyendo, se van a sorprender:

1 Petabyte = 1000 Terabyte (TB)
1 Terabyte = 1000 Gigabyte (GB)
1 Petabyte = 1000 Terabyte - Pasando directo a Gigabyte = 1.000.000 GB

A modo de curiosidad, se puede evitar su indexación y grabación de información en el archivo robots.txt con: User-agent: ia_archiver Disallow: /


¿Conocían esta página web?
¿Han buscado copias de su blog?

2 comentarios:

  1. La verdad, muy interesante. No conocía la página ni de nombre siquiera, pero es impresionante que guarde semejante cantidad de datos. La internet no deja de asombrarme, jajaja.
    Muy buena entrada!
    Y ya que estamos te comento que te nominé para el Tag Under 200 :) ¡Ojalá puedas hacerlo! http://disparatescosmicos.blogspot.com.ar/2017/02/tag-under-200.html
    ¡Saludos!

    ResponderEliminar
  2. ¡Hola amor! La verdad que no sabía tanto de esta página. Supe su existencia gracias a vos y a veces es bonito ver el pasado de algunas páginas. Justo me imaginaba como había sido el pasado de Youtube jummm ¡Besos!

    ResponderEliminar