Wayback Machine - Wayback Machine

De Wikipedia, La Enciclopedia Libre

Pin
Send
Share
Send

Wayback Machine
Texto estilizado que dice:
Captura de pantalla
20151221 Internet Archive Wayback Machine.png
Visualización de archivos de wikipedia.org en Wayback Machine (diciembre de 2015)
Tipo de sitio
Archivo
Área de servicioMundial (excepto China y Rusia)
DueñoArchivo de Internet
URLweb.archivo.org Edita esto en Wikidata
RegistroOpcional
Lanzado24 de octubre de 2001; Hace 19 años (2001-10-24)[1][2]
Estado actualActivo
Escrito enJava, Pitón

los Wayback Machine es un digital archivo de El Red mundial, fundada por el Archivo de Internet, una biblioteca sin fines de lucro basada en San Francisco. Permite al usuario "retroceder en el tiempo" y ver cómo eran los sitios web en el pasado. Sus fundadores, Brewster Kahle y Bruce Gilliat, desarrolló Wayback Machine con la intención de proporcionar "acceso universal a todo el conocimiento" mediante la conservación de copias archivadas de páginas web desaparecidas.

Desde su lanzamiento en 2001, se han agregado más de 463 mil millones de páginas al archivo. El servicio también ha provocado controversia sobre si la creación de páginas archivadas sin el permiso del propietario constituye infracción de copyright en determinadas jurisdicciones.

Historia

Archivo de Internet fundadores Brewster Kahle y Bruce Gilliat lanzó Wayback Machine en 2001 para abordar el problema de la desaparición del contenido del sitio web cada vez que se cambia o se cierra.[3] El servicio permite a los usuarios ver versiones archivadas de páginas web a lo largo del tiempo, que el archivo llama un "índice tridimensional".[4] Kahle y Gilliat crearon la máquina con la esperanza de archivar todo Internet y proporcionar "acceso universal a todo el conocimiento".[5]

El nombre Wayback Machine fue elegido como referencia a una ficción viaje en el tiempo dispositivo, el "Wayback Machine"(pronunciado camino de vuelta), utilizado por los personajes Señor Peabody y Sherman en la caricatura El show de Rocky y Bullwinkle desde la década de 1960.[6][7] En uno de los segmentos componentes de la caricatura animada, La improbable historia de Peabody, los personajes usaron rutinariamente la máquina para presenciar, participar y, a menudo, alterar eventos famosos de la historia.

La Wayback Machine comenzó a archivar en caché páginas web en mayo de 1996,[8][9] con el objetivo de hacer público el servicio cinco años después.[10] De 1996 a 2001, la información se mantuvo en cinta digital, y Kahle ocasionalmente permitió a los investigadores y científicos aprovechar la torpe base de datos.[11] Cuando el archivo cumplió su quinto aniversario en 2001, fue inaugurado y abierto al público en una ceremonia en el Universidad de California, Berkeley.[12] Cuando se lanzó Wayback Machine, ya contenía más de 10 mil millones de páginas archivadas.[13]

Hoy, los datos se almacenan en el gran grupo de archivos de Internet Linux nodos.[5] En ocasiones, revisa y archiva nuevas versiones de sitios web (consulte los detalles técnicos a continuación).[14] Los sitios también se pueden capturar manualmente ingresando el URL en el cuadro de búsqueda, siempre que el sitio web permita a Wayback Machine "rastrearlo" y guardar los datos.[10]El 30 de octubre de 2020, Wayback Machine comenzó a verificar el contenido.[15]

Detalles técnicos

El software ha sido desarrollado para "gatear" la web y descargar todas las páginas de la World Wide Web de acceso público, Ardilla de tierra jerarquía, la Netnews (Usenet) sistema de tablero de anuncios y software descargable.[16] La información recopilada por estos "rastreadores" no incluye toda la información disponible en Internet, ya que muchos de los datos están restringidos por el editor o almacenados en bases de datos que no son accesibles. Para superar las inconsistencias en sitios web parcialmente almacenados en caché, Archive-It.org fue desarrollado en 2005 por Internet Archive como un medio para permitir que las instituciones y los creadores de contenido recolecten y conserven voluntariamente colecciones de contenido digital y creen archivos digitales.[17]

Los rastreos provienen de varias fuentes, algunas importadas de terceros y otras generadas internamente por el Archivo.[14] Por ejemplo, los rastreos son aportados por el Fundación Sloan y Alexa, rastreos ejecutados por IA en nombre de NARA y el Fundación de la memoria de Internet, espejos de Rastreo común.[14] Los "Rastreos Web en todo el mundo" se han estado ejecutando desde 2010 y capturan la Web global.[14][18]

La frecuencia de las capturas de instantáneas varía según el sitio web.[14] Los sitios web de "Rastreos web en todo el mundo" se incluyen en una "lista de rastreo", y el sitio se archiva una vez por rastreo.[14] Un rastreo puede tardar meses o incluso años en completarse según el tamaño.[14] Por ejemplo, "Wide Crawl Number 13" comenzó el 9 de enero de 2015 y finalizó el 11 de julio de 2016.[19] Sin embargo, puede haber varios rastreos en curso a la vez y un sitio puede estar incluido en más de una lista de rastreo, por lo que la frecuencia con la que se rastrea un sitio varía ampliamente.[14]

En octubre de 2019, los usuarios limitado a 5 solicitudes de archivo y recuperaciones por minuto.[¿Por qué?]

Capacidad de almacenamiento y crecimiento

A medida que la tecnología se ha desarrollado a lo largo de los años, la capacidad de almacenamiento de Wayback Machine ha aumentado. En 2003, después de sólo dos años de acceso público, Wayback Machine crecía a una tasa de 12 terabytes / mes. Los datos se almacenan en PetaBox sistemas de bastidores diseñados a medida por el personal de Internet Archive. El primer bastidor de 100 TB entró en pleno funcionamiento en junio de 2004, aunque pronto quedó claro que necesitarían mucho más almacenamiento que eso.[20][21]

Internet Archive migró su arquitectura de almacenamiento personalizada a Almacenamiento abierto Sun en 2009, y alberga un nuevo centro de datos en un Centro de datos modular Sun en Microsistemas solaresCampus de California.[22] Desde 2009, la Wayback Machine contenía aproximadamente tres petabytes de datos y estaba creciendo a una tasa de 100 terabytes cada mes.[23]

Una nueva versión mejorada de Wayback Machine, con una interfaz actualizada y un índice más actualizado de contenido archivado, estuvo disponible para pruebas públicas en 2011.[24] En marzo de ese año, se dijo en el foro de Wayback Machine que "la Beta de la nueva Wayback Machine tiene un índice más completo y actualizado de todos los materiales rastreados en 2010, y continuará actualizándose regularmente. El índice conducir la clásica Wayback Machine solo tiene un poco de material después de 2008, y no se planean más actualizaciones del índice, ya que se eliminará este año ".[25] También en 2011, Internet Archive instaló su sexto par de racks PetaBox, lo que aumentó la capacidad de almacenamiento de Wayback Machine en 700 terabytes.[26]

En enero de 2013, la compañía anunció un hito revolucionario de 240 mil millones de URL.[27]

En octubre de 2013, la empresa introdujo la función "Guardar una página"[28][29] que permite a cualquier usuario de Internet archivar el contenido de una URL y genera rápidamente un Enlace Permanente a diferencia del anterior liveweb característica.

Se convirtió en una amenaza de abuso por parte del servicio para hospedaje de binarios maliciosos.[30][31]

A diciembre de 2014, la Wayback Machine contenía 435 mil millones páginas web: casi nueve petabytes de datos, y crecía a unos 20 terabytes por semana.[13][32][33]

A julio de 2016, la Wayback Machine contenía alrededor de 15 petabytes de datos.[34]

En septiembre de 2018, Wayback Machine contenía más de 25 petabytes de datos.[35][36]

Crecimiento de Wayback Machine[37][38]
Wayback Machine por añoPáginas archivadas (mil millones)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452

Política de exclusión de sitios web

Históricamente, Wayback Machine ha respetado el estándar de exclusión de robots (robots.txt) para determinar si se rastreará un sitio web; o si ya se ha rastreado, si sus archivos podrían verse públicamente. Los propietarios de sitios web tenían la opción de excluirse de Wayback Machine mediante el uso de robots.txt. Aplicó las reglas de robots.txt de forma retroactiva; Si un sitio bloqueaba el Archivo de Internet, las páginas del dominio previamente archivadas tampoco estaban disponibles de inmediato. Además, Internet Archive declaró que "a veces, el propietario de un sitio web se comunicará con nosotros directamente y nos pedirá que dejemos de rastrear o archivar un sitio. Cumplimos con estas solicitudes".[39] Además, el sitio web dice: "El Archivo de Internet no está interesado en preservar u ofrecer acceso a sitios web u otros documentos de Internet de personas que no quieren que sus materiales estén en la colección".[40][41]

El 17 de abril de 2017, surgieron informes de sitios que habían desaparecido y se convirtieron en Dominios aparcados que usaban robots.txt para excluirse de los motores de búsqueda, lo que los excluía inadvertidamente de Wayback Machine.[42] El archivo de Internet cambió la política para ahora requerir una solicitud de exclusión explícita para eliminarlo de Wayback Machine.[43]

Política de archivos de Oakland

La política de exclusión retroactiva de Wayback se basa en parte en Recomendaciones para administrar solicitudes de eliminación y preservar la integridad de los archivos publicado por la Escuela de Sistemas y Gestión de la Información en Universidad de California, Berkeley en 2002, que otorga al propietario de un sitio web el derecho a bloquear el acceso a los archivos del sitio.[44] Wayback ha cumplido con esta política para ayudar a evitar costosos litigios.[45]

La política de exclusión retroactiva de Wayback comenzó a relajarse en 2017, cuando dejó de respetar el archivo robots.txt en los sitios web militares y del gobierno de EE. UU. Para rastrear y mostrar páginas web. Desde abril de 2017, Wayback ignora el archivo robots.txt de manera más amplia, no solo para los sitios web del gobierno de EE. UU.[46][47][48][49]

Usos

Desde su lanzamiento público en 2001, Wayback Machine ha sido estudiado por académicos tanto por la forma en que almacena y recopila datos como por las páginas reales contenidas en su archivo. En 2013, los académicos habían escrito alrededor de 350 artículos sobre Wayback Machine, en su mayoría de los campos de tecnología de la información, bibliotecología y ciencias sociales. Los estudiosos de las ciencias sociales han utilizado Wayback Machine para analizar cómo el desarrollo de sitios web desde mediados de la década de 1990 hasta el presente ha afectado el crecimiento de la empresa.[13]

Cuando Wayback Machine archiva una página, generalmente incluye la mayoría de los hipervínculos, lo que los mantiene activos cuando la inestabilidad de Internet podría haberlos roto con la misma facilidad. Investigadores de la India estudiaron la eficacia de la capacidad de Wayback Machine para guardar hipervínculos en publicaciones académicas en línea y descubrieron que salvó un poco más de la mitad de ellos.[50]

"Los periodistas usan Wayback Machine para ver sitios web muertos, informes de noticias fechados y cambios en el contenido del sitio web. Su contenido se ha utilizado para responsabilizar a los políticos y exponer mentiras en el campo de batalla".[51] En 2014, una página de redes sociales archivada de Igor Girkin, un líder rebelde separatista en Ucrania, lo mostró jactándose de que sus tropas habían derribado un presunto avión militar ucraniano antes de que se supiera que el avión en realidad era un avión civil de Malaysian Airlines (Vuelo 17 de Malaysia Airlines), después de lo cual eliminó la publicación y culpó al ejército de Ucrania por derribar el avión.[51][52] En 2017, el Marcha por la ciencia se originó a partir de una discusión sobre reddit que indicaba que alguien había visitado Archive.org y descubrió que todas las referencias a cambio climático había sido eliminado del sitio web de la Casa Blanca. En respuesta, un usuario comentó: "Es necesario que haya una Marcha de científicos en Washington".[53][54][55]

Además, el sitio se utiliza mucho para la verificación, proporcionando acceso a referencias y creación de contenido por Editores de Wikipedia.[56]

En septiembre de 2020, se anunció una asociación con Cloudflare para archivar automáticamente los sitios web servidos a través de su servicio "Siempre en línea", que también le permitirá dirigir a los usuarios a su copia del sitio si no pueden acceder al host original.[57]

Limitaciones

En 2014 hubo un lapso de seis meses entre el momento en que se rastreó un sitio web y el momento en que estuvo disponible para su visualización en Wayback Machine.[58] Actualmente, el tiempo de retraso es de 3 a 10 horas.[59] Wayback Machine ofrece solo funciones de búsqueda limitadas. Su función "Búsqueda de sitios" permite a los usuarios encontrar un sitio basándose en palabras que describen el sitio, en lugar de palabras que se encuentran en las páginas web en sí.[60]

Wayback Machine no incluye todas las páginas web que se hayan creado debido a las limitaciones de su rastreador web. Wayback Machine no puede archivar completamente las páginas web que contienen características interactivas como plataformas Flash y formularios escritos en JavaScript y aplicaciones web progresivas, porque esas funciones requieren interacción con el sitio web anfitrión. Esto significa que, desde junio de 2013, Wayback Machine no ha podido mostrar los comentarios de YouTube al guardar las páginas de YouTube, ya que, según el equipo de archivo, los comentarios ya no se "cargan dentro de la propia página".[61] El rastreador web de Wayback Machine tiene dificultades para extraer cualquier cosa que no esté codificada en HTML o una de sus variantes, lo que a menudo puede resultar en hipervínculos rotos e imágenes faltantes. Debido a esto, el rastreador web no puede archivar "páginas huérfanas" que no contienen enlaces a otras páginas.[60][62] El rastreador de Wayback Machine solo sigue un número predeterminado de hipervínculos basado en un límite de profundidad preestablecido, por lo que no puede archivar todos los hipervínculos en cada página.[18]

A partir de abril de 2018, los miembros del personal administrativo del equipo de archivo de Wayback Machine han hecho cumplir la regla del trimestre de mes, al eliminar ocasionalmente intervalos de tiempo de 23 días o 39 días (3/4 y 5/4 de un mes, respectivamente), con el fin de reducir el tamaño de la cola.[cita necesaria]

En evidencia legal

Juicio civil

Netbula LLC contra Chordiant Software Inc.

En un caso de 2009, Netbula, LLC contra Chordiant Software Inc., el acusado Chordiant presentó una moción para obligar a Netbula a deshabilitar el robots.txt archivo en su sitio web que estaba causando que Wayback Machine eliminara retroactivamente el acceso a versiones anteriores de páginas que había archivado desde el sitio de Netbula, páginas que Chordiant creía que respaldarían su caso.[63]

Netbula objetó la moción sobre la base de que los acusados ​​estaban pidiendo alterar el sitio web de Netbula y que deberían haber citado a Internet Archive para las páginas directamente.[64] Sin embargo, un empleado de Internet Archive presentó una declaración jurada apoyando la moción de Chordiant, indicando que no podía producir las páginas web por ningún otro medio "sin una carga, un gasto y una interrupción considerables para sus operaciones".[63]

El juez de instrucción Howard Lloyd en el Distrito Norte de California, División de San José, rechazó los argumentos de Netbula y les ordenó que deshabilitaran temporalmente el bloqueo de robots.txt para permitir que Chordiant recuperara las páginas archivadas que buscaban.[63]

Telewizja Polska

En un caso de octubre de 2004, Telewizja Polska USA, Inc. v. Satélite Echostar, No. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. 15 de octubre de 2004), un litigante intentó utilizar los archivos de Wayback Machine como fuente de evidencia admisible, quizás por primera vez. Telewizja Polska es el proveedor de TVP Polonia y EchoStar opera el Dish Network. Antes del proceso del juicio, EchoStar indicó que tenía la intención de ofrecer instantáneas de Wayback Machine como prueba del contenido anterior del sitio web de Telewizja Polska. Telewizja Polska presentó una moción en limine para suprimir las instantáneas por motivos de rumores y fuente no autenticada, pero el juez de instrucción Arlander Keys rechazó la afirmación de Telewizja Polska de rumores y negó la moción de TVP en limine para excluir la evidencia en el juicio.[65][66] En el juicio, sin embargo, el juez del tribunal de distrito Ronald Guzmán, el juez de primera instancia, anuló las conclusiones del magistrado Keys y sostuvo que ni la declaración jurada del empleado de Internet Archive ni las páginas subyacentes (es decir, el sitio web de Telewizja Polska) eran admisibles como prueba. El juez Guzmán razonó que la declaración jurada del empleado contenía tanto rumores como declaraciones de respaldo no concluyentes, y la supuesta página web, las impresiones no eran auto-autenticables.[67][68]

Ley de Patentes

Siempre que se cumplan algunos requisitos adicionales (por ejemplo, proporcionar una declaración autorizada del archivero), Oficina de patentes de Estados Unidos y el Oficina Europea de Patentes aceptará sellos de fecha del Archivo de Internet como evidencia de cuándo una determinada página web fue accesible al público. Estas fechas se utilizan para determinar si una página web está disponible como arte previo por ejemplo, al examinar una solicitud de patente.[69]

Limitaciones de utilidad

Existen limitaciones técnicas para archivar un sitio web y, como consecuencia, es posible que las partes contrarias en un litigio hagan un mal uso de los resultados proporcionados por los archivos del sitio web. Este problema puede verse agravado por la práctica de enviar capturas de pantalla de páginas web en quejas, respuestas o informes de testigos expertos cuando los enlaces subyacentes no están expuestos y, por lo tanto, pueden contener errores. Por ejemplo, archivos como Wayback Machine no completan formularios y, por lo tanto, no incluyen el contenido deSosegado bases de datos de comercio electrónico en sus archivos.[70]

Estatus legal

En Europa, la Wayback Machine podría interpretarse como una violación derechos de autor leyes. Solo el creador de contenido puede decidir dónde se publica o duplica su contenido, por lo que el Archivo tendría que eliminar páginas de su sistema a solicitud del creador.[71] Las políticas de exclusión de Wayback Machine se pueden encontrar en la sección de preguntas frecuentes del sitio.[72]

Problemas legales de contenido archivado

Se han presentado varios casos contra Internet Archive específicamente por sus esfuerzos de archivo Wayback Machine.

Cienciología

A finales de 2002, Internet Archive eliminó varios sitios que criticaban Cienciología de la Wayback Machine.[73] Un mensaje de error indicaba que esto era en respuesta a una "solicitud del propietario del sitio".[74] Posteriormente se aclaró que abogados de la Iglesia de Scientology había exigido la eliminación y que los propietarios del sitio no querían que se eliminara su material.[75]

Defensores de la atención médica, Inc.

En 2003, Harding Earley Follmer & Frailey defendió a un cliente de una disputa de marca utilizando la Wayback Machine del Archive. Los abogados pudieron demostrar que los reclamos hechos por el demandante eran inválidos, basándose en el contenido de su sitio web de varios años antes. El demandante, Healthcare Advocates, luego modificó su queja para incluir el Archivo de Internet, acusando a la organización de infracción de derechos de autor, así como de violaciones de la DMCA y el Ley de abuso y fraude informático. Healthcare Advocates afirmó que, dado que habían instalado un robots.txt archivo en su sitio web, incluso si después de que se presentó la demanda inicial, el Archivo debería haber eliminado todas las copias anteriores del sitio web del demandante de Wayback Machine, sin embargo, parte del material continuó siendo visible públicamente en Wayback.[76] La demanda se resolvió fuera de los tribunales, después de que Wayback solucionó el problema.[77]

Concha de Suzanne

Activista Concha de Suzanne presentó una demanda en diciembre de 2005, exigiendo que Internet Archive le pagara US $ 100.000 por archivar su sitio web profane-justice.org entre 1999 y 2004.[78][79] Archivo de Internet presentó un juicio declaratorio acción en el Tribunal de Distrito de los Estados Unidos para el Distrito Norte de California el 20 de enero de 2006, buscando una determinación judicial de que Internet Archive no violó la derechos de autor. Shell respondió y trajo un contraataque en contra de Internet Archive por archivar su sitio, que alega es una violación de su términos de servicio.[80] El 13 de febrero de 2007 un juez de la Tribunal de Distrito de los Estados Unidos para el Distrito de Colorado desestimó todas las contrademandas excepto incumplimiento de contrato.[79] El Archivo de Internet no se movió para descartar infracción de copyright Shell afirmó que surgen de sus actividades de copia, que también seguirían adelante.[81]

El 25 de abril de 2007, Internet Archive y Suzanne Shell anunciaron conjuntamente el acuerdo de su demanda.[78] El Archivo de Internet dijo que "... no tiene ningún interés en incluir materiales en Wayback Machine de personas que no desean que se archive su contenido web. Reconocemos que la Sra. Shell tiene un copyright válido y exigible en su sitio web y lo lamentamos que la inclusión de su sitio web en Wayback Machine resultó en este litigio ". Shell dijo: "Respeto el valor histórico del objetivo de Internet Archive. Nunca tuve la intención de interferir con ese objetivo ni causarle ningún daño".[82]

Daniel Davydiuk

Entre 2013 y 2016, un actor pornográfico llamado Daniel Davydiuk intentó eliminar imágenes archivadas de sí mismo del archivo de Wayback Machine, primero enviando múltiples Solicitudes de DMCA al archivo, y luego apelando a la Tribunal Federal de Canadá.[83][84][85]

Censura y otras amenazas

Archive.org es actualmente bloqueado en China.[86][87] Después de la prohibición de la organización terrorista Estado Islámico, el Archivo de Internet se bloqueado en su totalidad en Rusia como anfitrión de un video de divulgación de esa organización, por un corto tiempo en 2015-2016.[51][88][89][necesita actualización] Desde 2016, el sitio web ha estado de regreso, disponible en su totalidad, aunque los grupos de presión comerciales locales están demandando al Archivo de Internet en un tribunal local para prohibirlo por motivos de derechos de autor.[90]

Alison Macrina, director del Library Freedom Project, señala que "si bien los bibliotecarios valoran profundamente la privacidad individual, también nos oponemos firmemente a la censura".[51]

Se conocen casos raros en los que el sitio web ha desactivado el acceso en línea a contenido que "por nada" ha puesto a las personas en peligro.[51]

Otras amenazas incluyen desastres naturales,[91] destrucción (remota o física),[92] manipulación del contenido del archivo (ver también: ataque cibernetico, respaldo), leyes de derechos de autor problemáticas[93] y vigilancia de los usuarios del sitio.[94]

Kevin Vaughan sospecha que, a largo plazo de varias generaciones, "casi nada" sobrevivirá de una manera útil, afirmando: "Si tenemos continuidad en nuestra civilización tecnológica" mediante la cual "muchos de los datos básicos seguirán siendo fáciles de encontrar y buscar. ".[95]

En un artículo que reflexiona sobre la preservación del conocimiento humano, El Atlántico ha comentado que Internet Archive, que se describe a sí mismo para ser construido a largo plazo,[96] "está trabajando frenéticamente para capturar datos antes de que desaparezcan sin ninguna infraestructura a largo plazo de la que hablar".[97]

Ver también

Referencias

  1. ^ "Información de dominio, DNS y WHOIS de WayBackMachine.org - DomainTools". QUIÉN ES. Recuperado 13 de marzo, 2016.
  2. ^ "Información de dominio, DNS y WHOIS de InternetArchive.org - DomainTools". QUIÉN ES. Recuperado 13 de marzo, 2016.
  3. ^ Notess, Greg R. (marzo-abril de 2002). "La Wayback Machine: el archivo de la Web". En línea. 26: 59–61 - a través de EBSCOhost.
  4. ^ "La Wayback Machine", Preguntas frecuentes, archivado del original el 18 de septiembre de 2018, recuperado 18 de septiembre 2018
  5. ^ a B "20.000 discos duros en una misión | Blogs de Internet Archive". blog.archive.org. 25 de octubre de 2016. Archivado del original el 20 de octubre de 2018. Recuperado 15 de octubre 2018.
  6. ^ Green, Heather (28 de febrero de 2002). "Una biblioteca tan grande como el mundo". BusinessWeek. Archivado desde el original el 20 de diciembre de 2011.
  7. ^ Tong, Judy (8 de septiembre de 2002). "Partido responsable - Brewster Kahle; una biblioteca de la web, en la web". New York Times. Archivado del original el 20 de febrero de 2011. Recuperado 15 de agosto, 2011.
  8. ^ "MTV Online: Página principal - Wayback Machine". Wayback Machine. 12 de mayo de 1996. Archivado desde el original el 12 de mayo de 1996. Recuperado 17 de julio 2020.
  9. ^ "Guía Infoseek - Wayback Machine". Wayback Machine. 12 de mayo de 1996. Archivado desde el original el 12 de mayo de 1996. Recuperado 16 de diciembre 2016.
  10. ^ a B "Archivo de Internet: Wayback Machine". archive.org. Archivado del original el 3 de enero de 2014. Recuperado 15 de octubre 2018.
  11. ^ Cook, John (1 de noviembre de 2001). "El sitio web lo lleva a la historia de Internet". Seattle Post-Intelligencer. Archivado del original el 12 de agosto de 2014. Recuperado 15 de agosto, 2011.
  12. ^ Mayfield, Kendra (28 de octubre de 2001). "Wayback se remonta a la Web". Cableado. Archivado del original el 16 de octubre de 2017. Recuperado 16 de octubre 2017.
  13. ^ a B C Arora, Sanjay K .; Li, Yin; Youtie, Jan; Shapira, Philip (5 de mayo de 2015). "Uso de la máquina wayback para minar sitios web en ciencias sociales: un recurso metodológico". Revista de la Asociación de Ciencia y Tecnología de la Información. 67 (8): 1904–1915. doi:10.1002 / asi.23503. ISSN 2330-1635.
  14. ^ a B C D mi F gramo h Kalev Leetaru (28 de enero de 2016). "El archivo de Internet cumple 20 años: una mirada entre bastidores al archivo de la Web". Forbes. Archivado del original el 16 de octubre de 2017. Recuperado 16 de octubre 2017.
  15. ^ http://blog.archive.org/2020/10/30/fact-checks-and-context-for-wayback-machine-pages/
  16. ^ Kahle, Brewster. "Archivar Internet". Scientific American - Número de marzo de 1997. Archivado del original el 3 de abril de 2012. Recuperado 19 de agosto 2011.
  17. ^ Jeff Kaplan (27 de octubre de 2014). "Archive-It: rastreando la Web juntos". Blogs de Internet Archive. Archivado del original el 12 de octubre de 2017. Recuperado 16 de octubre 2017.
  18. ^ a B "Rastreos web en todo el mundo". Archivo de Internet. Archivado del original el 19 de octubre de 2017. Recuperado 16 de octubre 2017.
  19. ^ "Número de rastreo ancho 13". Archivo de Internet. Archivado del original el 19 de octubre de 2017. Recuperado 16 de octubre 2017.
  20. ^ "Archivo de Internet: Petabox". archive.org. Recuperado 25 de octubre 2018.
  21. ^ Kanellos, Michael (29 de julio de 2005). "Gran almacenamiento a bajo precio". CNET News.com. Archivado desde el original el 3 de abril de 2007. Recuperado 29 de julio 2007.
  22. ^ "Internet Archive y Sun Microsystems crean una historia viva de Internet". Microsistemas solares. 25 de marzo de 2009. Archivado del original el 26 de marzo de 2009. Recuperado 27 de marzo, 2009.
  23. ^ Mearian, Lucas (19 de marzo de 2009). "Internet Archive presenta el enorme centro de datos de Wayback Machine". Computerworld.com. Archivado desde el original el 23 de marzo de 2009. Recuperado 22 de marzo, 2009.
  24. ^ "Máquina Wayback actualizada en pruebas beta". Archivado desde el original el 23 de agosto de 2011. Recuperado 19 de agosto 2011.
  25. ^ "Beta Wayback Machine, en el foro". Archivado del original el 17 de abril de 2014. Recuperado 16 de abril 2014.
  26. ^ "Foros de archivos de Internet: el sexto par de racks entran en servicio: se utilizan más de 2 PB de espacio de datos". archive.org. Archivado del original el 24 de octubre de 2016. Recuperado 25 de octubre 2018.
  27. ^ "Wayback Machine: ahora con 240.000.000.000 de URL | Blogs de Internet Archive". 9 de enero de 2013. Archivado del original el 14 de abril de 2014. Recuperado 16 de abril 2014.
  28. ^ Rossi, Alexis (25 de octubre de 2013). "Reparación de enlaces rotos en Internet". archive.org. San Francisco, CA, EE.UU .: Equipo de colecciones, Internet Archive. Archivado del original el 7 de noviembre de 2014. Recuperado 25 de marzo, 2015. Hemos agregado la capacidad de archivar una página al instante y recuperar una URL permanente para esa página en Wayback Machine. Este servicio permite a cualquier persona (editores de Wikipedia, académicos, profesionales del derecho, estudiantes o cocineros caseros como yo) crear una URL estable para citar, compartir o marcar cualquier información a la que quieran tener acceso en el futuro.
  29. ^ "La nueva Wayback Machine de Internet Archive ahora en línea". www.digitaljournal.com. 23 de octubre de 2013.
  30. ^ El equipo de VirusTotal (25 de marzo de 2015). "207.241.226.190 información de dirección IP". virustotal.com. Dublín 2, Irlanda: VirusTotal. Archivado del original el 14 de julio de 2014. Recuperado 25 de marzo, 2015. 2015-03-25: Últimas URL alojadas en esta dirección IP detectadas por al menos un escáner de URL o un conjunto de datos de URL malicioso. ... 2/62 2015-03-25 16:14:12 [URL completa censurada] /Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [URL completa censurada] /CBLightSetup.exeMantenimiento CS1: ubicación (Enlace)
  31. ^ Aviso proporcionado por Google (25 de marzo de 2015). "Página de diagnóstico de navegación segura para archive.org". google.com/safebrowsing. Mountain View, CA, Estados Unidos. Archivado del original el 6 de abril de 2015. Recuperado 25 de marzo, 2015. 2015-03-25: Parte de este sitio se incluyó en la lista de actividad sospechosa 138 veces durante los últimos 90 días. ... ¿Qué pasó cuando Google visitó este sitio? ... De las 42410 páginas que probamos en el sitio durante los últimos 90 días, 450 páginas tuvieron como resultado la descarga e instalación de software malicioso sin el consentimiento del usuario. Google visitó este sitio por última vez el 2015-03-25 y la última vez que se encontró contenido sospechoso en este sitio fue el 2015-03-25. ... El software malicioso incluye 169 trojan (s), 126 virus, 43 backdoor (s).
  32. ^ "Preguntas frecuentes sobre Internet Archive". Archivado del original el 21 de octubre de 2009. Recuperado 17 de enero 2015.
  33. ^ "Preguntas frecuentes sobre Internet Archive". 18 de diciembre de 2014. Archivado desde el original el 18 de diciembre de 2014. Recuperado Diciembre 13, 2018.
  34. ^ "¿Puede la manipulación de big data cambiar la forma de pensar del mundo?". El Nacional. Archivado del original el 12 de enero de 2017. Recuperado 14 de mayo, 2017.
  35. ^ Crockett, Zachary (28 de septiembre de 2018). "Inside Wayback Machine, la cápsula del tiempo de Internet". Ajetreo. Archivado del original el 2 de octubre de 2018. Recuperado 26 de octubre 2018.
  36. ^ Heffernan, Virginia (18 de septiembre de 2018). "Las cosas se rompen y decaen en Internet: eso es bueno". CON CABLE. Archivado del original el 25 de septiembre de 2018. Recuperado 26 de octubre 2018.
  37. ^ michelle (9 de mayo de 2014). "¡Wayback Machine alcanza los 400.000.000.000!". Archivo de Internet. Archivado del original el 26 de agosto de 2014. Recuperado 25 de marzo, 2015.
  38. ^ "Wayback Machine de Internet Archive". Archivo de Internet. Archivado desde el original el 13 de febrero de 2015. Recuperado 25 de marzo, 2015.
  39. ^ "Algunos sitios no están disponibles debido a Robots.txt u otras exclusiones". Archivado desde el original el 15 de abril de 2011.
  40. ^ "Preguntas frecuentes sobre Internet Archive". Archivado desde el original el 17 de abril de 2014.
  41. ^ Cox, Joseph (22 de mayo de 2018). "La Wayback Machine está eliminando evidencia de malware vendido a Stalkers". Archivado del original el 23 de mayo de 2018. Recuperado 23 de mayo, 2018.
  42. ^ "Robots.txt destinado a motores de búsqueda no funciona bien para archivos web". Archivo de Internet. 17 de abril de 2017. Recuperado 29 de junio 2019.
  43. ^ https://help.archive.org/hc/en-us/articles/360004651732-Using-The-Wayback-Machine
  44. ^ "Recomendaciones para administrar solicitudes de eliminación y preservar la integridad de los archivos". Universidad de California. 14 de diciembre de 2002. Archivado del original el 18 de septiembre de 2017. Recuperado 14 de septiembre 2017.
  45. ^ "Eliminación retroactiva de robots.txt de rastreos anteriores, también conocida como Política de archivo de Oakland". Archivo de Internet. 7 de julio de 2014. Archivado del original el 10 de octubre de 2017. Recuperado 14 de septiembre 2017.
  46. ^ Mark Graham (17 de abril de 2017). "Robots.txt destinado a motores de búsqueda no funciona bien para archivos web". Blogs de Internet Archive. Archivado del original el 17 de abril de 2017. Recuperado 16 de abril 2017.
  47. ^ "Archivierung des Internets: Internet Archive ignoriert künftig robots.txt" (en alemán). heise en línea. Archivado del original el 27 de abril de 2017. Recuperado 14 de mayo, 2017.
  48. ^ "Suchmaschinen: Internet Archive künftig Robots.txt-Einträge ignorieren - Golem.de" (en alemán). Archivado del original el 19 de junio de 2017. Recuperado 14 de mayo, 2017.
  49. ^ "Internet Archive ignorará los archivos robots.txt para mantener un registro histórico preciso". Tendencias digitales. 24 de abril de 2017. Archivado del original el 16 de mayo de 2017. Recuperado 14 de mayo, 2017.
  50. ^ Sampath Kumar, B.T .; Prithviraj, K.R. (21 de octubre de 2014). "Dar vida a los muertos: papel de Wayback Machine en la recuperación de URL desaparecidas". Revista de ciencia de la información. 41 (1): 71–81. doi:10.1177/0165551514552752. ISSN 0165-5515. S2CID 28320982.
  51. ^ a B C D mi "Wayback Machine no censurará el archivo por gusto, dice el director después de que se borró el artículo de los Juegos Olímpicos". Archivado del original el 6 de enero de 2017. Recuperado 14 de mayo, 2017.
  52. ^ Lepore, Jill (26 de enero de 2015). "Lo que la Web dijo ayer". El neoyorquino. Archivado del original el 25 de enero de 2015. Recuperado 14 de mayo, 2017.
  53. ^ "La Marcha por la Ciencia comenzó con la 'línea de usar y tirar' de esta persona en Reddit". El Correo de Washington. Archivado del original el 23 de abril de 2017. Recuperado 23 de abril 2017.
  54. ^ "¿Los científicos van a marchar sobre Washington?". El Washington Post. Archivado del original el 31 de enero de 2017. Recuperado Enero 31, 2017.
  55. ^ Foley, Katherine Ellen. "La Marcha mundial por la ciencia comenzó con un solo hilo de Reddit". Cuarzo. Archivado del original el 24 de abril de 2017. Recuperado 23 de abril 2017.
  56. ^ http://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued
  57. ^ Graham, Mark (17 de septiembre de 2020). "Cloudflare y Wayback Machine, uniendo fuerzas para una Web más confiable". Blogs de Internet Archive. Recuperado Septiembre 17, 2020.
  58. ^ "Preguntas frecuentes sobre Internet Archive". Archivo de Internet. 2 de abril de 2014. Archivado desde el original el 2 de abril de 2014. Recuperado 23 de noviembre 2018.
  59. ^ "Preguntas frecuentes sobre Internet Archive". archive.org. Recuperado 23 de noviembre 2018.
  60. ^ a B Bates, Mary Ellen (2002). "La Wayback Machine". En línea. 26: 80 - a través de EBSCOhost.
  61. ^ "YouTube - Archiveteam". archiveteam.org. Recuperado 6 de agosto 2020.
  62. ^ "Preguntas frecuentes sobre Internet Archive". archive.org. Archivado del original el 20 de abril de 2013. Recuperado 18 de octubre 2018.
  63. ^ a B C Lloyd, Howard (octubre de 2009). "Orden para deshabilitar Robots.txt" (PDF). Archivado desde el original (PDF) el 8 de agosto de 2019. Recuperado 15 de octubre 2009.
  64. ^ Cortes, Antonio (octubre de 2009). "Movimiento en contra de la eliminación de Robots.txt". Archivado desde el original el 27 de octubre de 2010. Recuperado 15 de octubre 2009.
  65. ^ Gelman, Lauren (17 de noviembre de 2004). "Las instantáneas de la página web de Internet Archive se consideran admisibles como prueba". Paquetes. 2 (3). Archivado desde el original el 30 de abril de 2011. Recuperado 4 de enero 2007.
  66. ^ Howell, Beryl A. (febrero de 2006). "Comprobación del historial web: cómo utilizar Internet Archive" (PDF). Revista de Derecho de Internet: 3–9. Archivado desde el original (PDF) el 5 de julio de 2010. Recuperado 6 de agosto 2008.
  67. ^ "Buscando evidencia en lugares virtuales Admisibilidad de evidencia en Internet". Archivado del original el 1 de julio de 2019. Recuperado 14 de junio, 2020.
  68. ^ Levitt, Carole A .; Rosch, Mark E. (2010). Encuentre información como un profesional: minar los recursos de Internet disponibles al público para la investigación de investigación, Tom 1. Asociación de Abogados de Estados Unidos. págs. 194-196. ISBN 978-1-60442-890-2. Recuperado 14 de junio, 2020.
  69. ^ Wynn W. Coggins (otoño de 2002). "Estado de la técnica en el campo de las patentes de métodos comerciales: ¿cuándo es un documento electrónico una publicación impresa para fines del estado de la técnica?". USPTO. Archivado desde el original el 21 de septiembre de 2012. Recuperado 15 de agosto, 2012.
  70. ^ "Desacreditando la Wayback Machine". Archivado desde el original el 29 de junio de 2010.
  71. ^ Bahr, Martin (2002). "La Wayback Machine und Google Cache - ¿eine Verletzung deutschen Urheberrechts?". JurPC (en alemán): 9. doi:10.7328 / jurpcb / 20021719. Archivado del original el 23 de agosto de 2009.
  72. ^ "Preguntas frecuentes sobre Internet Archive". Archivado del original el 17 de abril de 2014. Recuperado 16 de abril 2014.
  73. ^ Bowman, Lisa M (24 de septiembre de 2002). "Net archive silencia al crítico de Scientology". CNET News.com. Archivado desde el original el 15 de mayo de 2012. Recuperado 4 de enero 2007.
  74. ^ Jeff (23 de septiembre de 2002). "exclusiones de Wayback Machine" (Blog). Foro de Wayback Machine. Archivo de Internet. Archivado del original el 11 de febrero de 2007. Recuperado 4 de enero 2007. El autor y la fecha indican el inicio del hilo del foro.
  75. ^ Miller, Ernest. "Sherman, establece la máquina de retroceso para Scientology". LawMeme. Facultad de Derecho de Yale. Archivado desde el original (Blog) el 16 de noviembre de 2012. Recuperado 4 de enero 2007.
  76. ^ Tinte, Jessica (2005). "Sitio web demandado por viaje controvertido al pasado de Internet". EContent. 28. 11: 8–9.
  77. ^ Bangeman, Eric (31 de agosto de 2006). "Archivo de Internet resuelve demanda por Wayback Machine". Ars Technica. Archivado del original el 5 de noviembre de 2007. Recuperado 29 de noviembre 2007.
  78. ^ a B Archivo de Internet v. Shell, 505 F.Supp.2d 755 en justia.com, 1: 2006cv01726 (Tribunal de Distrito de Colorado 31 de agosto de 2006) ("'Se anunció el acuerdo de conciliación del 25 de abril de 2007.' Presentación 65, 2007-04-30: '... por lo tanto, ORDENÓ que este asunto sea DESALTADO CON PREJUICIO ...'").
  79. ^ a B Babcock, Lewis T., juez principal (13 de febrero de 2007). "Archivo de Internet v. Shell Acción Civil No. 06cv01726LTBCBS " (PDF). Archivado (PDF) del original el 25 de enero de 2014. Recuperado 25 de marzo, 2015. 1) Se OTORGA la moción de Internet Archive para desestimar la contrademanda de Shell por conversión y robo civil (Segunda Causa de Acción), 2) Se DENEGA la moción de Internet Archive para desestimar la contrademanda de Shell por incumplimiento de contrato (Tercera Causa de Acción); 3) Se OTORGA la moción de Internet Archive para desestimar la contrademanda de Shell por crimen organizado bajo RICO y COCCA (Cuarta Causa de Acción).
  80. ^ Claburn, Thomas (16 de marzo de 2007). "Mujer de Colorado demanda para mantener a los rastreadores web en contratos". Nueva York, NY, EE. UU .: Semana de la información, UBM Tech, UBM LLC. Archivado del original el 4 de septiembre de 2014. Recuperado 25 de marzo, 2015. Las computadoras pueden celebrar contratos en nombre de las personas. La Ley Uniforme de Transacciones Electrónicas (UETA) dice que un 'contrato puede formarse mediante la interacción de agentes electrónicos de las partes, incluso si ningún individuo conocía o revisaba las acciones de los agentes electrónicos o los términos y acuerdos resultantes'.
  81. ^ Samson, Martin H., Phillips Nizer LLP (2007). "Archivo de Internet contra Suzanne Shell". internetlibrary.com. Biblioteca de Internet de leyes y decisiones judiciales. Archivado del original el 3 de agosto de 2014. Recuperado 25 de marzo, 2015. Más importante aún, sostuvo el tribunal, la mera copia de Internet Archive del sitio de Shell, y su exhibición en su base de datos, no constituía el ejercicio requerido de dominio y control sobre la propiedad del acusado. Es importante destacar que, señaló el tribunal, el acusado en todo momento poseía y operaba su propio sitio. Dijo el Tribunal: 'Shell no ha alegado hechos que demuestren que Internet Archive ejerció dominio o control sobre su sitio web, ya que la denuncia de Shell afirma explícitamente que ella continuó siendo propietaria y operando el sitio web mientras estaba archivado en la máquina Wayback. Shell no identifica ninguna autoridad que respalde la noción de que copiar documentos es por sí mismo una privación de uso suficiente para respaldar la conversión. Por el contrario, numerosos circuitos han determinado que no lo es '.
  82. ^ brewster (25 de abril de 2007). "Internet Archive y Suzanne Shell llegan a un acuerdo". archive.org. Denver, CO, EE.UU .: Internet Archive. Archivado del original el 5 de diciembre de 2010. Recuperado 25 de marzo, 2015. Ambas partes lamentan sinceramente cualquier confusión que la demanda pueda haber causado a la otra. Ni Internet Archive ni la Sra. Shell tolera ninguna conducta que pueda haber causado daño a cualquiera de las partes como resultado de la atención pública a esta demanda. Las partes no se han involucrado en tal conducta y solicitan que la respuesta pública a la resolución amistosa de este litigio sea consistente con sus deseos de que no se cause más daño o confusión a ninguna de las partes.
  83. ^ Stobbe, Richard (5 de diciembre de 2014). "¿Implicaciones de derechos de autor de un" derecho al olvido "?. Mondaq. Recuperado 8 de marzo, 2019.
  84. ^ McVeigh, Glennys (16 de octubre de 2014). Philpott, James; Weissman, Adam; Bucholz, Ren; Hervidores, Brent; Pearl, Aaron (eds.). "Davydiuk v. Internet Archive Canada, 2014 FC 944". CanLII. Federación de Sociedades de Abogados de Canadá. Recuperado 8 de marzo, 2019.
  85. ^ Southcott, Richard F. (30 de noviembre de 2016). Philpott, John; Alton, Alex; Bucholz, Ren (eds.). "Davydiuk v. Internet Archive Canada e Internet Archive, 2016 FC 1313 (CanLII)". CanLII. Ottawa, Ontario: Federación de Sociedades de Abogados de Canadá. Recuperado 8 de marzo, 2019.
  86. ^ Conger, Kate. "Hacer una copia de seguridad de la historia de Internet en Canadá para salvarla de Trump". TechCrunch. Archivado del original el 27 de diciembre de 2016. Recuperado 14 de mayo, 2017.
  87. ^ "Dónde encontrar lo que ha desaparecido en línea y mucho más: Internet Archive". Public Radio International. Archivado del original el 28 de marzo de 2017. Recuperado 14 de mayo, 2017.
  88. ^ Chirgwin, Richard. "No hay vuelta atrás en Rusia: Putin bloquea Archive.org". Archivado del original el 7 de octubre de 2016. Recuperado 14 de mayo, 2017.
  89. ^ "Rusia no retrocederá, bloquea el Archivo de Internet". Tendencias digitales. 26 de junio de 2015. Archivado del original el 17 de abril de 2016. Recuperado 14 de mayo, 2017.
  90. ^ "В России разблокирован крупнейший интернет-архив". Российская газета (en ruso). Recuperado 18 de octubre 2020.
  91. ^ "Ayúdenos a mantener el archivo gratuito, accesible y privado para el lector | Blogs de Internet Archive". 29 de noviembre de 2016. Archivado del original el 21 de mayo de 2017. Recuperado 14 de mayo, 2017.
  92. ^ https://www.engadget.com/2013-11-07-wayback-machine-internet-archive-fire.html
  93. ^ "Archivo de Internet: los cambios propuestos a la DMCA nos harían" censurar la Web"". Consumista. 7 de junio de 2016. Archivado del original el 11 de noviembre de 2016. Recuperado 14 de mayo, 2017.
  94. ^ Hierba, Ulrich. "Die Trump-Angst grassiert" (en alemán). heise en línea. Archivado del original el 7 de diciembre de 2016. Recuperado 14 de mayo, 2017.
  95. ^ LaFrance, Adrienne. "La Edad Media de Internet". El Atlántico. Archivado del original el 7 de mayo de 2017. Recuperado 14 de mayo, 2017.
  96. ^ "Toda la Internet se archivará en Canadá para protegerla de Trump". Tarjeta madre. 29 de noviembre de 2016. Archivado del original el 16 de mayo de 2017. Recuperado 14 de mayo, 2017.
  97. ^ LaFrance, Adrienne (3 de junio de 2016). "El miedo humano al conocimiento total". El Atlántico. Archivado del original el 2 de diciembre de 2016. Recuperado 14 de mayo, 2017.

enlaces externos

Pin
Send
Share
Send