Niciodată în istoria omenirii nu au existat atât de multe informații despre Explorând Wayback Machine în 2023: un ghid cuprinzător așa cum există astăzi datorită internetului. Cu toate acestea, acest acces la tot ce are legătură cu Explorând Wayback Machine în 2023: un ghid cuprinzător nu este întotdeauna ușor. Saturație, utilizare slabă și dificultatea de a discerne între informațiile corecte și incorecte despre Explorând Wayback Machine în 2023: un ghid cuprinzător sunt adesea greu de depășit. Acesta este ceea ce ne-a motivat să creăm un site de încredere, sigur și eficient.
Ne-a fost clar că pentru a ne atinge scopul, nu era suficient să avem informații corecte și verificate despre Explorând Wayback Machine în 2023: un ghid cuprinzător . Despre tot ce adunasem Explorând Wayback Machine în 2023: un ghid cuprinzător de asemenea trebuia prezentat într-un mod clar, lizibil, într-o structură care să faciliteze experiența utilizatorului, cu un design curat și eficient, și care să prioritizeze viteza de încărcare. Suntem încrezători că am reușit acest lucru, deși lucrăm mereu pentru a aduce mici îmbunătățiri. Dacă ați găsit ceea ce ați găsit util Explorând Wayback Machine în 2023: un ghid cuprinzător și v-ați simțit confortabil, vom fi foarte fericiți dacă veți reveni scientiaen.com oricând vrei și ai nevoie.
![]() | |
Tipul de site | arhivă |
---|---|
Fondat |
|
Zona deservita | La nivel mondial (cu excepția Chinei și Bahrain) |
Proprietar | Internet Archive |
URL-ul | web |
Comercial | Nu |
Înregistrare | Opțional |
Statusul curent | Activ |
Scris in | HTML, CSS, JavaScript, Java, Piton. |
Wayback Masini este un digital Arhiva a World Wide Web fondat de către Internet Archive, o organizație nonprofit cu sediul în San Francisco, California. Creat în 1996 și lansat publicului în 2001, acesta permite utilizatorului să meargă „înapoi în timp” și să vadă cum arătau site-urile web în trecut. Fondatorii săi, Brewster-Kahle și Bruce Gilliat, a dezvoltat Wayback Machine pentru a oferi „acces universal la toate cunoștințele” prin păstrarea copiilor arhivate ale paginilor web defuncte.
Lansată pe 10 mai 1996, Wayback Machine a salvat peste 38.2 milioane de pagini web la sfârșitul anului 2009. Începând cu 13 martie 2023, Wayback Machine a arhivat peste 800 de miliarde de pagini web.
Wayback Machine a început să arhiveze în cache pagini web în 1996. Una dintre cele mai vechi pagini cunoscute a fost arhivată la 10 mai 1996, la (UTC).
Internet Archive fondatorii Brewster-Kahle și Bruce Gilliat a lansat Wayback Machine în San Francisco, California, în octombrie 2001, în primul rând pentru a aborda problema dispariției conținutului web ori de câte ori este schimbat sau când un site web este închis. Serviciul permite utilizatorilor să vadă versiunile arhivate ale pagini web de-a lungul timpului, pe care arhiva îl numește „index tridimensional”. Kahle și Gilliat au creat mașina sperând să arhiveze întregul Internet și să ofere „acces universal la toate cunoștințele”. Numele „Wayback Machine” este o referire la un dispozitiv fictiv de călătorie în timp și de traducere, „Wayback Masini", folosit de personaje Domnule Peabody și Sherman în desenul animat Aventurile lui Rocky și Bullwinkle and Friends. Într-unul dintre segmentele desenului animat, „Istoria improbabilă a lui Peabody”, personajele au folosit mașina pentru a fi martori, pentru a participa la evenimente celebre din istorie și, deseori, pentru a modifica.
Din 1996 până în 2001, informațiile au fost păstrate pe bandă digitală, Kahle permițând ocazional cercetătorilor și oamenilor de știință să exploateze „nebunul” Baza de date. Când arhiva a ajuns la a cincea aniversare în 2001, a fost dezvăluită și deschisă publicului în cadrul unei ceremonii la University of California, Berkeley. Până la lansarea Wayback Machine, acesta conținea deja peste 10 miliarde de pagini arhivate. Datele sunt stocate în grupul mare de Internet Archive Linux noduri. Revizuiește și arhivează ocazional versiuni noi de site-uri web (a se vedea detaliile tehnice de mai jos). Site-urile pot fi, de asemenea, capturate manual prin introducerea unui site web URL-ul în caseta de căutare, cu condiția ca site-ul web să permită Wayback Machine să-l „crawleze” și să salveze datele.
Pe 30 octombrie 2020, Wayback Machine a început să verifice conținutul. Din ianuarie 2022, domeniile de servere publicitare sunt dezactivate de la capturare.
În mai 2021, pentru cea de-a 25-a aniversare a Internet Archive, Wayback Machine a introdus „Wayforward Machine”, care permite utilizatorilor „să călătorească pe Internet în 2046, unde cunoștințele sunt sub incidență”. asediu".
Software-ul Wayback Machine a fost dezvoltat pentru a „târî" pe Web și descărcați toate informațiile și fișierele de date accesibile public de pe paginile web, popândău ierarhie, cel Netnews sistem de bord (Usenet) și software descărcabil. Informațiile colectate de acești „crawler-uri” nu includ toate informațiile disponibile pe internet, deoarece multe dintre date sunt restricționate de editor sau stocate în baze de date care nu sunt accesibile. Pentru a depăși inconsecvențele din site-urile web parțial stocate în cache, Archive-It.org a fost dezvoltat în 2005 de Internet Archive ca un mijloc de a permite instituțiilor și creatorilor de conținut să colecteze și să păstreze în mod voluntar colecții de conținut digital și să creeze arhive digitale.
Crawl-urile sunt contribuite din diverse surse, unele importate de la terți, iar altele generate intern de Arhivă. De exemplu, crawlurile sunt contribuite de Fundația Sloan și Alexa, accesări cu crawlere efectuate de Internet Archive în numele NARA si Internet Memory Foundation, oglinzi ale Crawl comun. „Worldwide Web Crawls” rulează din 2010 și captează web-ul global.
Documentele și resursele sunt stocate cu adrese URL de marcare temporală, cum ar fi 20230528135735
. Resursele individuale ale paginilor, cum ar fi imaginile și foile de stil și scripturile, precum și hyperlinkurile de ieșire, sunt legate cu marca temporală a paginii vizualizate în prezent, astfel încât acestea sunt redirecționate automat către capturile lor individuale care sunt cele mai apropiate în timp.
Frecvența captărilor de instantanee variază în funcție de site. Site-urile din „Worldwide Web Crawls” sunt incluse într-o „listă de accesare cu crawlere”, site-ul arhivat o dată pe accesare cu crawlere. Un crawl poate dura luni sau chiar ani pentru a se finaliza, în funcție de dimensiune. De exemplu, „Wide Crawl Number 13” a început pe 9 ianuarie 2015 și s-a finalizat pe 11 iulie 2016. Cu toate acestea, pot exista mai multe accesări cu crawlere în desfășurare la un moment dat și un site poate fi inclus în mai multe liste de accesare cu crawlere, așa că frecvența cu care este accesat cu crawlere un site variază foarte mult.
Începând cu octombrie 2019, utilizatorii sunt limitat la 15 cereri de arhivare și extrageri pe minut.[Ce?]
Pe măsură ce tehnologia sa dezvoltat de-a lungul anilor, capacitatea de stocare a Wayback Machine a crescut. În 2003, după doar doi ani de acces public, Wayback Machine creștea cu o rată de 12 terabytes pe lună. Datele sunt stocate pe PetaBox sisteme rack concepute personalizat de personalul Internet Archive. Primul rack de 100 TB a devenit complet operațional în iunie 2004, deși în curând a devenit clar că ar avea nevoie de mult mai mult spațiu de stocare decât atât.
Arhiva Internet și-a migrat arhitectura de stocare personalizată la Sun Open Storage în 2009 și găzduiește un nou centru de date în a Centrul de date modular Sun on Sun MicrosystemsCampusul din California. Ca de 2009, Wayback Machine conținea aproximativ trei petabytes de date și creștea cu o rată de 100 terabytes în fiecare lună.
O versiune nouă, îmbunătățită a Wayback Machine, cu o interfață actualizată și un index mai proaspăt al conținutului arhivat, a fost pusă la dispoziție pentru testare publică în 2011, unde capturile apar într-un aspect calendaristic cu cercuri a căror lățime vizualizează numărul de accesări cu crawlere în fiecare zi, dar fără marcarea duplicatelor cu asteriscuri sau a unei pagini de căutare avansată. Un top bara de instrumente a fost adăugat pentru a facilita navigarea între capturi. O diagramă cu bare vizualizează frecvența captărilor pe lună de-a lungul anilor. Funcții precum „Modificări”, „Rezumat” și o hartă grafică a site-ului au fost adăugate ulterior.
În luna martie a acelui an, pe forumul Wayback Machine sa spus că „Beta a noii Wayback Machine are un index mai complet și mai actualizat al tuturor materialelor accesate cu crawlere în 2010 și va continua să fie actualizat în mod regulat. Indexul Conducerea clasicei Wayback Machine are doar un pic de material după 2008 și nu sunt planificate alte actualizări ale indexului, deoarece va fi eliminat treptat în acest an.” Tot în 2011, Internet Archive a instalat a șasea pereche de rack-uri PetaBox, ceea ce a crescut capacitatea de stocare a Wayback Machine cu 700 de terabytes.
În ianuarie 2013, compania a anunțat o etapă revoluționară de 240 de miliarde de adrese URL.
În octombrie 2013, compania a introdus funcția „Salvați o pagină”. care permite oricărui utilizator de Internet să arhiveze conținutul unei adrese URL și generează rapid un legătură permanentă spre deosebire de precedentul liveweb caracteristică.
În decembrie 2014, Wayback Machine conținea 435 miliard pagini web — aproape nouă petabytes de date și creștea cu aproximativ 20 de terabytes pe săptămână.
În martie 2015, a fost publicat că cercetătorii în domeniul securității au luat cunoștință de amenințarea reprezentată de operațiunile neintenționate ale serviciului găzduirea de fișiere binare rău intenționate de pe site-uri arhivate.
În iulie 2016, Wayback Machine conținea aproximativ 15 petaocteți de date.
În septembrie 2018, Wayback Machine conținea peste 25 de petaocteți de date.
În decembrie 2020, Wayback Machine conținea peste 70 de petaocteți de date.
Serviciul Wayback Machine oferă trei API-uri publice, SavePageNow, Availability și CDX. SavePageNow poate fi folosit pentru a arhiva pagini web. API-ul de disponibilitate pentru verificarea stării de disponibilitate a arhivei pentru o pagină web, verificând dacă există sau nu o arhivă pentru pagina web. CDX API este pentru interogări complexe, filtrare și analiză a datelor capturate.
Din punct de vedere istoric, Wayback Machine a respectat standard de excludere a roboților (robots.txt) pentru a determina dacă un site web va fi accesat cu crawlere sau dacă arhivele sale ar putea fi vizualizate public. Proprietarii de site-uri web au avut opțiunea de a renunța la Wayback Machine prin utilizarea robots.txt. A aplicat regulile robots.txt retroactiv; dacă un site bloca Arhiva Internet, orice pagini arhivate anterior din domeniu erau imediat indisponibile. În plus, Arhiva Internet a precizat că „Uneori, proprietarul unui site web ne va contacta direct și ne va cere să încetăm accesarea cu crawlere sau arhivarea unui site. Ne conformăm acestor solicitări”. În plus, site-ul web spune: „Arhiva Internet nu este interesată să păstreze sau să ofere acces la site-uri web sau alte documente de internet ale persoanelor care nu doresc materialele lor în colecție”.
Pe 17 aprilie 2017, au apărut rapoarte despre site-uri care au dispărut și au devenit domenii parcate care foloseau robots.txt pentru a se exclude din motoarele de căutare, ceea ce a dus la excluderea lor din neatenție din Wayback Machine. Arhiva Internet a schimbat politica pentru a solicita acum o solicitare explicită de excludere pentru a o elimina din Wayback Machine.
Politica de excludere retroactivă a Wayback se bazează parțial pe Recomandări pentru gestionarea solicitărilor de eliminare și păstrarea integrității arhivistice publicat de Școala de Management și Sisteme Informaționale la University of California, Berkeley în 2002, care dă proprietarului unui site web dreptul de a bloca accesul la arhivele site-ului. Wayback a respectat această politică pentru a evita litigiile costisitoare.
Politica de excludere retroactivă Wayback a început să se relaxeze în 2017, când a încetat să onoreze roboții de pe site-urile web guvernamentale și militare ale SUA, atât pentru accesarea cu crawlere, cât și pentru afișarea paginilor web. Din aprilie 2017, Wayback ignoră robots.txt într-un mod mai larg, nu doar pentru site-urile web ale guvernului SUA.
De la lansarea sa publică în 2001, Wayback Machine a fost studiată de cercetători atât pentru modurile în care stochează și colectează date, cât și pentru paginile reale conținute în arhiva sa. Începând cu 2013, oamenii de știință au scris aproximativ 350 de articole despre Wayback Machine, majoritatea din domeniile tehnologiei informației, bibliotecologiei și științelor sociale. Specialiștii în științe sociale au folosit Wayback Machine pentru a analiza modul în care dezvoltarea site-urilor web de la mijlocul anilor 1990 până în prezent a afectat creșterea companiei.
Când Wayback Machine arhivează o pagină, de obicei include majoritatea hyperlink-urilor, menținând acele link-uri active atunci când la fel de ușor ar fi putut fi rupte de instabilitatea Internetului. Cercetătorii din India au studiat eficiența capacității Wayback Machine de a salva hyperlinkuri în publicațiile academice online și au descoperit că a salvat puțin mai mult de jumătate dintre ele.
„Jurnaliştii folosesc Wayback Machine pentru a vedea site-uri web moarte, rapoarte de ştiri datate şi modificări ale conţinutului site-ului web. Conţinutul său a fost folosit pentru a trage politicienii la răspundere şi pentru a dezvălui minciunile câmpului de luptă”. În 2014, o pagină de socializare arhivată a Igor Girkin, un lider separatist rebel din Ucraina, i-a arătat lăudându-se că trupele sale au doborât un presupus avion militar ucrainean înainte să se știe că avionul era de fapt un avion civil Malaysian Airlines (Zborul 17 al Malaysia Airlines), după care a șters postarea și a dat vina pe armata Ucrainei pentru că a doborât avionul. În 2017, Martie pentru știință provenit dintr-o discuţie pe Reddit asta a indicat că cineva a vizitat Archive.org și a descoperit că toate referințele la schimbarea climei fusese ștearsă de pe site-ul Casei Albe. Ca răspuns, un utilizator a comentat: „Trebuie să existe un marș al oamenilor de știință pe Washington”.
În plus, site-ul este utilizat intens pentru verificare, oferind acces la referințe și crearea de conținut de către Editori Wikipedia.
În septembrie 2020, a fost anunțat un parteneriat cu Cloudflare să arhiveze automat site-urile web deservite prin serviciul său „Întotdeauna online”, care îi va permite, de asemenea, să direcționeze utilizatorii către copia sa a site-ului dacă nu poate ajunge la gazda originală.
În 2014, a existat un interval de șase luni între momentul în care un site web a fost accesat cu crawlere și când a devenit disponibil pentru vizualizare în Wayback Machine. În prezent, timpul de întârziere este de 3 până la 10 ore. Wayback Machine oferă doar facilități limitate de căutare. Caracteristica sa „Căutare pe site” permite utilizatorilor să găsească un site pe baza cuvintelor care descriu site-ul, mai degrabă decât a cuvintelor găsite în paginile web în sine.
Wayback Machine nu include fiecare pagină web creată vreodată din cauza limitărilor crawler-ului său web. Wayback Machine nu poate arhiva complet pagini web care conțin funcții interactive, cum ar fi platforme Flash și formulare scrise în JavaScript și aplicații web progresive, deoarece aceste funcții necesită interacțiune cu site-ul web gazdă. Aceasta înseamnă că, începând cu aproximativ 9 iulie 2013, Wayback Machine nu a putut afișa comentarii YouTube atunci când salvează paginile de vizionare ale videoclipurilor, deoarece, potrivit echipei de arhive, comentariile nu mai sunt „încărcate în pagina însăși”. Crawler-ul web al Wayback Machine are dificultăți în extragerea a ceva care nu este codificat în HTML sau în una dintre variantele sale, ceea ce poate duce adesea la hiperlinkuri rupte și imagini lipsă. Din acest motiv, crawler-ul web nu poate arhiva „pagini orfane” care nu sunt legate de alte pagini. Crawler-ul Wayback Machine urmărește doar un număr predeterminat de hyperlinkuri, bazat pe o limită de adâncime prestabilită, astfel încât nu poate arhiva fiecare hyperlink de pe fiecare pagină.
Într-un caz din 2009, Netbula, LLC împotriva Chordiant Software Inc., inculpatul Chordiant a depus o moțiune pentru a obliga Netbula să dezactiveze robots.txt fișier de pe site-ul său web care determina Wayback Machine să elimine retroactiv accesul la versiunile anterioare ale paginilor pe care le arhivase de pe site-ul Netbula, pagini despre care Chordiant credea că le-ar susține cazul.
Netbula s-a opus moțiunii pe motiv că inculpații cereau modificarea site-ului Netbula și că ar fi trebuit să citeze direct Internet Archive pentru pagini. Totuși, un angajat al Internet Archive a depus o declarație sub jurământ susținând moțiunea lui Chordiant, în care afirmă că nu poate produce paginile web prin alte mijloace „fără o povară considerabilă, cheltuieli și întreruperi ale operațiunilor sale”.
Judecătorul judecător Howard Lloyd din Districtul de Nord al Californiei, Divizia San Jose, a respins argumentele Netbula și le-a ordonat să dezactiveze temporar blocarea robots.txt pentru a permite Choordiant să recupereze paginile arhivate pe care le căutau.
Într-un caz din octombrie 2004, Telewizja Polska USA, Inc. v. Satelitul Echostar, Nr. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (ND Ill. 15 octombrie 2004), un justițiabil a încercat să folosească arhivele Wayback Machine ca sursă de probe admisibile, poate pentru prima dată. Telewizja Polska este furnizorul de DVT Polonia și EchoStar operează DISH Network. Înainte de procedurile de judecată, EchoStar a indicat că intenționează să ofere instantanee Wayback Machine ca dovadă a conținutului trecut al site-ului Telewizja Polska. Telewizja Polska a prezentat o moțiune în limine pentru a suprima instantaneele pe motiv de din auzite și sursă neautentificată, dar judecătorul Arlander Keys a respins afirmația Telewizja Polska de auzite și a respins moțiunea TVP în limine pentru a exclude probele din proces. La proces, însă, judecătorul de la Curtea Districtuală Ronald Guzman, judecătorul de fond, a respins concluziile magistratului Keys și a considerat că nici declarația pe propria răspundere a angajatului Internet Archive, nici paginile subiacente (adică, site-ul Telewizja Polska) nu erau admisibile ca probă. Judecătorul Guzman a motivat că declarația pe propria răspundere a angajatului conținea atât auzite, cât și declarații în susținere neconcludente, iar pretinsa pagină web, imprimările nu se auto-autentificau.
Oficiul de brevete al Statelor Unite si Oficiul European de Brevete va accepta ștampile cu data din Arhiva Internet ca dovadă a momentului în care o anumită pagină Web a fost accesibilă publicului. Aceste date sunt folosite pentru a determina dacă o pagină Web este disponibilă ca arta prioritara de exemplu la examinarea unei cereri de brevet.
Există limitări tehnice pentru arhivarea unui site web și, în consecință, părțile adverse aflate în litigiu pot folosi greșit rezultatele furnizate de arhivele site-ului web. Această problemă poate fi exacerbată de practica de a trimite capturi de ecran ale paginilor web în plângeri, răspunsuri sau rapoarte ale experților atunci când linkurile subiacente nu sunt expuse și, prin urmare, pot conține erori. De exemplu, arhivele precum Wayback Machine nu completează formulare și, prin urmare, nu includ conținutul non-Odihnitor bazele de date de comerț electronic în arhivele lor.
În Europa, Wayback Machine ar putea fi interpretată ca încalcă drepturi de autor legi. Doar creatorul de conținut poate decide unde este publicat sau duplicat conținutul său, astfel încât Arhiva ar trebui să șteargă pagini din sistemul său la cererea creatorului. Politicile de excludere pentru Wayback Machine pot fi găsite în secțiunea Întrebări frecvente a site-ului.
Unele cazuri au fost aduse împotriva Arhivei Internet în special pentru eforturile sale de arhivare Wayback Machine.
La sfârșitul anului 2002, Arhiva Internet a eliminat diverse site-uri care erau critice Scientologia de la Wayback Machine. Un mesaj de eroare spunea că aceasta a fost ca răspuns la o „solicitare a proprietarului site-ului”. Ulterior, s-a clarificat că avocații din Biserica Scientologică ceruse îndepărtarea și că proprietarii site-ului nu doreau să le fie îndepărtat materialul.
În 2003, Harding Earley Follmer & Frailey au apărat un client dintr-o dispută privind mărcile comerciale folosind mașina Wayback a arhivei. Avocații au putut demonstra că pretențiile formulate de reclamantă erau nevalide, pe baza conținutului site-ului lor de mai mulți ani înainte. Reclamantul, Healthcare Advocates, și-a modificat apoi plângerea pentru a include Arhiva Internet, acuzând organizația de încălcarea drepturilor de autor, precum și de încălcarea DMCA si Legea privind fraudele și abuzurile pe calculator. Avocații din domeniul sănătății au susținut că, din moment ce au instalat un robots.txt dosar pe site-ul lor, chiar dacă după depunerea procesului inițial, Arhiva ar fi trebuit să elimine toate copiile anterioare ale site-ului reclamantului de pe Wayback Machine, cu toate acestea, unele materiale au continuat să fie vizibile public pe Wayback. Procesul a fost soluționat în afara instanței după ce Wayback a remediat problema.
Activist Suzanne Shell a intentat proces în decembrie 2005, cerând Internet Archive să-i plătească 100,000 USD pentru arhivarea site-ului ei profane-justice.org între 1999 și 2004. Internet Archive a depus a judecată declarativă acţiune în Curtea Districtuală a Statelor Unite pentru Districtul de Nord din California la 20 ianuarie 2006, cerând o decizie judecătorească că Internet Archive nu a încălcat prevederile Shell drepturi de autor. Shell a răspuns și a adus un contra costum împotriva Internet Archive pentru arhivarea site-ului ei, despre care ea pretinde că o încălcă punct de vedere al serviciului. La 13 februarie 2007, un judecător al Tribunalul Districtual al Statelor Unite pentru Districtul Colorado a respins toate cererile reconvenționale, cu excepția întrerupere de contract. Arhiva Internet nu sa mutat pentru a respinge încălcarea drepturilor de autor susține că Shell a afirmat ca decurgând din activitățile sale de copiere, care ar continua.
La 25 aprilie 2007, Internet Archive și Suzanne Shell au anunțat împreună soluționarea procesului lor. Arhiva Internet a spus că „... nu are niciun interes să includă materiale în Wayback Machine ale persoanelor care nu doresc să aibă conținutul lor web arhivat. Recunoaștem că doamna Shell are drepturi de autor valide și aplicabile pe site-ul ei web și noi regret că includerea site-ului ei web în Wayback Machine a dus la acest litigiu.” Shell a spus: „Respect valoarea istorică a obiectivului Internet Archive. Nu am intenționat niciodată să interferez cu acest obiectiv și nici să-i fac vreun rău”.
Între 2013 și 2016, a actor pornografic numit Daniel Davydiuk a încercat să elimine imaginile arhivate cu el din arhiva Wayback Machine, mai întâi trimițând mai multe solicitări DMCA la arhivă, iar apoi apelând la Curtea Federală a Canada. Imaginile au fost apoi eliminate de pe site în 2017.
În 2018, arhivele ale aplicație stalkerware FlexiSpysite-ul lui a fost eliminat din Wayback Machine. Compania a susținut că a contactat Arhiva Internet, probabil pentru a elimina arhivele site-ului său.
Archive.org este în prezent blocat în China. După ce organizația teroristă Statul Islamic a fost interzisă, Internet Archive a fost blocat în întregime în Rusia ca gazdă a unui videoclip de informare de la acea organizație, pentru o perioadă scurtă de timp în 2015-16.[are nevoie de actualizare] Din 2016, site-ul a revenit, disponibil în întregime, deși lobbyiștii comerciali locali dau în judecată Arhiva Internetului într-o instanță locală pentru a o interzice din motive de drepturi de autor.
Alison Macrina, director al Proiectul Libertatea Bibliotecii, notează că „în timp ce bibliotecarii prețuiesc profund intimitatea individuală, ne opunem ferm cenzurii”.
Există cel puțin un caz în care un articol a fost eliminat din arhivă la scurt timp după ce a fost eliminat de pe site-ul său original. A Daily Beast Reporterul a scris un articol care a scos la iveală mai mulți sportivi olimpici gay în 2016, după ce și-a făcut un profil fals, dând drept bărbat gay într-o aplicație de întâlniri. The Daily Beast a eliminat articolul după ce a fost întâmpinat cu furie larg răspândită; nu după mult timp, Arhiva de Internet a făcut curând la fel de bine, dar a declarat cu insistență că nu a făcut-o pentru niciun alt motiv decât pentru a proteja siguranța sportivilor dezvăluiți.
Alte amenințări includ dezastrele naturale, distrugere (la distanță sau fizică), manipularea conținutului arhivei (vezi și: atac cibernetic, de rezervă), legile problematice ale drepturilor de autor si supravegherea utilizatorilor site-ului.
Alexander Rose, director executiv al Fundația Long Now, bănuiește că pe termen lung a mai multor generații „lângă nimic” va supraviețui într-un mod util, afirmând: „Dacă avem continuitate în civilizația noastră tehnologică, bănuiesc că multe dintre datele goale vor rămâne găsibile și căutate. Dar eu nu bănuiți că aproape nimic din formatul în care a fost livrat nu va fi recunoscut”, deoarece site-urile „cu back-end profund de sisteme de management al conținutului precum Drupal și Ruby și Django” sunt mai greu de arhivat.
Într-un articol care reflectă asupra păstrării cunoștințelor umane, Atlantic a comentat că Arhiva Internet, care se descrie a fi construită pe termen lung, „lucrează cu furie să capteze date înainte ca acestea să dispară fără nicio infrastructură pe termen lung de care să vorbim”.
{{cite web}}
: CS1 maintenance: copie arhivată ca titlu (legătură)
Am adăugat posibilitatea de a arhiva o pagină instantaneu și de a obține înapoi o adresă URL permanentă pentru pagina respectivă în Wayback Machine. Acest serviciu permite oricui – editori wikipedia, savanți, profesioniști din domeniul juridic, studenți sau bucătari acasă ca mine – să creeze o adresă URL stabilă pentru a cita, partaja sau marca orice informații la care doresc să aibă acces în viitor.
2015-03-25: Cele mai recente adrese URL găzduite în această adresă IP au fost detectate de cel puțin un scanner de adrese URL sau un set de date de adrese URL rău intenționate. ... 2/62 2015-03-25 16:14:12 /Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 /CBLightSetup.exe
2015: O parte a acestui site a fost listată pentru activitate suspectă de 03 ori(e) în ultimele 25 de zile. ... Ce s-a întâmplat când Google a vizitat acest site? ... Din cele 138 pagini testate pe site în ultimele 90 de zile, 42410 pagini au dus la descărcarea și instalarea de software rău intenționat fără consimțământul utilizatorului. Ultima dată când Google a vizitat acest site a fost în 90-450-2015, iar ultima dată când a fost găsit conținut suspect pe acest site a fost în 03-25-2015. ... Software-ul rău intenționat include 03 troian(i), 25 virus, 169 backdoor(e).
1) Moțiunea Internet Archive de respingere a cererii reconvenționale a Shell pentru conversie și furt civil (a doua cauză de acțiune) este ACORDĂ; 2) Moțiunea Internet Archive de respingere a cererii reconvenționale a Shell pentru racket în temeiul RICO și COCCA (a patra cauză de acțiune) este ACCORDĂ.
Calculatoarele pot încheia contracte în numele oamenilor. Actul Uniform Electronic Transactions Act (UETA) spune că „un contract poate fi format prin interacțiunea agenților electronici ai părților, chiar dacă niciun individ nu cunoștea sau examina acțiunile agenților electronici sau termenii și acordurile rezultate”.
Mai important, a spus instanța, simpla copiere de către Internet Archive a site-ului Shell și afișarea acestuia în baza de date a acestuia nu a constituit exercițiul necesar de stăpânire și control asupra proprietății pârâtului. Important, a reținut instanța, pârâta a deținut și exploatat în orice moment propriul site. Curtea a spus: „Shell a omis să pretindă fapte care să arate că Internet Archive a exercitat stăpânire sau control asupra site-ului ei, deoarece plângerea Shell afirmă în mod explicit că ea a continuat să dețină și să opereze site-ul în timp ce acesta a fost arhivat pe computerul Wayback. Shell nu identifică nicio autoritate care să susțină ideea că copierea documentelor este în sine o privare suficientă de utilizare pentru a sprijini conversia. În schimb, numeroase circuite au stabilit că nu este.
Ambele părți regretă sincer orice tulburare pe care procesul le-ar fi putut provoca celeilalte. Nici Internet Archive, nici doamna Shell nu acceptă niciun comportament care ar fi putut cauza prejudicii oricăreia dintre părți, rezultat din atenția publică a acestui proces. Părțile nu s-au implicat într-un astfel de comportament și solicită ca răspunsul public la soluționarea pe cale amiabilă a acestui litigiu să fie în concordanță cu dorințele lor de a nu mai fi cauzat niciun prejudiciu sau tulburare nici uneia dintre părți.
Die Betreiber des Archives fürchten neben Zensur und Manipulation der digitalen Aufzeichnungen demnach auch die Überwachung der Archive-Nutzer. .