Principală  —  Investigatii  —  Ghiduri de investigații   —   GHID/ Sfaturi pentru utilizarea serviciului…

GHID Sfaturi pentru utilizarea serviciului Wayback Machine al Arhivei de Internet în următoarea dvs. investigație

Ilustrație: Ziarul de Gardă

Acest capitol a fost scris de Mark Graham pentru Global Investigative Journalism Network.

Internet Archive (Arhiva de Internet) și Wayback Machine sunt instrumente de neprețuit pentru jurnaliștii de investigație. 

Internet Archive este o bibliotecă non-profit, care anul curent va sărbători 25 de ani în care asigură „accesul universal la toate informațiile”. Ea a devenit faimoasă mai ales pentru serviciul său Wayback Machine. Serviciul deține arhiva aproape a întregului internet disponibil public la o rată de peste 1 miliard de adrese URL arhivate pe zi. 

Jurnaliștii, cadrele universitare, editorialiștii, activiștii și toți cei care doresc să folosească Wayback Machine o pot face gratuit în fiecare zi. Câteva mii de articole au fost scrise despre noi sau cu referire la serviciile noastre. Chiar și în postarea finală a GIJN din 2020 Instrumentele mele preferate, mai mulți jurnaliști de investigație de top au citat serviciul ca fiind un ajutor valoros. 

Mai jos este o prezentare generală a acestui serviciu pentru acei jurnaliști care doresc să încerce Wayback Machine în următoarea lor investigație. 

Arhivarea adreselor URL

Dacă publicați un articol care face referire la un site web, dar proprietarii site-ului au șters pagina principală sau chiar întregul site, atunci datele ar fi pierdute pentru totdeauna dacă nimeni nu le-ar arhiva. Nu lăsați să vi se întâmple asta! 

Zeci de milioane de adrese URL sunt salvate zilnic de utilizatori folosind serviciul „Save Page Now” (salvați pagina acum) a serviciului Wayback Machine. Oricine poate introduce adresa URL și dacă sunteți conectat la un cont de arhivă gratuit, puteți solicita și arhivarea „outlink-urilor” – linkuri externe din pagina originală pe care o salvați. Un raport relevant privind procesul de salvare va fi trimis la adresa dvs. O altă opțiune utilă a Wayback Machine este că acum puteți descărca adresele URL salvate în format WACZ și le puteți revizui/procesa folosind instrumentele dvs. proprii.

Ilustrație: Ziarul de Gardă

Opțiunea „Save Page Now” vă permite să arhivați automat o cantitate mare de informații de pe Twitter. De exemplu, puteți arhiva cu ușurință până la 3200 de tweet-uri recente din orice profil. Pentru a face acest lucru, copiați și  introduceți adresa URL, apoi selectați opțiunea corespunzătoare. 

Iată câteva detalii tehnice: dacă aveți o listă de adrese URL pe care doriți să le arhivați, adăugați-le în coloana „A” din foaia de calcul Google (Google Sheet) și trimiteți-o prin intermediul serviciului „Save Page Now” a foii de calcul Google. Apoi, trebuie să o specificați în serviciul de salvare a paginii aici. Coloanele B, C și D vor afișa apoi un cod de stare, adresa URL a arhivei și un indicator cu privire la salvarea  anterioară a paginii în Wayback Machine. 

O altă opțiune este să trimiteți prin email o singură adresă URL, separat, la adresa „[email protected]”. Dacă adăugați cuvintele „capture outlinks” la linia de subiect, toate linkurile de ieșire din pagină vor fi salvate. Raportul va fi trimis și prin email la finalizarea procesului. 

În cele din urmă, pentru utilizatorii mai avansați din punct de vedere tehnic, Wayback Machine oferă o Interfață de Programare a Aplicațiilor – API, care vă permite să integrați serviciul în fluxurile de lucru existente ori să automatizați crearea de noi aplicații. Un exemplu în acest sens este Meedan, o organizație non-profit din San Francisco care produce software pentru a oferi suport jurnalismului la scară globală. Ei și-au integrat serviciul lor „Check” cu Wayback Machine. 

Comparați modificările din diferite versiuni arhivate 

Ilustrație: Ziarul de Gardă

Ați avut vreodată nevoie să căutați și să afișați diferența dintre două versiuni ale aceleiași pagini web – poate pentru a vedea cum o companie sau o persoană și-a schimbat site-ul sau a modificat formularea de pe pagina lor? Acest lucru poate fi făcut cu ușurință folosind opțiunea „Changes” (modificări). 

Pentru a face acest lucru, introduceți orice adresă URL salvată în caseta de căutare de pe pagina de pornire Wayback Machine. Apoi selectați opțiunea „Changes”. 

Veți vedea o listă de versiuni salvate cu date și ore diferite, evidențiate în culori în funcție de gradul de semnificație al modificărilor. 

Apoi selectați oricare două versiuni ale paginii din marcaje de timp diferite. Acestea vor fi prezentate una lângă alta, iar diferențele dintre texte vor fi evidențiate cu  albastru și galben. Cu ajutorul acestei opțiuni a fost posibil să fie identificat modul în care un blogger britanic și consilier politic a încercat să rescrie istoria (a se vedea captura de ecran de mai jos).

Opțiunea de evaluare a modificării de la Wayback Machine a dezvăluit că Dominic Cummings, fost consilier șef al prim-ministrului Britanic, a încercat să adauge discret text (cu albastru, în dreapta) la postarea sa originală de pe blog (în stânga). Imagine: captură de ecran 

Căutare profundă în arhivă 

Ilustrație: Ziarul de Gardă

Selectați opțiunea „URL-uri” pentru a găsi subadresele oricărei pagini web salvate,  folosind cuvinte cheie și/sau tipuri MIME (extensii) de fișiere, de exemplu, txt pentru texte, png, jpg – pentru imagini. Serviciul vă permite să filtrați/sortați cu ușurință rezultatele, ceea ce facilitează găsirea arhivelor de interes. 

Unele fișiere și colecții de site-uri web au fost indexate de inginerii noștri, astfel încât interfața de căutare full-text este acum disponibilă în Wayback Machine.  Găsiți secțiunea „Collection Search” (căutare colecție) din partea de jos a paginii de pornire Wayback Machine. Această opțiune vă ajută să accesați resurse care nu sunt accesibile, cum ar fi poetry.com, site-uri media rusești independente și o colecție de 749 de milioane de fișiere PDF. De asemenea, puteți vedea opțiunile disponibile pentru lucrul cu anumite colecții pe pagina de start Internet Archive. Dacă doriți să indexați colecții specifice de materiale arhivate (de exemplu, în funcție de modelele diferite ale URL), vă rugăm să ne contactați la [email protected]

Utilizarea API-urilor (interfețelor de programare a aplicațiilor) cu Wayback Machine 

Adițional la API-urile de arhivare „Save Page Now”, există și alte API-uri care pot fi utilizate în scopul trimiterii unei solicitări către Wayback Machine pentru a verifica dacă au fost salvate anumite adrese URL. Puteți citi mai multe despre aceasta aici

La fel ca majoritatea serviciilor sale, Wayback nu pune limite formale frecvenței utilizării API-urilor sale. Dar, uneori, accesul este restricționat. Dacă întâmpinați probleme legate de utilizarea Wayback Machine, trimiteți-ne un e-mail sau trimiteți-ne un mesaj privat pe Twitter. Suportul jurnaliștilor este prioritatea noastră. 

Adăugarea contextului la paginile arhivate 

Noi realizăm că proveniența și contextul informațiilor sunt aspecte extrem de importante pentru lucrul cu orice arhivă. În acest sens, am început să adăugăm bannere contextuale pentru a ajuta utilizatorii să înțeleagă mai bine resursele noastre arhivate. Aceste bannere pot fi utilizate atunci când o pagină web arhivată este ștearsă sau când o organizație bine cunoscută a menționat despre această pagină.

Wayback Machine folosește anteturi galbene cu un link către utilizarea externă a paginilor de arhivă și adaugă fila „About this capture” (despre această captură), care oferă informații despre istoricul acestei pagini. Imagine: captură de ecran 

Uneori, este imposibil să înțelegeți conținutul unei pagini fără a înțelege originea fiecărei adrese URL arhivate din aceasta. De exemplu, au fost oare unele dintre imaginile de pe pagina de arhivă  înregistrate în același timp cu alte elemente de pe pagină? Aceste informații pot fi văzute făcând clic pe linkul „About this capture” din colțul din dreapta sus al fiecărei pagini de arhivă. 

Noi acordăm o atenție deosebită integrității arhivelor noastre și transparenței originii tuturor materialelor acumulate de-a lungul anilor. Datorită acestui fapt, utilizatorii au încredere în noi, iar dovezile stocate în Wayback Machine sunt acceptate ca admisibile de o mare varietate de instanțe din întreaga lume. Dacă doriți să luăm în considerare adăugarea contextului la arhivele pe care le-ați creat dvs. cu funcția „Save Page Now”, vă rugăm să ne contactați. 

Extensii de browser 

După cum v-ați putea aștepta, avem extensii pentru browserele Safari, Firefox și Chrome, precum și aplicații mobile pentru iOS și Android. Dorim în special să menționăm că datorită parteneriatului nostru cu motorul de căutare Brave, am creat detectarea 404 nativă și alte detectări de erori direct în browserul Brave, pentru a facilita utilizarea Wayback Machine atunci când vizitați diferite site-uri. 

Dar cel mai important, vă rugăm să notați că echipa de asistență a Internet Archive și Wayback Machine este întotdeauna disponibilă prin email sau mesaj privat pe Twitter. Trimiteți-ne întrebări, rapoarte de erori și investigații de succes. Dorim în special să aflăm ce nu v-a plăcut la serviciul nostru, ce caracteristici credeți că trebuie să remediem ori să adăugăm. În acest fel, putem răspunde mai bine nevoilor jurnaliștilor. 

Dar așteaptă! Asta nu e tot… 

Adițional la arhivarea majorității paginilor de pe web-ul public, Internet Archive păstrează și afișează alte colecții de materiale, inclusiv peste 25 de milioane de lucrări academice din domeniul public, pe site-ul Internet Archive Scholar; aproape 30 de milioane de cărți electronice și texte care pot fi vizualizate sau descărcate; milioane de ore de știri TV de arhivă (zeci de canale de aproape 10 ani) sunt disponibile pentru căutarea textului integral după subtitrări indexate. 

Pentru a fi la curent cu proiectele și serviciile Internet Archive și Wayback Machine, vă rugăm să ne urmăriți pe Twitter @internetarchive și @waybackmachine și să citiți postările noastre de pe blog

Mark Graham este responsabil de Wayback Machine de mai bine de cinci ani. Înainte de aceasta, a fost vicepreședinte la NBC News Digital. Graham a ajutat, de asemenea, la procesul de lansare a primului serviciu de email între SUA și Uniunea Sovietică, a proiectat prima interfață web pentru un forum online și a ajutat să fie lansat iVillage, unul dintre primele servicii online pentru femei.