Veri Gazeteciliği

Bir Sonraki Araştırmanız İçin İnternet Arşivi Wayback Makinesini Kullanmanın İpiçları!

Gijn
Mark Graham

İnternet Arşivi bu yıl 25. yılını kutluyor. Arşiv mevcut kütüphanesinin tamamını erişime açtı. Günde 1 milyardan fazla arşivlenmiş URL’si bulunan, tüm bunları kullanıma açan Wayback Machine  öenmli bir araştırma kaynağı.

Gazetecilerin, araştırmacıların, teyitçilerin, aktivistlerin ve genel halkın her gün kullanımına açık ücretsiz Wayback Machine’e erişmesinin birçok yolu var. Bizim hakkımızda binlerce makale yazıldı veya hizmetlerimize atıfta bulunuldu. Aslında, GIJN’nin 2020 için En Sevdiğim Araçlar serisinde de detaylar görebilirsiniz.

Wayback Machine’i denemek isteyenlere tavsiyeler listesi:

URL’leri Arşivlemek

Bir web sitesine atıfta bulunan bir makale yayınlarsanız ve o sitenin sahipleri önemli sayfaları veya sitenin kendisini kaldırırsa, arşivlenmemişlerse sonsuza kadar kaybolabilirler. Bunun sana olmasına izin vermeyebilirsin!

Wayback Machine’in “Sayfayı Şimdi Kaydet” hizmetiyle kullanıcılar tarafından her gün on milyonlarca URL arşivleniyor. Herkes URL’leri gönderebilir ve ücretsiz bir arşiv hesabıyla oturum açtıysanız, orijinal sayfada yakalamak istediğiniz harici bağlantılar olan tüm “dışarı bağlantıları” arşivlemeyi ve bu yakalama işlemine ilişkin genel bir rapora sahip olmayı da isteyebilirsiniz. Size e-postayle yollanıyor.

İşte teknik bilgi: Arşivlemek istediğiniz URL’lerin bir listesi varsa, bunları bir Google E-Tablosunun “A sütununa” ekleyin ve burada bulabileceğiniz “Sayfayı Şimdi Kaydet” Google E-Tablolar hizmeti aracılığıyla gönderin. URL daha önce Wayback Machine tarafından arşivlenmişse, B, C ve D sütunları bir durum kodu, arşivlenmiş URL ve bir bayrak ile doldurulacaktır.

Başka bir seçenek de tek bir URL’yi “spn@archive.org” adresine e-posta göndermek ve konu satırına “yakalanan dış bağlantıları” eklerseniz bunlar da korunur. Yine, işlem tamamlandığında bir e-posta raporu alacaksınız.

Son olarak, teknik açıdan daha yetkin olanlar için Wayback Machine, mevcut yazılım iş akışlarınıza entegrasyona veya yeni uygulamalar oluştururken işinizi otomatikleştirmeye yardımcı olacak bir API veya programlama arabirimi sağlar. Bunun bir örneği, küresel gazeteciliği güçlendirmek için yazılım ve girişimler oluşturan San Francisco merkezli kâr amacı gütmeyen teknoloji şirketi Meedan’ın “Kontrol” hizmetini Wayback Machine ile nasıl entegre ettiğidir .

Farklı Arşivlenmiş Sürümlerdeki Değişiklikleri Karşılaştırın

Hiç aynı web sayfasının iki versiyonu arasındaki farkı keşfetmek ve göstermek istediniz mi? Belki de bir şirketin veya bireyin sitelerini nasıl değiştirdiğini veya sayfalarındaki ifadeleri nasıl uyarladığını görmek istersiniz? Bunu “Değişiklikler” özelliği ile yapabilirsiniz.

Bunu denemek için, Wayback Machine’in ana sayfasındaki arama işlevine arşivlenmiş herhangi bir URL’yi girin. Ardından “Değiştir” seçeneğini seçin.

Çeşitli tarih ve saatlerin arşivlenmiş sürümlerinin bir listesi size gösterilecektir; bu değişiklikler, arşivlenmiş bir URL’den diğerine değişiklik derecelerini temsil etmek için renk kodludur.

Ardından, URL’nin zaman damgalı herhangi iki sürümünü seçin ve bunlar, metin farklılıkları mavi ve sarı metinle vurgulanarak yan yana oluşturulacaktır. Bu özellik, bir İngiliz blog yazarı ve siyasi danışmanın tarihi nasıl yeniden yazmaya çalıştığını göstermek için kullanıldı ve aşağıdaki ekran görüntüsünde gösterilmektedir.

Dominic Cummings'in bir blog gönderisine nasıl gizli eklemeler (mavi) yaptığını gösteren Wayback Machine.  Resim: Ekran görüntüsü

Wayback Machine’in “Değişiklikler” özelliği, İngiltere başbakanının eski başdanışmanı Dominic Cummings’in orijinal blog gönderisine (solda) gizli eklemeler (mavi, sağda) nasıl yaptığını gösteriyor. Resim: Ekran görüntüsü

Daha Derin Arşiv Aramaları

Wayback Machine’deki arşivlenmiş URL’lerle ilgili metin dizine eklenmediğinden, hizmet henüz tam metin arama arabirimi sunamaz. Bu, kullanıcıların sayfanın arşivlerini bulmak için aradıkları URL’yi bilmeleri gerektiği anlamına gelir. Ancak Wayback Machine mühendisleri, belirli arşiv koleksiyonları için web sayfalarıyla ilgili çeşitli meta verileri indeksleme sürecinde. ( İnternet Arşivi ana sayfasındaki koleksiyonlar için sunulan hizmetler hakkında daha fazla bilgi edinin .)

API’leri Wayback Machine ile Kullanmak

“Sayfayı Şimdi Kaydet” hizmeti aracılığıyla arşivlemeyi destekleyen bir API’ye ek olarak, belirli URL’lerin arşivlenip arşivlenmediğini görmek için Wayback Makinesini sorgulamak için kullanılabilecek API’ler de vardır. Daha fazla bilgiye buradadan erişebilirsiniz .

Hizmetlerinin çoğu gibi, Wayback de API’lerinin kullanım sıklığına resmi sınırlar koymuyor. Ancak, zaman zaman kısıtlama önlemleri uygulayabilir. Wayback Machine’in kullanımıyla ilgili herhangi bir sorunla karşılaşırsanız, bize Twitter üzerinden bir e-posta veya DM gönderin gazetecileri desteklemek bizim önceliğimiz.

Arşivlenmiş Sayfalara Kaynak Eklemek

Herhangi bir arşivin daha eksiksiz bir şekilde anlaşılması için kaynağın hayati önem taşıdığının farkındayız. Bunu göz önünde bulundurarak, kullanıcıların arşivlenmiş kaynaklarımızı daha iyi anlamalarına yardımcı olmak için kaynak afişleri eklemeye başladık. Bu tür afişler arşivlenmiş bir web sayfası kaldırıldığında veya sayfa hakkında bilinen bir araştırma kuruluşu tarafından yazıldığında kullanılabilir.

Wayback Machine, arşivlenmiş sayfaların harici kullanımlarına bağlantı veren sarı başlıklar içerir ve sayfa hakkında ek tarihsel bağlam sağlayan bir “Yakalama hakkında” sekmesine sahiptir. Resim: Ekran görüntüsü

Bir web sayfasını oluşturan arşivlenmiş URL’lerin her birinin kaynağı, o sayfanın anlaşılması için kritik olabilir. Örneğin, arşivlenmiş bir web sayfasındaki belirli görüntüler, sayfadaki diğer öğelerle aynı saat ve tarihte mi çekildi? Bu bilgileri, arşivlenmiş her URL oynatma sayfasının sağ üst köşesindeki “Bu yakalama hakkında” bağlantısını tıklayarak görebilirsiniz.

Arşivlerimizin bütünlüğüne gösterdiğimiz özen ve dikkat ve yıllar içinde onların kaynağına getirdiğimiz şeffaflık, insanların Wayback Machine’e duyduğu genel güvene katkıda bulunmuştur, bu nedenle Wayback Machine’de saklanan kanıtlar dünya çapında birden fazla mahkeme tarafından kabul edilmiştir.

“Sayfayı Şimdi Kaydet” özelliğimizle oluşturduğunuz arşivlere içerik eklememizi isterseniz lütfen bizimle iletişime geçin .

Tarayıcı Uzantıları

Tahmin edebileceğiniz gibi, Safari , Firefox ve Chrome için tarayıcı uzantılarımızın yanı sıra iOS ve Android için yerel mobil uygulamalarımız var. Ayrıca web gezinme deneyimlerinin süper kolay olması için Wayback Machine 404 (ve diğer hata koşulları) algılamasını doğrudan tarayıcılarına oluşturmak için bir arama motoru olan Brave ile ortaklık kurdu.

Her şeyden önce, lütfen İnternet Arşivi ve Wayback Makinesi desteğinin yalnızca bir e-posta veya Twitter DM uzağınızda olduğunu bilin. Lütfen sorularınızı, isteklerinizi, hata raporlarınızı ve başarı öykülerinizi paylaşın. Özellikle hizmetlerimizle ilgili beğenmediğiniz şeyleri veya hangi özellikleri geliştirmemiz veya eklememiz gerektiğini düşündüğünüzü duymak istiyoruz. Bu şekilde, gazetecilerin ihtiyaç ve isteklerini desteklemek için daha iyi bir iş çıkarmak için çalışabiliriz.

Fakat bekleyin! Fazlası var…

İnternet Arşivi, herkese açık web’in çoğunu arşivlemeye ek olarak, Internet Archive Scholar hizmetimiz aracılığıyla 25 milyondan fazla açık erişim bilimsel makale de dahil olmak üzere diğer materyal koleksiyonlarını korur ve kullanıma sunar ; önizlenebilen, ödünç alınabilen veya indirilebilen yaklaşık 30 milyon e-kitap ve metin ve milyonlarca saatlik arşivlenmiş TV haberleri (10 yılın daha iyi bir kısmı için düzinelerce istasyon), ilgili altyazıların tam metin dizine eklenmesi yoluyla aranabilir.

Internet Archive ve Wayback Machine’in proje ve hizmetlerinden haberdar olmak için lütfen bizi Twitter @internetarchive ve waybackmachine’de takip edin ve blog yazılarımızı okuyun .

Ek kaynaklar

İnternet Arşivi Nedir ve Ne Bulabilirim?

İnternet Arşivi Wayback Makinesi Nasıl Kullanılır

OSINT Araştırmaları için Archive.org’u Kullanma

GIJN Web Semineri: Evden Raporlamak için Açık Kaynak Bilgilerini Kullanma

GIJN Kaynak Merkezi: Çevrimiçi Araştırma Araçları


Mark Graham küçük resim

Mark Graham , Wayback Machine’i beş yıldan fazla bir süredir yönetiyor . Bundan önce, NBC News Digital’de kıdemli başkan yardımcısıydı. Graham ayrıca ilk ABD-Sovyet e-posta hizmetinin çalıştırılmasına yardımcı oldu, çevrim içi bir tartışma sistemi için ilk web tabanlı arayüzü oluşturmak için bir proje başlattı ve kadınlar için erken bir çevrim içi hizmeti olan iVillage’ın çalışmasına yardımcı oldu. 

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*