Bir Veritabanı İle Röportaj – Hassel Fallas

Yazan: Hassel Fallas Çeviren:Zerrin Yarbay Şahin
Yazının orijinal kaynağı: http://hasselfallas.com/2014/10/01/interview-with-a-database/


2014 ağustosunda, Poderopedia kuruluşu tarafından The Iberoamerican Data Driven Journalism Manual (İspanyolca) için yayınlamıştır. Bu ebook 30’dan fazla muhabir, grafiker ve programcının tavsiye ve tekniklerini içeren makalelerin bir derlemesiydi. Bu projenin bir parçası olmaktan dolayı onur duymaktayım.

Veritabanı ile Röportaj

Bir veritabanı gazetecilerin gündelik hayatta karşılaştığı diğer herhangi bir kaynak gibidir. Yalanlar söylemeye, bilgiyi saklamaya, bize bir fenomenin bir parçasının resmini vermeye ve bizi yanlış yapmaya yönlendirmeye meyillidir. Her ne kadar sayılardan çok şey beklesek de, onlar da aslında yanılabilir ve mutlak doğruyu vermeyebilir, çünkü basit olarak, veritabanları insanlar tarafından yapılır.

Veritabanlarında istemeden veya kasten yapılan hataları bulabiliriz ve bu durumu araştırmacı gazetecilik için esas alırken göz önünde tutmak her zaman tavsiye edilir. Bu nedenledir ki veri setleri (veri bulutları) biz insanlar ve belgeli kaynaklar olarak kesinlikle aynı sertlikte ele alınmalıdır: içerikleri geçerli olmalı ve doğruluğu üçüncü kişiler tarafından doğrulanmalıdır. Sadece geleneksel habercilik değil, veri gazeteciliği yaparken dönüşü olmayan yanlış sonuçları yayınladığınızda kariyeriniz hatta yayın organınız büyük bir trajedi yaşayabilir.

Adımlar:

Hazırlama

Bu noktaları açıklarken, öncelikle yapılması gereken şey bir veritabanı ile röportaj yapmanın ne olduğunun tamamen bilinmesidir.

Ayrıntılarıyla araştırılması gereken:

  1. Bu sayıları kim elde etmiştir ve bu insanların amacı nedir?
  2. Veri toplama yöntemi nedir?
  3. Bunları elde edenler ne kadar güvenilir insan veya kuruluşlardır?
  4. Belge tamamlanmış mıdır, sonradan eklenen bilgi var mıdır veya sadece gazetecinin ihtiyaçlarını karşılamak üzere bazı çaprazlanmış veri mi içermektedir?
  5. Veriyi gönderen kişinin ilgi alanları nelerdir?
  6. Veya kişi veya kuruluş paylaşmak istemediği şeylerde neyi gizlemektedir?
  7. Rakamların kayıtları bir projeyi başlatmak için gerekli bütün bilgiyi sağlıyor mu, farklı tabanlara bakmak veya kendimizinkini yaratmak gerekli mi?

Tedirgin Olmak

Bu sorulara cevap vermişse ve eğer cevaplarından çoğu gazeteciye göre tatmin ediciyse, bir sonraki adım incelemeye çokça zaman harcayarak  Excel, Tableau, SPSS, SQL veya bilgi analizinde kullanılan herhangi bir bilgisayar programına takılı kalarak  başlamak.

Sadece veritabanının yapısını anlamak için ciddi sayıda saatler geçirdiğinizde tam anlamıyla aynı görüş ve başarılı bir projenin önemli bir kısmı olacak olan anlamlı ve verimli sonuçlara hazır olursunuz. Yanlış yazılmış rakamlar veya tekrarlanmış isimler veya aynı birime ait olmasına rağmen farklı yazılma gibi tutarsızlıkların farkına varmak hayati önem taşımaktadır.

Bunlar beklenmeyen sonuçlar doğuran ve araştırmanın sonucunu değiştiren yanlışlıklardır. Buna örnek olarak yakınlarda Kosta Rika’nın La Nacion’s Veri İstihbarat Birimi’nde gerçekleştirdiğimizdevlet liselerindeki topluma aykırı davranışlar üzerine bir projede yaşanmıştı. İş arkadaşım Amy Ross ve ben biri yurt genelinde en çok azalan fenomenlerinden biri olarak duran 643 lisenin bilgisine sahip bir veritabanını inceledik.

Eğitim Bakanlığı’nın resmi kayıtlarına girilen rakamlara göre bu kuruluşta öğrenci firarı 2011’de yüzde 68 iken 2013’te yüzde 14 olmuştur, problem 53 puan düşmüştür. Bu değişim şüphe uyandıracak şekilde oldukça uçtur. Bu okul müdürü ile gerçek ve ilgili veriyi karşılaştırmak üzere konuştuğumda, kayıtlarını gözden geçirdi ve geçen yılın öğrenci sayısındaki yazım hatasını doğruladı; gerçek, öğrencilerin yüzde 50’siydi.

Bir veritabanı keşfetmenin diğer yararı tam olarak kayıp sayıları not etmedir. “Okulu bırakma”projesinde, tekrar, en büyük kurumların birinde (1000’den fazla öğrenciye sahip) öğrenci firarının 2012’de 445 iken 2013’te sıfır olması dikkatimizi çekti. Açıkçası, burada eksik bir şey vardı. Ayrıca, Eğitim Bakanlığı istemeden yapılan bir hata nedeniyle 2013’te ayrılan 694 öğrencinin raporda yer almadığını onayladı.

Bu sayı kritikti; aksi halde, bu kurumun öğrenci ayrılmasının önemli olduğunu kaçırmış olacaktık. Bu detaylara yakın ilgi göstermemiz gerekir. Ülkenin suç oranında gösterilen rakamları kullanarak, soygunların, saldırıların ve cinayetlerin sayısındaki eksikliği fark etmediğinizi düşünün. Bütün çalışmanız boşa gider çünkü yanlış sonuçlara varırsınız.

Sorgulayın

Veritabanını tam olarak inceledikten sonra, araştırdığınız konudaki bilinmeyenlerin hepsini ve bir kısmını çözme becerisine sahip olup olmadığını bileceksiniz. Bundan sonra, Excel belgesini filtre ve pivot tabloların yardımıyla analiz ederken cevap vermek istediğiniz soruların listesini yapmanız doğru olacaktır.

Eğer bu araçları kullanmayı bilmiyorsanız, bu araçların bilgilendirici eğitimlerini  Centro para el Periodismo de Investigación (Araştırmacı Gazetecilik Merkezi) ve Consorcio Internacional de Periodistas de Investigación (Uluslararası Araştırmacı Gazeteciler Konsorsiyumu)’nundan öneririm.

Daha önce belirttiğim gibi, söz konusu veritabanının suç oranı olduğunu varsayalım.

Genelden özele gidilirse, görüşmede yer alabilecek bazı temel sualler şu şekildedir:

  1. Rakamla mevcut olduğu yıl veya yıllar boyunca ülkede gerçekleşen toplam suç sayısı nedir?
  2. Suç çoğalmış mı, azalmış mı?
  3. En yaygın suç tipleri ve bunların yıllık sıklıkları nedir? Bunlar artmış mı, azalmış mı?
  4. Toplamda ve kaza türüne göre suçun en çok arttığı şehir hangisidir?
  5. Ters olarak, suç göstergelerinin düştüğü şehir hangisidir?

10 bin veya 100  bin nüfus için oranlar hesaplanırken her zaman bu gibi ya da hastalık, kaza ile ilgili durumlar hatırlanmalıdır. Bu, bir fenomenin zamanla arttığını veya azaldığını belirlemek için en güvenilir yoldur. Bunu yapmak için, ilgilenilen yıllar için her şehirdeki toplam nüfus bilgisine sahip olmalısınız. Örneğin yetki alanımızda 40 ciddi suçun olduğunu ve toplam nüfusunun 50 bin kişi olduğunu düşünelim.

Oranı hesaplamak için Excel formülü şu şekildedir:

excel1

Bu örneği kullanarak, 2013’te 10 bin  kişi başına 8 suçun düştüğü sonucuna varılabilir: bu oran toplamda 25 suçun kaydedildiği 2004’ten çok veya az mı olduğunu merak edebiliriz.

Eğer 2004’te toplam nüfus 30 bin kişi ise, yukarıdaki formüle göre, 10 bin kişi başına 8 suçta kaldığı sonucuna varabiliriz.

excel2

Bu karşılaştırmalı veri ile şunları sorabilirsiniz:

  1. 2005’ten 2012’ye kadar her yıl için benim şehrimdeki suçun hareketi nasıldır?
  2. Oran 10 bşn kişi başına 8’e yakın mı oldu veya bu yıllar arasında varyasyonlar var mıydı?
  3. Bu değişiklikler ani veya değil miydi?
  4. Eğer değişiklikler ani ise: suça karşı mücadele neden yıldan yıla tutarsızdı?
  5. Eğer oran sabitse, neden bu şekilde kaldı?
  6. Şehirde 10 bin  nüfus başına kaç polis memuru var?
  7. Her yıl yetkililer bütçede güvenlik olarak ne araştırırlar?
  8. Diğer şehirlere veya ülkenin geneline göre şehrimdeki suç oranı yüksek veya alçak mıdır?

Görüldüğü gibi, bir veritabanı araştırma sırasında diğer herhangi bir kaynakta olduğu gibi birkaç kez araştırılabilir ve araştırılmalıdır. Genelde, verilen bazı cevaplar diğer veritabanlarına gömülü cevapları olan yeni sorulara neden olabilir veya farklı belgelerin kullanımına ve resmi temsilciye gerek duyabilir. Sonuç olarak, en kritik sorunun veritabanına yapılan olduğunun unutulmaması gerekir ve şu sorulmalıdır rakamlar ile anlatılan olaylar insanlar için neden önemlidir?

Bir gazeteci en iyi veri analizine ve sonuçlara sahip olabilir fakat sayıların insani tarafını göstermeyi unutursa, rapor anlamsızdır.


Yazan: Hassel Fallas Çeviren:Zerrin Yarbay Şahin
Yazının orijinal kaynağı: http://hasselfallas.com/2014/10/01/interview-with-a-database/

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*