Veri Gazeteciliği

Koronavirüs Verileri ve Analiz Etme Araçları

Gijn

Organize suç, COVID-19 kapsamında kaçakçılık rotalarını değiştiriyor. Amazon’daki kereste kaçakçıları, denetim olmadan işlerini büyütür. İşsizlik ve alkol bağımlılığı oranları hızla yükseliyor ve iklim değişikliği hız kesmeden devam ediyor.

Columbia Üniversitesi Veri Gazeteciliği Programı direktörü Giannina Segnini, dünyanın koronavirüs salgınının gölgesinde hızla ve neredeyse her seviyede değiştiğini söylüyor.

Ancak Segnini, bu değişiklikleri araştırmak ve analiz etmek yeterince veri ve aracın  olduğunu ve muhabirlerin bu değişimlerin çoğunu gerçek zamanlı olarak izleyebileceğini belirtiyor.

“Torunlarınız COVID-19 öncesi ve sonrası dönemden bahsedecek. GIJN’in Investigating the Pandemic  18 Haziran tarihinde düzenlenen web seminerinde; “Tarihsel bir duruma şahit oluyoruz. Bu şey daha yeni başlıyor. Sınırlar arasında izlenemeyen  pek çok şey var. Ancak neler olup bittiğini izleyecek veriler  yine de mevcut ve veriler dünyayı anlamlandırmak için hiç bu kadar önemli bir araç olmamıştı.” dedi.

Latin Amerika Araştırmacı Gazetecilik Merkezi’nin (CLIP, İspanyolca kısaltması) kurucularından Segnini ve CLIP’deki veri bilimci meslektaşı Rigoberto Carvajal, bu yeni dünyayı araştırmak için yeni veri kaynakları  hakkında görüşlerini paylaşıyorlar.

Segnini, COVID-19’un doğrudan sağlık tehditlerinin ve etkilerinin ötesinde, haber merkezlerinin bu verileri etkin şekilde kullanabileceklerini belirtiyor.

“Otomatikleştirilmiş veri entegrasyonu ve standartlaştırılmış ölçekleri kullanarak, trafik cezaları, tutuklamalar, yiyecek fiyatları, tahliyeler gibi değişkenlerdeki değişiklikleri yansıtan  çalışmaları düşünebiliriz.” dedi.  Değişiklikler herkesi etkiliyor ancak  kötü aktörler,  koronavirüsle dağılan dikkatimizden  yararlanmaya devam ediyorlar. İnsan ticareti ve yolsuzluk hala devam ediyor, ancak rotaları ve yöntemleri değiştiriyorlar. Tedarik zincirlerinde yıkım var. Seyahat kısıtlamalarıyla birlikte nakliye ve havayollarında önemli değişiklikler var.”

Segnini, bu modelde sayılar hayal ürünü olsa da, haber merkezlerinin daha geniş etkileri göstermek için COVID-19 vaka verilerinin üzerine yerleştirilen “sıradan yaşam” verileriyle kendi gösterge tablolarını oluşturabileceğini söylüyor. Resim: Columbia Üniversitesi ve CLIP

Segnini daha önce Kosta Rika’daki La Nación’daki  araştırmacı gazetecilik  departmanının başındaydı ve ekibi ile üç eski cumhurbaşkanı da dahil olmak üzere 50’den fazla kamuoyuna mal olmuş kişinin yargılanmasını sağladılar.

Uluslararası Araştırmacı Gazeteciler Konsorsiyumu‘ndaki önceki görevinde gazeteci Carvajal, Panama Belgeleri araştırmasının veri uzmanlarından biriydi.

Carvajal, hükümetler tarafından sağlanan COVID-19 vaka verilerinin, ham sayılar ve göstergelerle  indirilebilir toplu veriler olarak sunulduğunu belirtiyor. Özellikle  Latin Amerika’da Meksika, Kolombiya ve Peru’nun en zengin vaka verilerini sunan ülkeler olarak öne çıktığınu ifade ediyor.

Carvajal, “Veri setlerinden zengin veri görselleştirme elde etmenin en iyi yolunun, her hasta [vaka] için ayrı ayrı [anonim] kayıtlardan ayrıntılı veriler çıkararak sağlanabilir.” diyor.

Bu verileri çok büyük olması nedeniyle gösterge panelleri ( dashboards) veya görselleştirmelere otomatik olarak aktarma sağlayan “ETL” programları (ayıklama, dönüştürme, yükleme) kullanmanın önemli olduğunu söylüyor. Veri entegrasyonu için açık kaynaklı bir araç olan Talend Open Studio öneriyor.

Bununla birlikte, COVID-19 verilerinin birçok ülkede hala güvenilmez olduğu düşünüldüğünde Segnini, aşırı ölüm oranı verilerinin araştırılmasının pandeminin daha geniş etkilerini göstermek için güçlü bir teknik olduğunu söylüyor.

Kişisel cep telefonu sinyallerinin anonim hale getirilip toplanabildiği mobilite verilerinin  hızlı değişimi açıklamak için güçlü ve yeni bir araç olduğunu söylüyor.

“İster dağınık ister toplu verileriniz olsun, tüm vakaların sayılmadığını biliyoruz – çünkü çoğu evde öldü veya bunlar test edilmedi ve politika yalnızca pozitif test edilen kişileri [alıntılıyor] veya raporlama sistemleri yetersiz ya da yanlış, ”dedi. “Birçoğu hastanelere gitmekten korkuyor ve komplikasyonları olduğu için öldü. Bu aşırı ölüm oranını hesaplamanıza izin veren bir metodoloji var. Önceki yıllarda aynı dönemde meydana gelen önceki tüm ölümlere ilişkin verilere sahip olmanız gerekir. Mutlak sayılarla veya yüzde olarak gösterebilirsiniz. Ne kadar önceki yılınız varsa, hesaplama o kadar iyi olur. ”

Carvajal ve Segnini tarafından Önerilen Veri Araçları

Hareketlilik verileri: Google COVID-19 Topluluk Hareketlilik Raporları, COVID-19 politikalarına  göre  nüfus hareketi eğilimlerini gösterir. COVID-19 Mobilite Veri Ağı, davranışı izlemek için cep telefonlarından ve teknoloji şirketlerinden anonimleştirilmiş verileri kullanan bir grup epidemiyolog ağıdır.

Mobilite analizi: Apple Haritalar’daki yol tarifilerini kullanarak, Apple Mobilite Trendleri Raporlarında gizliliği korurken hareket veri setleri  oluşturur. İnsan hareketlerinin jeo-uzamsal analizini basitleştiren bir katalog Descartes Labs Platformudur.

Açık kaynak veri entegrasyon araçları: Talend Open Studio gibi açık kaynaklı veri entegrasyon araç bunlardan biridir. Otomatik indirme ve entegrasyon, pandemiyle ilgili birçok gösterge paneli ve görselleştirme  sağlar.

Fotoğraf: Columbia Üniversitesi ve CLIP

Ülkeye ve bölgeye özgü COVID-19 vaka araçları: ABD için, 1Point3Acres ve The Covid Tracking Project‘i deneyin. Çin hakkında güvenilir veriler için Ding Xiang Yuan’ı deneyin. Afrika’daki pandemik etkilere ilişkin birden fazla kaynaktan gelen veriler için ONE Africa COVID-19 Tracker ve Africa COVID-19 Tracker‘ı kullanın. Avrupa aşırı ölüm verileri için EuroMOMO‘yu deneyin. Özellikle Batı ülkeleri için güncellenmiş aşırı ölüm oranı karşılaştırmaları için İnsan Ölümleri Veritabanını deneyin. Türkiye verileri için https://covid19.saglik.gov.tr/ ulaşabilirsiniz.

Uzmanlaşmış veritabanı araçları: Belirtiler, seyahat geçmişi ve kronik hastalıklar gibi tıbbi ayrıntılarla ilgili veriler için Kaggle Roman Koronavirüs Veri  Setini  deneyin. ABD’de yarış ve COVID-19 ile ilgili veriler için COVID Racial Data Tracker‘ı deneyin.

Uluslararası ticaret ve tedarik zinciri kaynakları: Açık kaynaklı veriler için BM Comtrade Veritabanını deneyin. Ticari deneme için Panjiva, Datamyne ya da ImportGenius.


Rowan Philp, GIJN’de muhabir. Rowan eskiden Güney Afrika’nın Sunday Times gazetesinin baş muhabiriydi.  Dış haberler muhabiri  olarak dünya çapında iki düzineden fazla ülkeden haberler, siyaset, yolsuzluk ve çatışmalar hakkında haber yaptı.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*