Açık veriler için doğru formatı seçme

Açık bir veri setinin ‘formatı’, verilerin yapılandırıldığı insanlar ve makineler tarafından kullanılma biçimini ifade eder. Doğru formatı seçmek, verilerin basitçe yönetilmesini ve tekrar kullanılmasını sağlar.

Bir iki detay ile önemi üzerinde duracağız.  Neden açık veri için format önemli ya da doğru yapılandırılmış olanı seçmek, farklı açık veri formatlarına erişmek, CSV olarak seçmek?

a)Kullanılabilirlik

Veri için en kullanışlı format, veri setlerinin oluşturduğu ilk  format. Yani en baştan formatı doğru seçmek. Birçok durumda, bu format Microsoft Excel gibi tescilli bir yazılım programı olabilir. Bu tür programlar çoğu zaman verileri diğer biçimlerle dışa aktarabilirken, popülerlikleri, yayıncılığın farklı bir biçimde olması da bazen yeniden kullanıma engel oluşturabiliyor.

b) Ortak veri yapıları/yönetim

Tablolar

Veriler için en yaygın yapı tablolar. Veriler, harcama gibi sıralı değerleri listeleyen satırlar ve sütunlar halinde organize edilir. Veriler birbirine bağlı olmayan ayrı girdilere dayanıyorsa, CSV idealdir. Uygun tablolama verilerine bir örnek, İtalyan veri portalının müze katılım rakamları incelenebilir

Açık veriyi kullananlar, veriyi yayınlayanların (yayıncıların) verilerin yeniden kullanımı için hangi formatlarda veriyi sunduklarını  bilmeleri/anlamaları önem taşıyor. Tüm veriler çok büyük,  statik dosyalar olarak görünmesi çok olduğu için indirmek için uygun olamıyor. Bazı verilerin daha küçük parçalara ayrılarak paylaşılması daha yararlı olabiliyor.

CSV

Virgülle ayrılmış değerler (CSV) dosyası, yalnızca veri satırları olup, her veri noktası bir virgül ile ayrılır. CSV, tablo verileri için mükemmeldir ve Excel gibi uygulamalara kolayca yüklenebilir ve kaydedilebilir, böylece kullanıcılar tarafından erişilebilir olur.

CSV biçimi ve Excel biçimleri gibi grafik oluşturulamasa da, açık, makine tarafından okunabilen bir biçimdir. CSV, açık verilerin geniş ölçüde yeniden kullanılmasını destekleyen en basit biçimi/formatı temsil eder. Başka bir deyişle, CSV, açık veriler için ‘en düşük ortak payda’ – açık verilerin mümkün olan yerlerde bu formatta sunulması gerekir.

Coğrafi veriler 

Genellikle basit tabular veri setlerinden daha karmaşıktır. Hiyerarşik veri seti olarak, ülkeler ve il / eyaletler hakkında ayrıntılı bilgi vererek veya yolları ayrıntılandıran bir ağ veri setleridir.

Bu tür verileri yayınlarken, geoJSON (JavaScript Nesne Tabelası – JSON) ve KML (Genişletilebilir Biçimlendirme Dili – XML) gibi biçimler düşünülmelidir.

Bu formatlar özellikle kullanılabilirlik göz önüne alınarak tasarlanmıştır ve Open Street Map ve CartoDB gibi uzman haritalama araçlarından kolayca içe aktarılabilir veya dışa aktarılabilir.

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*