Veri GazeteciliğiVeri TemizlemeVeri Temizleme Etiği

Dağınık Veri Temizleme Aracı Open Refine’ın V3.0 Beta Sürümü Çıktı

Veri gazetecilerinin dağınık veri temizlemede sıklıkla kullandığı araç  Open Refine  yeni sitesi ile yayında. Site geçtiğimiz günlerde Beta sürümünü de duyurmuştu.

http://openrefine.org/download.html ekran görüntüsüdür.

Veri Temizleme Aracı Open Refine’ın V3.0 Beta Sürümü Çıktı. Veriler kazındığında ya da bilgi edinmeden temin edildiğinde istenen yapıda ve kalitede olmayabiliyor. Boşluklar, satır ve sütunlar birbirine geçmiş olabiliyor, bazı hücreleri ayırmak gerekebiliyor.

Excel ile de veri temizlenip analiz edilebilir ancak Open Refine, Excel’den  daha fazla fonksiyonu olan bir araç. Bu sebeple bu  açık kaynak araç ile Open Refine’ı kullanarak dağınık veriyi temizleyebilirsiniz.  Araç web tarayıcısında çalışır, açık kaynak bir araçtır. 

V3.0 beta sürümünde açıklanan yeni özellikler şöyle:

Wikidata uzantısı
Veri paketi meta verileri
Etiket sistemi
Google Drive API’sı
OpenRefine Veritabanı Alma Uzantısı
Birleştirme işlevini ekle
“Facet by null” ve “Facet by empty string”  uygulayın ve özelleştirilmiş facets menüsüne ekleyin
Özellik İsteği: SqlDump
JRDF’den JENA kütüphanesine geçiş
Veri tablosundaki hücrelerde göster / gizle boş değerleri arasında geçiş yapma seçeneği eklendi
Dahili tarih türünü birleştirin
OpenRefine logosunu güncelle
Http req başlıklarını ayarla
Bulma işlevi ekle
Bazı hata düzeltmeleri

Değişikliklerin tam listesine buradan ulaşabilirsiniz :

https://github.com/OpenRefine/OpenRefine/issues?q=is%3Aissue+milestone%3A3.0+is%3Aclosed

 

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*