Veri KazımaVeri Kazıma EtiğiWeb Kazımı

Web/Veri Kazıma Etik Bir Uygulama Mı?

Veri kazıma eski bir bilgisayar bilimi ve veri sistemi. Biraz aşırıya kaçıp ihlal ediyor olsak da farklı kaynaklardan veri kazımayı uzun zamandır yapıyoruz. Şimdi ise bu işi otomatik ve büyük ölçekli yapan daha gelişmiş teknolojilerle yapıyoruz. Webden veri kazıma iş hayatı/medya/araştırma alanında önemli bir fayda doğurabiliyor. Ancak faydacı tarafına rağmen webden veri kazıma işlemi etik midir?

Geliştirdiğimiz araçların / teknolojilerin hem iyi hem de kötü tarafları var. Bilakis, aslında teknolojinin kendisi değil, insanlar aslında iyi olan bir şeyi kötüye çevirmede daha başarılı olabiliyor. Bu durumu veri kazıma için de belirtebiliriz. Veri kazıma inanılmaz bir teknoloji; hele ki hayati bir amaç için kullandığınızda. Ancak iyi niyetli kulanmadığınızda da kötü de olabilir.

Web Kazımanın İyi Tarafları

Web kazımanın, veri kazımanın iş hayatı , veri gazeteciliği vb. alanlarda avantajlı tarafları var. Geliştiriyor olduğunuz ürünün daha fazla inovatif olmasına katkı sağlayabileceği gibi, haberde kaynak, veri sıkıntısı sürecinde önemli bir veri toplama pratiğine dönüşebiliyor. Veri kazımının iyi taraflarına yönelik bir iki iyi örnek hatta hayati şekilde kullanıma yönelik örnekler şöyle:

Veri Analizi ve Görselleştirme için Kullanılabilir

Veri analizi, her alanda veya sektör ile alakalı bir şey. Gazetecilik, E-ticaret, finans, IT ya da sağlık hizmetleri olsun, veri analizi her yerde hayati bir rol oynayabilir. İyi veri haberciliğinin, işin omurgası olabilir ve milyonlarca insanı bir şekilde etkiler. Veri analizi veri olmadan açıkça imkansızdır, bu nedenle veri madenciliği olmadan eksik bir süreçtir. Her analiz; veri görselleştirme sürecini yönlendiren bir temeli işaret eder. Veri analizi söz konusu olduğunda, birden çok kaynaktan gelen veriler esastır. Bu tür verilerin özellikle toplanması, temizlenmesi ve organize edilmesi için yüksek düzeyde teknik beceri gerekir. Web verilerini kazıma, daha fazla şirket bilgileri İnternet’e taşıdığından, işletme analizi için vazgeçilmez bir bileşen olarak adlandırılabilir. Aynı durumu araştırmacı veri habercileri için de belirtebiliriz. Verinin dijital ortamda bulunması kazıma pratiğini de etkilemiştir.

 

Araştırma ve Geliştirmeye Yardım Eder

Tüketiciler daha iyi, daha hızlı ve yenilikçi ürünler için sonsuz bir talebe sahiptir. Ürünlerin gelişmesi için daha iyi araştırma ihtiyacı her zaman var.  Bu veri haberciliği süreci veri toplama aşaması için de söz konusu. 

Örneğin şirketler, ürünlerini daha iyi ürünlere dönüştürmeyi düşünmeden önce pazardaki mevcut ürünlerle ilgili eğilimleri, talepleri ve sorunları tanımaya yönelik çok araştırma yaparlar. Araştırma, ürün geliştirme ve yenilikçiliğin vazgeçilmez bir unsuru nitekim. Bu araştırmayı yapabilmek için de çok miktarda veriye ihtiyaç duyulur. Web veri kazıması, günümüzün elektronik cihazlarının geliştirilmesinde çok yardımcı olmuştur. Dolayısıyla, araştırma ve geliştirme, veri madenciliği olmadan anlamsızdır. Veri Haberciliği çalışmalarında da önemli bir veri toplama ve edinme pratiğidir.

 

Pazar analizi ve fiyat karşılaştırılmasında kullanılabilir

İşletmeler her zaman veri ihtiyacı duyarlar. Veri, şirketiniz ne kadar küçük olursa olsun, mükemmel bir iş stratejisi oluşturmada yardımcı olur. Pazar analizi, şirketlerin müşterilere değer katarken, rakiplerinin üstünde nasıl yükselmeyi öğreneceğini kapsar. Bununla birlikte, fiyat karşılaştırması rakibin web sitelerinden kazınmış veriler kullanılarak da yapılabilir. Her ikisi de işletmelerin kârlarını büyük bir farkla geliştirmelerine yardımcı olabilir.


Verilerin kazınmasının kötü tarafları

Daha önce de tartıştığımız gibi, teknoloji ile ilgili her şeyin karanlık yüzü var. Aynı  durum veri kazıma için de geçerlidir. Veri kazıma, kötü insanlar tarafından etik olmayan veya hatta yasadışı faaliyetler için kullanılabilir. Bu, veri kazıma teknolojisinin kötü olduğu anlamına gelmez, bunu yapan insanların kötü olduğu anlamına gelir. Veri kazıma teknolojisi yardımıyla yapılabilecek kötü şeylerden bazıları.

 

İntihal teşvik edebilir

Veri kazıma, İnternet’in dört bir yanından herhangi bir biçimde bir yerden içerik toplamanızı sağlar. İçerik toplamak yanlış değildir, ancak içerik oluşturucularının izni olmaksızın içerikten yeni bir şey üretmeniz kesinlikle yanlıştır. İntihal, başkasının telif hakkıyla korunan eserlerini kopyalayıp, kendi işlerinizde yeniden yayımlıyor olmanız anlamına gelir. Bu sadece etik dışı değil,  dijital telif hakkı yasası açısından da yasadışıdır.  Bir kişi veya şirket, çeşitli kaynaklardan veri toplamak için veriler kazıyarak bunları kendisininmiş gibi yayınlarsa, etkilenen taraflar için maddi kayıplara neden olabilir. Bu, veri kazıma sürecinin dahil olduğu etik olmayan bir uygulamadır.

 

Spam gönderimi için kullanılır

Spam gönderilme, şimdiye kadar İnternet’te karşılaştığımız en can sıkıcı şeylerden biri olarak gösterilebilir. Hiç kimse, alakasız e-postalar veya bazı ürün ve hizmetleri tanıtan çağrılar almak istemez. Birçok spam göndericisi, e-posta kimliklerini ve cep telefon numaralarını İnternet’te toplamak için web veri kazımını kullanıyor. Ayrıca, reklamları ve tanıtım amaçlı e-postalar göndermek için toplanan iletişim bilgilerini kullanırlar. Veri kazıma, büyük iletişim bilgileri listelerini web’den toplamanın en kolay yoludur ve bu, verilerin kazınmasında bir başka kötü yönü de beraberinde getirir.

 

Kimlik hırsızlığı için kullanılabilir

Sosyal medya profilleri ve içindeki veriler veri kazıma teknikleri kullanılarak kazınabilir. Kötü niyetli insanlar, kimlik hırsızlığı ve benzeri yasa dışı eylemler için bunu yapabilir. Kimlik hırsızlığı yüzünden insanları aldatmak amacıyla e-postalar, cep telefonu numaraları ve kişisel bilgiler için veriler kazımak  bir tehdittir. Ne yazık ki, veri kazıma bu tür dolandırıcılıkları gerçekleştirmek için kullanılabilir.

 

Verilerin kazınması etiği

Yukarıda veri kazıma yardımıyla yapılabilecek iyi ve kötü şeyleri gördük, bu durumda sizce veri kazıma  etik midir? Tamamıyla etik bir kavram olduğunu düşünüyoruz. Web verilerini kazıma, bir bilgisayarı bir web sitesini otomatik olarak ziyaret ettirmek ve süreç içinde bazı veriler toplamak için bir mekanizma. Teknik olarak, kendi başına bir web sitesini ziyaret eden bir bilgisayar ile web sitesini ziyaret etmek için bir bilgisayar kullanan bir insan arasında fark yoktur. Ayrıca, kazıma, doğru taraftan yapılması durumunda ilgili tarafların tamamına olumlu etki yapabilir. Bununla birlikte, izlenmesi gereken birkaç kural vardır. Veri kazımaya başlamadan önce bir; sitenin Kullanım Koşullarını okumanız gerekir. Bazı web siteleri, verilerinizi taramanıza ve özetlemenize engel olabilir ve bunu robots.txt dosyasında belirtirler. İşinizi layıkıyla yapmak istiyorsanız bunlara uymanız gerekir. Bunları takip ettiğiniz sürece etik dışı hiçbir şey yapmış olmazsınız.  Unutmayın, Google, her web sitesinin taranmasının sevildiği bir veri kazıma altyapısıdır.

 

Sonuç

Veri kazıması, şimdiye kadar denenmiş en iyi iş stratejilerini yapmanıza yardımcı olabilecek mükemmel bir teknolojidir. Büyük güç büyük sorumluluk getirir ve dolayısıyla tek başına iyi kullanılması gerekir. Kazıma botu web siteleri tarafından belirlenen tüm kurallara saygılı olduğu sürece kazıma etiktir ve kazınmış veriler iyi niyetlerle kullanılır. Veri kazımanın teknik ve hukuki yönleri hakkında daha fazla bilgi edinmek isterseniz, buradaki talimatları düzgün bir şekilde derledik.


Kaynak / Derleme / Ekleme / Çeviri: https://www.promptcloud.com/blog/is-data-scraping-ethical
Yazının bazı bölümlerine özgün eklemeler yapılmış, veri gazeteciliği alanı ile ilişkilendirilmiştir. 


Veri Gazeteciliği Platformu (www.verigazeteciligi.com) sitesinde yayınlanan haber, makale, rapor ve çeviriler genellikle telif hakkına sahip olunan çalışmalardır. Kullanımı için  Creative Commons License lisansı dikkate alınmalıdır.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*