|
Veri analizi
işlemini gerçekleştimenin öncesinde veri temizliği yapmak
gerekmektedir. Bu adım çok kritiktir ve veri analizi
sürecinin başarılı ya da başarısız olmasında bir anahtar işlevi
görebilmektedir. Veri temizleme işlemi, farklı veri tipleri farklı
teknikleri gerektirdiği için, zeki bir yaklaşımı
gerektirmektedir. Verilerin gerçek süreçleri ve
değişiklikleri yansıtacak bir biçimde hazırlanması gerekmektedir.
Tipik olarak, veri temizleme ayrıksı ve tamamlanmamış kayıtların ortaya
çıkarılmasını içerir. Ayrılsı kayıtlar, tipik değerlerden
önemli ölçüde farklı olan değerlerdir. Örnek
olarak, bir kişinin boyunu tanımlayan parametrenin 3 metreye eşit
olduğu bir durum gösterilebilir. Tamamlanmamış kayıtlar ise,
veri giriş sistemlerindeki hataların sonuçları
olabilirler. Örnek olarak,
ısı ölçüm cihazı arızalanmış ve ölçüm
yapmayı bu nedenle durdurmuş olabilir.
Hatalı ya da tamamlanmamış veriler bir kere tepit edildiğinde,
analizden çıkarılmalı ya da düzeltilmelidir.
|
|