Pembersihan data

Pengarang: Randy Alexander
Tanggal Pembuatan: 26 April 2021
Tanggal Pembaruan: 1 Juli 2024
Anonim
Data Cleansing Menggunakan Formula Excel
Video: Data Cleansing Menggunakan Formula Excel

Isi

Definisi - Apa artinya Pembersihan Data?

Pembersihan data adalah proses mengubah data dalam sumber daya penyimpanan yang diberikan untuk memastikan bahwa itu akurat dan benar. Ada banyak cara untuk mengejar pembersihan data di berbagai perangkat lunak dan arsitektur penyimpanan data; sebagian besar dari mereka berpusat pada tinjauan yang cermat terhadap set data dan protokol yang terkait dengan teknologi penyimpanan data tertentu.


Pembersihan data juga dikenal sebagai pembersihan data atau penggosokan data.

Pengantar Microsoft Azure dan Microsoft Cloud | Sepanjang panduan ini, Anda akan mempelajari tentang apa itu cloud computing dan bagaimana Microsoft Azure dapat membantu Anda untuk bermigrasi dan menjalankan bisnis Anda dari cloud.

Techopedia menjelaskan Pembersihan Data

Pembersihan data kadang-kadang dibandingkan dengan pembersihan data, di mana data lama atau tidak berguna akan dihapus dari kumpulan data. Meskipun pembersihan data dapat melibatkan penghapusan data yang lama, tidak lengkap, atau digandakan, pembersihan data berbeda dari pembersihan data karena pembersihan data biasanya berfokus pada membersihkan ruang untuk data baru, sedangkan pembersihan data berfokus pada memaksimalkan akurasi data dalam suatu sistem. Metode pembersihan data dapat menggunakan parsing atau metode lain untuk menghilangkan kesalahan sintaksis, kesalahan ketik atau fragmen catatan. Analisis yang cermat dari kumpulan data dapat menunjukkan bagaimana menggabungkan beberapa set menyebabkan duplikasi, dalam hal ini pembersihan data dapat digunakan untuk memperbaiki masalah.


Banyak masalah yang melibatkan pembersihan data mirip dengan masalah yang dihadapi arsiparis, staf admin database dan lainnya di sekitar proses seperti pemeliharaan data, penambangan data yang ditargetkan dan metodologi ekstraksi, transformasi, muat (ETL), di mana data lama dimuat kembali ke dalam kumpulan data baru. Masalah-masalah ini sering menganggap sintaks dan penggunaan perintah khusus untuk mempengaruhi tugas terkait dalam teknologi database dan server seperti SQL atau Oracle. Administrasi basis data adalah peran yang sangat penting dalam banyak bisnis dan organisasi yang mengandalkan kumpulan data besar dan catatan akurat untuk perdagangan atau inisiatif lainnya.