Penambangan Data

Pengarang: Randy Alexander
Tanggal Pembuatan: 26 April 2021
Tanggal Pembaruan: 24 Juni 2024
Anonim
"Data Preprocessing" | Kuliah Data Mining / Penambangan Data
Video: "Data Preprocessing" | Kuliah Data Mining / Penambangan Data

Isi

Definisi - Apa artinya Penambangan Data?

Penambangan data adalah proses menganalisis pola data yang tersembunyi menurut berbagai perspektif untuk kategorisasi menjadi informasi yang berguna, yang dikumpulkan dan dikumpulkan di area umum, seperti gudang data, untuk analisis yang efisien, algoritma penambangan data, memfasilitasi pengambilan keputusan bisnis dan informasi lainnya persyaratan untuk akhirnya memotong biaya dan meningkatkan pendapatan.


Penambangan data juga dikenal sebagai penemuan data dan penemuan pengetahuan.

Pengantar Microsoft Azure dan Microsoft Cloud | Sepanjang panduan ini, Anda akan mempelajari tentang apa itu cloud computing dan bagaimana Microsoft Azure dapat membantu Anda untuk bermigrasi dan menjalankan bisnis Anda dari cloud.

Techopedia menjelaskan Penambangan Data

Langkah-langkah utama yang terlibat dalam proses penambangan data adalah:

  • Ekstrak, ubah, dan muat data ke dalam gudang data
  • Menyimpan dan mengelola data dalam basis data multidimensi
  • Berikan akses data ke analis bisnis menggunakan perangkat lunak aplikasi
  • Sajikan data yang dianalisis dalam bentuk yang mudah dimengerti, seperti grafik

Langkah pertama dalam penambangan data adalah mengumpulkan data relevan yang penting untuk bisnis. Data perusahaan dapat berupa transaksional, non-operasional, atau metadata. Data transaksional berkaitan dengan operasi sehari-hari seperti penjualan, inventaris, dan biaya, dll. Data non-operasional biasanya diramalkan, sedangkan metadata berkaitan dengan desain basis data logis. Pola dan hubungan antar elemen data membuat informasi yang relevan, yang dapat meningkatkan pendapatan organisasi. Organisasi dengan fokus konsumen yang kuat berurusan dengan teknik penambangan data yang memberikan gambaran yang jelas tentang produk yang dijual, harga, persaingan, dan demografi pelanggan.


Misalnya, raksasa ritel Wal-Mart mentransmisikan semua informasi yang relevan ke gudang data dengan terabyte data. Data ini dapat dengan mudah diakses oleh pemasok yang memungkinkan mereka mengidentifikasi pola pembelian pelanggan. Mereka dapat menghasilkan pola pada kebiasaan belanja, sebagian besar hari belanja, paling dicari untuk produk dan data lainnya menggunakan teknik data mining.

Langkah kedua dalam penambangan data adalah memilih algoritma yang cocok - mekanisme yang menghasilkan model penambangan data. Pekerjaan umum dari algoritma melibatkan mengidentifikasi tren dalam satu set data dan menggunakan output untuk definisi parameter. Algoritma yang paling populer digunakan untuk data mining adalah algoritma klasifikasi dan algoritma regresi, yang digunakan untuk mengidentifikasi hubungan antara elemen data. Vendor basis data utama seperti Oracle dan SQL menggabungkan algoritma data mining, seperti clustering dan regresi tress, untuk memenuhi permintaan untuk data mining.