Apa perbedaan antara data besar dan Hadoop?

Pengarang: Judy Howell
Tanggal Pembuatan: 5 Juli 2021
Tanggal Pembaruan: 23 Juni 2024
Anonim
Hadoop dalam Big Data
Video: Hadoop dalam Big Data

Isi

Q:

Apa perbedaan antara data besar dan Hadoop?


SEBUAH:

Perbedaan antara data besar dan program perangkat lunak sumber terbuka Hadoop adalah perbedaan dan mendasar. Yang pertama adalah aset, seringkali merupakan aset yang kompleks dan ambigu, sedangkan yang kedua adalah program yang mencapai serangkaian tujuan dan sasaran untuk berurusan dengan aset itu.

Big data hanyalah kumpulan besar data yang disatukan oleh bisnis dan pihak lain untuk melayani tujuan dan operasi tertentu. Data besar dapat mencakup berbagai jenis data dalam berbagai jenis format. Misalnya, bisnis dapat melakukan banyak pekerjaan dalam mengumpulkan ribuan keping data tentang pembelian dalam format mata uang, pada pengidentifikasi pelanggan seperti nama atau nomor Jaminan Sosial, atau pada informasi produk dalam bentuk nomor model, nomor penjualan atau nomor inventaris. Semua ini, atau banyak informasi lainnya, dapat disebut data besar. Sebagai aturan, itu mentah dan tidak disortir sampai dimasukkan melalui berbagai jenis alat dan penangan.


Hadoop adalah salah satu alat yang dirancang untuk menangani data besar. Hadoop dan produk perangkat lunak lainnya berfungsi untuk menginterpretasikan atau mengurai hasil pencarian data besar melalui algoritma dan metode kepemilikan khusus. Hadoop adalah program sumber terbuka di bawah lisensi Apache yang dikelola oleh komunitas pengguna global. Ini mencakup berbagai komponen utama, termasuk seperangkat fungsi MapReduce dan sistem file terdistribusi Hadoop (HDFS).

Gagasan di balik MapReduce adalah bahwa Hadoop pertama-tama dapat memetakan kumpulan data besar, dan kemudian melakukan pengurangan pada konten itu untuk hasil tertentu. Fungsi pengurangan dapat dianggap sebagai semacam filter untuk data mentah. Sistem HDFS kemudian bertindak untuk mendistribusikan data melalui jaringan atau memigrasikannya seperlunya.

Administrator basis data, pengembang, dan lainnya dapat menggunakan berbagai fitur Hadoop untuk menangani data besar dalam berbagai cara. Misalnya, Hadoop dapat digunakan untuk mengejar strategi data seperti pengelompokan dan penargetan dengan data yang tidak seragam, atau data yang tidak cocok dengan rapi ke tabel tradisional atau merespon dengan baik pertanyaan sederhana.