Sistem File Terdistribusi Hadoop (HDFS)

Pengarang: Judy Howell
Tanggal Pembuatan: 28 Juli 2021
Tanggal Pembaruan: 23 Juni 2024
Anonim
Basics of Hadoop Distributed File System (HDFS)
Video: Basics of Hadoop Distributed File System (HDFS)

Isi

Definisi - Apa yang dimaksud dengan Hadoop Distributed File System (HDFS)?

Sistem File Terdistribusi Hadoop (HDFS) adalah sistem file terdistribusi yang berjalan pada perangkat keras standar atau low-end. Dikembangkan oleh Apache Hadoop, HDFS bekerja seperti sistem file terdistribusi standar tetapi menyediakan throughput data yang lebih baik dan akses melalui algoritma MapReduce, toleransi kesalahan yang tinggi dan dukungan asli dari set data besar.


Pengantar Microsoft Azure dan Microsoft Cloud | Sepanjang panduan ini, Anda akan mempelajari tentang apa itu cloud computing dan bagaimana Microsoft Azure dapat membantu Anda untuk bermigrasi dan menjalankan bisnis Anda dari cloud.

Techopedia menjelaskan Sistem File Terdistribusi Hadoop (HDFS)

HDFS menyimpan sejumlah besar data yang ditempatkan di beberapa mesin, biasanya dalam ratusan dan ribuan node yang terhubung secara bersamaan, dan memberikan keandalan data dengan mereplikasi setiap instance data sebagai tiga salinan berbeda - dua dalam satu kelompok dan satu di yang lain. Salinan ini dapat diganti jika terjadi kegagalan.

Arsitektur HDFS terdiri dari cluster, yang masing-masing diakses melalui alat perangkat lunak NameNode tunggal yang diinstal pada mesin terpisah untuk memantau dan mengelola sistem file cluster dan mekanisme akses pengguna. Mesin lain memasang satu instance DataNode untuk mengelola penyimpanan cluster.


Karena HDFS ditulis dalam Java, ia memiliki dukungan asli untuk Java application programming interfaces (API) untuk integrasi dan aksesibilitas aplikasi. Ini juga dapat diakses melalui browser Web standar.