Apache Spark

Pengarang: Eugene Taylor
Tanggal Pembuatan: 8 Agustus 2021
Tanggal Pembaruan: 1 Juli 2024
Anonim
Что такое Apache Spark
Video: Что такое Apache Spark

Isi

Definisi - Apa yang dimaksud dengan Apache Spark?

Apache Spark adalah program sumber terbuka yang digunakan untuk analisis data. Merupakan bagian dari seperangkat alat yang lebih besar, termasuk Apache Hadoop dan sumber daya open-source lainnya untuk komunitas analitik saat ini.


Para ahli menggambarkan perangkat lunak open-source yang relatif baru ini sebagai alat komputasi klaster analitik data. Ini dapat digunakan dengan Sistem File Terdistribusi Hadoop (HDFS), yang merupakan komponen Hadoop tertentu yang memfasilitasi penanganan file yang rumit.

Beberapa profesional TI menggambarkan penggunaan Apache Spark sebagai pengganti potensial untuk komponen Apache Hadoop MapReduce. MapReduce juga merupakan alat pengelompokan yang membantu pengembang memproses set data yang besar. Mereka yang memahami desain Apache Spark menunjukkan bahwa itu bisa berkali-kali lebih cepat daripada MapReduce, dalam beberapa situasi.

Pengantar Microsoft Azure dan Microsoft Cloud | Sepanjang panduan ini, Anda akan mempelajari tentang apa itu cloud computing dan bagaimana Microsoft Azure dapat membantu Anda untuk bermigrasi dan menjalankan bisnis Anda dari cloud.

Techopedia menjelaskan Apache Spark

Mereka yang melaporkan penggunaan Apache Spark modern menunjukkan bahwa perusahaan menggunakannya dengan berbagai cara. Salah satu penggunaan umum adalah untuk mengumpulkan data dan menyusunnya dengan cara yang lebih halus. Apache Spark juga dapat membantu pekerjaan analisis mesin atau klasifikasi data.


Biasanya, organisasi menghadapi tantangan memperbaiki data dengan cara yang efisien dan agak otomatis, di mana Apache Spark dapat digunakan untuk tugas-tugas semacam ini. Beberapa juga menyiratkan bahwa menggunakan Spark dapat membantu menyediakan akses ke mereka yang kurang memiliki pengetahuan tentang pemrograman dan ingin terlibat dalam penanganan analitik.

Apache Spark mencakup API untuk Python dan bahasa perangkat lunak terkait.