Analisis Big Data Sumber Terbuka

Pengarang: Laura McKinney
Tanggal Pembuatan: 1 April 2021
Tanggal Pembaruan: 14 Boleh 2024
Anonim
[Uber Open Summit 2018] Scaling Uber’s Big Data Platform
Video: [Uber Open Summit 2018] Scaling Uber’s Big Data Platform

Isi

Definisi - Apa yang dimaksud dengan Analisis Data Besar Sumber Terbuka?

Analisis data besar open-source mengacu pada penggunaan perangkat lunak open-source dan alat untuk menganalisis data dalam jumlah besar untuk mengumpulkan informasi yang relevan dan dapat ditindaklanjuti yang dapat digunakan organisasi untuk memajukan tujuan bisnisnya. Pemain terbesar dalam analisis data besar open-source adalah Apaches Hadoop - ini adalah pustaka perangkat lunak yang paling banyak digunakan untuk memproses kumpulan data besar di sekelompok komputer menggunakan proses yang didistribusikan untuk paralelisme.


Pengantar Microsoft Azure dan Microsoft Cloud | Sepanjang panduan ini, Anda akan mempelajari tentang apa itu cloud computing dan bagaimana Microsoft Azure dapat membantu Anda untuk bermigrasi dan menjalankan bisnis Anda dari cloud.

Techopedia menjelaskan Analisis Data Besar Sumber Terbuka

Analisis data besar open-source memanfaatkan perangkat lunak dan alat open-source untuk mengeksekusi analitik data besar dengan menggunakan seluruh platform perangkat lunak atau berbagai alat sumber terbuka untuk tugas yang berbeda dalam proses analitik data. Apache Hadoop adalah sistem yang paling terkenal untuk analitik data besar, tetapi komponen lain diperlukan sebelum sistem analisis nyata dapat disatukan.

Hadoop adalah implementasi open-source dari algoritma MapReduce yang dipelopori oleh Google dan Yahoo, jadi itu adalah dasar dari sebagian besar sistem analitik saat ini. Banyak alat analisis data besar menggunakan open source, termasuk sistem basis data yang kuat seperti open-source MongoDB, basis data NoSQL yang canggih dan dapat diukur sangat cocok untuk aplikasi data besar, dan juga yang lainnya.


Layanan analitik data besar open-source meliputi:

  • Sistem pengumpulan data
  • Pusat kontrol untuk administrasi dan pemantauan cluster
  • Pembelajaran mesin dan perpustakaan penambangan data
  • Layanan koordinasi aplikasi
  • Hitung mesin
  • Kerangka kerja eksekusi