5 Area Utama Di Mana Big Data Membuat Dampak Besar

Pengarang: Eugene Taylor
Tanggal Pembuatan: 9 Agustus 2021
Tanggal Pembaruan: 22 Juni 2024
Anonim
Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn
Video: Hadoop In 5 Minutes | What Is Hadoop? | Introduction To Hadoop | Hadoop Explained |Simplilearn

Isi


Sumber: Nmedia / Dreamstime.com

Bawa pulang:

Data besar adalah bisnis besar di mana-mana, tetapi beberapa area spesifik memanfaatkan teknologi ini paling banyak.

Ketika saya memulai artikel ini, saya berencana untuk membuat daftar berbagai jenis platform data besar. Tetapi, setelah tiga hari mencoba untuk mengurung semua penawaran big data yang berbeda - relasional versus non-relasional, SQL versus NoSQL dan database versus kerangka kerja - ke dalam beberapa urutan pesanan, saya memutuskan untuk menghindari kekacauan itu.

Untuk menambah penghinaan pada cedera, saya berharap untuk memperkenalkan orang yang menciptakan istilah "data besar" sebagai bagian dari artikel. Tapi, saya bahkan tidak bisa melakukannya. Tidak ada jawaban yang disepakati. Bahkan, ada proyek penelitian lengkap yang mencari tahu siapa yang menghasilkan data besar pada awalnya. Sebagai gantinya, saya akan melihat beberapa cara utama data besar digunakan. Itu jauh lebih penting. Dan itu lebih menarik dan mengejutkan daripada yang mungkin Anda pikirkan.


Bagaimana Itu Terjadi

Analis menggunakan data mining tradisional telah memanipulasi data selama bertahun-tahun. Analis yang sama ini sekarang menemukan kesulitan untuk mengatasi jumlah dan variasi data yang diselamatkan oleh bisnis, organisasi swasta dan lembaga pemerintah.

Masukkan data besar, langkah evolusi selanjutnya dalam penambangan data. Big data dirancang untuk menangani database besar dan berbagai jenis data yang dibuat di dunia digital saat ini. Jika "masif" membuat Anda berpikir tentang Google dan semua data yang dikumpulkannya, Anda akan berada di stadion baseball. Yang mungkin mengejutkan Anda adalah bahwa Google hanya berada di urutan keempat dalam Daftar Sepuluh Besar basis data terbesar di dunia. Pada Januari 2014, Pusat Data Dunia untuk Iklim menduduki puncak daftar dengan 220 terabyte data, dan siapa pun dapat menebak ukuran database yang dikendalikan oleh lembaga pemerintah tertentu.

Tentu saja, big data lepas landas karena memungkinkan untuk memanipulasi sejumlah besar data yang berbeda, dan menemukan hal-hal luar biasa - dan sangat terperinci dan pribadi. John Sumser, analis industri SDM, memberikan contoh berikut:


"Hari ini kita membuat hipotesis dan mengumpulkan data. Besok kita akan melakukan kebalikannya. Akumulasi data yang konstan dan stabil akan memungkinkan kita untuk melihat data sebelum kita membentuk pertanyaan. Itu berarti kita akan mendapatkan jawaban atas pertanyaan yang kita tidak lakukan." Saya tidak tahu untuk bertanya. Kami tidak akan memikirkan banyak hal yang kami anggap sebagai fakta. "

Tentu saja, kita semua telah mendengar tentang beberapa cara menyeramkan data ini telah digunakan, seperti kemampuan Target untuk melihat kehamilan wanita muda sebelum keluarganya bahkan mengetahuinya. Tetapi data besar juga digunakan untuk penyebab yang jauh lebih menyeramkan. Berikut adalah beberapa organisasi yang paling memanfaatkannya:

Anda tidak dapat meningkatkan keterampilan pemrograman Anda ketika tidak ada yang peduli dengan kualitas perangkat lunak.

Satu area nyata yang dapat membantu data besar dalam menangani catatan kesehatan elektronik dengan aman dan akurat di seluruh organisasi medis. Memiliki catatan yang akurat akan memberi pasien layanan yang lebih baik dan mengurangi kesalahan. Bidang perawatan kesehatan, untuk alasan yang jelas, mengadaptasi data besar dengan lebih lambat agar sesuai dengan peraturan pemerintah mengenai kerahasiaan pasien.

Seperti disebutkan sebelumnya, data besar dikenal untuk memberikan jawaban atas pertanyaan yang tidak diajukan. Di bidang perawatan kesehatan, ini mungkin berarti menemukan obat baru atau perawatan yang tidak akan ditemukan sebaliknya. Menurut McKinsey & Company, big data dapat memungkinkan hal-hal berikut dalam waktu yang tidak terlalu lama:

  • Pemodelan prediktif proses biologis dan obat-obatan menjadi lebih canggih dan luas.
  • Pasien diidentifikasi untuk mendaftar dalam uji klinis berdasarkan lebih banyak sumber informasi, seperti media sosial.
  • Uji coba dimonitor secara real time untuk mengidentifikasi masalah keselamatan atau operasional dengan cepat.
  • Alih-alih silo data kaku yang sulit dieksploitasi, data ditangkap secara elektronik dan mengalir dengan mudah antara unit yang berbeda.

Big Data, Big Opportunity

Sementara data besar sedang dimanfaatkan di beberapa bidang tertentu, ia menawarkan peluang bagi semua organisasi di bidang berikut ini:

Hampir semua komputasi dan perangkat jaringan mencatat data. Jumlah data yang dicatat dengan cepat menjadi sulit. Big data dapat dengan mudah mengelola jumlah data itu, memungkinkan administrator untuk memantau aktivitas jaringan, mendiagnosis masalah atau, dalam contoh yang diberikan Rubin kepada saya, mencari pola lalu lintas jaringan tertentu yang akan menunjukkan aktivitas malware.

Jika Anda membaca artikel ini, itu adalah taruhan yang cukup aman bahwa Anda mengetahui masalah Heartbleed seputar OpenSSL. Selain masalah teknis, ada kekhawatiran bahwa kerentanan telah ada selama beberapa tahun. Rubin menyebutkan bahwa big data memungkinkan administrator jaringan, bekerja dengan analis data, untuk membuat program yang akan mencari semua log jaringan untuk detak jantung yang berbahaya. Posting EFF ini menyebutkan:

"Setiap operator jaringan yang memiliki log paket yang luas dapat memeriksa detak jantung berbahaya, yang paling umum memiliki muatan TCP dari 18 03 02 00 03 01 atau 18 03 01 00 03 01 (atau bahkan mungkin 18 03 03 00 03 01)."

Contoh berikut adalah contoh output dari perintah audit show:

Router # tampilkan audit

* 14 Sep 18: 37: 31.535:% AUDIT-1-RUN_VERSION: Hash:

24D98B13B87D106E7E6A7E5D1B3CE0AD Pengguna:

* 14 Sep 18: 37: 31.583:% AUDIT-1-RUN_CONFIG: Hash:

4AC2D776AA6FCA8FD7653CEB8969B695 Pengguna:

* 14 Sep 18: 37: 31.595:% AUDIT-1-STARTUP_CONFIG: Hash:

95DD497B1BB61AB33A629124CBFEC0FC Pengguna:

* 14 Sep 18: 37: 32.107:% AUDIT-1-FILESYSTEM: Hash:

330E7111F2B526F0B850C24ED5774EDE Pengguna:

* 14 Sep 18: 37: 32.107:% AUDIT-1-HARDWARE_CONFIG: Hash:

32F66463DDA802CC9171AF6386663D20 Pengguna:


Jika Anda mengikuti prangko waktu, interval waktu untuk semua entri itu kurang dari satu detik. Saya bahkan tidak ingin memperkirakan hal itu selama sehari, apalagi dua tahun!

Sesuatu untuk Ditonton

Jika Anda memeriksa iklan pekerjaan, ada kebutuhan besar untuk ahli data besar. Saya bertanya kepada Rubin tentang ini. Dia setuju, menyebutkan murid-muridnya bersemangat tentang prospek mereka. Saya kemudian menyadari bahwa platform big data, khususnya yang dianggap open source, mengikuti garis waktu yang sangat mirip dengan bagaimana Linux menjadi arus utama.

Universitas merangkul versi open-source platform big-data, khususnya Hadoop, karena bebas, dan siswa dapat memanipulasi kode sumber. Jadi lulusan yang mengisi semua lowongan pekerjaan itu akan lebih suka bekerja dengan platform open-source, karena itulah yang mereka tahu yang terbaik. Ini akan menarik untuk ditonton.