Tantangan Big Data Hari Ini Berasal Dari Variasi, Bukan Volume atau Kecepatan

Pengarang: Judy Howell
Tanggal Pembuatan: 28 Juli 2021
Tanggal Pembaruan: 1 Juli 2024
Anonim
Apa Itu Big Data?
Video: Apa Itu Big Data?

Isi


Bawa pulang:

Terlalu banyak departemen TI membuang semua yang mereka miliki pada masalah volume dan kecepatan data, lupa untuk mengatasi masalah mendasar dari beragam data.

Tantangan mengelola dan memanfaatkan data besar datang dari tiga elemen, menurut Doug Laney, wakil presiden riset di Gartner. Laney pertama kali mencatat lebih dari satu dekade lalu bahwa data besar menimbulkan masalah bagi perusahaan karena memperkenalkan volume, kecepatan, dan variasi yang sulit dikelola. Masalahnya adalah, terlalu banyak departemen TI membuang semua yang mereka miliki pada masalah volume dan kecepatan data, lupa untuk mengatasi masalah mendasar dari berbagai data.

Kembali pada tahun 2001, Laney menulis bahwa "perusahaan-perusahaan terkemuka akan semakin menggunakan gudang data terpusat untuk mendefinisikan kosakata bisnis umum yang meningkatkan kolaborasi internal dan eksternal." Masalah kosa kata itu - dan variabilitas yang membuat perusahaan tidak menciptakannya - tetap menjadi aspek yang paling sedikit ditangani dari teka-teki big data saat ini. (Periksa apa yang dikatakan pakar lain. Lihat Big Data Experts untuk Diikuti.)


Tiga Vs data besar

Banyak bisnis telah menemukan metode untuk memanfaatkan peningkatan volume dan kecepatan data. , misalnya, dapat menganalisis volume data yang sangat besar. Tentu saja, data itu sering disajikan berulang-ulang dalam parameter yang sama. Ini mendorong inovasi teknologi seperti basis data kolom, yang sekarang banyak digunakan oleh perusahaan lain yang menghadapi toko barang data serupa yang berukuran cukup besar.

Dalam hal menjinakkan kecepatan, vendor seperti Splunk membantu perusahaan menganalisis data yang dibuat dengan cepat melalui file log yang menangkap beberapa ribu peristiwa per detik. Analisis peristiwa volume tinggi ini ditargetkan pada kasus penggunaan pemantauan keamanan dan kinerja. Seperti dengan tantangan volume data, tantangan kecepatan sebagian besar telah diatasi melalui teknik pengindeksan yang canggih dan analitik data terdistribusi yang memungkinkan kapasitas pemrosesan untuk skala dengan peningkatan kecepatan data.


Namun ketika menyangkut variasi, terlalu banyak perusahaan masih menghadapi masalah besar dalam pendekatan mereka terhadap analitik data besar. Masalah ini didorong oleh tiga faktor: Pertama, karena pertumbuhan, akuisisi, dan inovasi teknologi yang menambah sistem baru ke dalam lingkungan, perusahaan terkunci di lingkungan yang sangat heterogen dan heterogenitas ini hanya meningkat seiring waktu. Perusahaan perlu melacak sejumlah besar jenis sistem dan mengelola puluhan ribu jenis data, serta data yang sama direpresentasikan menggunakan nomenklatur dan format yang berbeda.

Kedua, sistem dan tipe data ini dalam banyak kasus melaporkan informasi dan informasi yang relevan yang dapat disaring dengan aman sebagai tidak relevan untuk masalah yang sedang ditangani. Ada kebutuhan untuk secara andal mengidentifikasi informasi yang berdampak.

Dimensi ketiga terhadap tantangan varietas adalah variabilitas atau perubahan konstan dalam lingkungan. Sistem ditingkatkan, sistem baru diperkenalkan, tipe data baru ditambahkan dan nomenklatur baru diperkenalkan. Ini semakin menegangkan kemampuan kami untuk menjinakkan tantangan variasi data. Ini menambahkan lapisan tambahan ke tantangan variasi. (Untuk informasi lebih lanjut, lihat Data Besar: Bagaimana Data Diambil, Dikunyah dan Digunakan untuk Membuat Keputusan Bisnis.)

Mengatasi Masalah Berbagai Data

Untuk mengatasi masalah variasi data, perusahaan harus memulai dengan domain TI, karena sering kali mewakili pelaku terburuk dan korban terburuk dari masalah variasi. Langkah pertama adalah memulai dengan definisi komprehensif atau taksonomi semua elemen atau aset TI. Ini memberikan dasar atau dasar untuk merujuk pada apa pun di dalam atau tentang TI dan memungkinkan perusahaan untuk mengelola peningkatan heterogenitas terhadap taksonomi atau terminologi yang dikenal.

Tanpa Bug, Tanpa Stres - Panduan Langkah Demi Langkah Anda untuk Membuat Perangkat Lunak yang Mengubah Hidup Tanpa Menghancurkan Kehidupan Anda

Anda tidak dapat meningkatkan keterampilan pemrograman Anda ketika tidak ada yang peduli dengan kualitas perangkat lunak.

Langkah selanjutnya adalah mengidentifikasi berbagai cara objek yang sama diwakili di berbagai sistem catatan. Hal ini memungkinkan para profesional TI untuk melihat lingkungan heterogen mereka dan sangat menyaring dan mengompresi data menjadi potongan yang relevan dan dikelola.

Akhirnya, manajer TI harus mengadopsi proses pemeriksaan lingkungan yang konstan untuk perubahan seperti jenis elemen baru yang diperkenalkan atau nomenklatur baru untuk merujuk pada elemen yang sama.

Dengan langkah-langkah ini, organisasi TI dapat mengelola berbagai masalah dan memperoleh wawasan mendalam yang secara historis menghindari tim TI. Selain itu, mengelola masalah varietas sangat meningkatkan laba atas investasi dalam alat dan teknik yang mengatasi masalah big data volume dan kecepatan.