Ilmu Data atau Pembelajaran Mesin? Inilah Cara Menemukan Perbedaan

Pengarang: Laura McKinney
Tanggal Pembuatan: 3 April 2021
Tanggal Pembaruan: 1 Juli 2024
Anonim
Data Science Machine Learning Python : Apa itu Perbedaan Hyperparameter dan Parameter
Video: Data Science Machine Learning Python : Apa itu Perbedaan Hyperparameter dan Parameter

Isi


Sumber: Elnur / Dreamstime.com

Bawa pulang:

Ilmu data dan pembelajaran mesin berbeda dalam hal-hal kunci. Dalam beberapa hal, satu dapat dilihat sebagai bagian dari yang lain. Keduanya penting dalam kemajuan TI saat ini.

Di dunia baru kecerdasan buatan dan manajemen data ini, mudah untuk dikacaukan oleh beberapa istilah yang paling umum digunakan di dunia TI.

Sebagai contoh, ilmu data dan pembelajaran mesin banyak berhubungan satu sama lain. Tidak mengherankan bahwa banyak orang yang hanya memiliki sedikit pengetahuan tentang disiplin ilmu ini akan mengalami kesulitan mencari tahu bagaimana mereka berbeda satu sama lain.

Inilah cara terbaik untuk memisahkan ilmu data dari pembelajaran mesin, sebagai prinsip dan sebagai pendekatan teknologi.

Ilmu Data dan Pembelajaran Mesin: Terminologi Luas dan Sempit

Pertama-tama, ilmu data adalah kategori teknologi yang luas dan menyeluruh yang mencakup berbagai jenis proyek dan kreasi. (Untuk lebih lanjut tentang apa yang terlibat dalam pekerjaan ilmu data, lihat Peran Pekerjaan: Ilmuwan Data.)


Ilmu data pada dasarnya adalah praktik bekerja dengan data besar. Itu muncul sebagai hukum Moore dan proliferasi perangkat penyimpanan yang lebih efisien menyebabkan sejumlah besar data dikumpulkan oleh perusahaan dan pihak lain. Kemudian, platform data besar dan alat-alat seperti Hadoop mulai mendefinisikan kembali komputasi dengan mengubah cara kerja manajemen data. Sekarang, dengan cloud dan containerisasi serta model-model baru, big data telah menjadi pendorong utama cara kita bekerja dan hidup.

Dalam bentuknya yang paling sederhana, ilmu data adalah cara kami mengelola data itu, dari membersihkannya dan memperbaikinya untuk menggunakannya dalam bentuk wawasan.

Definisi pembelajaran mesin jauh lebih sempit. Dalam pembelajaran mesin, teknologi mengambil data dan memasukkannya melalui algoritma, untuk mensimulasikan proses kognitif manusia yang digambarkan sebagai "belajar." Dengan kata lain, setelah mengambil data dan melatihnya, komputer dapat memberikan hasil sendiri. , di mana teknologi tampaknya telah belajar dari proses yang dilakukan oleh programmer.


Set Keterampilan Pembelajaran Ilmu dan Mesin Data

Cara lain untuk membandingkan ilmu data dan pembelajaran mesin adalah dengan melihat berbagai keterampilan yang paling berharga bagi para profesional di kedua bidang ini.

Tanpa Bug, Tanpa Stres - Panduan Langkah Demi Langkah Anda untuk Membuat Perangkat Lunak yang Mengubah Hidup Tanpa Menghancurkan Kehidupan Anda

Anda tidak dapat meningkatkan keterampilan pemrograman Anda ketika tidak ada yang peduli dengan kualitas perangkat lunak.

Ada konsensus umum bahwa para ilmuwan data mendapat manfaat dari keterampilan analitis dan matematika yang mendalam, pengalaman langsung dengan teknologi basis data, dan pengetahuan tentang bahasa pemrograman seperti Python atau paket lain yang digunakan untuk menguraikan data besar.

“Siapa pun yang tertarik membangun karier yang kuat dalam (ilmu data) harus mendapatkan keterampilan kunci di tiga departemen: analitik, pemrograman, dan pengetahuan domain,” tulis Srihari Sasikumar di Simplilearn. "Naik satu tingkat lebih dalam, keterampilan berikut akan membantu Anda mengukir ceruk sebagai ilmuwan data: Pengetahuan yang kuat tentang Python, SAS, R (dan) Scala, pengalaman langsung dalam pengkodean basis data SQL, kemampuan untuk bekerja dengan data tidak terstruktur dari berbagai sumber seperti video dan media sosial, memahami berbagai fungsi analitis (dan) pengetahuan tentang pembelajaran mesin. "

Di sisi pembelajaran mesin, para ahli sering mengutip keterampilan pemodelan data, pengetahuan probabilitas dan statistik, dan keterampilan pemrograman yang lebih luas sebagai alat yang bermanfaat dalam toolkit insinyur pembelajaran mesin.

Cara Belajar Mesin Spot

Kuncinya di sini adalah bahwa segala macam hal terdiri dari pekerjaan sains data, tetapi ini bukan pembelajaran mesin kecuali Anda memiliki rejimen yang sangat ketat yang diatur untuk membantu komputer belajar dari inputnya.

Ketika itu ada, itu akan membuat beberapa sistem yang secara mengejutkan mampu yang dapat memiliki efek luas pada kehidupan kita.

"Banyak hal yang kita lakukan dengan pembelajaran mesin terjadi di bawah permukaan," pendiri Amazon Jeff Bezos dilaporkan mengatakan, menunjukkan beberapa aplikasi dari jenis sistem ini. “Pembelajaran mesin mendorong algoritma kami untuk perkiraan permintaan, peringkat pencarian produk, rekomendasi produk dan penawaran, penempatan merchandising, deteksi penipuan, terjemahan, dan banyak lagi. Meskipun kurang terlihat, sebagian besar dampak pembelajaran mesin akan dari jenis ini - diam-diam tetapi secara bermakna meningkatkan operasi inti. "

Salah satu contoh paling membantu di sini adalah munculnya jaringan saraf - itu adalah metode yang umum dan populer untuk menyiapkan proses pembelajaran mesin.

Dalam bentuknya yang paling dasar, jaringan saraf terdiri dari lapisan neuron buatan. Setiap neuron buatan individu memiliki fungsi yang setara dengan neuron biologis - tetapi alih-alih sinapsis dan dendrit, ia memiliki input, fungsi aktivasi, dan keluaran akhirnya.

Jaringan saraf dibuat untuk bertindak seperti otak manusia, dan profesional pembelajaran mesin sering menggunakan model ini untuk menciptakan hasil pembelajaran mesin.

Namun, itu bukan satu-satunya cara untuk melakukan pembelajaran mesin. Beberapa proyek pembelajaran mesin yang lebih sederhana hanya mencakup menunjukkan komputer berbagai foto (atau memasoknya dengan data mentah lainnya), memasukkan ide melalui proses menggunakan pembelajaran mesin yang diawasi dan label data, dan memiliki komputer akhirnya dapat membedakan antara berbagai bentuk atau item dalam bidang visual. (Untuk dasar-dasar pembelajaran mesin, lihat Machine Learning 101.)

Dua Disiplin Mutakhir

Kesimpulannya, pembelajaran mesin adalah bagian berharga dari ilmu data. Tetapi ilmu data mewakili perbatasan vaster dan con di mana pembelajaran mesin berlangsung.

Bisa dibilang, pembelajaran mesin tidak akan pernah terjadi tanpa data besar. Namun, data besar itu sendiri tidak menciptakan pembelajaran mesin - sebaliknya, setelah kami secara kolektif mengumpulkan begitu banyak data sehingga kami hampir tidak tahu apa yang harus dilakukan dengan itu, para pemikir top datang dengan proses bio-simulasi ini sebagai cara supercharged memberikan wawasan.

Hal baik lain yang perlu diingat di sini adalah bahwa ilmu data dapat diterapkan dalam dua cara utama - kita dapat merangkul pembelajaran mesin dan kecerdasan buatan, membiarkan komputer berpikir untuk kita, atau kita dapat membawa ilmu data kembali ke pendekatan yang lebih berpusat pada manusia di mana komputer hanya menyajikan hasil dan kita sebagai manusia membuat keputusan.

Itulah yang memimpin beberapa pakar, termasuk beberapa inovator top saat ini, untuk meminta penghitungan yang lebih bersemangat tentang cara kami menggunakan teknologi ini.

"(AI) mampu jauh lebih banyak dari yang diketahui siapa pun dan tingkat peningkatannya eksponensial," kata Elon Musk, sambil mengingatkan bahwa pembelajaran mesin dan program AI membutuhkan pengawasan.

Bagaimanapun, ilmu data dan pembelajaran mesin adalah bagian inti dari kemajuan yang kita sebagai masyarakat ciptakan dalam teknologi saat ini.