Pembelajaran Penguatan Dapat Memberikan Perputaran Dinamis yang Bagus untuk Pemasaran

Pengarang: Roger Morrison
Tanggal Pembuatan: 1 September 2021
Tanggal Pembaruan: 1 Juli 2024
Anonim
Webinar Penguatan Peran Pustakawan dalam Meningkatkan Penelitian di Perguruan Tinggi
Video: Webinar Penguatan Peran Pustakawan dalam Meningkatkan Penelitian di Perguruan Tinggi

Isi



Sumber: Juliatimchenko / Dreamstime.com

Bawa pulang:

Pembelajaran penguatan adalah bagian dari kecerdasan buatan dan pembelajaran mesin yang dapat memprediksi hasil dan membantu pengguna membuat keputusan yang lebih baik.

Pemasar terus mencari solusi yang scalable dan cerdas ketika mencoba untuk mendapatkan keunggulan dalam kondisi pemasaran yang semakin kompetitif. Tidak heran kecerdasan buatan (AI) dan pembelajaran mesin (ML) sekarang diadopsi secara massal oleh merek dan organisasi pemasaran mereka. (Untuk mempelajari lebih lanjut tentang dasar-dasar ML, lihat Machine Learning 101.)

Untuk yang belum tahu, AI secara umum dapat dianggap sebagai teknologi ketika komputer mengotomatiskan tugas-tugas yang ditentukan yang seharusnya dilakukan manusia. Pembelajaran mesin, sebagai area fungsional dalam AI, adalah ketika komputer diberikan tujuan akhir, tetapi perlu menghitung rute terbaik sendiri.

Hari ini, kami melihat teknologi ini - terutama pembelajaran mesin - yang digunakan di banyak bidang pemasaran, termasuk deteksi penipuan iklan, perkiraan perilaku konsumen, sistem rekomendasi, personalisasi kreatif, dan banyak lagi.


Sementara itu semua baik dan bagus, ada teknologi cabang baru yang, bagi pemasar, akan benar-benar memenuhi permintaan yang diciptakan pembelajaran mesin. Ini disebut "penguatan pembelajaran" (RL).

Apa itu Pembelajaran Penguatan?

Langkah-perubahan dari ML ke RL lebih dari sekedar huruf. Sebagian besar tugas yang diserahkan ke pembelajaran mesin melibatkan penggunaan satu langkah, seperti "mengenali gambar ini," "memahami konten buku" atau "menangkap penipuan." Untuk pemasar, tujuan bisnis seperti "menarik, mempertahankan, dan melibatkan pengguna" adalah inheren multi-langkah dan jangka panjang, tidak mudah dicapai dengan pembelajaran mesin.

Di sinilah pembelajaran penguatan masuk. Algoritma RL adalah tentang mengoptimalkan untuk perjalanan yang berlangsung dan terus berubah - yang mana masalah dinamis terjadi. Dengan menggunakan "fungsi hadiah" matematika untuk menghitung hasil dari setiap permutasi, RL dapat melihat ke masa depan dan membuat panggilan yang tepat.


Saat ini, perwujudan terbaik dari teknologi mutakhir ini dapat dilihat dalam permainan dan mobil self-driving. Ketika sistem Google AlphaGo mengalahkan pemain papan permainan Go terbaik dunia tahun lalu, saus rahasia mereka adalah pembelajaran yang menguatkan. Sementara permainan telah menetapkan aturan, opsi pemain untuk rute menuju kemenangan berubah secara dinamis berdasarkan kondisi dewan. Dengan pembelajaran penguatan, sistem memperhitungkan semua kemungkinan permutasi yang mungkin berubah berdasarkan setiap langkah selanjutnya.

Demikian pula, mobil yang dapat menyetir sendiri melakukan perjalanan di mana aturan jalan dan lokasi tujuan tetap, tetapi variabel di sepanjang jalan - dari pejalan kaki ke blok jalan hingga pengendara sepeda - berubah secara dinamis. Itulah sebabnya OpenAI, organisasi yang didirikan oleh Tesla's Elon Musk, menggunakan algoritma RL canggih untuk kendaraannya.

Tanpa Bug, Tanpa Stres - Panduan Langkah Demi Langkah Anda untuk Membuat Perangkat Lunak yang Mengubah Hidup Tanpa Menghancurkan Kehidupan Anda


Anda tidak dapat meningkatkan keterampilan pemrograman Anda ketika tidak ada yang peduli dengan kualitas perangkat lunak.

Mesin untuk Pemasar

Apa arti semua ini bagi pemasar?

Banyak tantangan inti pemasar diciptakan oleh kenyataan bahwa kondisi bisnis berubah sepanjang waktu. Strategi kampanye yang menang dapat menjadi tidak disukai dari waktu ke waktu, sementara strategi yang lama dapat memperoleh daya tarik baru. RL adalah langkah untuk meniru kecerdasan manusia sejati di mana kita belajar dari keberhasilan dan / atau kegagalan berbagai hasil, dan membentuk strategi kemenangan di masa depan. Izinkan saya memberikan beberapa contoh:

1. Peningkatan keterlibatan pengguna

Mari kita fokus pada keterlibatan pelanggan untuk rantai restoran, dan tujuan untuk melipatgandakannya sepuluh kali lipat untuk tahun berikutnya. Saat ini, kampanye pemasaran mungkin melibatkan ucapan selamat ulang tahun dengan penawaran diskon, bahkan mungkin berdasarkan preferensi makanan. Ini adalah pemikiran linier di mana pemasar telah menetapkan titik awal dan akhir.

Dalam dunia yang sibuk, kehidupan pelanggan terus berubah secara waktu nyata - terkadang mereka lebih terlibat, kadang kurang. Dalam pembelajaran penguatan, suatu sistem akan secara konstan mengkalibrasi ulang taktik mana dalam gudang pemasaran, pada saat tertentu, yang memiliki peluang terbaik untuk menggerakkan penerima ke arah tujuan akhir dari keterlibatan 10x.

2. Alokasi anggaran yang dinamis

Sekarang bayangkan sebuah skenario periklanan di mana Anda memiliki anggaran $ 1 juta dan perlu menghabiskan beberapa setiap hari sampai akhir bulan, dialokasikan di empat saluran yang berbeda: TV, promosi loyalitas, dan Google. Bagaimana Anda dapat memastikan Anda menghabiskan anggaran dengan cara yang paling optimal? Jawabannya tergantung pada hari, target pengguna, harga persediaan dan sejumlah faktor lainnya.

Dalam pembelajaran penguatan, algoritma akan menggunakan data hasil iklan historis untuk menulis fungsi hadiah yang mencetak keputusan pengeluaran tertentu. Tetapi juga memperhitungkan faktor waktu nyata seperti harga dan kemungkinan penerimaan positif dari anggota audiens target. Melalui pembelajaran berulang, alokasi belanja iklan sepanjang bulan akan berubah secara dinamis. Meskipun tujuan akhir telah ditetapkan, RL akan mengalokasikan anggaran dengan cara sebaik mungkin melalui semua skenario. (Untuk lebih lanjut tentang AI dalam pemasaran, lihat Bagaimana Kecerdasan Buatan Akan Merevolusi Industri Penjualan.)

Segera akan datang

Pembelajaran penguatan mengakui kompleksitas dan mengakui bahwa orang-orang heterogen dan menjelaskan kebenaran-kebenaran ini, meningkatkan setiap tindakan selanjutnya seiring berjalannya waktu ketika potongan papan permainan Anda berubah di sekitarnya.

Pembelajaran penguatan masih sebagian besar merupakan kelestarian proyek penelitian dan pengadopsi terdepan. Konsep dan teknik matematika telah ada selama lebih dari 40 tahun, tetapi belum memungkinkan untuk diterapkan sampai saat ini, berkat tiga tren:

  1. Proliferasi daya komputasi melalui GPU (GPU).

  2. Cloud computing membuat daya prosesor high-end tersedia di sebagian kecil dari biaya pembelian GPU sendiri, memungkinkan pihak ketiga untuk menyewa GPU untuk melatih model RL mereka selama beberapa jam, hari atau minggu dengan harga basement yang relatif murah.

  3. Peningkatan dalam algoritma numerik atau heuristik pintar. Beberapa langkah numerik penting dalam algoritma RL sekarang dapat menyatu dengan kecepatan yang jauh lebih cepat. Tanpa trik numerik ajaib ini, mereka masih tidak akan layak bahkan dengan komputer paling kuat saat ini.

Berpikir Lebih Besar

Semua ini berarti kekuatan baru pembelajaran penguatan akan segera tersedia dalam skala untuk merek dan pemasar. Namun, merangkulnya akan membutuhkan perubahan pola pikir. Bagi seorang manajer pemasaran, teknologi ini berarti kemampuan untuk melepaskan tangan mereka.

Setiap bisnis memiliki tujuan, tetapi ketika Anda berada di dalam parit, tindakan harian yang diambil untuk mencapai tujuan itu dapat menjadi kabur. Sekarang teknologi RL akan memungkinkan para pembuat keputusan untuk menetapkan tujuan, dengan lebih percaya diri bahwa sistem akan merencanakan jalan terbaik mereka ke arah itu.

Dalam periklanan, misalnya, hari ini banyak orang menyadari bahwa metrik seperti rasio klik-tayang (RKT) hanyalah proksi untuk hasil bisnis sejati, dihitung hanya karena mereka dapat dihitung. Sistem pemasaran yang digerakkan oleh RL akan mengurangi metrik perantara seperti itu dan semua beban berat yang terkait dengannya, memungkinkan bos untuk fokus pada tujuan.

Ini akan membutuhkan bisnis untuk memikirkan masalah besar mereka dengan cara yang jauh lebih proaktif dan jangka panjang. Ketika teknologi sudah matang, mereka akan mencapai tujuan mereka.

Jalan Menuju Adopsi

Pembelajaran penguatan belum siap untuk penggunaan skala penuh oleh merek; namun, pemasar harus meluangkan waktu untuk memahami konsep baru ini yang dapat merevolusi cara pemasaran merek, menjadikan baik pada beberapa janji awal pembelajaran mesin.

Ketika daya tiba, itu akan datang dalam perangkat lunak pemasaran dengan antarmuka pengguna, tetapi tugas-tugas yang diperlukan oleh perangkat lunak itu akan disederhanakan secara radikal. Untuk staf, akan ada lebih sedikit saklar yang bergerak dan memasukkan angka, serta lebih sedikit membaca laporan analitik dan menindaklanjutinya. Di belakang dashboard, algoritma akan menangani sebagian besar dari itu.

RL tidak mungkin bisa menandingi kecerdasan manusia langsung dari gerbang. Kecepatan pengembangannya akan tergantung pada umpan balik dan saran dari pemasar. Kita harus memastikan bahwa kita meminta komputer untuk memecahkan masalah yang tepat, dan menghukumnya ketika tidak. Kedengarannya seperti bagaimana Anda akan mengajar anak Anda sendiri, bukan?