Deep Q-Networks

Pengarang: Laura McKinney
Tanggal Pembuatan: 5 April 2021
Tanggal Pembaruan: 26 Juni 2024
Anonim
Deep Q-Learning - Combining Neural Networks and Reinforcement Learning
Video: Deep Q-Learning - Combining Neural Networks and Reinforcement Learning

Isi

Definisi - Apa artinya Deep Q-Networks?

Deep Q Networks (DQN) adalah jaringan saraf (dan / atau alat terkait) yang memanfaatkan pembelajaran Q mendalam untuk menyediakan model seperti simulasi permainan video game yang cerdas. Alih-alih menjadi nama spesifik untuk membangun jaringan saraf tertentu, Deep Q Networks dapat terdiri dari jaringan saraf convolutional dan struktur lain yang menggunakan metode khusus untuk mempelajari berbagai proses.


Pengantar Microsoft Azure dan Microsoft Cloud | Sepanjang panduan ini, Anda akan mempelajari tentang apa itu cloud computing dan bagaimana Microsoft Azure dapat membantu Anda untuk bermigrasi dan menjalankan bisnis Anda dari cloud.

Techopedia menjelaskan Deep Q-Networks

Metode pembelajaran Q mendalam biasanya menggunakan sesuatu yang disebut iterasi kebijakan umum, yang digambarkan sebagai gabungan dari evaluasi kebijakan dan iterasi kebijakan, untuk mempelajari kebijakan dari input sensorik dimensi tinggi.

Misalnya, tipe umum dari jaringan Q mendalam yang tercakup dalam publikasi teknologi seperti Medium mengambil input sensorik dari Atari 2600 video game untuk memodelkan hasil. Ini dilakukan pada level yang sangat mendasar dengan mengumpulkan sampel, menyimpannya dan menggunakannya untuk replay pengalaman untuk memperbarui jaringan Q.

Secara umum, jaringan Q yang dalam melatih input yang mewakili pemain aktif di area atau sampel berpengalaman lainnya dan belajar untuk mencocokkan data tersebut dengan output yang diinginkan. Ini adalah metode yang kuat dalam pengembangan kecerdasan buatan yang dapat memainkan permainan seperti catur di tingkat tinggi, atau melakukan aktivitas kognitif tingkat tinggi lainnya - contoh bermain video game Atari atau catur juga merupakan contoh yang baik tentang bagaimana AI menggunakan jenis antarmuka yang secara tradisional digunakan oleh agen manusia.


Dengan kata lain, dengan pembelajaran Q mendalam, pemain AI menjadi lebih seperti pemain manusia dalam belajar untuk mencapai hasil yang diinginkan.