Bagaimana kemampuan pembelajaran mesin baru memungkinkan penambangan dokumen stok untuk data keuangan?

Pengarang: Roger Morrison
Tanggal Pembuatan: 26 September 2021
Tanggal Pembaruan: 1 Juli 2024
Anonim
1 Hour Online Training: Data Management Body of Knowledge (DMBOK)
Video: 1 Hour Online Training: Data Management Body of Knowledge (DMBOK)

Isi

Q:

Bagaimana kemampuan pembelajaran mesin baru memungkinkan penambangan dokumen stok untuk data keuangan?


SEBUAH:

Salah satu batas baru yang menarik dari pembelajaran mesin dan AI adalah bahwa para ilmuwan dan insinyur sedang memulai berbagai cara untuk menggunakan jenis sumber daya yang sama sekali baru untuk memprediksi pergerakan stok dan hasil investasi. Ini adalah pengubah permainan yang luar biasa di dunia keuangan, dan akan merevolusi strategi investasi dengan cara yang sangat mendalam.

Salah satu ide dasar untuk memperluas jenis penelitian saham ini adalah linguistik komputasi, yang melibatkan pemodelan bahasa alami. Para ahli sedang menyelidiki bagaimana menggunakan dokumen, dari pengarsipan SEC untuk surat-surat pemegang saham ke sumber daya berbasis periferal lainnya, untuk menambah atau menyempurnakan analisis stok atau untuk mengembangkan analisis yang sama sekali baru.


Penafian penting adalah bahwa semua ini hanya dapat dilakukan melalui kemajuan baru dalam jaringan saraf, pembelajaran mesin dan analisis bahasa alami. Sebelum munculnya ML / AI, teknologi komputasi sebagian besar menggunakan pemrograman linier untuk "membaca" input. dokumen terlalu sangat terstruktur untuk berguna. Tetapi dengan kemajuan yang dibuat dalam analisis bahasa alami dalam beberapa tahun terakhir, para ilmuwan menemukan bahwa adalah mungkin untuk "menambang" bahasa alami untuk hasil yang dapat diukur atau, dengan kata lain, hasil yang dapat dihitung dengan cara tertentu.


Beberapa bukti terbaik dan contoh paling berguna dari ini berasal dari berbagai disertasi dan pekerjaan doktoral yang tersedia di web. Dalam sebuah makalah, "Aplikasi Pembelajaran Mesin dan Linguistik Komputasi dalam Ekonomi Keuangan," diterbitkan April 2016, Lili Gao mampu menjelaskan proses yang relevan khusus untuk penambangan pengarsipan SEC perusahaan, panggilan pemegang saham, dan media sosial.

"Mengekstraksi sinyal yang berarti dari data yang tidak terstruktur dan berdimensi tinggi bukanlah tugas yang mudah," tulis Gao."Namun, dengan pengembangan pembelajaran mesin dan teknik linguistik komputer, pemrosesan dan analisis statistik tugas dokumen dapat diselesaikan, dan banyak aplikasi analisis statistik dalam ilmu sosial telah terbukti berhasil." Dari diskusi Gaos tentang pemodelan dan kalibrasi secara abstrak, seluruh dokumen yang dikembangkan menunjukkan bagaimana beberapa jenis analisis ini bekerja secara detail.

Sumber lain untuk proyek aktif termasuk halaman seperti ringkasan proyek GitHub ini, dan sumber daya IEEE ini berbicara secara khusus tentang mendapatkan informasi keuangan yang berharga dari "analisis sentimen."


Intinya adalah bahwa penggunaan model-model NLP baru ini mendorong inovasi cepat dalam menggunakan semua jenis dokumen, tidak hanya untuk analisis keuangan, tetapi untuk jenis lain penemuan mutakhir, mengaburkan garis yang secara tradisional menetapkan antara "bahasa" dan " data."