Machine Learning

Jasa Bimbingan Skripsi Tesis Disertasi Python | Artificial Intelligence: Reinforcement Learning Python

Panduan lengkap Pembelajaran Penguatan, dengan Aplikasi Perdagangan Saham dan Periklanan Online

Apa yang akan Anda pelajari

  • Terapkan metode pembelajaran mesin terawasi berbasis gradien ke pembelajaran penguatan
  • Memahami pembelajaran penguatan pada tingkat teknis
  • Memahami hubungan antara pembelajaran penguatan dan psikologi
  • Terapkan 17 algoritma pembelajaran penguatan yang berbeda

Persyaratan

  • Kalkulus (turunan)
  • Model Probabilitas / Markov
  • Numpy, Matplotlib
  • Bermanfaat untuk memiliki pengalaman dengan setidaknya beberapa metode pembelajaran mesin yang diawasi
  • Penurunan gradien
  • Keterampilan pemrograman berorientasi objek

Keterangan

Ketika orang berbicara tentang kecerdasan buatan , mereka biasanya tidak bermaksud pembelajaran mesin yang diawasi dan tidak diawasi .

Tugas-tugas ini cukup sepele dibandingkan dengan apa yang kami pikirkan tentang AI – bermain catur dan Go, mengendarai mobil, dan mengalahkan video game di level manusia super.

Pembelajaran penguatan baru-baru ini menjadi populer untuk melakukan semua itu dan lebih banyak lagi.

Sama seperti pembelajaran mendalam , banyak teori ditemukan pada tahun 70-an dan 80-an tetapi baru belakangan ini kami dapat mengamati secara langsung hasil luar biasa yang mungkin terjadi.

Pada tahun 2016 kami melihat Google AlphaGo mengalahkan Juara dunia dalam Go.

Kami melihat AI memainkan video game seperti Doom dan Super Mario.

Mobil self-driving sudah mulai melaju di jalan nyata dengan pengemudi lain dan bahkan membawa penumpang ( Uber ), semuanya tanpa bantuan manusia.

Jika kedengarannya luar biasa, persiapkan diri Anda untuk masa depan karena hukum percepatan pengembalian menyatakan bahwa kemajuan ini hanya akan terus meningkat secara eksponensial.

Mempelajari tentang pembelajaran mesin yang diawasi dan tidak diawasi bukanlah hal yang mudah.

Namun pembelajaran penguatan membuka dunia baru. Seperti yang akan Anda pelajari dalam kursus ini, paradigma pembelajaran penguatan sangat baik dari pembelajaran yang diawasi dan tidak diawasi.

Ini mengarah pada wawasan baru dan menakjubkan baik dalam psikologi perilaku dan ilmu saraf. Seperti yang akan Anda pelajari dalam kursus ini, ada banyak proses analogi dalam mengajar agen dan mengajar hewan atau bahkan manusia. Itu adalah hal terdekat yang kita miliki sejauh ini dengan kecerdasan umum buatan yang sebenarnya. Apa yang tercakup dalam kursus ini?

  • Masalah multi-bandit bersenjata dan dilema eksplorasi-eksploitasi
  • Cara menghitung rata-rata dan rata-rata bergerak serta hubungannya dengan penurunan gradien stokastik
  • Proses Keputusan Markov (MDP)
  • Pemrograman Dinamis
  • Montecarlo
  • Pembelajaran Temporal Difference (TD) (Q-Learning dan SARSA)
  • Metode Perkiraan (yaitu cara menyambungkan jaringan saraf yang dalam atau model yang dapat dibedakan lainnya ke dalam algoritme RL Anda)
  • Cara menggunakan OpenAI Gym, tanpa perubahan kode
  • Proyek: Terapkan Q-Learning untuk membuat bot perdagangan saham

Jika Anda siap menghadapi tantangan baru, dan mempelajari tentang teknik AI yang belum pernah Anda lihat sebelumnya dalam pembelajaran mesin terawasi tradisional, pembelajaran mesin tanpa pengawasan, atau bahkan pembelajaran mendalam, maka kursus ini cocok untuk Anda.

“Jika Anda tidak dapat menerapkannya, Anda tidak memahaminya”

  • Atau seperti yang dikatakan fisikawan hebat Richard Feynman: “Apa yang tidak dapat saya buat, saya tidak mengerti”.
  • Kursus ini adalah SATU-SATUNYA kursus di mana Anda akan mempelajari cara menerapkan algoritme pembelajaran mesin dari awal
  • Kursus lain akan mengajari Anda cara menyambungkan data ke perpustakaan, tetapi apakah Anda benar-benar membutuhkan bantuan dengan 3 baris kode?
  • Setelah melakukan hal yang sama dengan 10 kumpulan data, Anda menyadari bahwa Anda tidak mempelajari 10 hal. Anda mempelajari 1 hal, dan hanya mengulangi 3 baris kode yang sama sebanyak 10 kali…

Prasyarat yang disarankan:

  • Kalkulus
  • Kemungkinan
  • Pemrograman berorientasi objek
  • Pengodean python: if/else, loop, daftar, dikte, set
  • Pengodean numpy: operasi matriks dan vektor
  • Regresi linier
  • Penurunan gradien

FITUR UNIK

  • Setiap baris kode dijelaskan secara detail
  • Tidak ada waktu yang terbuang untuk “mengetik” pada keyboard
  • Tidak takut dengan matematika tingkat universitas – dapatkan detail penting tentang algoritma

Untuk siapa kursus ini:

  • Siapa pun yang ingin belajar tentang kecerdasan buatan, ilmu data, pembelajaran mesin, dan pembelajaran mendalam
  • Baik mahasiswa maupun profesional

Related Articles

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *

Back to top button