Library Automation and Digital Archive
LONTAR
Fakultas Ilmu Komputer
Universitas Indonesia

Pencarian Sederhana

Find Similar Add to Favorite

Call Number SK-2501 (Softcopy SK-1983)
Collection Type Skripsi
Title Bencharking Algorithmic Variations in Average-Reward Policy Evaluation Reinforcement Learning
Author Clarissa Thea Aryanto;
Publisher Depok: Fasilkom UI, 2025
Subject Reinforcementlearning
Location FASILKOM-UI;
Lokasi : Perpustakaan Fakultas Ilmu Komputer
Nomor Panggil ID Koleksi Status
SK-2501 (Softcopy SK-1983) TERSEDIA
Tidak ada review pada koleksi ini: 55991
ABSTRAK

Nama :ClarissaTheaAryanto Program Studi:IlmuKomputer Judul :KomparasiVariasiAlgoritmikDalamAverage-Reward Policy-EvaluationReinforcementLearning Pembimbing :Prof.Dr.Eng.WisnuJatmiko,S.T.,M.Kom. VektorDewanto,S.T.,M.Eng.,Ph.D. Karya inimenelitiberbagaimetode policy evaluation dalam average-rewardsetting, yang berfokuspadakinerjaberbagaimetodeaproksimasi gain dan bias. Penelitian ini membandingkanmetode-metodeaproksimasi gain seperti: stochasticapproxima- tion, stochasticapproximationwithTD, batchmethodsusingsampleaverages, dan batchmethodswithstatereference. Sertametodeaproksimasibiasseperti: tabular, parameterizedactionvalues, dan parameterizedactionadvantages. Hasilpenelitian menunjukkan bahwametode batchmethodswithstatereference dan parameterized action values mencapai konvergensidan gain yang terbaik.Sementarametode stochastic approximation menunjukkan variansyanglebihtinggi.Studiinimemberikananalisis empiris mengenaikelebihandankekurangandarimasing-masingkombinasimetode.