Call Number | SK-2501 (Softcopy SK-1983) |
Collection Type | Skripsi |
Title | Bencharking Algorithmic Variations in Average-Reward Policy Evaluation Reinforcement Learning |
Author | Clarissa Thea Aryanto; |
Publisher | Depok: Fasilkom UI, 2025 |
Subject | Reinforcementlearning |
Location | FASILKOM-UI; |
Nomor Panggil | ID Koleksi | Status |
---|---|---|
SK-2501 (Softcopy SK-1983) | TERSEDIA |
Nama :ClarissaTheaAryanto Program Studi:IlmuKomputer Judul :KomparasiVariasiAlgoritmikDalamAverage-Reward Policy-EvaluationReinforcementLearning Pembimbing :Prof.Dr.Eng.WisnuJatmiko,S.T.,M.Kom. VektorDewanto,S.T.,M.Eng.,Ph.D. Karya inimenelitiberbagaimetode policy evaluation dalam average-rewardsetting, yang berfokuspadakinerjaberbagaimetodeaproksimasi gain dan bias. Penelitian ini membandingkanmetode-metodeaproksimasi gain seperti: stochasticapproxima- tion, stochasticapproximationwithTD, batchmethodsusingsampleaverages, dan batchmethodswithstatereference. Sertametodeaproksimasibiasseperti: tabular, parameterizedactionvalues, dan parameterizedactionadvantages. Hasilpenelitian menunjukkan bahwametode batchmethodswithstatereference dan parameterized action values mencapai konvergensidan gain yang terbaik.Sementarametode stochastic approximation menunjukkan variansyanglebihtinggi.Studiinimemberikananalisis empiris mengenaikelebihandankekurangandarimasing-masingkombinasimetode.