Perpustakaan Fakultas Ilmu Komputer

Call Number	SK-2501 (Softcopy SK-1983)
Collection Type	Skripsi
Title	Bencharking Algorithmic Variations in Average-Reward Policy Evaluation Reinforcement Learning
Author	Clarissa Thea Aryanto;
Publisher	Depok: Fasilkom UI, 2025
Subject	Reinforcementlearning
Location	FASILKOM-UI;

Lokasi : Perpustakaan Fakultas Ilmu Komputer

Nomor Panggil	ID Koleksi	Status
SK-2501 (Softcopy SK-1983)		TERSEDIA

SK-2501 (softcopy SK-1983) Clarissa Thea Aryanto_2106634673.pdf

Tidak ada review pada koleksi ini: 55991

ABSTRAK

Nama :ClarissaTheaAryanto Program Studi:IlmuKomputer Judul :KomparasiVariasiAlgoritmikDalamAverage-Reward Policy-EvaluationReinforcementLearning Pembimbing :Prof.Dr.Eng.WisnuJatmiko,S.T.,M.Kom. VektorDewanto,S.T.,M.Eng.,Ph.D. Karya inimenelitiberbagaimetode policy evaluation dalam average-rewardsetting, yang berfokuspadakinerjaberbagaimetodeaproksimasi gain dan bias. Penelitian ini membandingkanmetode-metodeaproksimasi gain seperti: stochasticapproxima- tion, stochasticapproximationwithTD, batchmethodsusingsampleaverages, dan batchmethodswithstatereference. Sertametodeaproksimasibiasseperti: tabular, parameterizedactionvalues, dan parameterizedactionadvantages. Hasilpenelitian menunjukkan bahwametode batchmethodswithstatereference dan parameterized action values mencapai konvergensidan gain yang terbaik.Sementarametode stochastic approximation menunjukkan variansyanglebihtinggi.Studiinimemberikananalisis empiris mengenaikelebihandankekurangandarimasing-masingkombinasimetode.