Pengendalian gerak robot yang optimal dalam pencapaian tujuan sangat diperlukan dalam penentuan kinerja robot. Gerakan robot yang optimal dapat meminimalkan energi atau waktu yang diperlukan. Metode Reinforcement Learning dapat diterapkan pada robot untuk menentukan tindakan idela secara otomatis dalam keadaan tertentu, dalam rangka memaksimalkan kinerja robot. Pada paper ini diuraikan tentang pengembangan perangkat lunak yang digunakan untuk pengendalian gerak robot menggunakan metode Reinforcement Learning. Pembelajaran agen pada metode Reinforcement Learning dilakukan estimasi dari masing-masing nilai state-action, dengan perhitungan nilai reward dan pemilihan harga maksimum untuk setiap action. Simulasi dilakukan untuk penentuan gerak robot pada ruang yang terdiri dari 6 ruang bagian dengan satu ruang bagian sebagai tujuan. Ujicoba menunjukkan bahwa aplikasi yang dibuat mampu melakukan pemilihan action untuk mendapatkan gerak robot yang optimal, sehingga dapat meminimalkan energi dan waktu.