Hierarchical Reinforcement Learning based on Planning Operators

Introduction

Paper website: https://arxiv.org/abs/2309.14237

Authors: Jing Zhang, Karinne Ramirez-Amaro

Framework

Setup

[email protected]:jingzhang00/RL_operator.git

pip install -r requirements.txt

Training

cd scripts/experiments
bash main.bash 42 cuda:0 stack_2

Independent Policy Evaluation

without render

cd scripts/evaluation
bash visualize_model.bash 37 "trained_model/" "state_dict.pt" "sacx_experiment_setting.pkl" 50 5 false

render

bash visualize_model.bash 37 "trained_model/" "state_dict.pt" "sacx_experiment_setting.pkl" 50 5 true

for other policies, change the last number "5", (open:0, close:1, reach:2, lift:3, move:4, stack:5)

Note

Current hyperparameters only apply for 2 blocks, more blocks need fine-tuning.
As for planning success rate, it was evaluated through training process, check "/home/omen/Downloads/RL_operator/trained_model/tensorboard":

cd trained_model
tensorboard --logdir=tensorboard

then it is shown in "evaluation_info/epoch_success_rate".

Name		Name	Last commit message	Last commit date
Latest commit History 17 Commits
manipulator_learning		manipulator_learning
rl_sandbox		rl_sandbox
scripts		scripts
trained_model		trained_model
README.md		README.md
framework.jpg		framework.jpg
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Hierarchical Reinforcement Learning based on Planning Operators

Introduction

Framework

Setup

Training

Independent Policy Evaluation

without render

render

Note

About

Releases

Packages

Languages

jingzhang00/RL_operator

Folders and files

Latest commit

History

Repository files navigation

Hierarchical Reinforcement Learning based on Planning Operators

Introduction

Framework

Setup

Training

Independent Policy Evaluation

without render

render

Note

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages