offline-reinforcement-learning

Here are 82 public repositories matching this topic...

tinkoff-ai / CORL

High-quality single-file implementations of SOTA Offline and Offline-to-Online RL algorithms: AWAC, BC, CQL, DT, EDAC, IQL, SAC-N, TD3+BC, LB-SAC, SPOT, Cal-QL, ReBRAC

reinforcement-learning gym offline-reinforcement-learning d4rl

Updated Aug 3, 2023
Python

ikostrikov / jaxrl

Star

JAX (Flax) implementation of algorithms for Deep Reinforcement Learning with continuous action spaces.

reinforcement-learning deep-learning deep-reinforcement-learning gym flax behavioral-cloning sac continuous-control deep-deterministic-policy-gradient jax soft-actor-critic offline-reinforcement-learning batch-reinforcement-learning

Updated Oct 26, 2022
Jupyter Notebook

yihaosun1124 / OfflineRL-Kit

Star

An elegant PyTorch offline reinforcement learning library for researchers.

reinforcement-learning deep-learning deep-reinforcement-learning pytorch offline-reinforcement-learning offlinerl

Updated Apr 17, 2024
Python

Allenpandas / Reinforcement-Learning-Papers

Star

📚 List of Top-tier Conference Papers on Reinforcement Learning (RL)，including: NeurIPS, ICML, AAAI, IJCAI, AAMAS, ICLR, ICRA, etc.

Updated May 30, 2024

Cryolite / kanachan

Star

A Japanese (Riichi) Mahjong AI Framework

mahjong machine-learning reinforcement-learning deep-learning transformers deep-reinforcement-learning transformer dqn behavioral-cloning imitation-learning game-ai curriculum-learning japanese-mahjong riichi-mahjong mahjong-ai majsoul mahjong-soul offline-rl offline-reinforcement-learning

Updated Feb 16, 2025
Python

nikhilbarhate99 / min-decision-transformer

Star

Minimal implementation of Decision Transformer: Reinforcement Learning via Sequence Modeling in PyTorch for mujoco control tasks in OpenAI gym

machine-learning reinforcement-learning deep-learning robotics deep-reinforcement-learning openai-gym pytorch transformer mujoco pytorch-transformers offline-reinforcement-learning

Updated Jun 10, 2022
Python

polixir / OfflineRL

Star

A collection of offline reinforcement learning algorithms.

reinforcement-learning offline-reinforcement-learning

Updated Nov 26, 2024
Python

instadeepai / og-marl

Star

Datasets with baselines for offline multi-agent reinforcement learning.

reinforcement-learning multi-agent-reinforcement-learning offline-reinforcement-learning

Updated Mar 25, 2025
Python

nissymori / JAX-CORL

Star

Clean single-file implementation of offline RL algorithms in JAX

reinforcement-learning flax cql single-file jax awac iql offline-rl offline-reinforcement-learning d4rl decision-transformer td3bc

Updated Dec 24, 2024
Python

BY571 / CQL

Star

PyTorch implementation of the Offline Reinforcement Learning algorithm CQL. Includes the versions DQN-CQL and SAC-CQL for discrete and continuous action spaces.

machine-learning pytorch dqn reinforcement-learning-algorithms sac pytorch-implementation discrete-sac offline-reinforcement-learning

Updated May 6, 2024
Python

polixir / NeoRL

Star

Python interface for accessing the near real-world offline reinforcement learning (NeoRL) benchmark datasets

offline-reinforcement-learning

Updated Nov 21, 2024
Python

ZhengyaoJiang / latentplan

Star

Code release for Efficient Planning in a Compact Latent Action Space (ICLR2023) https://arxiv.org/abs/2208.10291.

reinforcement-learning transformer generative-model model-based-reinforcement-learning offline-reinforcement-learning

Updated May 12, 2023
Python

ZhengYinan-AIR / FISOR

Star

[ICLR 2024] The official implementation of "Safe Offline Reinforcement Learning with Feasibility-Guided Diffusion Model"

reinforcement-learning imitation-learning jax safe-reinforcement-learning diffusion-models offline-reinforcement-learning hamilton-jacobi-reachability

Updated Feb 11, 2025
Python

snu-mllab / EDAC

Star

Official PyTorch implementation of "Uncertainty-Based Offline Reinforcement Learning with Diversified Q-Ensemble" (NeurIPS'21)

offline-reinforcement-learning

Updated Aug 14, 2022
Python

Pytorch Implementation of Stochastic MuZero for gym environment. This algorithm is capable of supporting a wide range of action and observation spaces, including both discrete and continuous variations.