Welcome to trlX's documentation!

trlX is a library made for training large language models using reinforcement learning. It currently supports training using PPO or ILQL for models up to 20B using Accelerate.

.. toctree::
   :maxdepth: 2
   :caption: Contents:

   data
   models
   configs
   pipeline
   examples

Indices and tables

:ref:`genindex`
:ref:`modindex`
:ref:`search`

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

index.rst

index.rst

Welcome to trlX's documentation!

Indices and tables

Files

index.rst

Latest commit

History

index.rst

File metadata and controls

Welcome to trlX's documentation!

Indices and tables