Reinforcement Learning Models

Browse AI models for multimodal decomposition and recomposition pipelines — plug any model into your extractors.

215 models available

Start free Schedule Demo Read Documentation

Showing 1–24 of 215 models

Reinforcement Learning

HumanCompatibleAI/ppo-seals-CartPole-v0

45K

stable-baselines3

View Details

Reinforcement Learning

HumanCompatibleAI/ppo-Pendulum-v1

19K

stable-baselines3

View Details

Reinforcement Learning

mradermacher/AReaL-SEA-235B-A22B-i1-GGUF

15K

transformers

View Details

Reinforcement Learning

TianheWu/VisualQuality-R1-7B

View Details

Reinforcement Learning

mradermacher/Aryabhata-2.0-i1-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/SpatialThinker-30B-i1-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/GoLongRL-4B-i1-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/TinyResearcher-i1-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/Vero-Qwen35-9B-Base-i1-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/ChineseErrorCorrector4-4B-i1-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/Vero-Qwen35-9B-i1-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/Reflector-Internalizing-Safety-Llama-3.1-8B-RL-i1-GGUF

transformers

View Details

Reinforcement Learning

sb3/ppo-LunarLanderContinuous-v2

stable-baselines3

View Details

Reinforcement Learning

mradermacher/Aryabhata-2.0-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/LongTraceRL-30B-i1-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/DeepHermes-Egregore-v1-RLAIF-8b-Atropos-i1-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/GALAX-i1-GGUF

transformers

View Details

Reinforcement Learning

sb3/sac-BipedalWalkerHardcore-v3

stable-baselines3

View Details

Reinforcement Learning

mradermacher/LongTraceRL-4B-i1-GGUF

transformers

View Details

Reinforcement Learning

ValueFX9507/Tifa-Deepsex-14b-CoT-GGUF-Q4

838

transformers

View Details

Reinforcement Learning

nicklashansen/newt

View Details

Reinforcement Learning

infly/inf-retriever-v1-pro

View Details

Reinforcement Learning

mradermacher/MediX-R1-8B-i1-GGUF

transformers

View Details

Reinforcement Learning

mradermacher/MediX-R1-2B-i1-GGUF

transformers

View Details

...

1 / 9

Connectors

Retrievers