Reinforcement Learning Models

Browse AI models for multimodal decomposition and recomposition pipelines — plug any model into your extractors.

215 models available

Start free Schedule Demo Read Documentation

Showing 145–168 of 215 models

Reinforcement Learning

PKU-Alignment/beaver-7b-v3.0-reward

295

safe-rlhf

View Details

Reinforcement Learning

ValueFX9507/Tifa-DeepsexV2-7b-MGRPO-GGUF-F16

292

transformers

View Details

Reinforcement Learning

divyasridoredla/traffic-incident-resilient

292

stable-baselines3

View Details

Reinforcement Learning

TianheWu/VisualQuality-R1-7B-preview

290

View Details

Reinforcement Learning

manlong/dqn-SpaceInvadersNoFrameskip-v4

289

stable-baselines3

View Details

Reinforcement Learning

mradermacher/sft_14B-GGUF

288

transformers

View Details

Reinforcement Learning

mradermacher/Miner-4B-GGUF

285

transformers

View Details

Reinforcement Learning

mradermacher/SIRI-7B-high-i1-GGUF

285

transformers

View Details

Reinforcement Learning

mradermacher/nexus-1.5b-i1-GGUF

284

transformers

View Details

Reinforcement Learning

JohnRoger/SU-01-Q4_K_M-GGUF

284

View Details

Reinforcement Learning

sb3/tqc-FetchPickAndPlace-v1

282

stable-baselines3

View Details

Reinforcement Learning

mradermacher/drkernel-14b-i1-GGUF

282

transformers

View Details

Reinforcement Learning

mradermacher/NurseSim-Triage-Llama-3.2-3B-GGUF

280

transformers

View Details

Reinforcement Learning

Sudhish-Poojary/ppo-LunarLander-v3

279

stable-baselines3

View Details

Reinforcement Learning

SSGoatt/poca-SoccerTwos

279

ml-agents

View Details

Reinforcement Learning

HoaAn2003/ppo-Huggy

279

ml-agents

View Details

Reinforcement Learning

mradermacher/SocialR1-4B-i1-GGUF

278

transformers

View Details

Reinforcement Learning

sb3/a2c-BreakoutNoFrameskip-v4

276

stable-baselines3

View Details

Reinforcement Learning

mradermacher/Orsta-7B-i1-GGUF

276

transformers

View Details

Reinforcement Learning

mradermacher/KnowRL-Nemotron-1.5B-i1-GGUF

275

transformers

View Details

Reinforcement Learning

mradermacher/ATLAS-8B-Thinking-i1-GGUF

275

transformers

View Details

Reinforcement Learning

mradermacher/MetaphorStar-3B-i1-GGUF

273

transformers

View Details

Reinforcement Learning

RLinf/RLinf-OpenVLAOFT-LIBERO-130-Base-Lora

272

View Details

Reinforcement Learning

mradermacher/Autobool-Qwen4b-Reasoning-conceptual-GGUF

269

transformers

View Details

...

7 / 9

Connectors

Retrievers