Reinforcement Learning Models

Browse AI models for multimodal decomposition and recomposition pipelines — plug any model into your extractors.

215 models available

Start free Schedule Demo Read Documentation

Showing 193–215 of 215 models

Reinforcement Learning

mradermacher/Pluto-GGUF

240

transformers

View Details

Reinforcement Learning

sb3/ppo-CarRacing-v0

240

stable-baselines3

View Details

Reinforcement Learning

mradermacher/CIM-Qwen2-VL-7B-GGUF

238

transformers

View Details

Reinforcement Learning

wanglab/bioreason-pro-rl

236

View Details

Reinforcement Learning

mradermacher/IntelliAsk-Qwen3-32B-450-Merged-GGUF

232

transformers

View Details

Reinforcement Learning

mradermacher/CIM-Qwen2-VL-7B-SFT-GGUF

227

transformers

View Details

Reinforcement Learning

mradermacher/Vero-Qwen3T-8B-i1-GGUF

223

transformers

View Details

Reinforcement Learning

Raiden-1001/poca-Soccerv7

222

ml-agents

View Details

Reinforcement Learning

mradermacher/PRIMO-COT-SFT-7B-GGUF

221

transformers

View Details

Reinforcement Learning

mradermacher/R-PRM-7B-DPO-i1-GGUF

221

transformers

View Details

Reinforcement Learning

mradermacher/Vero-Qwen25-7B-i1-GGUF

220

transformers

View Details

Reinforcement Learning

mradermacher/HER-32B-i1-GGUF

220

transformers

View Details

Reinforcement Learning

RLinf/RLinf-OpenVLAOFT-LIBERO-130

217

View Details

Reinforcement Learning

sb3/sac-HalfCheetah-v3

216

stable-baselines3

View Details

Reinforcement Learning

mradermacher/Miner-8B-i1-GGUF

212

transformers

View Details

Reinforcement Learning

cjksofm/ppo-LunarLander-v3

210

stable-baselines3

View Details

Reinforcement Learning

mradermacher/PulseMind-72B-i1-GGUF

204

transformers

View Details

Reinforcement Learning

mradermacher/Tifa-DeepsexV2-7b-MGRPO-safetensors-GGUF

204

transformers

View Details

Reinforcement Learning

mradermacher/ToolOmni-Qwen3-4B-i1-GGUF

203

transformers

View Details

Reinforcement Learning

tarmus/hw3-rl-models

201

stable-baselines3

View Details

Reinforcement Learning

werdunkel/losingit

200

stable-baselines3

View Details

Reinforcement Learning

Srgreen/ppo-LunarLander-v3

198

stable-baselines3

View Details

Reinforcement Learning

mradermacher/Miner-4B-i1-GGUF

191

transformers

View Details

...

9 / 9

Connectors

Retrievers