EnergyAI
/

Qwen3.5-0.8B-GRPO

Model card Files Files and versions

Qwen3.5-0.8B-GRPO

1.52 GB

Ctrl+K

Ctrl+K

1 contributor

History: 5 commits

Omarito101's picture

Update README.md

3a0bed7 verified about 2 months ago

.gitattributes

1.57 kB
Upload Qwen3.5-0.8B-GRPO (checkpoint-1000) — GRPO post-trained MCQ verifier 2 months ago
README.md

152 Bytes
Update README.md about 2 months ago
chat_template.jinja

7.76 kB
Upload Qwen3.5-0.8B-GRPO (checkpoint-1000) — GRPO post-trained MCQ verifier 2 months ago
config.json

1.8 kB
Upload Qwen3.5-0.8B-GRPO (checkpoint-1000) — GRPO post-trained MCQ verifier 2 months ago
generation_config.json

156 Bytes
Upload Qwen3.5-0.8B-GRPO (checkpoint-1000) — GRPO post-trained MCQ verifier 2 months ago
model.safetensors

1.5 GB
xet

Upload Qwen3.5-0.8B-GRPO (checkpoint-1000) — GRPO post-trained MCQ verifier 2 months ago
plot_eval_accuracy_0.8b.png

74.3 kB
Upload plot_eval_accuracy_0.8b.png about 2 months ago
tokenizer.json

20 MB
xet

Upload Qwen3.5-0.8B-GRPO (checkpoint-1000) — GRPO post-trained MCQ verifier 2 months ago
tokenizer_config.json

1.1 kB
Upload Qwen3.5-0.8B-GRPO (checkpoint-1000) — GRPO post-trained MCQ verifier 2 months ago