R1-Experiments

Run

pip install -r requirements.txt
pip install flash-attn --no-build-isolation
pip install git+https://github.com/huggingface/trl.git

Name		Name	Last commit message	Last commit date
Latest commit History 12 Commits
configs		configs
iGSM-main		iGSM-main
trainer		trainer
.gitignore		.gitignore
README.md		README.md
grpo_demo.py		grpo_demo.py
requirements.txt		requirements.txt
run.sh		run.sh

Provide feedback