Kallinteris-Andreas
/

TRL-demo-Qwen2.5-0.5B-Reward-max_lenght512-4RA-gradient_checkpoint

Model card Files Files and versions Community

TRL-demo-Qwen2.5-0.5B-Reward-max_lenght512-4RA-gradient_checkpoint / special_tokens_map.json

Commit History

Upload 14 files

b2f0dd5
verified

Kallinteris-Andreas commited on 26 days ago