Kallinteris-Andreas
/

TRL-demo-Qwen2.5-0.5B-Reward-max_lenght96-4RA-gradient_checkpoint

Model card Files Files and versions Community

TRL-demo-Qwen2.5-0.5B-Reward-max_lenght96-4RA-gradient_checkpoint / merges.txt

Kallinteris-Andreas's picture

Kallinteris-Andreas

Upload 14 files

13a9ff7 verified 25 days ago

history contribute delete

1.67 MB

File too large to display, you can check the raw version instead.