RLHF-And-Friends
/

Pythia-70M-Reward

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Pythia-70M-Reward / adapter_config.json

Commit History

Training in progress, step 500

bc4ba00
verified

evgurov commited on Dec 17, 2024

Training in progress, step 500

9c15d2f
verified

arqa39 commited on Dec 11, 2024