NicholasCorrado
/

tinyllama-1.1b-chat-v1.0-arena-hh-dpo

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

tinyllama-1.1b-chat-v1.0-arena-hh-dpo

Commit History

End of training

7fe06c6
verified

NicholasCorrado commited on Sep 2, 2024

Model save

3c44280
verified

NicholasCorrado commited on Sep 2, 2024

Training in progress, step 378

3e0398e
verified

NicholasCorrado commited on Sep 2, 2024

Training in progress, step 300

a14a9d8
verified

NicholasCorrado commited on Sep 2, 2024

Training in progress, step 200

16db81e
verified

NicholasCorrado commited on Sep 2, 2024

Training in progress, step 100

7dca7df
verified

NicholasCorrado commited on Sep 2, 2024

Training in progress, step 1

aa742e6
verified

NicholasCorrado commited on Sep 2, 2024

initial commit

9e01e8d
verified

NicholasCorrado commited on Sep 2, 2024