artarif
/

trainer_output

Text Classification

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

artarif commited on Mar 23

Commit

1a72179

·

verified ·

1 Parent(s): 2f86c06

artarif/llm-course-hw2-reward-model-trainer

Files changed (3) hide show

README.md +1 -1
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -35,7 +35,7 @@ This model was trained with Reward.
 ### Framework versions
-- TRL: 0.15.2
 - Transformers: 4.49.0
 - Pytorch: 2.6.0+cu124
 - Datasets: 3.4.1

 ### Framework versions
+- TRL: 0.16.0
 - Transformers: 4.49.0
 - Pytorch: 2.6.0+cu124
 - Datasets: 3.4.1

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc911766a983719e0a1e7457e6a6ac5dbb68eee9aa102873c389acfc5c1c07a6
 size 538092792

 version https://git-lfs.github.com/spec/v1
+oid sha256:844bd0aa41ab1475af0c5ddab41b720d93891db452f2654ad0e4c2539497c69c
 size 538092792

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:80abeead9151ec8fab60fd0959db967a13b122c907d9fba11a924733ecf6eb1a
 size 5368

 version https://git-lfs.github.com/spec/v1
+oid sha256:08ab124f486b4e119a41d214d5dae2296647e5dffeb189f2fb2ad7e2cbc000d5
 size 5368