--per_device_train_batch_size 2 --learning_rate 3e-5 --num_train_epochs 2 --max_seq_length 512 --doc_stride 250 --max_answer_length 200

Files changed (1) hide show

all_results.json ADDED Viewed

+{
+ "epoch": 2.0,
+ "eval_exact_match": 35.148514851485146,
+ "eval_f1": 58.875424185466564,
+ "eval_runtime": 704.4252,
+ "eval_samples": 5412,
+ "eval_samples_per_second": 7.683,
+ "eval_steps_per_second": 0.961,
+ "total_flos": 9.031922425511117e+16,
+ "train_loss": 0.3265183397838395,
+ "train_runtime": 46558.184,
+ "train_samples": 48626,
+ "train_samples_per_second": 2.089,
+ "train_steps_per_second": 1.044
+}