{ "best_metric": 0.03096950612962246, "best_model_checkpoint": "/robodata/smodak/Projects/nspl/scripts/terrainseg/training/models/parking-terrain/checkpoint-160", "epoch": 40.0, "global_step": 160, "is_hyper_param_search": false, "is_local_process_zero": true, "is_world_process_zero": true, "log_history": [ { "epoch": 0.25, "learning_rate": 4.1666666666666667e-07, "loss": 1.3152, "step": 1 }, { "epoch": 0.5, "learning_rate": 8.333333333333333e-07, "loss": 1.3189, "step": 2 }, { "epoch": 0.75, "learning_rate": 1.25e-06, "loss": 1.3046, "step": 3 }, { "epoch": 1.0, "learning_rate": 1.6666666666666667e-06, "loss": 1.3124, "step": 4 }, { "epoch": 1.25, "learning_rate": 2.0833333333333334e-06, "loss": 1.3014, "step": 5 }, { "epoch": 1.5, "learning_rate": 2.5e-06, "loss": 1.2884, "step": 6 }, { "epoch": 1.75, "learning_rate": 2.916666666666667e-06, "loss": 1.2836, "step": 7 }, { "epoch": 2.0, "learning_rate": 3.3333333333333333e-06, "loss": 1.266, "step": 8 }, { "epoch": 2.25, "learning_rate": 3.75e-06, "loss": 1.2544, "step": 9 }, { "epoch": 2.5, "learning_rate": 4.166666666666667e-06, "loss": 1.2427, "step": 10 }, { "epoch": 2.75, "learning_rate": 4.583333333333333e-06, "loss": 1.2271, "step": 11 }, { "epoch": 3.0, "learning_rate": 5e-06, "loss": 1.2266, "step": 12 }, { "epoch": 3.25, "learning_rate": 5.416666666666667e-06, "loss": 1.2002, "step": 13 }, { "epoch": 3.5, "learning_rate": 5.833333333333334e-06, "loss": 1.1886, "step": 14 }, { "epoch": 3.75, "learning_rate": 6.25e-06, "loss": 1.1605, "step": 15 }, { "epoch": 4.0, "learning_rate": 6.666666666666667e-06, "loss": 1.1389, "step": 16 }, { "epoch": 4.25, "learning_rate": 7.083333333333334e-06, "loss": 1.1115, "step": 17 }, { "epoch": 4.5, "learning_rate": 7.5e-06, "loss": 1.0863, "step": 18 }, { "epoch": 4.75, "learning_rate": 7.916666666666667e-06, "loss": 1.0763, "step": 19 }, { "epoch": 5.0, "learning_rate": 8.333333333333334e-06, "loss": 1.0322, "step": 20 }, { "epoch": 5.0, "eval_accuracy_ELSE": 0.7236194227710022, "eval_accuracy_road": 0.9371333371304893, "eval_accuracy_sidewalk": 0.5361869895803999, "eval_accuracy_unlabeled": NaN, "eval_iou_ELSE": 0.7051860054312004, "eval_iou_road": 0.6015263687048716, "eval_iou_sidewalk": 0.40198458777578383, "eval_iou_unlabeled": 0.0, "eval_loss": 1.1061346530914307, "eval_mean_accuracy": 0.7323132498272971, "eval_mean_iou": 0.42717424047796393, "eval_overall_accuracy": 0.7757415771484375, "eval_runtime": 0.7193, "eval_samples_per_second": 1.39, "eval_steps_per_second": 1.39, "step": 20 }, { "epoch": 5.25, "learning_rate": 8.75e-06, "loss": 1.0201, "step": 21 }, { "epoch": 5.5, "learning_rate": 9.166666666666666e-06, "loss": 0.9859, "step": 22 }, { "epoch": 5.75, "learning_rate": 9.583333333333334e-06, "loss": 0.9649, "step": 23 }, { "epoch": 6.0, "learning_rate": 1e-05, "loss": 0.9171, "step": 24 }, { "epoch": 6.25, "learning_rate": 1.0416666666666668e-05, "loss": 0.8769, "step": 25 }, { "epoch": 6.5, "learning_rate": 1.0833333333333334e-05, "loss": 0.882, "step": 26 }, { "epoch": 6.75, "learning_rate": 1.125e-05, "loss": 0.8217, "step": 27 }, { "epoch": 7.0, "learning_rate": 1.1666666666666668e-05, "loss": 0.7833, "step": 28 }, { "epoch": 7.25, "learning_rate": 1.2083333333333333e-05, "loss": 0.7459, "step": 29 }, { "epoch": 7.5, "learning_rate": 1.25e-05, "loss": 0.7156, "step": 30 }, { "epoch": 7.75, "learning_rate": 1.2916666666666668e-05, "loss": 0.6706, "step": 31 }, { "epoch": 8.0, "learning_rate": 1.3333333333333333e-05, "loss": 0.6556, "step": 32 }, { "epoch": 8.25, "learning_rate": 1.3750000000000002e-05, "loss": 0.6085, "step": 33 }, { "epoch": 8.5, "learning_rate": 1.4166666666666668e-05, "loss": 0.5801, "step": 34 }, { "epoch": 8.75, "learning_rate": 1.4583333333333335e-05, "loss": 0.5008, "step": 35 }, { "epoch": 9.0, "learning_rate": 1.5e-05, "loss": 0.5359, "step": 36 }, { "epoch": 9.25, "learning_rate": 1.5416666666666668e-05, "loss": 0.4526, "step": 37 }, { "epoch": 9.5, "learning_rate": 1.5833333333333333e-05, "loss": 0.461, "step": 38 }, { "epoch": 9.75, "learning_rate": 1.6250000000000002e-05, "loss": 0.3945, "step": 39 }, { "epoch": 10.0, "learning_rate": 1.6666666666666667e-05, "loss": 0.3821, "step": 40 }, { "epoch": 10.0, "eval_accuracy_ELSE": 0.9475472637354313, "eval_accuracy_road": 0.9957851569174688, "eval_accuracy_sidewalk": 0.7203604618417347, "eval_accuracy_unlabeled": NaN, "eval_iou_ELSE": 0.9428740645022344, "eval_iou_road": 0.876176157363904, "eval_iou_sidewalk": 0.5966180758017493, "eval_iou_unlabeled": NaN, "eval_loss": 0.332696795463562, "eval_mean_accuracy": 0.8878976274982117, "eval_mean_iou": 0.805222765889296, "eval_overall_accuracy": 0.954315185546875, "eval_runtime": 0.6036, "eval_samples_per_second": 1.657, "eval_steps_per_second": 1.657, "step": 40 }, { "epoch": 10.25, "learning_rate": 1.7083333333333333e-05, "loss": 0.3487, "step": 41 }, { "epoch": 10.5, "learning_rate": 1.75e-05, "loss": 0.3294, "step": 42 }, { "epoch": 10.75, "learning_rate": 1.7916666666666667e-05, "loss": 0.3092, "step": 43 }, { "epoch": 11.0, "learning_rate": 1.8333333333333333e-05, "loss": 0.2778, "step": 44 }, { "epoch": 11.25, "learning_rate": 1.8750000000000002e-05, "loss": 0.2508, "step": 45 }, { "epoch": 11.5, "learning_rate": 1.9166666666666667e-05, "loss": 0.2453, "step": 46 }, { "epoch": 11.75, "learning_rate": 1.9583333333333333e-05, "loss": 0.2169, "step": 47 }, { "epoch": 12.0, "learning_rate": 2e-05, "loss": 0.2321, "step": 48 }, { "epoch": 12.25, "learning_rate": 2.0416666666666667e-05, "loss": 0.2083, "step": 49 }, { "epoch": 12.5, "learning_rate": 2.0833333333333336e-05, "loss": 0.1772, "step": 50 }, { "epoch": 12.75, "learning_rate": 2.125e-05, "loss": 0.1643, "step": 51 }, { "epoch": 13.0, "learning_rate": 2.1666666666666667e-05, "loss": 0.1781, "step": 52 }, { "epoch": 13.25, "learning_rate": 2.2083333333333333e-05, "loss": 0.1629, "step": 53 }, { "epoch": 13.5, "learning_rate": 2.25e-05, "loss": 0.1367, "step": 54 }, { "epoch": 13.75, "learning_rate": 2.2916666666666667e-05, "loss": 0.1678, "step": 55 }, { "epoch": 14.0, "learning_rate": 2.3333333333333336e-05, "loss": 0.1151, "step": 56 }, { "epoch": 14.25, "learning_rate": 2.375e-05, "loss": 0.1134, "step": 57 }, { "epoch": 14.5, "learning_rate": 2.4166666666666667e-05, "loss": 0.113, "step": 58 }, { "epoch": 14.75, "learning_rate": 2.4583333333333332e-05, "loss": 0.1298, "step": 59 }, { "epoch": 15.0, "learning_rate": 2.5e-05, "loss": 0.1146, "step": 60 }, { "epoch": 15.0, "eval_accuracy_ELSE": 0.9833345958639497, "eval_accuracy_road": 0.9951443868542462, "eval_accuracy_sidewalk": 0.7050126724866235, "eval_accuracy_unlabeled": NaN, "eval_iou_ELSE": 0.9793074460861975, "eval_iou_road": 0.9435900897859988, "eval_iou_sidewalk": 0.6242363795038025, "eval_iou_unlabeled": NaN, "eval_loss": 0.09062469005584717, "eval_mean_accuracy": 0.8944972184016065, "eval_mean_iou": 0.8490446384586662, "eval_overall_accuracy": 0.9789581298828125, "eval_runtime": 0.5877, "eval_samples_per_second": 1.701, "eval_steps_per_second": 1.701, "step": 60 }, { "epoch": 15.25, "learning_rate": 2.5416666666666667e-05, "loss": 0.1079, "step": 61 }, { "epoch": 15.5, "learning_rate": 2.5833333333333336e-05, "loss": 0.0953, "step": 62 }, { "epoch": 15.75, "learning_rate": 2.625e-05, "loss": 0.094, "step": 63 }, { "epoch": 16.0, "learning_rate": 2.6666666666666667e-05, "loss": 0.1031, "step": 64 }, { "epoch": 16.25, "learning_rate": 2.7083333333333332e-05, "loss": 0.0991, "step": 65 }, { "epoch": 16.5, "learning_rate": 2.7500000000000004e-05, "loss": 0.09, "step": 66 }, { "epoch": 16.75, "learning_rate": 2.791666666666667e-05, "loss": 0.0938, "step": 67 }, { "epoch": 17.0, "learning_rate": 2.8333333333333335e-05, "loss": 0.0784, "step": 68 }, { "epoch": 17.25, "learning_rate": 2.8749999999999997e-05, "loss": 0.074, "step": 69 }, { "epoch": 17.5, "learning_rate": 2.916666666666667e-05, "loss": 0.0754, "step": 70 }, { "epoch": 17.75, "learning_rate": 2.9583333333333335e-05, "loss": 0.0908, "step": 71 }, { "epoch": 18.0, "learning_rate": 3e-05, "loss": 0.0746, "step": 72 }, { "epoch": 18.25, "learning_rate": 3.0416666666666666e-05, "loss": 0.0705, "step": 73 }, { "epoch": 18.5, "learning_rate": 3.0833333333333335e-05, "loss": 0.0786, "step": 74 }, { "epoch": 18.75, "learning_rate": 3.125e-05, "loss": 0.0759, "step": 75 }, { "epoch": 19.0, "learning_rate": 3.1666666666666666e-05, "loss": 0.0743, "step": 76 }, { "epoch": 19.25, "learning_rate": 3.208333333333334e-05, "loss": 0.0665, "step": 77 }, { "epoch": 19.5, "learning_rate": 3.2500000000000004e-05, "loss": 0.0642, "step": 78 }, { "epoch": 19.75, "learning_rate": 3.291666666666667e-05, "loss": 0.0707, "step": 79 }, { "epoch": 20.0, "learning_rate": 3.3333333333333335e-05, "loss": 0.0668, "step": 80 }, { "epoch": 20.0, "eval_accuracy_ELSE": 0.9925168006752735, "eval_accuracy_road": 0.9965967989975508, "eval_accuracy_sidewalk": 0.6823430019712757, "eval_accuracy_unlabeled": NaN, "eval_iou_ELSE": 0.9843781863455368, "eval_iou_road": 0.9669927325983033, "eval_iou_sidewalk": 0.663653793481238, "eval_iou_unlabeled": NaN, "eval_loss": 0.05583948642015457, "eval_mean_accuracy": 0.8904855338813666, "eval_mean_iou": 0.8716749041416927, "eval_overall_accuracy": 0.9852066040039062, "eval_runtime": 0.5774, "eval_samples_per_second": 1.732, "eval_steps_per_second": 1.732, "step": 80 }, { "epoch": 20.25, "learning_rate": 3.375000000000001e-05, "loss": 0.0614, "step": 81 }, { "epoch": 20.5, "learning_rate": 3.4166666666666666e-05, "loss": 0.0692, "step": 82 }, { "epoch": 20.75, "learning_rate": 3.458333333333333e-05, "loss": 0.0609, "step": 83 }, { "epoch": 21.0, "learning_rate": 3.5e-05, "loss": 0.085, "step": 84 }, { "epoch": 21.25, "learning_rate": 3.541666666666667e-05, "loss": 0.0666, "step": 85 }, { "epoch": 21.5, "learning_rate": 3.5833333333333335e-05, "loss": 0.059, "step": 86 }, { "epoch": 21.75, "learning_rate": 3.625e-05, "loss": 0.0564, "step": 87 }, { "epoch": 22.0, "learning_rate": 3.6666666666666666e-05, "loss": 0.0598, "step": 88 }, { "epoch": 22.25, "learning_rate": 3.708333333333334e-05, "loss": 0.0542, "step": 89 }, { "epoch": 22.5, "learning_rate": 3.7500000000000003e-05, "loss": 0.0556, "step": 90 }, { "epoch": 22.75, "learning_rate": 3.791666666666667e-05, "loss": 0.0584, "step": 91 }, { "epoch": 23.0, "learning_rate": 3.8333333333333334e-05, "loss": 0.0563, "step": 92 }, { "epoch": 23.25, "learning_rate": 3.875e-05, "loss": 0.0526, "step": 93 }, { "epoch": 23.5, "learning_rate": 3.9166666666666665e-05, "loss": 0.0595, "step": 94 }, { "epoch": 23.75, "learning_rate": 3.958333333333333e-05, "loss": 0.0521, "step": 95 }, { "epoch": 24.0, "learning_rate": 4e-05, "loss": 0.0637, "step": 96 }, { "epoch": 24.25, "learning_rate": 4.041666666666667e-05, "loss": 0.0526, "step": 97 }, { "epoch": 24.5, "learning_rate": 4.0833333333333334e-05, "loss": 0.0589, "step": 98 }, { "epoch": 24.75, "learning_rate": 4.125e-05, "loss": 0.0513, "step": 99 }, { "epoch": 25.0, "learning_rate": 4.166666666666667e-05, "loss": 0.0491, "step": 100 }, { "epoch": 25.0, "eval_accuracy_ELSE": 0.9903145865572954, "eval_accuracy_road": 0.9915560745001993, "eval_accuracy_sidewalk": 0.8296254576175726, "eval_accuracy_unlabeled": NaN, "eval_iou_ELSE": 0.9854569928657962, "eval_iou_road": 0.9708338561490094, "eval_iou_sidewalk": 0.7111647555823778, "eval_iou_unlabeled": NaN, "eval_loss": 0.047440506517887115, "eval_mean_accuracy": 0.937165372891689, "eval_mean_iou": 0.8891518681990611, "eval_overall_accuracy": 0.9862937927246094, "eval_runtime": 0.7221, "eval_samples_per_second": 1.385, "eval_steps_per_second": 1.385, "step": 100 }, { "epoch": 25.25, "learning_rate": 4.208333333333334e-05, "loss": 0.0548, "step": 101 }, { "epoch": 25.5, "learning_rate": 4.25e-05, "loss": 0.0491, "step": 102 }, { "epoch": 25.75, "learning_rate": 4.291666666666667e-05, "loss": 0.0552, "step": 103 }, { "epoch": 26.0, "learning_rate": 4.3333333333333334e-05, "loss": 0.0476, "step": 104 }, { "epoch": 26.25, "learning_rate": 4.375e-05, "loss": 0.051, "step": 105 }, { "epoch": 26.5, "learning_rate": 4.4166666666666665e-05, "loss": 0.0465, "step": 106 }, { "epoch": 26.75, "learning_rate": 4.458333333333334e-05, "loss": 0.0502, "step": 107 }, { "epoch": 27.0, "learning_rate": 4.5e-05, "loss": 0.0479, "step": 108 }, { "epoch": 27.25, "learning_rate": 4.541666666666667e-05, "loss": 0.0526, "step": 109 }, { "epoch": 27.5, "learning_rate": 4.5833333333333334e-05, "loss": 0.0471, "step": 110 }, { "epoch": 27.75, "learning_rate": 4.6250000000000006e-05, "loss": 0.0405, "step": 111 }, { "epoch": 28.0, "learning_rate": 4.666666666666667e-05, "loss": 0.0449, "step": 112 }, { "epoch": 28.25, "learning_rate": 4.708333333333334e-05, "loss": 0.0443, "step": 113 }, { "epoch": 28.5, "learning_rate": 4.75e-05, "loss": 0.0406, "step": 114 }, { "epoch": 28.75, "learning_rate": 4.791666666666667e-05, "loss": 0.0436, "step": 115 }, { "epoch": 29.0, "learning_rate": 4.8333333333333334e-05, "loss": 0.052, "step": 116 }, { "epoch": 29.25, "learning_rate": 4.875e-05, "loss": 0.0468, "step": 117 }, { "epoch": 29.5, "learning_rate": 4.9166666666666665e-05, "loss": 0.0402, "step": 118 }, { "epoch": 29.75, "learning_rate": 4.958333333333334e-05, "loss": 0.0456, "step": 119 }, { "epoch": 30.0, "learning_rate": 5e-05, "loss": 0.04, "step": 120 }, { "epoch": 30.0, "eval_accuracy_ELSE": 0.9936638999210017, "eval_accuracy_road": 0.9914136811528166, "eval_accuracy_sidewalk": 0.877640101379893, "eval_accuracy_unlabeled": NaN, "eval_iou_ELSE": 0.9889762507404815, "eval_iou_road": 0.9755362822434882, "eval_iou_sidewalk": 0.8067564069376133, "eval_iou_unlabeled": NaN, "eval_loss": 0.03659357875585556, "eval_mean_accuracy": 0.9542392274845705, "eval_mean_iou": 0.9237563133071943, "eval_overall_accuracy": 0.9899177551269531, "eval_runtime": 0.6094, "eval_samples_per_second": 1.641, "eval_steps_per_second": 1.641, "step": 120 }, { "epoch": 30.25, "learning_rate": 4.99780701754386e-05, "loss": 0.0374, "step": 121 }, { "epoch": 30.5, "learning_rate": 4.9956140350877195e-05, "loss": 0.0435, "step": 122 }, { "epoch": 30.75, "learning_rate": 4.9934210526315795e-05, "loss": 0.0442, "step": 123 }, { "epoch": 31.0, "learning_rate": 4.991228070175439e-05, "loss": 0.0387, "step": 124 }, { "epoch": 31.25, "learning_rate": 4.989035087719299e-05, "loss": 0.0422, "step": 125 }, { "epoch": 31.5, "learning_rate": 4.986842105263158e-05, "loss": 0.0398, "step": 126 }, { "epoch": 31.75, "learning_rate": 4.984649122807018e-05, "loss": 0.0428, "step": 127 }, { "epoch": 32.0, "learning_rate": 4.9824561403508773e-05, "loss": 0.0375, "step": 128 }, { "epoch": 32.25, "learning_rate": 4.980263157894737e-05, "loss": 0.0447, "step": 129 }, { "epoch": 32.5, "learning_rate": 4.9780701754385966e-05, "loss": 0.0358, "step": 130 }, { "epoch": 32.75, "learning_rate": 4.9758771929824566e-05, "loss": 0.0357, "step": 131 }, { "epoch": 33.0, "learning_rate": 4.973684210526316e-05, "loss": 0.0369, "step": 132 }, { "epoch": 33.25, "learning_rate": 4.971491228070176e-05, "loss": 0.0333, "step": 133 }, { "epoch": 33.5, "learning_rate": 4.969298245614035e-05, "loss": 0.0381, "step": 134 }, { "epoch": 33.75, "learning_rate": 4.967105263157895e-05, "loss": 0.036, "step": 135 }, { "epoch": 34.0, "learning_rate": 4.9649122807017544e-05, "loss": 0.0396, "step": 136 }, { "epoch": 34.25, "learning_rate": 4.9627192982456144e-05, "loss": 0.0376, "step": 137 }, { "epoch": 34.5, "learning_rate": 4.960526315789474e-05, "loss": 0.0388, "step": 138 }, { "epoch": 34.75, "learning_rate": 4.958333333333334e-05, "loss": 0.0311, "step": 139 }, { "epoch": 35.0, "learning_rate": 4.956140350877193e-05, "loss": 0.0339, "step": 140 }, { "epoch": 35.0, "eval_accuracy_ELSE": 0.9937234192214875, "eval_accuracy_road": 0.9900751836874181, "eval_accuracy_sidewalk": 0.9129822585187272, "eval_accuracy_unlabeled": NaN, "eval_iou_ELSE": 0.9891420261754726, "eval_iou_road": 0.9801381449111926, "eval_iou_sidewalk": 0.8095892121363466, "eval_iou_unlabeled": NaN, "eval_loss": 0.03316768258810043, "eval_mean_accuracy": 0.9655936204758776, "eval_mean_iou": 0.9262897944076706, "eval_overall_accuracy": 0.9905586242675781, "eval_runtime": 0.6199, "eval_samples_per_second": 1.613, "eval_steps_per_second": 1.613, "step": 140 }, { "epoch": 35.25, "learning_rate": 4.953947368421053e-05, "loss": 0.0351, "step": 141 }, { "epoch": 35.5, "learning_rate": 4.951754385964912e-05, "loss": 0.0318, "step": 142 }, { "epoch": 35.75, "learning_rate": 4.949561403508772e-05, "loss": 0.0354, "step": 143 }, { "epoch": 36.0, "learning_rate": 4.9473684210526315e-05, "loss": 0.0385, "step": 144 }, { "epoch": 36.25, "learning_rate": 4.9451754385964915e-05, "loss": 0.0342, "step": 145 }, { "epoch": 36.5, "learning_rate": 4.942982456140351e-05, "loss": 0.033, "step": 146 }, { "epoch": 36.75, "learning_rate": 4.940789473684211e-05, "loss": 0.0337, "step": 147 }, { "epoch": 37.0, "learning_rate": 4.93859649122807e-05, "loss": 0.0324, "step": 148 }, { "epoch": 37.25, "learning_rate": 4.93640350877193e-05, "loss": 0.0328, "step": 149 }, { "epoch": 37.5, "learning_rate": 4.9342105263157894e-05, "loss": 0.0363, "step": 150 }, { "epoch": 37.75, "learning_rate": 4.932017543859649e-05, "loss": 0.0309, "step": 151 }, { "epoch": 38.0, "learning_rate": 4.9298245614035086e-05, "loss": 0.034, "step": 152 }, { "epoch": 38.25, "learning_rate": 4.9276315789473686e-05, "loss": 0.0297, "step": 153 }, { "epoch": 38.5, "learning_rate": 4.925438596491228e-05, "loss": 0.031, "step": 154 }, { "epoch": 38.75, "learning_rate": 4.923245614035088e-05, "loss": 0.0308, "step": 155 }, { "epoch": 39.0, "learning_rate": 4.921052631578947e-05, "loss": 0.0368, "step": 156 }, { "epoch": 39.25, "learning_rate": 4.918859649122807e-05, "loss": 0.032, "step": 157 }, { "epoch": 39.5, "learning_rate": 4.9166666666666665e-05, "loss": 0.0336, "step": 158 }, { "epoch": 39.75, "learning_rate": 4.9144736842105264e-05, "loss": 0.0285, "step": 159 }, { "epoch": 40.0, "learning_rate": 4.912280701754386e-05, "loss": 0.0341, "step": 160 }, { "epoch": 40.0, "eval_accuracy_ELSE": 0.9941238217883926, "eval_accuracy_road": 0.9888790795694025, "eval_accuracy_sidewalk": 0.9129822585187272, "eval_accuracy_unlabeled": NaN, "eval_iou_ELSE": 0.9896685088824968, "eval_iou_road": 0.978181869401093, "eval_iou_sidewalk": 0.8118192062100914, "eval_iou_unlabeled": NaN, "eval_loss": 0.03096950612962246, "eval_mean_accuracy": 0.9653283866255075, "eval_mean_iou": 0.9265565281645604, "eval_overall_accuracy": 0.9905204772949219, "eval_runtime": 0.6028, "eval_samples_per_second": 1.659, "eval_steps_per_second": 1.659, "step": 160 } ], "max_steps": 2400, "num_train_epochs": 600, "total_flos": 1.0059234964144128e+18, "trial_name": null, "trial_params": null }