FossilBERT / trainer_state.json

Upload 13 files

553b0df almost 2 years ago

5.5 kB

	{
	"best_metric": 0.9909420289855073,
	"best_model_checkpoint": "./fossilBERT_output/checkpoint-5661",
	"epoch": 10.0,
	"global_step": 6290,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.79,
	"learning_rate": 4.6025437201907795e-05,
	"loss": 0.1219,
	"step": 500
	},
	{
	"epoch": 1.0,
	"eval_accuracy": 0.9829025844930418,
	"eval_f1": 0.980708838043966,
	"eval_loss": 0.06422444432973862,
	"eval_precision": 0.9741532976827094,
	"eval_recall": 0.987353206865402,
	"eval_runtime": 2.8563,
	"eval_samples_per_second": 880.496,
	"eval_steps_per_second": 55.315,
	"step": 629
	},
	{
	"epoch": 1.59,
	"learning_rate": 4.205087440381558e-05,
	"loss": 0.0426,
	"step": 1000
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.9864811133200795,
	"eval_f1": 0.9845313921747042,
	"eval_loss": 0.06980240345001221,
	"eval_precision": 0.9917506874427131,
	"eval_recall": 0.9774164408310749,
	"eval_runtime": 2.8485,
	"eval_samples_per_second": 882.932,
	"eval_steps_per_second": 55.469,
	"step": 1258
	},
	{
	"epoch": 2.38,
	"learning_rate": 3.8076311605723374e-05,
	"loss": 0.0288,
	"step": 1500
	},
	{
	"epoch": 3.0,
	"eval_accuracy": 0.9876739562624255,
	"eval_f1": 0.986054880791723,
	"eval_loss": 0.08222242444753647,
	"eval_precision": 0.982078853046595,
	"eval_recall": 0.990063233965673,
	"eval_runtime": 2.8512,
	"eval_samples_per_second": 882.071,
	"eval_steps_per_second": 55.414,
	"step": 1887
	},
	{
	"epoch": 3.18,
	"learning_rate": 3.410174880763116e-05,
	"loss": 0.0057,
	"step": 2000
	},
	{
	"epoch": 3.97,
	"learning_rate": 3.0127186009538953e-05,
	"loss": 0.0084,
	"step": 2500
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.9880715705765407,
	"eval_f1": 0.9864253393665158,
	"eval_loss": 0.07759582996368408,
	"eval_precision": 0.9882139619220308,
	"eval_recall": 0.9846431797651309,
	"eval_runtime": 2.839,
	"eval_samples_per_second": 885.877,
	"eval_steps_per_second": 55.654,
	"step": 2516
	},
	{
	"epoch": 4.77,
	"learning_rate": 2.6152623211446743e-05,
	"loss": 0.0061,
	"step": 3000
	},
	{
	"epoch": 5.0,
	"eval_accuracy": 0.988469184890656,
	"eval_f1": 0.9868599909379248,
	"eval_loss": 0.10027419775724411,
	"eval_precision": 0.99,
	"eval_recall": 0.983739837398374,
	"eval_runtime": 2.8617,
	"eval_samples_per_second": 878.859,
	"eval_steps_per_second": 55.213,
	"step": 3145
	},
	{
	"epoch": 5.56,
	"learning_rate": 2.2178060413354532e-05,
	"loss": 0.0016,
	"step": 3500
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.989662027833002,
	"eval_f1": 0.9882777276825968,
	"eval_loss": 0.08881077915430069,
	"eval_precision": 0.9864986498649865,
	"eval_recall": 0.990063233965673,
	"eval_runtime": 2.8662,
	"eval_samples_per_second": 877.455,
	"eval_steps_per_second": 55.124,
	"step": 3774
	},
	{
	"epoch": 6.36,
	"learning_rate": 1.820349761526232e-05,
	"loss": 0.0023,
	"step": 4000
	},
	{
	"epoch": 7.0,
	"eval_accuracy": 0.9904572564612326,
	"eval_f1": 0.9891500904159132,
	"eval_loss": 0.09042701870203018,
	"eval_precision": 0.9900452488687783,
	"eval_recall": 0.988256549232159,
	"eval_runtime": 2.8476,
	"eval_samples_per_second": 883.214,
	"eval_steps_per_second": 55.486,
	"step": 4403
	},
	{
	"epoch": 7.15,
	"learning_rate": 1.4228934817170111e-05,
	"loss": 0.0037,
	"step": 4500
	},
	{
	"epoch": 7.95,
	"learning_rate": 1.02543720190779e-05,
	"loss": 0.0017,
	"step": 5000
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.9888667992047714,
	"eval_f1": 0.9872611464968153,
	"eval_loss": 0.09531795978546143,
	"eval_precision": 0.9945004582951421,
	"eval_recall": 0.980126467931346,
	"eval_runtime": 2.8577,
	"eval_samples_per_second": 880.078,
	"eval_steps_per_second": 55.289,
	"step": 5032
	},
	{
	"epoch": 8.74,
	"learning_rate": 6.279809220985691e-06,
	"loss": 0.0,
	"step": 5500
	},
	{
	"epoch": 9.0,
	"eval_accuracy": 0.9920477137176938,
	"eval_f1": 0.9909420289855073,
	"eval_loss": 0.0791691467165947,
	"eval_precision": 0.9936421435059037,
	"eval_recall": 0.988256549232159,
	"eval_runtime": 2.8459,
	"eval_samples_per_second": 883.726,
	"eval_steps_per_second": 55.518,
	"step": 5661
	},
	{
	"epoch": 9.54,
	"learning_rate": 2.3052464228934817e-06,
	"loss": 0.0,
	"step": 6000
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.9916500994035785,
	"eval_f1": 0.990493435943866,
	"eval_loss": 0.07801677286624908,
	"eval_precision": 0.9927404718693285,
	"eval_recall": 0.988256549232159,
	"eval_runtime": 2.8772,
	"eval_samples_per_second": 874.116,
	"eval_steps_per_second": 54.915,
	"step": 6290
	}
	],
	"max_steps": 6290,
	"num_train_epochs": 10,
	"total_flos": 3330561570708480.0,
	"trial_name": null,
	"trial_params": null
	}