metadata

library_name: transformers
license: mit
base_model: xlm-roberta-base
tags:
  - generated_from_trainer
model-index:
  - name: GPT_nyala
    results: []

GPT_nyala

This model is a fine-tuned version of xlm-roberta-base on an unknown dataset. It achieves the following results on the evaluation set:

Loss: 3.0644

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

learning_rate: 3e-05
train_batch_size: 8
eval_batch_size: 8
seed: 42
optimizer: Use OptimizerNames.ADAMW_TORCH with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
lr_scheduler_type: linear
num_epochs: 20

Training results

Training Loss	Epoch	Step	Validation Loss
No log	1.0	63	1.9867
No log	2.0	126	1.8179
No log	3.0	189	1.6489
No log	4.0	252	1.4101
No log	5.0	315	1.3706
No log	6.0	378	1.4276
No log	7.0	441	1.5910
1.5172	8.0	504	1.6088
1.5172	9.0	567	1.7207
1.5172	10.0	630	2.0775
1.5172	11.0	693	2.2686
1.5172	12.0	756	2.4158
1.5172	13.0	819	2.5343
1.5172	14.0	882	2.6213
1.5172	15.0	945	2.6917
0.2964	16.0	1008	2.7928
0.2964	17.0	1071	3.0821
0.2964	18.0	1134	3.0595
0.2964	19.0	1197	3.0762
0.2964	20.0	1260	3.0644

Framework versions

Transformers 4.47.1
Pytorch 2.5.1+cu121
Tokenizers 0.21.0