Ayham
/

roberta_gpt2_summarization_cnn_dailymail

Text2Text Generation

encoder-decoder

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

roberta_gpt2_summarization_cnn_dailymail / README.md

Ayham's picture

Update README.md

bd7a32f about 3 years ago

|

1.89 kB

	---
	tags:
	- generated_from_trainer
	datasets:
	- cnn_dailymail
	model-index:
	- name: roberta_gpt2_summarization_cnn_dailymail
	results: []
	---

	<!-- This model card has been generated automatically according to the information the Trainer had access to. You
	should probably proofread and complete it, then remove this comment. -->

	# roberta_gpt2_summarization_cnn_dailymail

	This model is a fine-tuned version of [](https://huggingface.co/) on the cnn_dailymail dataset.

	## Model description
	This model uses RoBerta encoder and GPT2 decoder and fine-tuned on the summarization task. It got Rouge scores as follows:

	Rouge1= 35.886

	Rouge2= 16.292

	RougeL= 23.499
	## Intended uses & limitations

	More information needed

	To use its API:
	from transformers import BertTokenizerFast, GPT2Tokenizer, EncoderDecoderModel

	model = EncoderDecoderModel.from_pretrained("Ayham/roberta_gpt2_summarization_cnn_dailymail")
	# reuse tokenizer from bert2bert encoder-decoder model
	input_tokenizer = BertTokenizerFast.from_pretrained('bert-base-cased')


	article = """Your Input Text"""

	input_ids = input_tokenizer(article, return_tensors="pt").input_ids
	output_ids = model.generate(input_ids)

	# we need a gpt2 tokenizer for the output word embeddings
	output_tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
	print(output_tokenizer.decode(output_ids[0], skip_special_tokens=True))

	More information needed

	## Training procedure

	### Training hyperparameters

	The following hyperparameters were used during training:
	- learning_rate: 5e-05
	- train_batch_size: 8
	- eval_batch_size: 8
	- seed: 42
	- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
	- lr_scheduler_type: linear
	- lr_scheduler_warmup_steps: 2000
	- num_epochs: 3.0
	- mixed_precision_training: Native AMP

	### Training results



	### Framework versions

	- Transformers 4.12.0.dev0
	- Pytorch 1.10.0+cu111
	- Datasets 1.16.1
	- Tokenizers 0.10.3