YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

Dataset Card for Custom Text Dataset

Dataset Name

μ»€μŠ€ν…€ CNN/DailyMail μΆ”μΆœ μš”μ•½ 데이터셋

Overview

이 데이터셋은 CNN/DailyMail λ‰΄μŠ€ κΈ°μ‚¬μ—μ„œ μΆ”μΆœν•œ λ¬Έμž₯λ“€κ³Ό ν•΄λ‹Ή λ¬Έμž₯의 μš”μ•½μœΌλ‘œ κ΅¬μ„±λ˜μ–΄ μžˆλ‹€. 이 데이터셋은 ν›ˆλ ¨ 및 ν…ŒμŠ€νŠΈλ₯Ό μœ„ν•΄ μ»€μŠ€ν…€ν•œ μ†Œκ·œλͺ¨ ν•˜μœ„ 데이터셋을 ν¬ν•¨ν•˜κ³  μžˆλ‹€.

Composition

  • ν›ˆλ ¨ 데이터: ν•˜λ‚˜μ˜ λ¬Έμž₯κ³Ό 그에 λŒ€ν•œ μš”μ•½μ΄ ν¬ν•¨λœ μƒ˜ν”Œ.
  • ν…ŒμŠ€νŠΈ 데이터: CNN/DailyMail λ°μ΄ν„°μ…‹μ˜ 원본 ν…ŒμŠ€νŠΈ μ„ΈνŠΈμ—μ„œ 100개의 μƒ˜ν”Œμ„ μΆ”μΆœ.

Collection Process

ν›ˆλ ¨ λ°μ΄ν„°λŠ” μˆ˜μž‘μ—…μœΌλ‘œ μƒμ„±λ˜μ—ˆμœΌλ©°, ν…ŒμŠ€νŠΈ λ°μ΄ν„°λŠ” cnn_dailymail λ°μ΄ν„°μ…‹μ˜ ν…ŒμŠ€νŠΈ μ„ΈνŠΈμ—μ„œ μΆ”μΆœλ˜μ—ˆλ‹€.

Preprocessing

Hugging Face datasets 라이브러리λ₯Ό μ‚¬μš©ν•˜μ—¬ 데이터λ₯Ό μ „μ²˜λ¦¬ν–ˆλ‹€. ν›ˆλ ¨ 및 ν…ŒμŠ€νŠΈ 데이터셋은 Hugging Faceμ—μ„œ μ‚¬μš©ν•  수 μžˆλŠ” ν˜•μ‹μœΌλ‘œ μ €μž₯λ˜μ—ˆλ‹€.

How to Use

from datasets import load_from_disk

train_dataset = load_from_disk('./results/custom_dataset/train')
test_dataset = load_from_disk('./results/custom_dataset/test')

Evaluation

이 데이터셋은 ROUGE와 같은 전톡적인 μš”μ•½ 평가 μ§€ν‘œλ₯Ό μ‚¬μš©ν•˜μ—¬ 평가할 수 μžˆλ‹€.

Limitations

ν›ˆλ ¨ 데이터셋은 맀우 적은 μ–‘μœΌλ‘œ, μΌλ°˜ν™”κ°€ μ–΄λ €μšΈ 수 μžˆλ‹€. ν…ŒμŠ€νŠΈ λ°μ΄ν„°λŠ” μ™ΈλΆ€ μΆœμ²˜μ—μ„œ κ°€μ Έμ™”μœΌλ©°, 원본 데이터셋에 μ‘΄μž¬ν•˜λŠ” 편ν–₯이 포함될 수 μžˆλ‹€.

Ethical Considerations

이 λ°μ΄ν„°μ…‹μ—λŠ” λ―Όκ°ν•œ μ •μΉ˜μ  μ£Όμ œμ™€ κ΄€λ ¨λœ λ‚΄μš©μ΄ ν¬ν•¨λ˜μ–΄ μžˆλ‹€. μ‚¬μš©μžλŠ” μš”μ•½μ—μ„œ λ°œμƒν•  수 μžˆλŠ” μ˜€ν•΄λ‚˜ 편ν–₯을 μ£Όμ˜ν•΄μ•Ό ν•œλ‹€

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.
The model cannot be deployed to the HF Inference API: The model has no library tag.