inctdd
/

told_br_binary_sm

Text Classification

Trained with AutoTrain

Inference Endpoints

Model card Files Files and versions Community

alexandreteles commited on Dec 15, 2022

Commit

349a781

•

1 Parent(s): e896a05

Update README.md

Files changed (1) hide show

README.md +8 -2

README.md CHANGED Viewed

@@ -16,6 +16,9 @@ co2_eq_emissions:
 - Problem type: Binary Classification
 - Model ID: 2489276793
 - CO2 Emissions (in grams): 4.4298
 ## Validation Metrics
@@ -29,6 +32,9 @@ co2_eq_emissions:
 ## Usage
 You can use cURL to access this model:
 ```
@@ -40,9 +46,9 @@ Or Python API:
 ```
 from transformers import AutoModelForSequenceClassification, AutoTokenizer
-model = AutoModelForSequenceClassification.from_pretrained("alexandreteles/autotrain-told_br_binary_sm-2489276793", use_auth_token=True)
-tokenizer = AutoTokenizer.from_pretrained("alexandreteles/autotrain-told_br_binary_sm-2489276793", use_auth_token=True)
 inputs = tokenizer("I love AutoTrain", return_tensors="pt")

 - Problem type: Binary Classification
 - Model ID: 2489276793
+- Base model: BertForSequenceClassification
+- Parameters: 109M
+- Model size: 416MB
 - CO2 Emissions (in grams): 4.4298
 ## Validation Metrics
 ## Usage
+This model was trained on a random subset of the [told_br](https://huggingface.co/datasets/told-br) dataset (1/3 of the original size). Our main objective is to provide a small
+model that can be used to classify Brazilian Portuguese tweets in a binary way ('toxic' or 'non toxic').
 You can use cURL to access this model:
 ```
 ```
 from transformers import AutoModelForSequenceClassification, AutoTokenizer
+model = AutoModelForSequenceClassification.from_pretrained("alexandreteles/told_br_binary_sm", use_auth_token=True)
+tokenizer = AutoTokenizer.from_pretrained("alexandreteles/told_br_binary_sm", use_auth_token=True)
 inputs = tokenizer("I love AutoTrain", return_tensors="pt")