RinInori
/

bert-base-uncased_finetuned_sentiments

Text Classification

Inference Endpoints

Model card Files Files and versions Community

RinInori commited on May 15, 2023

Commit

b50123f

•

1 Parent(s): f2a2066

Update README.md

Files changed (1) hide show

README.md +4 -4

README.md CHANGED Viewed

@@ -64,7 +64,7 @@ def predict_sentiments(model_name, tokenizer_name, input_file):
     df = pd.read_csv(input_file)
-    # Tokenize the input text
     test_inputs = tokenizer(list(df['text']), padding=True, truncation=True, max_length=128, return_tensors='pt')
     # Make predictions
@@ -91,7 +91,7 @@ tokenizer_name = "RinInori/bert-base-uncased_finetune_sentiments"
 #Predict Unlabeled data
 predict_sentiments(model_name, tokenizer_name, '/content/drive/MyDrive/DLBBT01/data/c_unlabeled/dc_America.csv')
-# Load the predicted data
 df_Am = pd.read_csv('/content/drive/MyDrive/DLBBT01/data/c_unlabeled/dc_America_predicted.csv')
 df_Am.head()
@@ -106,13 +106,13 @@ tokenizer = AutoTokenizer.from_pretrained(tokenizer_name, do_lower_case=True)
 input_file = '/content/drive/MyDrive/DLBBT01/data/c_unlabeled/dc_America_predicted.csv'
 df_Am = pd.read_csv(input_file)
-# Examine the distribution of data based on labels
 sentences = df_Am.text.values
 print("Distribution of data based on labels: ", df_Am.label.value_counts())
 MAX_LEN = 512
-# Plot the label distribution
 label_count = df_Am['label'].value_counts()
 plot_users = label_count.plot.pie(autopct='%1.1f%%', figsize=(4, 4))
 plt.rc('axes', unicode_minus=False)

     df = pd.read_csv(input_file)
+    # Tokenize input text
     test_inputs = tokenizer(list(df['text']), padding=True, truncation=True, max_length=128, return_tensors='pt')
     # Make predictions
 #Predict Unlabeled data
 predict_sentiments(model_name, tokenizer_name, '/content/drive/MyDrive/DLBBT01/data/c_unlabeled/dc_America.csv')
+# Load predicted data
 df_Am = pd.read_csv('/content/drive/MyDrive/DLBBT01/data/c_unlabeled/dc_America_predicted.csv')
 df_Am.head()
 input_file = '/content/drive/MyDrive/DLBBT01/data/c_unlabeled/dc_America_predicted.csv'
 df_Am = pd.read_csv(input_file)
+# Examine distribution of data based on labels
 sentences = df_Am.text.values
 print("Distribution of data based on labels: ", df_Am.label.value_counts())
 MAX_LEN = 512
+# Plot label
 label_count = df_Am['label'].value_counts()
 plot_users = label_count.plot.pie(autopct='%1.1f%%', figsize=(4, 4))
 plt.rc('axes', unicode_minus=False)