AndyJamesTurner
/

suicideDetector

Text Classification

Scikit-learn

skops

Model card Files Files and versions

xet

Community

AndyJamesTurner commited on Apr 17, 2024

Commit

95af55b

verified ·

1 Parent(s): fbee800

Improved documentation

Browse files

Files changed (3) hide show

README.md +6 -4
main.py +2 -0
model.pkl +1 -1

README.md CHANGED Viewed

@@ -14,6 +14,8 @@ model_file: model.pkl
 Suicide Detection text classification model.
 ## Training Procedure
@@ -33,9 +35,9 @@ See main.py for further details.
 | Hyperparameter                      | Value                                     |
 |-------------------------------------|-------------------------------------------|
 | memory                              |                                           |
-| steps                               | [('tfidf', TfidfVectorizer(min_df=100, ngram_range=(1, 3),<br />                preprocessor=<function preprocessor at 0x7fcc098e3280>)), ('classifier', XGBClassifier(base_score=None, booster=None, callbacks=None,<br />              colsample_bylevel=None, colsample_bynode=None,<br />              colsample_bytree=None, device=None, early_stopping_rounds=None,<br />              enable_categorical=False, eval_metric=None, feature_types=None,<br />              gamma=None, grow_policy=None, importance_type=None,<br />              interaction_constraints=None, learning_rate=None, max_bin=None,<br />              max_cat_threshold=None, max_cat_to_onehot=None,<br />              max_delta_step=None, max_depth=None, max_leaves=None,<br />              min_child_weight=None, missing=nan, monotone_constraints=None,<br />              multi_strategy=None, n_estimators=None, n_jobs=None,<br />              num_parallel_tree=None, random_state=None, ...))]                                           |
 | verbose                             | True                                      |
-| tfidf                               | TfidfVectorizer(min_df=100, ngram_range=(1, 3),<br />                preprocessor=<function preprocessor at 0x7fcc098e3280>)                                           |
 | classifier                          | XGBClassifier(base_score=None, booster=None, callbacks=None,<br />              colsample_bylevel=None, colsample_bynode=None,<br />              colsample_bytree=None, device=None, early_stopping_rounds=None,<br />              enable_categorical=False, eval_metric=None, feature_types=None,<br />              gamma=None, grow_policy=None, importance_type=None,<br />              interaction_constraints=None, learning_rate=None, max_bin=None,<br />              max_cat_threshold=None, max_cat_to_onehot=None,<br />              max_delta_step=None, max_depth=None, max_leaves=None,<br />              min_child_weight=None, missing=nan, monotone_constraints=None,<br />              multi_strategy=None, n_estimators=None, n_jobs=None,<br />              num_parallel_tree=None, random_state=None, ...)                                           |
 | tfidf__analyzer                     | word                                      |
 | tfidf__binary                       | False                                     |
@@ -49,7 +51,7 @@ See main.py for further details.
 | tfidf__min_df                       | 100                                       |
 | tfidf__ngram_range                  | (1, 3)                                    |
 | tfidf__norm                         | l2                                        |
-| tfidf__preprocessor                 | <function preprocessor at 0x7fcc098e3280> |
 | tfidf__smooth_idf                   | True                                      |
 | tfidf__stop_words                   |                                           |
 | tfidf__strip_accents                |                                           |
@@ -178,7 +180,7 @@ div.sk-label-container:hover .sk-estimator-doc-link.fitted:hover,
 #sk-container-id-1 a.estimator_doc_link:hover {/* unfitted */background-color: var(--sklearn-color-unfitted-level-3);color: var(--sklearn-color-background);text-decoration: none;
 }#sk-container-id-1 a.estimator_doc_link.fitted:hover {/* fitted */background-color: var(--sklearn-color-fitted-level-3);
 }
-</style><div id="sk-container-id-1" class="sk-top-container" style="overflow: auto;"><div class="sk-text-repr-fallback"><pre>Pipeline(steps=[(&#x27;tfidf&#x27;,TfidfVectorizer(min_df=100, ngram_range=(1, 3),preprocessor=&lt;function preprocessor at 0x7fcc098e3280&gt;)),(&#x27;classifier&#x27;,XGBClassifier(base_score=None, booster=None, callbacks=None,colsample_bylevel=None, colsample_bynode=None,colsample_bytree=None, device=None,early_stopping_rounds=None,enable_categorical=False, eval_metric=None,featur...importance_type=None,interaction_constraints=None, learning_rate=None,max_bin=None, max_cat_threshold=None,max_cat_to_onehot=None, max_delta_step=None,max_depth=None, max_leaves=None,min_child_weight=None, missing=nan,monotone_constraints=None, multi_strategy=None,n_estimators=None, n_jobs=None,num_parallel_tree=None, random_state=None, ...))],verbose=True)</pre><b>In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook. <br />On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.</b></div><div class="sk-container" hidden><div class="sk-item sk-dashed-wrapped"><div class="sk-label-container"><div class="sk-label fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-1" type="checkbox" ><label for="sk-estimator-id-1" class="sk-toggleable__label fitted sk-toggleable__label-arrow fitted">&nbsp;&nbsp;Pipeline<a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.4/modules/generated/sklearn.pipeline.Pipeline.html">?<span>Documentation for Pipeline</span></a><span class="sk-estimator-doc-link fitted">i<span>Fitted</span></span></label><div class="sk-toggleable__content fitted"><pre>Pipeline(steps=[(&#x27;tfidf&#x27;,TfidfVectorizer(min_df=100, ngram_range=(1, 3),preprocessor=&lt;function preprocessor at 0x7fcc098e3280&gt;)),(&#x27;classifier&#x27;,XGBClassifier(base_score=None, booster=None, callbacks=None,colsample_bylevel=None, colsample_bynode=None,colsample_bytree=None, device=None,early_stopping_rounds=None,enable_categorical=False, eval_metric=None,featur...importance_type=None,interaction_constraints=None, learning_rate=None,max_bin=None, max_cat_threshold=None,max_cat_to_onehot=None, max_delta_step=None,max_depth=None, max_leaves=None,min_child_weight=None, missing=nan,monotone_constraints=None, multi_strategy=None,n_estimators=None, n_jobs=None,num_parallel_tree=None, random_state=None, ...))],verbose=True)</pre></div> </div></div><div class="sk-serial"><div class="sk-item"><div class="sk-estimator fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-2" type="checkbox" ><label for="sk-estimator-id-2" class="sk-toggleable__label fitted sk-toggleable__label-arrow fitted">&nbsp;TfidfVectorizer<a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.4/modules/generated/sklearn.feature_extraction.text.TfidfVectorizer.html">?<span>Documentation for TfidfVectorizer</span></a></label><div class="sk-toggleable__content fitted"><pre>TfidfVectorizer(min_df=100, ngram_range=(1, 3),preprocessor=&lt;function preprocessor at 0x7fcc098e3280&gt;)</pre></div> </div></div><div class="sk-item"><div class="sk-estimator fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-3" type="checkbox" ><label for="sk-estimator-id-3" class="sk-toggleable__label fitted sk-toggleable__label-arrow fitted">XGBClassifier</label><div class="sk-toggleable__content fitted"><pre>XGBClassifier(base_score=None, booster=None, callbacks=None,colsample_bylevel=None, colsample_bynode=None,colsample_bytree=None, device=None, early_stopping_rounds=None,enable_categorical=False, eval_metric=None, feature_types=None,gamma=None, grow_policy=None, importance_type=None,interaction_constraints=None, learning_rate=None, max_bin=None,max_cat_threshold=None, max_cat_to_onehot=None,max_delta_step=None, max_depth=None, max_leaves=None,min_child_weight=None, missing=nan, monotone_constraints=None,multi_strategy=None, n_estimators=None, n_jobs=None,num_parallel_tree=None, random_state=None, ...)</pre></div> </div></div></div></div></div></div>
 ## Evaluation Results

 Suicide Detection text classification model.
+PYTHON 3.9 ONLY
 ## Training Procedure
 | Hyperparameter                      | Value                                     |
 |-------------------------------------|-------------------------------------------|
 | memory                              |                                           |
+| steps                               | [('tfidf', TfidfVectorizer(min_df=100, ngram_range=(1, 3),<br />                preprocessor=<function preprocessor at 0x7fc4367e5280>)), ('classifier', XGBClassifier(base_score=None, booster=None, callbacks=None,<br />              colsample_bylevel=None, colsample_bynode=None,<br />              colsample_bytree=None, device=None, early_stopping_rounds=None,<br />              enable_categorical=False, eval_metric=None, feature_types=None,<br />              gamma=None, grow_policy=None, importance_type=None,<br />              interaction_constraints=None, learning_rate=None, max_bin=None,<br />              max_cat_threshold=None, max_cat_to_onehot=None,<br />              max_delta_step=None, max_depth=None, max_leaves=None,<br />              min_child_weight=None, missing=nan, monotone_constraints=None,<br />              multi_strategy=None, n_estimators=None, n_jobs=None,<br />              num_parallel_tree=None, random_state=None, ...))]                                           |
 | verbose                             | True                                      |
+| tfidf                               | TfidfVectorizer(min_df=100, ngram_range=(1, 3),<br />                preprocessor=<function preprocessor at 0x7fc4367e5280>)                                           |
 | classifier                          | XGBClassifier(base_score=None, booster=None, callbacks=None,<br />              colsample_bylevel=None, colsample_bynode=None,<br />              colsample_bytree=None, device=None, early_stopping_rounds=None,<br />              enable_categorical=False, eval_metric=None, feature_types=None,<br />              gamma=None, grow_policy=None, importance_type=None,<br />              interaction_constraints=None, learning_rate=None, max_bin=None,<br />              max_cat_threshold=None, max_cat_to_onehot=None,<br />              max_delta_step=None, max_depth=None, max_leaves=None,<br />              min_child_weight=None, missing=nan, monotone_constraints=None,<br />              multi_strategy=None, n_estimators=None, n_jobs=None,<br />              num_parallel_tree=None, random_state=None, ...)                                           |
 | tfidf__analyzer                     | word                                      |
 | tfidf__binary                       | False                                     |
 | tfidf__min_df                       | 100                                       |
 | tfidf__ngram_range                  | (1, 3)                                    |
 | tfidf__norm                         | l2                                        |
+| tfidf__preprocessor                 | <function preprocessor at 0x7fc4367e5280> |
 | tfidf__smooth_idf                   | True                                      |
 | tfidf__stop_words                   |                                           |
 | tfidf__strip_accents                |                                           |
 #sk-container-id-1 a.estimator_doc_link:hover {/* unfitted */background-color: var(--sklearn-color-unfitted-level-3);color: var(--sklearn-color-background);text-decoration: none;
 }#sk-container-id-1 a.estimator_doc_link.fitted:hover {/* fitted */background-color: var(--sklearn-color-fitted-level-3);
 }
+</style><div id="sk-container-id-1" class="sk-top-container" style="overflow: auto;"><div class="sk-text-repr-fallback"><pre>Pipeline(steps=[(&#x27;tfidf&#x27;,TfidfVectorizer(min_df=100, ngram_range=(1, 3),preprocessor=&lt;function preprocessor at 0x7fc4367e5280&gt;)),(&#x27;classifier&#x27;,XGBClassifier(base_score=None, booster=None, callbacks=None,colsample_bylevel=None, colsample_bynode=None,colsample_bytree=None, device=None,early_stopping_rounds=None,enable_categorical=False, eval_metric=None,featur...importance_type=None,interaction_constraints=None, learning_rate=None,max_bin=None, max_cat_threshold=None,max_cat_to_onehot=None, max_delta_step=None,max_depth=None, max_leaves=None,min_child_weight=None, missing=nan,monotone_constraints=None, multi_strategy=None,n_estimators=None, n_jobs=None,num_parallel_tree=None, random_state=None, ...))],verbose=True)</pre><b>In a Jupyter environment, please rerun this cell to show the HTML representation or trust the notebook. <br />On GitHub, the HTML representation is unable to render, please try loading this page with nbviewer.org.</b></div><div class="sk-container" hidden><div class="sk-item sk-dashed-wrapped"><div class="sk-label-container"><div class="sk-label fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-1" type="checkbox" ><label for="sk-estimator-id-1" class="sk-toggleable__label fitted sk-toggleable__label-arrow fitted">&nbsp;&nbsp;Pipeline<a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.4/modules/generated/sklearn.pipeline.Pipeline.html">?<span>Documentation for Pipeline</span></a><span class="sk-estimator-doc-link fitted">i<span>Fitted</span></span></label><div class="sk-toggleable__content fitted"><pre>Pipeline(steps=[(&#x27;tfidf&#x27;,TfidfVectorizer(min_df=100, ngram_range=(1, 3),preprocessor=&lt;function preprocessor at 0x7fc4367e5280&gt;)),(&#x27;classifier&#x27;,XGBClassifier(base_score=None, booster=None, callbacks=None,colsample_bylevel=None, colsample_bynode=None,colsample_bytree=None, device=None,early_stopping_rounds=None,enable_categorical=False, eval_metric=None,featur...importance_type=None,interaction_constraints=None, learning_rate=None,max_bin=None, max_cat_threshold=None,max_cat_to_onehot=None, max_delta_step=None,max_depth=None, max_leaves=None,min_child_weight=None, missing=nan,monotone_constraints=None, multi_strategy=None,n_estimators=None, n_jobs=None,num_parallel_tree=None, random_state=None, ...))],verbose=True)</pre></div> </div></div><div class="sk-serial"><div class="sk-item"><div class="sk-estimator fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-2" type="checkbox" ><label for="sk-estimator-id-2" class="sk-toggleable__label fitted sk-toggleable__label-arrow fitted">&nbsp;TfidfVectorizer<a class="sk-estimator-doc-link fitted" rel="noreferrer" target="_blank" href="https://scikit-learn.org/1.4/modules/generated/sklearn.feature_extraction.text.TfidfVectorizer.html">?<span>Documentation for TfidfVectorizer</span></a></label><div class="sk-toggleable__content fitted"><pre>TfidfVectorizer(min_df=100, ngram_range=(1, 3),preprocessor=&lt;function preprocessor at 0x7fc4367e5280&gt;)</pre></div> </div></div><div class="sk-item"><div class="sk-estimator fitted sk-toggleable"><input class="sk-toggleable__control sk-hidden--visually" id="sk-estimator-id-3" type="checkbox" ><label for="sk-estimator-id-3" class="sk-toggleable__label fitted sk-toggleable__label-arrow fitted">XGBClassifier</label><div class="sk-toggleable__content fitted"><pre>XGBClassifier(base_score=None, booster=None, callbacks=None,colsample_bylevel=None, colsample_bynode=None,colsample_bytree=None, device=None, early_stopping_rounds=None,enable_categorical=False, eval_metric=None, feature_types=None,gamma=None, grow_policy=None, importance_type=None,interaction_constraints=None, learning_rate=None, max_bin=None,max_cat_threshold=None, max_cat_to_onehot=None,max_delta_step=None, max_depth=None, max_leaves=None,min_child_weight=None, missing=nan, monotone_constraints=None,multi_strategy=None, n_estimators=None, n_jobs=None,num_parallel_tree=None, random_state=None, ...)</pre></div> </div></div></div></div></div></div>
 ## Evaluation Results

main.py CHANGED Viewed

@@ -85,6 +85,8 @@ model_card.metadata.license = "mit"
 model_description = """
 Suicide Detection text classification model.
 """
 model_card.add(**{"Model description": model_description})

 model_description = """
 Suicide Detection text classification model.
+PYTHON 3.9 ONLY
 """
 model_card.add(**{"Model description": model_description})

model.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:68d02c53135ed449af21eb59ac0d4275b1e9ab4260af78e03e3747215e3d80c2
 size 222084873

 version https://git-lfs.github.com/spec/v1
+oid sha256:4a017267c3abe9acc8cdc759cda29ee0c753b496c0e53ed4527c77235290f442
 size 222084873