中文新闻分类模型

介绍

基于 pytorch 使用今日头条数据集训练的中文新闻分类模型,用于学习中文文本分类使用,python 源码见 main.py

使用

from transformers import pipeline
classifier = pipeline("text-classification",  model="myml/toutiao")
classifier("只要关羽不捣乱,峡谷4V5也不怕?")
# echo [{'label': 'LABEL_16', 'score': 0.9958072900772095}]

结果映射

LABEL_0 民生 故事 
LABEL_1 文化 文化 
LABEL_2 娱乐 娱乐 
LABEL_3 体育 体育 
LABEL_4 财经 财经 
LABEL_6 房产 房产 
LABEL_7 汽车 汽车 
LABEL_8 教育 教育 
LABEL_9 科技 科技 
LABEL_10 军事 军事 
LABEL_12 旅游 旅游 
LABEL_13 国际 国际 
LABEL_14 证券 股票 
LABEL_15 农业 三农 
LABEL_16 电竞 游戏 
Downloads last month
11,350
Safetensors
Model size
102M params
Tensor type
I64
·
F32
·
Inference Examples
This model does not have enough activity to be deployed to Inference API (serverless) yet. Increase its social visibility and check back later, or deploy to Inference Endpoints (dedicated) instead.

Dataset used to train myml/toutiao