|
--- |
|
license: mit |
|
widget: |
|
|
|
- text: 从北京到莫斯科 |
|
example_title: 从北京到莫斯科 |
|
- text: 色卡里的春天 |
|
example_title: 色卡里的春天 |
|
- text: 中俄联合声明 释放了几个信号 |
|
example_title: 中俄联合声明 释放了几个信号 |
|
- text: 鸡鸣寺游客爆满设反悔门引导离寺 |
|
example_title: 鸡鸣寺游客爆满设反悔门引导离寺 |
|
datasets: |
|
- fourteenBDr/toutiao |
|
language: |
|
- zh |
|
pipeline_tag: text-classification |
|
--- |
|
|
|
# 中文新闻分类模型 |
|
|
|
## 介绍 |
|
|
|
基于 pytorch 使用[今日头条数据集](https://huggingface.co/datasets/fourteenBDr/toutiao)训练的中文新闻分类模型,用于学习中文文本分类使用,python 源码见 [main.py](./main.py) |
|
|
|
## 使用 |
|
|
|
```python |
|
from transformers import pipeline |
|
classifier = pipeline("text-classification", model="myml/toutiao") |
|
classifier("只要关羽不捣乱,峡谷4V5也不怕?") |
|
# echo [{'label': 'LABEL_16', 'score': 0.9958072900772095}] |
|
``` |
|
|
|
## 结果映射 |
|
|
|
```txt |
|
LABEL_0 民生 故事 |
|
LABEL_1 文化 文化 |
|
LABEL_2 娱乐 娱乐 |
|
LABEL_3 体育 体育 |
|
LABEL_4 财经 财经 |
|
LABEL_6 房产 房产 |
|
LABEL_7 汽车 汽车 |
|
LABEL_8 教育 教育 |
|
LABEL_9 科技 科技 |
|
LABEL_10 军事 军事 |
|
LABEL_12 旅游 旅游 |
|
LABEL_13 国际 国际 |
|
LABEL_14 证券 股票 |
|
LABEL_15 农业 三农 |
|
LABEL_16 电竞 游戏 |
|
``` |