File size: 1,391 Bytes
d043d05
 
24f39fd
fe49cfc
 
 
 
 
 
 
 
 
329fcb4
 
 
 
 
d043d05
24f39fd
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
329fcb4
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
---
license: mit
widget:
# 来自 2023年3月23日 百度首页的新闻
- text: 从北京到莫斯科
  example_title: 从北京到莫斯科
- text: 色卡里的春天
  example_title: 色卡里的春天
- text: 中俄联合声明 释放了几个信号
  example_title: 中俄联合声明 释放了几个信号
- text: 鸡鸣寺游客爆满设反悔门引导离寺
  example_title: 鸡鸣寺游客爆满设反悔门引导离寺
datasets:
- fourteenBDr/toutiao
language:
- zh
pipeline_tag: text-classification
---

# 中文新闻分类模型

## 介绍

基于 pytorch 使用[今日头条数据集](https://huggingface.co/datasets/fourteenBDr/toutiao)训练的中文新闻分类模型,用于学习中文文本分类使用,python 源码见 [main.py](./main.py)

## 使用

```python
from transformers import pipeline
classifier = pipeline("text-classification",  model="myml/toutiao")
classifier("只要关羽不捣乱,峡谷4V5也不怕?")
# echo [{'label': 'LABEL_16', 'score': 0.9958072900772095}]
```

## 结果映射

```txt
LABEL_0 民生 故事 
LABEL_1 文化 文化 
LABEL_2 娱乐 娱乐 
LABEL_3 体育 体育 
LABEL_4 财经 财经 
LABEL_6 房产 房产 
LABEL_7 汽车 汽车 
LABEL_8 教育 教育 
LABEL_9 科技 科技 
LABEL_10 军事 军事 
LABEL_12 旅游 旅游 
LABEL_13 国际 国际 
LABEL_14 证券 股票 
LABEL_15 农业 三农 
LABEL_16 电竞 游戏 
```