Spaces:
Sleeping
Sleeping
File size: 886 Bytes
e5451b9 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 |
---
title: ChinesePrivacyPolicyMark
emoji: 👁
colorFrom: gray
colorTo: purple
sdk: gradio
sdk_version: 5.5.0
app_file: app.py
pinned: false
short_description: Mark Chinese Privacy Policy with Retrieve models
---
使用的数据地址:https://github.com/EnlightenedAI/CAPP-130<br>
使用预训练好的模型检索预先保存好的隐私政策,以此标注隐私政策中的关键信息。<br>
首先使用特征提取模型将隐私政策中的句子进行tokenize,将其与保存的向量对比进行一次“粗筛”,选取与其最为接近的n条记录。<br>
之后使用文本相似度计算模型,将筛选出来的n条记录与原本的文本进行匹配,过滤出相似度高于阈值p的m条记录,将这m条记录所属的标记合并起来。<br>
由于没有使用GPU,直接在Space中运行会很慢。有条件可以clone下来试试。 |