chattts / README.md
zhzluke96
update
c6e99b3
|
raw
history blame
8.56 kB
---
title: ChatTTS Forge
emoji: 💬
colorFrom: yellow
colorTo: purple
sdk: gradio
app_file: webui.py
pinned: true
license: agpl-3.0
---
# HuggingFace Space Limit
由于 HuggingFace 对 GPU 运行时长有限制,超长任务会被强制停止(同时还会消耗 quota...),所以本 space 对文本长度做出如下限制:
| 类型 | 最大字符数 |
|------|-----------|
| TTS | 1000 字符 |
| SSML | 3000 字符(不计算 SSML 标签,只计算文本) |
# HuggingFace Space Limit
Due to the runtime limit for GPU usage on HuggingFace, extremely long tasks will be forcibly stopped (and they will also consume quota...), so this space imposes the following restrictions on text length:
| Type | Maximum Characters |
|------|---------------------|
| TTS | 1000 characters |
| SSML | 3000 characters (excluding SSML tags, only counting text) |
# 🗣️ ChatTTS-Forge
![GitHub Repo stars](https://img.shields.io/github/stars/lenML/ChatTTS-Forge)
这个Space展示了强大的[ChatTTS-Forge](https://github.com/lenML/ChatTTS-Forge)项目,基于 ChatTTS 开源模型,生成丰富的文本转语音内容。
欢迎随时体验我们的项目,或者复制以便无需排队运行你自己的实例!完整文档请访问我们的[GitHub仓库](https://github.com/lenML/ChatTTS-Forge)。
🔎 想了解更多关于SSML语法的信息,请查看我们的[SSML指南](https://github.com/lenML/ChatTTS-Forge/blob/main/docs/SSML.md)。
🔨 有关API部署的信息,请参考GitHub上的[部署部分](https://github.com/lenML/ChatTTS-Forge#本地部署)。
🚀 如果您想使用 Colab 进行部署,点击一键部署:[![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/lenML/ChatTTS-Forge/blob/main/colab.ipynb)
# en
This Space demonstrates the powerful [ChatTTS-Forge](https://github.com/lenML/ChatTTS-Forge) project, based on the open-source ChatTTS model, which generates rich text-to-speech content.
Feel free to explore our project, or duplicate it to run your own instances without a queue! For the full documentation, please visit our [GitHub repository](https://github.com/lenML/ChatTTS-Forge).
🔎 To learn more about SSML syntax, check out our [SSML guide](https://github.com/lenML/ChatTTS-Forge/blob/main/docs/SSML.md).
🔨 For information on deploying the API, please refer to the [deployment section](https://github.com/lenML/ChatTTS-Forge#本地部署) on GitHub.
🚀 If you want to deploy using Colab, click for one-click deployment: [![Open In Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/lenML/ChatTTS-Forge/blob/main/colab.ipynb)
# styles (Experimental)
由于自回归模型的特性,我们可以对生成过程进行干扰和控制,目前,仅为实验性质功能
# styles table
文件 `./data/styles.csv` 中包含所有风格,下面是具体的设定
> 风格名带有 `_p` 结尾的是注入上下文的风格,可能导致质量下降但是控制更强一点
| 风格 | 说明 |
| ------------------------- | -------------------------------------------------------------------------------------------------- |
| advertisement_upbeat | 用兴奋和精力充沛的语气推广产品或服务。 |
| affectionate | 以较高的音调和音量表达温暖而亲切的语气。说话者处于吸引听众注意力的状态。说话者的个性往往是讨喜的。 |
| angry | 表达生气和厌恶的语气。 |
| assistant | 数字助理用的是热情而轻松的语气。 |
| calm | 以沉着冷静的态度说话。语气、音调和韵律与其他语音类型相比要统一得多。 |
| chat | 表达轻松随意的语气。 |
| cheerful | 表达积极愉快的语气。 |
| customerservice | 以友好热情的语气为客户提供支持。 |
| depressed | 调低音调和音量来表达忧郁、沮丧的语气。 |
| disgruntled | 表达轻蔑和抱怨的语气。这种情绪的语音表现出不悦和蔑视。 |
| documentary-narration | 用一种轻松、感兴趣和信息丰富的风格讲述纪录片,适合配音纪录片、专家评论和类似内容。 |
| embarrassed | 在说话者感到不舒适时表达不确定、犹豫的语气。 |
| empathetic | 表达关心和理解。 |
| envious | 当你渴望别人拥有的东西时,表达一种钦佩的语气。 |
| excited | 表达乐观和充满希望的语气。似乎发生了一些美好的事情,说话人对此满意。 |
| fearful | 以较高的音调、较高的音量和较快的语速来表达恐惧、紧张的语气。说话人处于紧张和不安的状态。 |
| friendly | 表达一种愉快、怡人且温暖的语气。听起来很真诚且满怀关切。 |
| gentle | 以较低的音调和音量表达温和、礼貌和愉快的语气。 |
| hopeful | 表达一种温暖且渴望的语气。听起来像是会有好事发生在说话人身上。 |
| lyrical | 以优美又带感伤的方式表达情感。 |
| narration-professional | 以专业、客观的语气朗读内容。 |
| narration-relaxed | 为内容阅读表达一种舒缓而悦耳的语气。 |
| newscast | 以正式专业的语气叙述新闻。 |
| newscast-casual | 以通用、随意的语气发布一般新闻。 |
| newscast-formal | 以正式、自信和权威的语气发布新闻。 |
| poetry-reading | 在读诗时表达出带情感和节奏的语气。 |
| sad | 表达悲伤语气。 |
| serious | 表达严肃和命令的语气。说话者的声音通常比较僵硬,节奏也不那么轻松。 |
| shouting | 表达一种听起来好像声音在远处或在另一个地方的语气,努力让别人听清楚。 |
| sports_commentary | 表达一种既轻松又感兴趣的语气,用于播报体育赛事。 |
| sports_commentary_excited | 用快速且充满活力的语气播报体育赛事精彩瞬间。 |
| whispering | 表达一种柔和的语气,试图发出安静而柔和的声音。 |
| terrified | 表达一种害怕的语气,语速快且声音颤抖。听起来说话人处于不稳定的疯狂状态。 |
| unfriendly | 表达一种冷淡无情的语气。 |