poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)

#1
by Ai-Tunes - opened

poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)

poderia compartilhar o .safetensor e o vocab.txt tb? seria de bastante ajuda :)
irmão o safetensor você precisa converter diretamente na interface de finetune este e o modelo full e o vocab.txt e padrão do repo F5-TTS o so fazer fine tune e sai para o abraço fiquei tão feliz de encontrar este repositorio depois de ver ele falando no git ja fiz o finetune e ficou perfect

eu testei com o full so que nao ficou com sotaque brasileiro ficou sotaque de gringo

eu testei com o full so que nao ficou com sotaque brasileiro ficou sotaque de gringo

eu particulamente não testei o modelo diretamente utilizei para finetune para adiantar o trabalho mais uma dica você tem que usar o audio de referencia em portugues e tem que ter o texto de referencia igual o que esta no audio diferente de outros modelos que pega somente o pitch este parece pegar tudo exmplo -ref_text "levantara a mão contra ele e o oficial então arrancara da espada e atravessara o de lado a lado estava direito ah" \ aqui tem que ser a mesma coisa que seu audio de referente esta dizendo

"""python inference-cli.py \

Specify the model name to use for inference

--model "F5-TTS" \

Path to the model checkpoint file, which contains the saved model weights

--ckpt_file "path/to/model.pt" \

Path to the reference audio file. This file is used to capture the speaking style

and voice characteristics, which the model will try to mimic.

--ref_audio "wavs/sample_audio.wav" \

Reference text associated with the reference audio file.

This helps the model understand the speaking style.

--ref_text "levantara a mão contra ele e o oficial então arrancara da espada e atravessara o de lado a lado estava direito ah" \

Text that the model will generate speech for. This will be spoken in the style

derived from the reference audio and text.

--gen_text "O Brasil, oficialmente República Federativa do Brasil, é o maior país da América do Sul e da América Latina.""""

eu consegui um sotaque aceitavel ,mas o TTs instavel ele alucina de vez em quando

A qualidade desse treinamento ta legal pessoal?

Salve a todos. Eu baixei o model_2600000.pt, mas o voice-pro com F5TTS requer o formato .safetensors.
Como que faz pra converter em .safetensors ou configurar pra que aceite .pt? Obrigado
Edit: fiz a conversão com python, mas não funcionou. Mesmo sotaque gringo.

Utilize esse como ponto de partida. Os modelos que você encontra online geralmente não são 100% precisos. Pegue o arquivo .pt e trabalhe em cima dele com seu treinamento. É justamente o que eu faria, pois poupa tempo. Para que fique perfeito para o que você pretende fazer, é necessário melhorá-lo. Temos até que agradecer ao amigo por disponibilizá-lo, pois isso demanda tempo para ser feito.

@adrianobolder @tribuzeus @Ai-Tunes
can someone send me a better checkpoint using your datasets in brazilian portuguese?

Sign up or log in to comment