Ses Kalitesi
Merhaba,
F5-TTS mac üzerinde çalıştırıp kendi ses dosyaları ile
basit bir deneme yaptım fakat çıktı inanılmaz kötü.Sorun mac üzerinde çalıştırmamdan mı yoksa kurulum yada kullanım ile alakalı bir sorun mu anlayamadım.Buna benzer bir case ile karşılaştınız mı ?
İlgili çıktı: https://voca.ro/1jnxTUxSAF7i
Çalıştırmış olduğum kod:f5-tts_infer-cli --model "F5-TTS" --ref_audio "/path/to//F5-TTS/src/f5_tts/infer/examples/basic/basic_ref_en.wav" --ref_text "The content, subtitle or transcription of reference audio." --gen_text "Some text you want TTS model generate for you."
Leave a comment
Output:
Ref:
Belli ki referans ses transkription dogru degil. Ya gui üzerinde transcript metni silmelisin ya da kendin elle girmelisin. f5-tts böyle calisiyor. Ayrica output olarak da ingilizce ses olusturmussun :) Bu model ingilizce degil, türkce ses olusturmak icindir.
Çalıştırmayı başardım sorun sanırım CUDA (cu118) 'nun ARM64 tarafından desteklenmemesiden kaynaklanıyormuş.
Cuda'sız yeniden kurdum şu an bir sorun gözükmüyor.
Hızlıca test için hazır örnekler üzerinden deneme yapmıştım o sebepten model ingilizce, sağlıklı bir çıktı alamadığım için dil modelini değiştirme aşamasına geçememiştim :)