Spaces:

Nikolaygod777
/

MakerVideo

Sleeping

App Files Files Community

Nikolaygod777 commited on Mar 20

Commit

841d195

verified ·

1 Parent(s): a5e6912

Update app.py

Browse files

Files changed (1) hide show

app.py +74 -43

app.py CHANGED Viewed

@@ -1,65 +1,96 @@
 import gradio as gr
 import torch
 import soundfile as sf
-import numpy as np
-from diffusers import StableVideoDiffusionPipeline
-from transformers import MusicgenForConditionalGeneration, MusicgenProcessor
-# Определяем устройство (GPU, если доступен)
 device = "cuda" if torch.cuda.is_available() else "cpu"
-# Загружаем модель для генерации видео (Stable Video Diffusion)
 video_pipe = StableVideoDiffusionPipeline.from_pretrained(
-    "stabilityai/stable-video-diffusion-img2vid",
-    torch_dtype=torch.float16 if device == "cuda" else torch.float32
 ).to(device)
-# Загружаем модель для генерации музыки (MusicGen)
 music_model = MusicgenForConditionalGeneration.from_pretrained("facebook/musicgen-small")
 music_processor = MusicgenProcessor.from_pretrained("facebook/musicgen-small")
-# Функция генерации видео
-def generate_video(prompt):
-    # ❗ Stable Video Diffusion требует изображение, а не текст ❗
-    init_image = video_pipe.text_to_image(prompt, num_inference_steps=25).images[0]  # Генерация стартового кадра
-    video_frames = video_pipe(init_image, num_inference_steps=25).frames  # Генерация видео
-    # Сохранение видео
     video_path = "generated_video.mp4"
-    video_pipe.save_video(video_frames, video_path, fps=15)
     return video_path
-# Функция генерации музыки
 def generate_music(prompt):
-    inputs = music_processor(text=[prompt], return_tensors="pt")  # Правильная передача текста
-    audio_output = music_model.generate(**inputs, max_new_tokens=512)  # Генерация аудио
-    # Декодирование аудиовыхода
-    audio_array = audio_output[0].cpu().detach().numpy().squeeze()
-    # Сохранение аудио в файл
     audio_path = "generated_audio.wav"
-    sf.write(audio_path, audio_array, samplerate=16000)  # Правильная запись WAV
     return audio_path
-# Интерфейс Gradio
-with gr.Blocks() as demo:
-    gr.Markdown("# OnlyReels.AI 🎥🎵 - Генерация видео с музыкой")
-    with gr.Row():
-        prompt_input = gr.Textbox(label="Введите описание видео и музыки", placeholder="Пример: Киберпанк-город ночью, синтезаторная музыка")
-    with gr.Row():
-        btn_video = gr.Button("🎬 Сгенерировать видео")
-        btn_music = gr.Button("🎵 Сгенерировать музыку")
-    video_output = gr.Video(label="Сгенерированное видео")
-    music_output = gr.Audio(label="Сгенерированная музыка")
-    btn_video.click(fn=generate_video, inputs=prompt_input, outputs=video_output)
-    btn_music.click(fn=generate_music, inputs=prompt_input, outputs=music_output)
-# Запуск интерфейса
-demo.launch()

 import gradio as gr
 import torch
+import subprocess
+from diffusers import StableDiffusionPipeline, StableVideoDiffusionPipeline
+from transformers import MusicgenForConditionalGeneration, MusicgenProcessor, pipeline
 import soundfile as sf
+from PIL import Image
 device = "cuda" if torch.cuda.is_available() else "cpu"
+# Модель перевода русского текста на английский
+translator = pipeline("translation_ru_to_en", "Helsinki-NLP/opus-mt-ru-en")
+# Загрузка моделей
+image_pipe = StableDiffusionPipeline.from_pretrained(
+    "CompVis/stable-diffusion-v1-4", torch_dtype=torch.float32
+).to(device)
 video_pipe = StableVideoDiffusionPipeline.from_pretrained(
+    "stabilityai/stable-video-diffusion-img2vid", torch_dtype=torch.float32
 ).to(device)
 music_model = MusicgenForConditionalGeneration.from_pretrained("facebook/musicgen-small")
 music_processor = MusicgenProcessor.from_pretrained("facebook/musicgen-small")
+# Перевод промта
+def translate_prompt(prompt):
+    translation = translator(prompt)
+    return translation[0]['translation_text']
+# Генерация изображения
+def generate_image(prompt):
+    prompt_en = translate_prompt(prompt)
+    image = image_pipe(prompt_en, num_inference_steps=10).images[0]
+    image_path = "generated_image.png"
+    image.save(image_path)
+    return image_path
+# Генерация видео
+def generate_video(image_path):
+    image = Image.open(image_path)
+    video_frames = video_pipe(image, num_inference_steps=10, num_frames=16).frames
     video_path = "generated_video.mp4"
+    video_pipe.save_video(video_frames, video_path, fps=8)
     return video_path
+# Генерация музыки
 def generate_music(prompt):
+    prompt_en = translate_prompt(prompt)
+    inputs = music_processor(text=[prompt_en], return_tensors="pt")
+    audio_output = music_model.generate(**inputs, max_new_tokens=512)
+    audio_array = audio_output[0].cpu().numpy().squeeze()
     audio_path = "generated_audio.wav"
+    sf.write(audio_path, audio_array, samplerate=16000)
     return audio_path
+# Объединение видео и музыки
+def merge_video_audio(video_path, audio_path):
+    output_path = "final_video.mp4"
+    subprocess.run(
+        f"ffmpeg -y -i {video_path} -i {audio_path} -c:v copy -c:a aac {output_path}",
+        shell=True
+    )
+    return output_path
+# Главная функция для генерации всех элементов отдельно
+def create_all(prompt):
+    image_path = generate_image(prompt)
+    video_path = generate_video(image_path)
+    audio_path = generate_music(prompt)
+    final_video = merge_video_audio(video_path, audio_path)
+    return image_path, video_path, audio_path, final_video
+# Интерфейс Gradio
+with gr.Blocks() as demo:
+    gr.Markdown("# OnlyReels.AI 🎥🎵 - Генерация изображения, видео и музыки")
+    prompt_input = gr.Textbox(label="Описание (русский язык)",
+                              placeholder="Пример: Киберпанк-город ночью, синтезаторная музыка")
+    btn_generate = gr.Button("✨ Сгенерировать все")
+    image_output = gr.Image(label="Изображение")
+    video_output = gr.Video(label="Видео")
+    audio_output = gr.Audio(label="Музыка")
+    final_video_output = gr.Video(label="Итоговое видео с музыкой")
+    btn_generate.click(
+        fn=create_all,
+        inputs=prompt_input,
+        outputs=[image_output, video_output, audio_output, final_video_output]
+    )
+if __name__ == "__main__":
+    demo.launch()