start

Browse files

Files changed (11) hide show

.hydra/config.yaml +131 -0
.hydra/hydra.yaml +182 -0
.hydra/overrides.yaml +1 -0
checkpoints/last.ckpt +3 -0
config_tree.log +145 -0
data/train.txt +0 -0
data/valid.txt +24 -0
tags.log +1 -0
tensorboard/version_0/events.out.tfevents.1729448606.b9cbd4f2ed3e.1163.0 +3 -0
tensorboard/version_0/hparams.yaml +117 -0
train.log +13 -0

.hydra/config.yaml ADDED Viewed

	@@ -0,0 +1,131 @@

+task_name: train
+run_name: anna
+tags:
+- nabucasa
+- hungarian
+- anna
+train: true
+test: true
+ckpt_path: null
+seed: 1234
+data:
+  _target_: matcha.data.text_mel_datamodule.TextMelDataModule
+  name: nabucasa_anna
+  train_filelist_path: data/nabucasa_anna/train.txt
+  valid_filelist_path: data/nabucasa_anna/valid.txt
+  batch_size: 32
+  num_workers: 20
+  pin_memory: true
+  cleaners:
+  - hungarian_cleaners
+  add_blank: true
+  n_spks: 1
+  n_fft: 1024
+  n_feats: 80
+  sample_rate: 22050
+  hop_length: 256
+  win_length: 1024
+  f_min: 0
+  f_max: 8000
+  data_statistics:
+    mel_mean: -6.346419334411621
+    mel_std: 2.677656650543213
+  seed: ${seed}
+  load_durations: false
+model:
+  _target_: matcha.models.matcha_tts.MatchaTTS
+  n_vocab: 178
+  n_spks: ${data.n_spks}
+  spk_emb_dim: 64
+  n_feats: 80
+  data_statistics: ${data.data_statistics}
+  out_size: null
+  prior_loss: true
+  use_precomputed_durations: ${data.load_durations}
+  encoder:
+    encoder_type: RoPE Encoder
+    encoder_params:
+      n_feats: ${model.n_feats}
+      n_channels: 192
+      filter_channels: 768
+      filter_channels_dp: 256
+      n_heads: 2
+      n_layers: 6
+      kernel_size: 3
+      p_dropout: 0.1
+      spk_emb_dim: 64
+      n_spks: 1
+      prenet: true
+    duration_predictor_params:
+      filter_channels_dp: ${model.encoder.encoder_params.filter_channels_dp}
+      kernel_size: 3
+      p_dropout: ${model.encoder.encoder_params.p_dropout}
+  decoder:
+    channels:
+    - 256
+    - 256
+    dropout: 0.05
+    attention_head_dim: 64
+    n_blocks: 1
+    num_mid_blocks: 2
+    num_heads: 2
+    act_fn: snakebeta
+  cfm:
+    name: CFM
+    solver: euler
+    sigma_min: 0.0001
+  optimizer:
+    _target_: torch.optim.Adam
+    _partial_: true
+    lr: 0.0001
+    weight_decay: 0.0
+callbacks:
+  model_checkpoint:
+    _target_: lightning.pytorch.callbacks.ModelCheckpoint
+    dirpath: ${paths.output_dir}/checkpoints
+    filename: checkpoint_{epoch:03d}
+    monitor: epoch
+    verbose: false
+    save_last: true
+    save_top_k: 10
+    mode: max
+    auto_insert_metric_name: true
+    save_weights_only: false
+    every_n_train_steps: null
+    train_time_interval: null
+    every_n_epochs: 100
+    save_on_train_epoch_end: null
+  model_summary:
+    _target_: lightning.pytorch.callbacks.RichModelSummary
+    max_depth: 3
+  rich_progress_bar:
+    _target_: lightning.pytorch.callbacks.RichProgressBar
+logger:
+  tensorboard:
+    _target_: lightning.pytorch.loggers.tensorboard.TensorBoardLogger
+    save_dir: ${paths.output_dir}/tensorboard/
+    name: null
+    log_graph: false
+    default_hp_metric: true
+    prefix: ''
+trainer:
+  _target_: lightning.pytorch.trainer.Trainer
+  default_root_dir: ${paths.output_dir}
+  max_epochs: -1
+  accelerator: gpu
+  devices:
+  - 0
+  precision: 16-mixed
+  check_val_every_n_epoch: 1
+  deterministic: false
+  gradient_clip_val: 5.0
+paths:
+  root_dir: ${oc.env:PROJECT_ROOT}
+  data_dir: ${paths.root_dir}/data/
+  log_dir: ${paths.root_dir}/logs/
+  output_dir: ${hydra:runtime.output_dir}
+  work_dir: ${hydra:runtime.cwd}
+extras:
+  ignore_warnings: false
+  enforce_tags: true
+  print_config: true

.hydra/hydra.yaml ADDED Viewed

	@@ -0,0 +1,182 @@

+hydra:
+  run:
+    dir: ${paths.log_dir}/${task_name}/${run_name}/runs/${now:%Y-%m-%d}_${now:%H-%M-%S}
+  sweep:
+    dir: ${paths.log_dir}/${task_name}/${run_name}/multiruns/${now:%Y-%m-%d}_${now:%H-%M-%S}
+    subdir: ${hydra.job.num}
+  launcher:
+    _target_: hydra._internal.core_plugins.basic_launcher.BasicLauncher
+  sweeper:
+    _target_: hydra._internal.core_plugins.basic_sweeper.BasicSweeper
+    max_batch_size: null
+    params: null
+  help:
+    app_name: ${hydra.job.name}
+    header: '${hydra.help.app_name} is powered by Hydra.
+      '
+    footer: 'Powered by Hydra (https://hydra.cc)
+      Use --hydra-help to view Hydra specific help
+      '
+    template: '${hydra.help.header}
+      == Configuration groups ==
+      Compose your configuration from those groups (group=option)
+      $APP_CONFIG_GROUPS
+      == Config ==
+      Override anything in the config (foo.bar=value)
+      $CONFIG
+      ${hydra.help.footer}
+      '
+  hydra_help:
+    template: 'Hydra (${hydra.runtime.version})
+      See https://hydra.cc for more info.
+      == Flags ==
+      $FLAGS_HELP
+      == Configuration groups ==
+      Compose your configuration from those groups (For example, append hydra/job_logging=disabled
+      to command line)
+      $HYDRA_CONFIG_GROUPS
+      Use ''--cfg hydra'' to Show the Hydra config.
+      '
+    hydra_help: ???
+  hydra_logging:
+    version: 1
+    formatters:
+      colorlog:
+        (): colorlog.ColoredFormatter
+        format: '[%(cyan)s%(asctime)s%(reset)s][%(purple)sHYDRA%(reset)s] %(message)s'
+    handlers:
+      console:
+        class: logging.StreamHandler
+        formatter: colorlog
+        stream: ext://sys.stdout
+    root:
+      level: INFO
+      handlers:
+      - console
+    disable_existing_loggers: false
+  job_logging:
+    version: 1
+    formatters:
+      simple:
+        format: '[%(asctime)s][%(name)s][%(levelname)s] - %(message)s'
+      colorlog:
+        (): colorlog.ColoredFormatter
+        format: '[%(cyan)s%(asctime)s%(reset)s][%(blue)s%(name)s%(reset)s][%(log_color)s%(levelname)s%(reset)s]
+          - %(message)s'
+        log_colors:
+          DEBUG: purple
+          INFO: green
+          WARNING: yellow
+          ERROR: red
+          CRITICAL: red
+    handlers:
+      console:
+        class: logging.StreamHandler
+        formatter: colorlog
+        stream: ext://sys.stdout
+      file:
+        class: logging.FileHandler
+        formatter: simple
+        filename: ${hydra.runtime.output_dir}/${hydra.job.name}.log
+    root:
+      level: INFO
+      handlers:
+      - console
+      - file
+    disable_existing_loggers: false
+  env: {}
+  mode: RUN
+  searchpath: []
+  callbacks: {}
+  output_subdir: .hydra
+  overrides:
+    hydra:
+    - hydra.mode=RUN
+    task:
+    - experiment=anna
+  job:
+    name: train
+    chdir: null
+    override_dirname: experiment=anna
+    id: ???
+    num: ???
+    config_name: train.yaml
+    env_set: {}
+    env_copy: []
+    config:
+      override_dirname:
+        kv_sep: '='
+        item_sep: ','
+        exclude_keys: []
+  runtime:
+    version: 1.3.2
+    version_base: '1.3'
+    cwd: /workspace/Matcha-TTS
+    config_sources:
+    - path: hydra.conf
+      schema: pkg
+      provider: hydra
+    - path: /workspace/Matcha-TTS/configs
+      schema: file
+      provider: main
+    - path: hydra_plugins.hydra_colorlog.conf
+      schema: pkg
+      provider: hydra-colorlog
+    - path: ''
+      schema: structured
+      provider: schema
+    output_dir: /workspace/Matcha-TTS/logs/train/anna/runs/2024-10-20_18-23-24
+    choices:
+      debug: null
+      local: default
+      hparams_search: null
+      experiment: anna
+      hydra: default
+      extras: default
+      paths: default
+      trainer: default
+      logger: tensorboard
+      callbacks: default
+      model: matcha
+      model/optimizer: adam.yaml
+      model/cfm: default.yaml
+      model/decoder: default.yaml
+      model/encoder: default.yaml
+      data: nabucasa_anna.yaml
+      hydra/env: default
+      hydra/callbacks: null
+      hydra/job_logging: colorlog
+      hydra/hydra_logging: colorlog
+      hydra/hydra_help: default
+      hydra/help: default
+      hydra/sweeper: basic
+      hydra/launcher: basic
+      hydra/output: default
+  verbose: false

.hydra/overrides.yaml ADDED Viewed

	@@ -0,0 +1 @@


1	+ - experiment=anna

checkpoints/last.ckpt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:18235b00378cd8de238238006c26697df650cc36d581b2f47eebd603476876c8
+size 218838731

config_tree.log ADDED Viewed

	@@ -0,0 +1,145 @@

+CONFIG
+├── data
+│   └── _target_: matcha.data.text_mel_datamodule.TextMelDataModule
+│       name: nabucasa_anna
+│       train_filelist_path: data/nabucasa_anna/train.txt
+│       valid_filelist_path: data/nabucasa_anna/valid.txt
+│       batch_size: 32
+│       num_workers: 20
+│       pin_memory: true
+│       cleaners:
+│       - hungarian_cleaners
+│       add_blank: true
+│       n_spks: 1
+│       n_fft: 1024
+│       n_feats: 80
+│       sample_rate: 22050
+│       hop_length: 256
+│       win_length: 1024
+│       f_min: 0
+│       f_max: 8000
+│       data_statistics:
+│         mel_mean: -6.346419334411621
+│         mel_std: 2.677656650543213
+│       seed: 1234
+│       load_durations: false
+│
+├── model
+│   └── _target_: matcha.models.matcha_tts.MatchaTTS
+│       n_vocab: 178
+│       n_spks: 1
+│       spk_emb_dim: 64
+│       n_feats: 80
+│       data_statistics:
+│         mel_mean: -6.346419334411621
+│         mel_std: 2.677656650543213
+│       out_size: null
+│       prior_loss: true
+│       use_precomputed_durations: false
+│       encoder:
+│         encoder_type: RoPE Encoder
+│         encoder_params:
+│           n_feats: 80
+│           n_channels: 192
+│           filter_channels: 768
+│           filter_channels_dp: 256
+│           n_heads: 2
+│           n_layers: 6
+│           kernel_size: 3
+│           p_dropout: 0.1
+│           spk_emb_dim: 64
+│           n_spks: 1
+│           prenet: true
+│         duration_predictor_params:
+│           filter_channels_dp: 256
+│           kernel_size: 3
+│           p_dropout: 0.1
+│       decoder:
+│         channels:
+│         - 256
+│         - 256
+│         dropout: 0.05
+│         attention_head_dim: 64
+│         n_blocks: 1
+│         num_mid_blocks: 2
+│         num_heads: 2
+│         act_fn: snakebeta
+│       cfm:
+│         name: CFM
+│         solver: euler
+│         sigma_min: 0.0001
+│       optimizer:
+│         _target_: torch.optim.Adam
+│         _partial_: true
+│         lr: 0.0001
+│         weight_decay: 0.0
+│
+├── callbacks
+│   └── model_checkpoint:
+│         _target_: lightning.pytorch.callbacks.ModelCheckpoint
+│         dirpath: /workspace/Matcha-TTS/logs/train/anna/runs/2024-10-20_18-23-2
+│         filename: checkpoint_{epoch:03d}
+│         monitor: epoch
+│         verbose: false
+│         save_last: true
+│         save_top_k: 10
+│         mode: max
+│         auto_insert_metric_name: true
+│         save_weights_only: false
+│         every_n_train_steps: null
+│         train_time_interval: null
+│         every_n_epochs: 100
+│         save_on_train_epoch_end: null
+│       model_summary:
+│         _target_: lightning.pytorch.callbacks.RichModelSummary
+│         max_depth: 3
+│       rich_progress_bar:
+│         _target_: lightning.pytorch.callbacks.RichProgressBar
+│
+├── logger
+│   └── tensorboard:
+│         _target_: lightning.pytorch.loggers.tensorboard.TensorBoardLogger
+│         save_dir: /workspace/Matcha-TTS/logs/train/anna/runs/2024-10-20_18-23-
+│         name: null
+│         log_graph: false
+│         default_hp_metric: true
+│         prefix: ''
+│
+├── trainer
+│   └── _target_: lightning.pytorch.trainer.Trainer
+│       default_root_dir: /workspace/Matcha-TTS/logs/train/anna/runs/2024-10-20_
+│       max_epochs: -1
+│       accelerator: gpu
+│       devices:
+│       - 0
+│       precision: 16-mixed
+│       check_val_every_n_epoch: 1
+│       deterministic: false
+│       gradient_clip_val: 5.0
+│
+├── paths
+│   └── root_dir: /workspace/Matcha-TTS
+│       data_dir: /workspace/Matcha-TTS/data/
+│       log_dir: /workspace/Matcha-TTS/logs/
+│       output_dir: /workspace/Matcha-TTS/logs/train/anna/runs/2024-10-20_18-23-
+│       work_dir: /workspace/Matcha-TTS
+│
+├── extras
+│   └── ignore_warnings: false
+│       enforce_tags: true
+│       print_config: true
+│
+├── task_name
+│   └── train
+├── run_name
+│   └── anna
+├── tags
+│   └── ['nabucasa', 'hungarian', 'anna']
+├── train
+│   └── True
+├── test
+│   └── True
+├── ckpt_path
+│   └── None
+└── seed
+    └── 1234

data/train.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

data/valid.txt ADDED Viewed

	@@ -0,0 +1,24 @@

+data/nabucasa_anna/0000000001.wav|A színes manikűrök a fesztiválidőszakra tökéletesek lesznek, hiszen feltűnőek és izgalmasak, de abszolút elfogadható kereteken belül.
+data/nabucasa_anna/0000000029.wav|Két tojás volt a sok salátalevél között, csak az vette észre, aki kifejezetten az én kajámat figyelte.
+data/nabucasa_anna/0000000074.wav|Így amennyiben az átlagosnál nem csapadékosabb a tavasz és a nyárelő, komoly mezőgazdasági károk alakulhatnak ki, ahogy idén is.
+data/nabucasa_anna/0000000179.wav|A kanapé az egyik legporosabb tárgy az otthonodban.
+data/nabucasa_anna/0000000196.wav|Nem semmi történetet osztott meg egy vendég a neten.
+data/nabucasa_anna/0100000004.wav|Egyéni célokat tűzött maga elé?
+data/nabucasa_anna/0100000016.wav|De hát akkor ki írta?
+data/nabucasa_anna/0100000081.wav|Jó, akkor mikor hívjon?
+data/nabucasa_anna/0100000094.wav|Csapatban vagy egyedül érdemes futni?
+data/nabucasa_anna/0200000003.wav|Ilyenkor konkrétan felismerhetetlenné válnak a számunkra amúgy jól ismert tárgyak!
+data/nabucasa_anna/0200000066.wav|Szerencsés csillagzat alatt születtél, de nem csak ez az oka a sorozatos mázliknak!
+data/nabucasa_anna/0300000046.wav|Melyik szóra gondoltál, hűtő mint H Ű T Ő vagy fűtő mint F Ű T Ő?
+data/nabucasa_anna/3000000002.wav|Szia, ez nagyon jól hangzik, én is mehetek?
+data/nabucasa_anna/3000000030.wav|Imádom a sivatagokat, ezért utazom ebbe az országba.
+data/nabucasa_anna/3000000031.wav|A sivatagi táj lélegzetelállító, nekünk is el kellene menni.
+data/nabucasa_anna/3000000037.wav|Spontán módon jobban szeretek utazni.
+data/nabucasa_anna/3000000039.wav|Igen, holnap ötkor találkozunk a mozi előtt.
+data/nabucasa_anna/3000000144.wav|Igen, szeretném tudni, hol voltál.
+data/nabucasa_anna/3000000153.wav|Nekem is meg kell tanítanod ezt.
+data/nabucasa_anna/3000000219.wav|Akkor megcsinálom, és kifizetem.
+data/nabucasa_anna/3000000294.wav|Nagyon sajnálom, de pénzre van szükségem.
+data/nabucasa_anna/4000000179.wav|Ön jogosult meghosszabbítani a garanciát további ötezer forint ellenében, kérjük nyilatkozzon a szándékáról.
+data/nabucasa_anna/4000000189.wav|Ügyfeleink számára a lehető legjobb és könnyen adaptálható szolgáltatásra törekszünk.
+data/nabucasa_anna/4000000236.wav|Az informatikus kolléga holnap tudja elhárítani a problémát, mert a készülék jelenleg nincs raktáron.

tags.log ADDED Viewed

	@@ -0,0 +1 @@


1	+ ['nabucasa', 'hungarian', 'anna']

tensorboard/version_0/events.out.tfevents.1729448606.b9cbd4f2ed3e.1163.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ada84686dc195843ebdb55b2d2d145f2928434c49a590869e8deb9460ec6e110
+size 1468747

tensorboard/version_0/hparams.yaml ADDED Viewed

	@@ -0,0 +1,117 @@

+model:
+  _target_: matcha.models.matcha_tts.MatchaTTS
+  n_vocab: 178
+  n_spks: ${data.n_spks}
+  spk_emb_dim: 64
+  n_feats: 80
+  data_statistics: ${data.data_statistics}
+  out_size: null
+  prior_loss: true
+  use_precomputed_durations: ${data.load_durations}
+  encoder:
+    encoder_type: RoPE Encoder
+    encoder_params:
+      n_feats: ${model.n_feats}
+      n_channels: 192
+      filter_channels: 768
+      filter_channels_dp: 256
+      n_heads: 2
+      n_layers: 6
+      kernel_size: 3
+      p_dropout: 0.1
+      spk_emb_dim: 64
+      n_spks: 1
+      prenet: true
+    duration_predictor_params:
+      filter_channels_dp: ${model.encoder.encoder_params.filter_channels_dp}
+      kernel_size: 3
+      p_dropout: ${model.encoder.encoder_params.p_dropout}
+  decoder:
+    channels:
+    - 256
+    - 256
+    dropout: 0.05
+    attention_head_dim: 64
+    n_blocks: 1
+    num_mid_blocks: 2
+    num_heads: 2
+    act_fn: snakebeta
+  cfm:
+    name: CFM
+    solver: euler
+    sigma_min: 0.0001
+  optimizer:
+    _target_: torch.optim.Adam
+    _partial_: true
+    lr: 0.0001
+    weight_decay: 0.0
+model/params/total: 18204193
+model/params/trainable: 18204193
+model/params/non_trainable: 0
+data:
+  _target_: matcha.data.text_mel_datamodule.TextMelDataModule
+  name: nabucasa_anna
+  train_filelist_path: data/nabucasa_anna/train.txt
+  valid_filelist_path: data/nabucasa_anna/valid.txt
+  batch_size: 32
+  num_workers: 20
+  pin_memory: true
+  cleaners:
+  - hungarian_cleaners
+  add_blank: true
+  n_spks: 1
+  n_fft: 1024
+  n_feats: 80
+  sample_rate: 22050
+  hop_length: 256
+  win_length: 1024
+  f_min: 0
+  f_max: 8000
+  data_statistics:
+    mel_mean: -6.346419334411621
+    mel_std: 2.677656650543213
+  seed: ${seed}
+  load_durations: false
+trainer:
+  _target_: lightning.pytorch.trainer.Trainer
+  default_root_dir: ${paths.output_dir}
+  max_epochs: -1
+  accelerator: gpu
+  devices:
+  - 0
+  precision: 16-mixed
+  check_val_every_n_epoch: 1
+  deterministic: false
+  gradient_clip_val: 5.0
+callbacks:
+  model_checkpoint:
+    _target_: lightning.pytorch.callbacks.ModelCheckpoint
+    dirpath: ${paths.output_dir}/checkpoints
+    filename: checkpoint_{epoch:03d}
+    monitor: epoch
+    verbose: false
+    save_last: true
+    save_top_k: 10
+    mode: max
+    auto_insert_metric_name: true
+    save_weights_only: false
+    every_n_train_steps: null
+    train_time_interval: null
+    every_n_epochs: 100
+    save_on_train_epoch_end: null
+  model_summary:
+    _target_: lightning.pytorch.callbacks.RichModelSummary
+    max_depth: 3
+  rich_progress_bar:
+    _target_: lightning.pytorch.callbacks.RichProgressBar
+extras:
+  ignore_warnings: false
+  enforce_tags: true
+  print_config: true
+task_name: train
+tags:
+- nabucasa
+- hungarian
+- anna
+ckpt_path: null
+seed: 1234

train.log ADDED Viewed

	@@ -0,0 +1,13 @@

+[2024-10-20 18:23:24,847][matcha.utils.utils][INFO] - Enforcing tags! <cfg.extras.enforce_tags=True>
+[2024-10-20 18:23:24,853][matcha.utils.utils][INFO] - Printing config tree with Rich! <cfg.extras.print_config=True>
+[2024-10-20 18:23:24,925][__main__][INFO] - Instantiating datamodule <matcha.data.text_mel_datamodule.TextMelDataModule>
+[2024-10-20 18:23:25,425][__main__][INFO] - Instantiating model <matcha.models.matcha_tts.MatchaTTS>
+[2024-10-20 18:23:26,071][__main__][INFO] - Instantiating callbacks...
+[2024-10-20 18:23:26,071][matcha.utils.instantiators][INFO] - Instantiating callback <lightning.pytorch.callbacks.ModelCheckpoint>
+[2024-10-20 18:23:26,075][matcha.utils.instantiators][INFO] - Instantiating callback <lightning.pytorch.callbacks.RichModelSummary>
+[2024-10-20 18:23:26,076][matcha.utils.instantiators][INFO] - Instantiating callback <lightning.pytorch.callbacks.RichProgressBar>
+[2024-10-20 18:23:26,077][__main__][INFO] - Instantiating loggers...
+[2024-10-20 18:23:26,077][matcha.utils.instantiators][INFO] - Instantiating logger <lightning.pytorch.loggers.tensorboard.TensorBoardLogger>
+[2024-10-20 18:23:26,082][__main__][INFO] - Instantiating trainer <lightning.pytorch.trainer.Trainer>
+[2024-10-20 18:23:26,123][__main__][INFO] - Logging hyperparameters!
+[2024-10-20 18:23:26,188][__main__][INFO] - Starting training!