File size: 22,472 Bytes

e38a896

CONFIG
├── data
│   └── _target_: matcha.data.text_mel_datamodule.TextMelDataModule                                                                                                       
│       name: ja006                                                                                                                                                       
│       train_filelist_path: datas/merged_ja004_ja005/train.txt                                                                                                           
│       valid_filelist_path: datas/merged_ja004_ja005/valid.txt                                                                                                           
│       batch_size: 80                                                                                                                                                    
│       num_workers: 1                                                                                                                                                    
│       pin_memory: true                                                                                                                                                  
│       cleaners:                                                                                                                                                         
│       - basic_cleaners2                                                                                                                                                 
│       add_blank: true                                                                                                                                                   
│       n_spks: 1                                                                                                                                                         
│       n_fft: 1024                                                                                                                                                       
│       n_feats: 80                                                                                                                                                       
│       sample_rate: 22050                                                                                                                                                
│       hop_length: 256                                                                                                                                                   
│       win_length: 1024                                                                                                                                                  
│       f_min: 0                                                                                                                                                          
│       f_max: 8000                                                                                                                                                       
│       data_statistics:                                                                                                                                                  
│         mel_mean: -5.794878959655762                                                                                                                                    
│         mel_std: 2.2488205432891846                                                                                                                                     
│       seed: 3000                                                                                                                                                        
│                                                                                                                                                                         
├── model
│   └── _target_: matcha.models.matcha_tts.MatchaTTS                                                                                                                      
│       n_vocab: 178                                                                                                                                                      
│       n_spks: 1                                                                                                                                                         
│       spk_emb_dim: 64                                                                                                                                                   
│       n_feats: 80                                                                                                                                                       
│       data_statistics:                                                                                                                                                  
│         mel_mean: -5.794878959655762                                                                                                                                    
│         mel_std: 2.2488205432891846                                                                                                                                     
│       out_size: null                                                                                                                                                    
│       prior_loss: true                                                                                                                                                  
│       encoder:                                                                                                                                                          
│         encoder_type: RoPE Encoder                                                                                                                                      
│         encoder_params:                                                                                                                                                 
│           n_feats: 80                                                                                                                                                   
│           n_channels: 192                                                                                                                                               
│           filter_channels: 768                                                                                                                                          
│           filter_channels_dp: 256                                                                                                                                       
│           n_heads: 2                                                                                                                                                    
│           n_layers: 6                                                                                                                                                   
│           kernel_size: 3                                                                                                                                                
│           p_dropout: 0.1                                                                                                                                                
│           spk_emb_dim: 64                                                                                                                                               
│           n_spks: 1                                                                                                                                                     
│           prenet: true                                                                                                                                                  
│         duration_predictor_params:                                                                                                                                      
│           filter_channels_dp: 256                                                                                                                                       
│           kernel_size: 3                                                                                                                                                
│           p_dropout: 0.1                                                                                                                                                
│       decoder:                                                                                                                                                          
│         channels:                                                                                                                                                       
│         - 256                                                                                                                                                           
│         - 256                                                                                                                                                           
│         dropout: 0.05                                                                                                                                                   
│         attention_head_dim: 64                                                                                                                                          
│         n_blocks: 1                                                                                                                                                     
│         num_mid_blocks: 2                                                                                                                                               
│         num_heads: 2                                                                                                                                                    
│         act_fn: snakebeta                                                                                                                                               
│       cfm:                                                                                                                                                              
│         name: CFM                                                                                                                                                       
│         solver: euler                                                                                                                                                   
│         sigma_min: 0.0001                                                                                                                                               
│       optimizer:                                                                                                                                                        
│         _target_: torch.optim.Adam                                                                                                                                      
│         _partial_: true                                                                                                                                                 
│         lr: 0.0001                                                                                                                                                      
│         weight_decay: 0.0                                                                                                                                               
│                                                                                                                                                                         
├── callbacks
│   └── model_checkpoint:                                                                                                                                                 
│         _target_: lightning.pytorch.callbacks.ModelCheckpoint                                                                                                           
│         dirpath: /notebooks/Matcha-TTS/logs/train/merged_ja004_ja005/runs/2024-09-13_22-38-35/checkpoints                                                               
│         filename: checkpoint_{epoch:03d}                                                                                                                                
│         monitor: epoch                                                                                                                                                  
│         verbose: false                                                                                                                                                  
│         save_last: true                                                                                                                                                 
│         save_top_k: 25                                                                                                                                                  
│         mode: max                                                                                                                                                       
│         auto_insert_metric_name: true                                                                                                                                   
│         save_weights_only: false                                                                                                                                        
│         every_n_train_steps: null                                                                                                                                       
│         train_time_interval: null                                                                                                                                       
│         every_n_epochs: 10                                                                                                                                              
│         save_on_train_epoch_end: null                                                                                                                                   
│       model_summary:                                                                                                                                                    
│         _target_: lightning.pytorch.callbacks.RichModelSummary                                                                                                          
│         max_depth: 3                                                                                                                                                    
│       rich_progress_bar:                                                                                                                                                
│         _target_: lightning.pytorch.callbacks.RichProgressBar                                                                                                           
│                                                                                                                                                                         
├── logger
│   └── tensorboard:                                                                                                                                                      
│         _target_: lightning.pytorch.loggers.tensorboard.TensorBoardLogger                                                                                               
│         save_dir: /notebooks/Matcha-TTS/logs/train/merged_ja004_ja005/runs/2024-09-13_22-38-35/tensorboard/                                                             
│         name: null                                                                                                                                                      
│         log_graph: false                                                                                                                                                
│         default_hp_metric: true                                                                                                                                         
│         prefix: ''                                                                                                                                                      
│                                                                                                                                                                         
├── trainer
│   └── _target_: lightning.pytorch.trainer.Trainer                                                                                                                       
│       default_root_dir: /notebooks/Matcha-TTS/logs/train/merged_ja004_ja005/runs/2024-09-13_22-38-35                                                                    
│       max_epochs: -1                                                                                                                                                    
│       accelerator: gpu                                                                                                                                                  
│       devices:                                                                                                                                                          
│       - 0                                                                                                                                                               
│       precision: 16-mixed                                                                                                                                               
│       check_val_every_n_epoch: 1                                                                                                                                        
│       deterministic: false                                                                                                                                              
│       gradient_clip_val: 5.0                                                                                                                                            
│                                                                                                                                                                         
├── paths
│   └── root_dir: /notebooks/Matcha-TTS                                                                                                                                   
│       data_dir: /notebooks/Matcha-TTS/data/                                                                                                                             
│       log_dir: /notebooks/Matcha-TTS/logs/                                                                                                                              
│       output_dir: /notebooks/Matcha-TTS/logs/train/merged_ja004_ja005/runs/2024-09-13_22-38-35                                                                          
│       work_dir: /notebooks/Matcha-TTS                                                                                                                                   
│                                                                                                                                                                         
├── extras
│   └── ignore_warnings: false                                                                                                                                            
│       enforce_tags: true                                                                                                                                                
│       print_config: true                                                                                                                                                
│                                                                                                                                                                         
├── task_name
│   └── train                                                                                                                                                             
├── run_name
│   └── merged_ja004_ja005                                                                                                                                                
├── tags
│   └── ['merged_ja004_ja005']                                                                                                                                            
├── train
│   └── True                                                                                                                                                              
├── test
│   └── True                                                                                                                                                              
├── ckpt_path
│   └── /root/.local/share/matcha_tts/matcha_ljspeech.ckpt                                                                                                                
└── seed
    └── 1234