ecker
/

vall-e

Model card Files Files and versions Community

mrq commited on Oct 5, 2023

Commit

d606fd5

1 Parent(s): 96dc9c7

cleanup

Browse files

Files changed (5) hide show

ckpt/ar+nar-double-retnet-4/fp32.pth +0 -3
ckpt/ar+nar-retnet-4/fp32.pth +0 -3
ckpt/ar-retnet-4/fp32.pth +0 -3
ckpt/nar-retnet-4/fp32.pth +0 -3
config.ar_nar_double.yaml +0 -105

ckpt/ar+nar-double-retnet-4/fp32.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:2a9a4537d4ccfff0f5ececdb46d2342b0de2879837417ef11e23fc028f3d3f99
-size 827624127

ckpt/ar+nar-retnet-4/fp32.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:548246e8f11ed3cb13ec3f520a665e02fe6227d979f63b832a8bc036f0c0a67b
-size 424338659

ckpt/ar-retnet-4/fp32.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:e042d05f14f21a166cd5f5c16b9c9c4ac9ce18af2a4c285c7f0d3ef3ea6729bf
-size 418040575

ckpt/nar-retnet-4/fp32.pth DELETED Viewed

@@ -1,3 +0,0 @@
-version https://git-lfs.github.com/spec/v1
-oid sha256:18027cafe3c077cb8786a5665f04f732f4e3fcacff17844182f9383a1dca640f
-size 422230719

config.ar_nar_double.yaml DELETED Viewed

@@ -1,105 +0,0 @@
-dataset:
-  training: [
-  ]
-  validation: [
-  ]
-  noise: [
-  ]
-  speaker_name_getter: "lambda p: f'{p.parts[-3]}_{p.parts[-2]}'"
-  use_hdf5: True
-  use_metadata: True
-  hdf5_flag: r
-  validate: True
-  workers: 4
-  cache: True
-  phones_range: [4, 256]
-  duration_range: [1.0, 16.0]
-  random_utterance: 1.0
-  max_prompts: 3
-  prompt_duration: 3.0
-  sample_type: speaker
-  tasks_list: ["tts"] # , "ns", "sr", "tse", "cse", "nse", "tts"]
-models:
-  _prom_levels: 4
-  _max_levels: 8
-  _models:
-  - name: "ar+nar"
-    size: "double"
-    resp_levels: 4
-    prom_levels: 4
-    tasks: 8
-    arch_type: "retnet"
-    training: True
-hyperparameters:
-  batch_size: 8
-  gradient_accumulation_steps: 1
-  gradient_clipping: 100
-  optimizer: AdamW
-  learning_rate: 1.0e-5
-  scheduler_type: ""
-evaluation:
-  batch_size: 16
-  frequency: 500
-  size: 16
-  steps: 300
-  ar_temperature: 0.95
-  nar_temperature: 0.25
-  load_disabled_engines: True
-trainer:
-  iterations: 1_000_000
-  save_tag: step
-  save_on_oom: True
-  save_on_quit: True
-  save_frequency: 500
-  export_on_save: True
-  keep_last_checkpoints: 4
-  aggressive_optimizations: False
-  load_disabled_engines: False
-  load_state_dict: True
-  gc_mode: None # "global_step"
-  weight_dtype: float32
-  amp: False
-  backend: local
-  deepspeed:
-    zero_optimization_level: 0
-    use_compression_training: True
-inference:
-  weight_dtype: float32
-  amp: False
-  use_vocos: True
-  normalize: False
-  recurrent_chunk_size: 0
-  recurrent_forward: False
-bitsandbytes:
-  enabled: False
-  injects: True
-  linear: True
-  embedding: True
-device: cpu