This may take a little bit of time ...
Data Info
┏━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┳━┓
┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃ ┃
┡━╇━╇━╇━╇━╇━╇━╇━╇━╇━╇━╇━╇━╇━╇━╇━╇━╇━╇━╇━┩
│ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │
├─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┤
│ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │
├─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┼─┤
│ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │ │
└─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┴─┘
Total length of dataset is 1454108.0
frames - 24235.1 seconds
{
'base_path': '../data',
'processed_data_path':
'processed_v1',
'save_trimmed_audio': True,
'save_trimmed_animation': True,
'save_normalized_animations': False,
'save_final_data': True,
'audio_conf': {'pre_emphasis': False,
'pre_emph_coeff': 0.97, 'centered': True,
'real_amplitude': True,
'normalize_mel_bins': True,
'normalize_range': True, 'min_clipping':
1e-05, 'sampling_rate': 16000,
'mel_fmin': 20, 'mel_fmax': 7600,
'n_mel_channels': 80, 'filter_length':
800, 'hop_length': 200,
'resample_method': 'linear',
'normalize_loudness': True},
'audio_feature_type': ['mel_spec',
'energy'],
'visualize_spectrogram': False,
'visualize_gaze': False,
'len_ratios': [0.9, 1.0, 1.1]
}