|
#!/bin/bash
|
|
torchrun \
|
|
--standalone \
|
|
--nnodes=1 \
|
|
--nproc-per-node=1 \
|
|
train_model_ED.py \
|
|
--device cuda \
|
|
--n_batch 128 \
|
|
--n_layer 24 \
|
|
--n_embd 768 \
|
|
--d_state 16 \
|
|
--d_conv 4 \
|
|
--expand_factor 2 \
|
|
--dt_rank 'auto' \
|
|
--dt_min 0.001 \
|
|
--dt_max 0.1 \
|
|
--dt_init 'random' \
|
|
--dt_scale 1.0 \
|
|
--dt_init_floor 1e-4 \
|
|
--conv_bias 1 \
|
|
--bias 0 \
|
|
--max_len 202 \
|
|
--lr_start 3e-5 \
|
|
--lr_multiplier 1 \
|
|
--lr_decoder 3e-5 \
|
|
--n_workers 8 \
|
|
--max_epochs 131 \
|
|
--checkpoint_every 1 \
|
|
--train_load 'pubchem' \
|
|
--data_root './pubchem/pubchem_rd-canonical_smiles.smi' \
|
|
--save_checkpoint_path './checkpoints' \
|
|
--load_checkpoint_path '' \ |