|
python baselines/crossmodal_moment_localization/train.py \ |
|
--train_path data/TVR_Ranking/train_top01.json \ |
|
--val_path data/TVR_Ranking/val.json \ |
|
--test_path data/TVR_Ranking/test.json \ |
|
--corpus_path data/TVR_Ranking/video_corpus.json \ |
|
--desc_bert_path data/features/query_bert.h5 \ |
|
--vid_feat_path data/features/tvr_i3d_rgb600_avg_cl-1.5.h5 \ |
|
--sub_bert_path data/features/tvr_sub_pretrained_w_sub_query_max_cl-1.5.h5\ |
|
--dset_name=tvr \ |
|
--eval_split_name=val \ |
|
--nms_thd=-1 \ |
|
--results_root=results \ |
|
--clip_length=1.5 \ |
|
--vid_feat_size=1024 \ |
|
--ctx_mode=video_sub_tef \ |
|
--max_ctx_l=128 \ |
|
--max_pred_l=16 \ |
|
--eval_num_per_epoch=0.05 \ |
|
--n_epoch=4000 \ |
|
--exp_id=top01 \ |
|
--model_name=XML \ |
|
--lr=0.001 |
|
|
|
|
|
|
|
|