khoicrtp
/

cog-llama-test

khoicrtp commited on May 23, 2023

Commit

6bbcb90

•

2 Parent(s): 1c3d4f1 45bb876

Merge branch 'main' of https://huggingface.co/khoicrtp/cog-llama-test

Files changed (1) hide show

train_model.sh CHANGED Viewed

@@ -4,7 +4,6 @@ torchrun --nproc_per_node=1 --master_port=9292 train.py \
     --tokenizer_name_or_path /src/weights/tokenizer \
     --data_path ./alpaca_data.json \
     --model_name_or_path /src/weights/llama-7b \
-    --bf16 True \
     --output_dir alpaca_out \
     --num_train_epochs 3 \
     --per_device_train_batch_size 4 \
@@ -20,4 +19,3 @@ torchrun --nproc_per_node=1 --master_port=9292 train.py \
     --logging_steps 1 \
     --fsdp "full_shard auto_wrap" \
     --fsdp_transformer_layer_cls_to_wrap 'LLaMADecoderLayer' \
-    --tf32 True \

     --tokenizer_name_or_path /src/weights/tokenizer \
     --data_path ./alpaca_data.json \
     --model_name_or_path /src/weights/llama-7b \
     --output_dir alpaca_out \
     --num_train_epochs 3 \
     --per_device_train_batch_size 4 \
     --logging_steps 1 \
     --fsdp "full_shard auto_wrap" \
     --fsdp_transformer_layer_cls_to_wrap 'LLaMADecoderLayer' \