ybelkada
/

llama-xformers

ybelkada commited on Nov 15, 2023

Commit

d37c4cf

•

1 Parent(s): 491c189

Update llama_xformers_attention.py

Files changed (1) hide show

llama_xformers_attention.py CHANGED Viewed

@@ -5,6 +5,7 @@ from typing import Optional, Tuple
 from transformers.models.llama.modeling_llama import LlamaAttention, apply_rotary_pos_emb, repeat_kv
 from xformers.ops.fmha import (
  memory_efficient_attention,
 )

 from transformers.models.llama.modeling_llama import LlamaAttention, apply_rotary_pos_emb, repeat_kv
+import xformers
 from xformers.ops.fmha import (
  memory_efficient_attention,
 )