ybelkada
/

llama-xformers

ybelkada commited on Nov 15, 2023

Commit

1141922

•

1 Parent(s): 4f95d51

Update llama_xformers_attention.py

Files changed (1) hide show

llama_xformers_attention.py CHANGED Viewed

@@ -3,7 +3,11 @@ import torch.nn as nn
 from typing import Optional, Tuple
-from transformers.models.llama.modeling_llama import LlamaAttention
 class LlamaXFormersAttention(LlamaAttention):
  def forward(

 from typing import Optional, Tuple
+from transformers.models.llama.modeling_llama import LlamaAttention, apply_rotary_pos_emb
+from xformers.ops.fmha import (
+ memory_efficient_attention,
+)
 class LlamaXFormersAttention(LlamaAttention):
  def forward(