Saran's picture

2

Saran

saran1999

AI & ML interests

None yet

Recent Activity

new activity 3 days ago

answerdotai/ModernBERT-base:Loss = 0 and Gradient = NaN in ModernBERT Fine-Tuning for Regression

new activity 9 days ago

answerdotai/ModernBERT-base:nan or 0.0 loss when training with flash attention

new activity 9 days ago

answerdotai/ModernBERT-base:Loss = 0 and Gradient = NaN in ModernBERT Fine-Tuning for Regression

View all activity

Organizations

None yet

saran1999's activity

New activity in answerdotai/ModernBERT-base 3 days ago

Loss = 0 and Gradient = NaN in ModernBERT Fine-Tuning for Regression

#63 opened 9 days ago by

New activity in answerdotai/ModernBERT-base 9 days ago

nan or 0.0 loss when training with flash attention

#59 opened 10 days ago by

Loss = 0 and Gradient = NaN in ModernBERT Fine-Tuning for Regression

#63 opened 9 days ago by

nan or 0.0 loss when training with flash attention

#59 opened 10 days ago by

Loss = 0 and Gradient = NaN in ModernBERT Fine-Tuning for Regression

#63 opened 9 days ago by

nan or 0.0 loss when training with flash attention

#59 opened 10 days ago by