test loss 2.563950 on crumb/flan-ul2-tinystories-complex, initialized from crumb/opentinystories-30m-base, 2 epochs, linear decreasing lr 1e-4. trained with double the batch size (256)

Downloads last month: 12

Inference Providers NEW

Text Generation

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

crumb
/

opentinystories-30m-complex

Datasets used to train crumb/opentinystories-30m-complex