Ousso1117
/

PPO-SFT-meta-Llama-2-7B-meta-Llama-2-7B-mrd3-additive

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

PPO-SFT-meta-Llama-2-7B-meta-Llama-2-7B-mrd3-additive

1 contributor

History: 2 commits

Ousso1117's picture

Ousso1117/PPO-SFT-meta-Llama-2-7B-meta-Llama-2-7B-mrd3-additive

387f992 verified 1 day ago