Llama-3 - a RLHF-And-Friends Collection

Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

RLHF-And-Friends 's Collections

Llama-Reward-Quantized

Llama-3.2-3B-DPO-Math

Llama-3

Llama-3

updated Nov 8, 2024

RLHF-And-Friends/Llama-3.2-3B-Instruct

Text Generation • Updated Nov 8, 2024 • 108
RLHF-And-Friends/Llama-3.2-3B-Instruct-BnB-4bit

Updated Nov 7, 2024 • 5
RLHF-And-Friends/Llama3.1-8B

Updated Nov 1, 2024 • 1

Collection guide
Browse collections

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs