calibration-tuning (Calibration Tuning)

spamueldooley

authored 3 papers 8 months ago

manleyroberts

authored a paper 8 months ago

LiveBench: A Challenging, Contamination-Free LLM Benchmark

Paper • 2406.19314 • Published Jun 27, 2024 • 23

psiyum

updated a dataset 9 months ago

calibration-tuning/Llama-2-7b-hf-20k-choice

Viewer • Updated Jun 13, 2024 • 20.5k • 98 • 1

psiyum

updated 12 models 9 months ago

calibration-tuning/Llama-2-7b-hf-ct-choice

Updated Jun 13, 2024

calibration-tuning/Llama-2-13b-hf-ct-choice

Updated Jun 13, 2024

calibration-tuning/Mistral-7B-v0.1-ct-choice

Updated Jun 13, 2024

calibration-tuning/Llama-2-7b-chat-hf-ct-choice

Updated Jun 13, 2024

calibration-tuning/Llama-2-13b-chat-hf-ct-choice

Updated Jun 13, 2024

calibration-tuning/Mistral-7B-Instruct-v0.2-ct-choice

Updated Jun 13, 2024

calibration-tuning/Llama-2-7b-hf-ct-oe

Updated Jun 13, 2024

calibration-tuning/Llama-2-13b-hf-ct-oe

Updated Jun 13, 2024

calibration-tuning/Mistral-7B-v0.1-ct-oe

Updated Jun 13, 2024

calibration-tuning/Llama-2-7b-chat-hf-ct-oe

Updated Jun 13, 2024

calibration-tuning/Llama-2-13b-chat-hf-ct-oe

Updated Jun 13, 2024

calibration-tuning/Mistral-7B-Instruct-v0.2-ct-oe

Updated Jun 13, 2024

manleyroberts

authored 3 papers 9 months ago

Giraffe: Adventures in Expanding Context Lengths in LLMs

Paper • 2308.10882 • Published Aug 21, 2023 • 1

Smaug: Fixing Failure Modes of Preference Optimisation with DPO-Positive

Paper • 2402.13228 • Published Feb 20, 2024 • 3

Data Contamination Through the Lens of Time

Paper • 2310.10628 • Published Oct 16, 2023

Calibration Tuning

AI & ML interests

calibration-tuning's activity

LiveBench: A Challenging, Contamination-Free LLM Benchmark

Large Language Models Must Be Taught to Know What They Don't Know

Data Contamination Through the Lens of Time

LiveBench: A Challenging, Contamination-Free LLM Benchmark

calibration-tuning/Llama-2-7b-hf-20k-choice

calibration-tuning/Llama-2-7b-hf-ct-choice

calibration-tuning/Llama-2-13b-hf-ct-choice

calibration-tuning/Mistral-7B-v0.1-ct-choice

calibration-tuning/Llama-2-7b-chat-hf-ct-choice

calibration-tuning/Llama-2-13b-chat-hf-ct-choice

calibration-tuning/Mistral-7B-Instruct-v0.2-ct-choice

calibration-tuning/Llama-2-7b-hf-ct-oe

calibration-tuning/Llama-2-13b-hf-ct-oe

calibration-tuning/Mistral-7B-v0.1-ct-oe

calibration-tuning/Llama-2-7b-chat-hf-ct-oe

calibration-tuning/Llama-2-13b-chat-hf-ct-oe

calibration-tuning/Mistral-7B-Instruct-v0.2-ct-oe

Giraffe: Adventures in Expanding Context Lengths in LLMs

Smaug: Fixing Failure Modes of Preference Optimisation with DPO-Positive

Data Contamination Through the Lens of Time

AI & ML interests

Team members 4

calibration-tuning's activity