Tanish Gupta's picture

Tanish Gupta

gupta-tanish

AI & ML interests

None yet

Recent Activity

updated a dataset 2 days ago

gupta-tanish/Ultrafeedback-llama3-8b-instruct-1vs3-selection-swepo-on-policy-iteration2

published a dataset 2 days ago

gupta-tanish/Ultrafeedback-llama3-8b-instruct-1vs3-selection-swepo-on-policy-iteration2

updated a dataset 3 days ago

gupta-tanish/Ultrafeedback-llama3-8b-Instruct-optimal-selection-1vs7_total_responses_24

View all activity

Organizations

None yet

models 6

gupta-tanish/llama3-8b-instruct-on-policy-swepo-1vsk-iteration1

Updated 5 days ago • 105

gupta-tanish/llama3.1-8b-instruct-qfa-grpo-v1

Text Generation • Updated 19 days ago • 336

gupta-tanish/llama3.1-8b-instruct-qfa-grpo

Updated 20 days ago • 28

gupta-tanish/mistral-ddo-alignment-iteration1

Updated Feb 24 • 8

gupta-tanish/llama-7b-dpo-baseline

Text Generation • Updated Sep 29, 2024 • 11

gupta-tanish/train_llama-7b-instruct_dpo_baseline

Updated Sep 29, 2024

datasets 78

gupta-tanish/Ultrafeedback-llama3-8b-instruct-1vs3-selection-swepo-on-policy-iteration2

Viewer • Updated 2 days ago • 63.1k • 10

gupta-tanish/Ultrafeedback-llama3-8b-Instruct-optimal-selection-1vs7_total_responses_24

Viewer • Updated 3 days ago • 60.8k • 8

gupta-tanish/Ultrafeedback-llama3-8b-Instruct-optimal-selection-1vs7_total_responses_16

Viewer • Updated 3 days ago • 60.8k • 9

gupta-tanish/Ultrafeedback-mistral-7b-instruct-v0.2-1vs3-optimal-selection

Viewer • Updated 4 days ago • 62.2k • 11

gupta-tanish/Ultrafeedback-mistral-7b-instruct-1vs3-kmeans-selection

Viewer • Updated 4 days ago • 62.2k • 9

gupta-tanish/Ultrafeedback-llama3-8b-instruct-1vs3-optimal-selection

Viewer • Updated 5 days ago • 62.2k • 17

gupta-tanish/Ultrafeedback-llama3-8b-instruct-1vs3-kmeans-selection

Viewer • Updated 5 days ago • 62.2k • 23

gupta-tanish/Ultrafeedback-mistral-7b-instruct-v0.2-1vs3-simpo-selection

Viewer • Updated 5 days ago • 62.7k • 26

gupta-tanish/Ultrafeedback-llama3-8b-instruct-top2vsbottom2-selection

Viewer • Updated 5 days ago • 63.1k • 29

gupta-tanish/Ultrafeedback-mistral-7b-instruct-v0.2-top2vsbottom2-selection

Viewer • Updated 6 days ago • 25.1k • 50