Shashank Gupta's picture

Shashank Gupta

shashankg7

http://shashank-gupta.com

AI & ML interests

Off-policy learning, RLHF, Multimodal models

Organizations

None yet

Papers 1

arxiv:2503.00897

models 48

shashankg7/color_PPO_baseline_42

Text-to-Image • Updated Dec 13, 2024

shashankg7/RLOO_aesthetic_PPO_k_4_16

Text-to-Image • Updated Dec 13, 2024

shashankg7/RLOO_aesthetic_PPO_k_3_16

Text-to-Image • Updated Dec 13, 2024

shashankg7/RLOO_aesthetic_PPO_k_2_16

Text-to-Image • Updated Dec 13, 2024

shashankg7/RLOO_aesthetic_PPO_k_4_27

Text-to-Image • Updated Dec 13, 2024

shashankg7/RLOO_aesthetic_PPO_k_3_27

Text-to-Image • Updated Dec 13, 2024

shashankg7/RLOO_aesthetic_PPO_k_2_27

Text-to-Image • Updated Dec 13, 2024

shashankg7/RLOO_aesthetic_PPO_k_4_42

Text-to-Image • Updated Dec 13, 2024

shashankg7/RLOO_aesthetic_PPO_k_3_42

Text-to-Image • Updated Dec 13, 2024

shashankg7/RLOO_aesthetic_PPO_k_2_42

Text-to-Image • Updated Dec 13, 2024

datasets 0

None public yet