5 4

Andrey Galichin

andreuka18

avgalichin

AI & ML interests

None yet

Recent Activity

updated a model about 4 hours ago

andreuka18/sae-deepseek-r1-llama-8b

updated a dataset 7 days ago

andreuka18/truthful_qa

published a dataset 7 days ago

andreuka18/truthful_qa

View all activity

Organizations

None yet

andreuka18's activity

updated a model about 4 hours ago

andreuka18/sae-deepseek-r1-llama-8b

Updated about 4 hours ago

updated a dataset 7 days ago

andreuka18/truthful_qa

Viewer • Updated 7 days ago • 790 • 32

published a dataset 7 days ago

andreuka18/truthful_qa

Viewer • Updated 7 days ago • 790 • 32

updated a dataset 11 days ago

andreuka18/lmsys-chat-1m-100k-DeepSeek-R1

Viewer • Updated 11 days ago • 100k • 38

published a dataset 11 days ago

andreuka18/lmsys-chat-1m-100k-DeepSeek-R1

Viewer • Updated 11 days ago • 100k • 38

published a model 14 days ago

andreuka18/sae-deepseek-r1-llama-8b

Updated about 4 hours ago

New activity in andreuka18/DeepSeek-R1-Distill-Llama-8B-lmsys-openthoughts-tokenized 22 days ago

Add dataset description, paper link, task category, and code link

#2 opened 24 days ago by

nielsr

New activity in andreuka18/OpenThoughts-10k-DeepSeek-R1 22 days ago

Add link to paper and description

#1 opened 24 days ago by

nielsr

New activity in andreuka18/deepseek-r1-distill-llama-8b-lmsys-openthoughts 22 days ago

Add/improve metadata: pipeline tag, license, link to paper and code

#1 opened 24 days ago by

nielsr

updated a collection 22 days ago

SAE-Reasoning

Collection

Models and datasets used in the paper "Interpreting Reasoning Features in Large Language Models via Sparse Autoenoder": https://arxiv.org/abs/2503.188 • 4 items • Updated 22 days ago

updated a dataset 23 days ago

andreuka18/DeepSeek-R1-Distill-Qwen-7B-lmsys-openthoughts-tokenized

Viewer • Updated 23 days ago • 781k • 196

published a dataset 23 days ago

andreuka18/DeepSeek-R1-Distill-Qwen-7B-lmsys-openthoughts-tokenized

Viewer • Updated 23 days ago • 781k • 196

updated a dataset 23 days ago

andreuka18/DeepSeek-R1-Distill-Qwen-7B-OpenThoughts-114k-tokenized

Updated 23 days ago • 127

published a dataset 23 days ago

andreuka18/DeepSeek-R1-Distill-Qwen-7B-OpenThoughts-114k-tokenized

Updated 23 days ago • 127

updated a dataset 23 days ago

andreuka18/DeepSeek-R1-Distill-Qwen-7B-lmsys-chat-1m-tokenized

Viewer • Updated 23 days ago • 486k • 127

published a dataset 23 days ago

andreuka18/DeepSeek-R1-Distill-Qwen-7B-lmsys-chat-1m-tokenized

Viewer • Updated 23 days ago • 486k • 127

authored a paper 25 days ago

I Have Covered All the Bases Here: Interpreting Reasoning Features in Large Language Models via Sparse Autoencoders

Paper • 2503.18878 • Published 29 days ago • 117

updated a collection 27 days ago

SAE-Reasoning

Collection

Models and datasets used in the paper "Interpreting Reasoning Features in Large Language Models via Sparse Autoenoder": https://arxiv.org/abs/2503.188 • 4 items • Updated 22 days ago