72 37

Christopher Snyder

csnyder

AI & ML interests

pathology, math

Organizations

csnyder's activity

upvoted a paper 4 days ago

Emu3: Next-Token Prediction is All You Need

Paper • 2409.18869 • Published 8 days ago • 73

upvoted a paper 10 days ago

A Preliminary Study of o1 in Medicine: Are We Closer to an AI Doctor?

Paper • 2409.15277 • Published 12 days ago • 34

upvoted a paper 22 days ago

MEDIC: Towards a Comprehensive Framework for Evaluating LLMs in Clinical Applications

Paper • 2409.07314 • Published 24 days ago • 50

upvoted 2 papers 23 days ago

Physics of Language Models: Part 2.2, How to Learn From Mistakes on Grade-School Math Problems

Paper • 2408.16293 • Published Aug 29 • 23

FLUX that Plays Music

Paper • 2409.00587 • Published Sep 1 • 31

upvoted a paper about 2 months ago

Amuro & Char: Analyzing the Relationship between Pre-Training and Fine-Tuning of Large Language Models

Paper • 2408.06663 • Published Aug 13 • 15

upvoted 6 papers 3 months ago

upvoted 6 papers 4 months ago

ChartMimic: Evaluating LMM's Cross-Modal Reasoning Capability via Chart-to-Code Generation

Paper • 2406.09961 • Published Jun 14 • 54

GEB-1.3B: Open Lightweight Large Language Model

Paper • 2406.09900 • Published Jun 14 • 20

Husky: A Unified, Open-Source Language Agent for Multi-Step Reasoning

Paper • 2406.06469 • Published Jun 10 • 23

Autoregressive Model Beats Diffusion: Llama for Scalable Image Generation

Paper • 2406.06525 • Published Jun 10 • 64

Tx-LLM: A Large Language Model for Therapeutics

Paper • 2406.06316 • Published Jun 10 • 13

Large Language Model Confidence Estimation via Black-Box Access

Paper • 2406.04370 • Published Jun 1 • 19

upvoted 2 papers 5 months ago

Small Language Models Learn Enhanced Reasoning Skills from Medical Textbooks

Paper • 2404.00376 • Published Mar 30 • 3

Capabilities of Gemini Models in Medicine

Paper • 2404.18416 • Published Apr 29 • 22

upvoted a paper 6 months ago

ChatGLM-Math: Improving Math Problem-Solving in Large Language Models with a Self-Critique Pipeline

Paper • 2404.02893 • Published Apr 3 • 20

upvoted 3 papers 7 months ago

Algorithmic progress in language models

Paper • 2403.05812 • Published Mar 9 • 18

Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference

Paper • 2403.04132 • Published Mar 7 • 38

ShortGPT: Layers in Large Language Models are More Redundant Than You Expect

Paper • 2403.03853 • Published Mar 6 • 63

upvoted a collection 7 months ago

llm reasoning

Collection

4 items • Updated Mar 16 • 1

upvoted 5 papers 7 months ago

Quiet-STaR: Language Models Can Teach Themselves to Think Before Speaking

Paper • 2403.09629 • Published Mar 14 • 72

Teaching Large Language Models to Reason with Reinforcement Learning

Paper • 2403.04642 • Published Mar 7 • 46

FAX: Scalable and Differentiable Federated Primitives in JAX

Paper • 2403.07128 • Published Mar 11 • 11

Self-Discover: Large Language Models Self-Compose Reasoning Structures

Paper • 2402.03620 • Published Feb 6 • 109

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27 • 592

upvoted 8 papers 8 months ago

Coercing LLMs to do and reveal (almost) anything

Paper • 2402.14020 • Published Feb 21 • 12

Learning to Learn Faster from Human Feedback with Language Model Predictive Control

Paper • 2402.11450 • Published Feb 18 • 20

FiT: Flexible Vision Transformer for Diffusion Model

Paper • 2402.12376 • Published Feb 19 • 48

Chain-of-Thought Reasoning Without Prompting

Paper • 2402.10200 • Published Feb 15 • 98

Grandmaster-Level Chess Without Search

Paper • 2402.04494 • Published Feb 7 • 65

OLMo: Accelerating the Science of Language Models

Paper • 2402.00838 • Published Feb 1 • 79

DeepSeek-Coder: When the Large Language Model Meets Programming -- The Rise of Code Intelligence

Paper • 2401.14196 • Published Jan 25 • 46

MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24 • 44

upvoted 8 papers 9 months ago

Textbooks Are All You Need II: phi-1.5 technical report

Paper • 2309.05463 • Published Sep 11, 2023 • 86

TOFU: A Task of Fictitious Unlearning for LLMs

Paper • 2401.06121 • Published Jan 11 • 14

GPT-4V(ision) is a Generalist Web Agent, if Grounded

Paper • 2401.01614 • Published Jan 3 • 21

DocLLM: A layout-aware generative language model for multimodal document understanding

Paper • 2401.00908 • Published Dec 31, 2023 • 178

Self-Play Fine-Tuning Converts Weak Language Models to Strong Language Models

Paper • 2401.01335 • Published Jan 2 • 64

Learning Vision from Models Rivals Learning Vision from Data

Paper • 2312.17742 • Published Dec 28, 2023 • 15

LARP: Language-Agent Role Play for Open-World Games

Paper • 2312.17653 • Published Dec 24, 2023 • 29

Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4

Paper • 2312.16171 • Published Dec 26, 2023 • 34

upvoted 8 papers 10 months ago

ReST meets ReAct: Self-Improvement for Multi-Step Reasoning LLM Agent

Paper • 2312.10003 • Published Dec 15, 2023 • 34

LLM360: Towards Fully Transparent Open-Source LLMs

Paper • 2312.06550 • Published Dec 11, 2023 • 56

Photorealistic Video Generation with Diffusion Models

Paper • 2312.06662 • Published Dec 11, 2023 • 23

Object Recognition as Next Token Prediction

Paper • 2312.02142 • Published Dec 4, 2023 • 11

Chain of Code: Reasoning with a Language Model-Augmented Code Emulator

Paper • 2312.04474 • Published Dec 7, 2023 • 29

Large Language Models for Mathematicians

Paper • 2312.04556 • Published Dec 7, 2023 • 11

LivePhoto: Real Image Animation with Text-guided Motion Control

Paper • 2312.02928 • Published Dec 5, 2023 • 16

MagicDance: Realistic Human Dance Video Generation with Motions & Facial Expressions Transfer

Paper • 2311.12052 • Published Nov 18, 2023 • 32

upvoted a collection 10 months ago

RAG

Collection

122 items • Updated 22 days ago • 18

upvoted 2 papers 10 months ago

Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

Paper • 2005.11401 • Published May 22, 2020 • 11

ZipLoRA: Any Subject in Any Style by Effectively Merging LoRAs

Paper • 2311.13600 • Published Nov 22, 2023 • 42

upvoted 3 papers 11 months ago

Rethinking Attention: Exploring Shallow Feed-Forward Neural Networks as an Alternative to Attention Layers in Transformers

Paper • 2311.10642 • Published Nov 17, 2023 • 23

Exponentially Faster Language Modelling

Paper • 2311.10770 • Published Nov 15, 2023 • 118

SelfEval: Leveraging the discriminative nature of generative models for evaluation

Paper • 2311.10708 • Published Nov 17, 2023 • 14