Kai Zuberbühler

kaizuberbuehler

k-zubi

AI & ML interests

language models, agents, image generation, music generation

Recent Activity

updated a collection 2 days ago

Benchmarks

updated a collection 2 days ago

Vision Language Models

updated a collection 2 days ago

Agents

View all activity

Organizations

None yet

kaizuberbuehler's activity

upvoted 9 papers 2 days ago

PC-Agent: A Hierarchical Multi-Agent Collaboration Framework for Complex Task Automation on PC

Paper • 2502.14282 • Published 4 days ago • 14

ZeroBench: An Impossible Visual Benchmark for Contemporary Large Multimodal Models

Paper • 2502.09696 • Published 11 days ago • 38

The Danger of Overthinking: Examining the Reasoning-Action Dilemma in Agentic Tasks

Paper • 2502.08235 • Published 12 days ago • 53

Large Language Diffusion Models

Paper • 2502.09992 • Published 10 days ago • 76

ImageRAG: Dynamic Image Retrieval for Reference-Guided Image Generation

Paper • 2502.09411 • Published 11 days ago • 16

upvoted 11 papers 3 days ago

Mathematical Reasoning in Large Language Models: Assessing Logical and Arithmetic Errors across Wide Numerical Ranges

Paper • 2502.08680 • Published 12 days ago • 11

CoT-Valve: Length-Compressible Chain-of-Thought Tuning

Paper • 2502.09601 • Published 11 days ago • 12

mmE5: Improving Multimodal Multilingual Embeddings via High-quality Synthetic Data

Paper • 2502.08468 • Published 12 days ago • 13

Typhoon T1: An Open Thai Reasoning Model

Paper • 2502.09042 • Published 11 days ago • 16

SQuARE: Sequential Question Answering Reasoning Engine for Enhanced Chain-of-Thought in Large Language Models

Paper • 2502.09390 • Published 11 days ago • 16

Logical Reasoning in Large Language Models: A Survey

Paper • 2502.09100 • Published 11 days ago • 21

Exploring the Potential of Encoder-free Architectures in 3D LMMs

Paper • 2502.09620 • Published 11 days ago • 25

MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency

Paper • 2502.09621 • Published 11 days ago • 26

CoSER: Coordinating LLM-Based Persona Simulation of Established Roles

Paper • 2502.09082 • Published 11 days ago • 27

SelfCite: Self-Supervised Alignment for Context Attribution in Large Language Models

Paper • 2502.09604 • Published 11 days ago • 31

An Open Recipe: Adapting Language-Specific LLMs to a Reasoning Model in One Day via Model Merging

Paper • 2502.09056 • Published 11 days ago • 30