Models
Datasets
Spaces
Posts
Docs
Enterprise
Pricing
Log In
Sign Up

Collections

Discover the best community collections!

Collections including paper arxiv:2412.14689

Self-Rewarding Language Models

Paper • 2401.10020 • Published Jan 18, 2024 • 146
Orion-14B: Open-source Multilingual Large Language Models

Paper • 2401.12246 • Published Jan 20, 2024 • 12
MambaByte: Token-free Selective State Space Model

Paper • 2401.13660 • Published Jan 24, 2024 • 53
MM-LLMs: Recent Advances in MultiModal Large Language Models

Paper • 2401.13601 • Published Jan 24, 2024 • 45

december papers

RobustFT: Robust Supervised Fine-tuning for Large Language Models under Noisy Response

Paper • 2412.14922 • Published 24 days ago • 85
B-STaR: Monitoring and Balancing Exploration and Exploitation in Self-Taught Reasoners

Paper • 2412.17256 • Published 20 days ago • 45
OpenAI o1 System Card

Paper • 2412.16720 • Published 22 days ago • 31
Revisiting In-Context Learning with Long Context Language Models

Paper • 2412.16926 • Published 21 days ago • 28

Position Papers

How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published 24 days ago • 48
TheAgentCompany: Benchmarking LLM Agents on Consequential Real World Tasks

Paper • 2412.14161 • Published 25 days ago • 49
Thinking in Space: How Multimodal Large Language Models See, Remember, and Recall Spaces

Paper • 2412.14171 • Published 25 days ago • 24
The Open Source Advantage in Large Language Models (LLMs)

Paper • 2412.12004 • Published 27 days ago • 9

How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published 24 days ago • 48
SepLLM: Accelerate Large Language Models by Compressing One Segment into One Separator

Paper • 2412.12094 • Published 27 days ago • 10
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models

Paper • 2306.07691 • Published Jun 13, 2023 • 5
iSTFTNet: Fast and Lightweight Mel-Spectrogram Vocoder Incorporating Inverse Short-Time Fourier Transform

Paper • 2203.02395 • Published Mar 4, 2022

VisDoM: Multi-Document QA with Visually Rich Elements Using Multimodal Retrieval-Augmented Generation

Paper • 2412.10704 • Published 29 days ago • 15
How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published 24 days ago • 48

Data and other things

about 23 hours ago

MegaPairs: Massive Data Synthesis For Universal Multimodal Retrieval

Paper • 2412.14475 • Published 24 days ago • 53
How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published 24 days ago • 48
Token-Budget-Aware LLM Reasoning

Paper • 2412.18547 • Published 19 days ago • 44
WavePulse: Real-time Content Analytics of Radio Livestreams

Paper • 2412.17998 • Published 20 days ago • 10

How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published 24 days ago • 48
VidTwin: Video VAE with Decoupled Structure and Dynamics

Paper • 2412.17726 • Published 20 days ago • 8

MIT-10M: A Large Scale Parallel Corpus of Multilingual Image Translation

Paper • 2412.07147 • Published Dec 10, 2024 • 5
Grounding Descriptions in Images informs Zero-Shot Visual Recognition

Paper • 2412.04429 • Published Dec 5, 2024
Exploring Multi-Grained Concept Annotations for Multimodal Large Language Models

Paper • 2412.05939 • Published Dec 8, 2024 • 14
Euclid: Supercharging Multimodal LLMs with Synthetic High-Fidelity Visual Descriptions

Paper • 2412.08737 • Published Dec 11, 2024 • 52

Evaluating Language Models as Synthetic Data Generators

Paper • 2412.03679 • Published Dec 4, 2024 • 46
Smaller Language Models Are Better Instruction Evolvers

Paper • 2412.11231 • Published 28 days ago • 27
How to Synthesize Text Data without Model Collapse?

Paper • 2412.14689 • Published 24 days ago • 48

Search, Verify and Feedback: Towards Next Generation Post-training Paradigm of Foundation Models via Verifier Engineering

Paper • 2411.11504 • Published Nov 18, 2024 • 20
Top-nσ: Not All Logits Are You Need

Paper • 2411.07641 • Published Nov 12, 2024 • 19
Adaptive Decoding via Latent Preference Optimization

Paper • 2411.09661 • Published Nov 14, 2024 • 10
When Precision Meets Position: BFloat16 Breaks Down RoPE in Long-Context Training

Paper • 2411.13476 • Published Nov 20, 2024 • 15

Previous
1
2
Next

Company

TOS Privacy About Jobs

Website

Models Datasets Spaces Pricing Docs