DanaHehe's picture

20 7

DanaHehe

DanaHehe

AI & ML interests

None yet

Recent Activity

upvoted a paper 2 months ago

FlashInfer: Efficient and Customizable Attention Engine for LLM Inference Serving

upvoted a paper 3 months ago

FAST: Efficient Action Tokenization for Vision-Language-Action Models

View all activity

Organizations

None yet

DanaHehe's activity

upvoted a paper 2 months ago

FlashInfer: Efficient and Customizable Attention Engine for LLM Inference Serving

Paper • 2501.01005 • Published Jan 2 • 1

upvoted 2 papers 3 months ago

FAST: Efficient Action Tokenization for Vision-Language-Action Models

Paper • 2501.09747 • Published Jan 16 • 23

EnerVerse: Envisioning Embodied Future Space for Robotics Manipulation

Paper • 2501.01895 • Published Jan 3 • 56

upvoted a paper 4 months ago

Emma-X: An Embodied Multimodal Action Model with Grounded Chain of Thought and Look-ahead Spatial Reasoning

Paper • 2412.11974 • Published Dec 16, 2024 • 9

upvoted 2 papers 5 months ago

OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

Paper • 2411.04905 • Published Nov 7, 2024 • 124

Curriculum Learning for Small Code Language Models

Paper • 2407.10194 • Published Jul 14, 2024 • 1

upvoted 2 papers 6 months ago

PrefixQuant: Static Quantization Beats Dynamic through Prefixed Outliers in LLMs

Paper • 2410.05265 • Published Oct 7, 2024 • 31

Data Advisor: Dynamic Data Curation for Safety Alignment of Large Language Models

Paper • 2410.05269 • Published Oct 7, 2024 • 3

upvoted 3 papers 7 months ago

B4: Towards Optimal Assessment of Plausible Code Solutions with Plausible Tests

Paper • 2409.08692 • Published Sep 13, 2024 • 28

How Do Your Code LLMs Perform? Empowering Code Instruction Tuning with High-Quality Data

Paper • 2409.03810 • Published Sep 5, 2024 • 36

MiniCPM: Unveiling the Potential of Small Language Models with Scalable Training Strategies

Paper • 2404.06395 • Published Apr 9, 2024 • 23

upvoted 2 papers 8 months ago

MatchTime: Towards Automatic Soccer Game Commentary Generation

Paper • 2406.18530 • Published Jun 26, 2024 • 12

RAG Foundry: A Framework for Enhancing LLMs for Retrieval Augmented Generation

Paper • 2408.02545 • Published Aug 5, 2024 • 38

upvoted an article 10 months ago

Article

Cosmopedia: how to create large-scale synthetic data for pre-training Large Language Models

Mar 20, 2024

• 85

upvoted a paper 10 months ago

A Tale of Tails: Model Collapse as a Change of Scaling Laws

Paper • 2402.07043 • Published Feb 10, 2024 • 15

upvoted 4 papers 12 months ago

Deciphering the Impact of Pretraining Data on Large Language Models through Machine Unlearning

Paper • 2402.11537 • Published Feb 18, 2024 • 1

OpenELM: An Efficient Language Model Family with Open-source Training and Inference Framework

Paper • 2404.14619 • Published Apr 22, 2024 • 128

LLM-R2: A Large Language Model Enhanced Rule-based Rewrite System for Boosting Query Efficiency

Paper • 2404.12872 • Published Apr 19, 2024 • 12

Phi-3 Technical Report: A Highly Capable Language Model Locally on Your Phone

Paper • 2404.14219 • Published Apr 22, 2024 • 259