Yutao Zeng's picture

3 13

Yutao Zeng

Taoer

·

AI & ML interests

None yet

Recent Activity

updated a model 14 days ago

Open-Foundation-Models/PolyNorm_1B

updated a model 14 days ago

Open-Foundation-Models/PolyReLU_1B

upvoted a paper about 1 month ago

Expert Race: A Flexible Routing Strategy for Scaling Diffusion Transformer with Mixture of Experts

View all activity

Organizations

Taoer's activity

upvoted 2 papers about 1 month ago

Expert Race: A Flexible Routing Strategy for Scaling Diffusion Transformer with Mixture of Experts

Paper • 2503.16057 • Published Mar 20 • 14

Frac-Connections: Fractional Extension of Hyper-Connections

Paper • 2503.14125 • Published Mar 18 • 19

upvoted 2 papers about 2 months ago

HybridNorm: Towards Stable and Efficient Transformer Training via Hybrid Normalization

Paper • 2503.04598 • Published Mar 6 • 18

Scale-Distribution Decoupling: Enabling Stable and Effective Training of Large Language Models

Paper • 2502.15499 • Published Feb 21 • 13

upvoted a paper 3 months ago

Over-Tokenized Transformer: Vocabulary is Generally Worth Scaling

Paper • 2501.16975 • Published Jan 28 • 29

upvoted a paper 4 months ago

Evaluating and Aligning CodeLLMs on Human Preference

Paper • 2412.05210 • Published Dec 6, 2024 • 51

upvoted 2 papers 5 months ago

Ultra-Sparse Memory Network

Paper • 2411.12364 • Published Nov 19, 2024 • 24

OpenCoder: The Open Cookbook for Top-Tier Code Large Language Models

Paper • 2411.04905 • Published Nov 7, 2024 • 124

upvoted a paper 6 months ago

Polynomial Composition Activations: Unleashing the Dynamics of Large Language Models

Paper • 2411.03884 • Published Nov 6, 2024 • 29

upvoted a paper 7 months ago

Hyper-Connections

Paper • 2409.19606 • Published Sep 29, 2024 • 23

upvoted 2 papers 8 months ago

FuzzCoder: Byte-level Fuzzing Test via Large Language Model

Paper • 2409.01944 • Published Sep 3, 2024 • 46

TableBench: A Comprehensive and Complex Benchmark for Table Question Answering

Paper • 2408.09174 • Published Aug 17, 2024 • 53

upvoted a paper 10 months ago

McEval: Massively Multilingual Code Evaluation

Paper • 2406.07436 • Published Jun 11, 2024 • 42