Commits · yusufs/llama32-3b-instruct

Update Dockerfile

94a34ed
verified

yusufs commited on Aug 6

Update Dockerfile

89c17e2
verified

yusufs commited on Aug 6

Update Dockerfile

b983fc2
verified

yusufs commited on Aug 6

Update Dockerfile

258633e
verified

yusufs commited on Aug 6

Update Dockerfile

f6ddd47
verified

yusufs commited on Aug 6

Update Dockerfile

bc37efd
verified

yusufs commited on Aug 6

Update Dockerfile

04254aa
verified

yusufs commited on Aug 6

Update Dockerfile

344825e
verified

yusufs commited on Aug 6

--extra-index-url https://download.pytorch.org/whl/cu113

3044680
verified

yusufs commited on Aug 6

nvidia/cuda:11.7.1-cudnn8-runtime-ubuntu22.04

053dce6
verified

yusufs commited on Aug 6

debug

bf084e5
verified

yusufs commited on Aug 6

python3 -m vllm.entrypoints.openai.api_server

39a1959
verified

yusufs commited on Aug 6

fix(Dockerfile): use cmd single line

7b16e9f
verified

yusufs commited on Aug 6

fix(Dockerfile): revision

4bd51f5
verified

yusufs commited on Aug 6

fix(entrypoint) Dockerile

a48cf7b
verified

yusufs commited on Aug 6

(feat:vllm serve) Dockerfile

4dd2e29
verified

yusufs commited on Aug 6

feat(llama32-3b-instruct): change llama32-3b-instruct

46e845e

yusufs commited on May 3

feat(sailor2-3b-chat): change readme

0f8187a

yusufs commited on May 3

fix(float16): Bfloat16 is only supported on GPUs with compute capability of at least 8.0. Your Tesla T4 GPU has compute capability 7.5. You can use float16 instead by explicitly setting the`dtype` flag in CLI, for example: --dtype=half.

78963b9

yusufs commited on Apr 16

fix(using sail/Sailor2-3B-Chat): sail/Sailor2-3B-Chat

8132d1f

yusufs commited on Apr 16

docs(add-comment): add comment

22ac900

yusufs commited on Mar 20

feat(runner.sh): DeepSeek-R1-Distill-Qwen-32B d66bcfc2f3fd52799f95943264f32ba15ca0003d

148829b

yusufs commited on Jan 28

feat(runner.sh): --trust-remote-code

1530e6e

yusufs commited on Jan 28

feat(runner.sh): add deepseek-ai/DeepSeek-R1 and deepseek-ai/DeepSeek-V3

57f9fa5

yusufs commited on Jan 28

feat(Dockerfile): install gcc

e8cd3e0

yusufs commited on Jan 28

feat(runner.sh): only enable prefix caching and disable log request

c0cde8e

yusufs commited on Jan 28

feat(runner.sh): --enable-chunked-prefill and --enable-prefix-caching for faster generate

8c5a84b

yusufs commited on Jan 28

fix(runner.sh): enable eager mode (disabling cuda graph)

5bd7bc7

yusufs commited on Jan 20

fix(runner.sh): --enforce-eager not support values

cb15911

yusufs commited on Jan 20

fix(runner.sh): explicitly disabling enforce_eager

266e7dd

yusufs commited on Jan 20

fix(runner.sh): disable eager-loading so it using cuda graph (in order for parallel and faster processing)

6bb48e9

yusufs commited on Jan 20

feat(runner.sh): add specific task and code revision

dc19c1d

yusufs commited on Dec 31, 2024

feat(runner.sh): using MODEL_ID only

490e6a3

yusufs commited on Dec 26, 2024

feat(runner.sh): using runner.sh to select llm in the run time

69c6372

yusufs commited on Dec 26, 2024

feat(seed): Random seed for reproducibility.

d4b0956

yusufs commited on Dec 26, 2024

feat(/app/run-llama.sh): /app/run-llama.sh

cab183f

yusufs commited on Dec 23, 2024