Spaces:

openaccess-ai-collective
/

ggml-ui

Build error

winglian commited on May 14, 2023

Commit

6f7e42d

1 Parent(s): 29b3b7f

try out docker sdk

tweak dockerfile to use local builder
install bnb
add gradio dep
fix venv path
use chat.py, not app.py
explicit gradio app launch

Files changed (5) hide show

Dockerfile +68 -0
README.md +1 -1
chat.py +1 -1
entrypoint.sh +6 -0
requirements.txt +0 -2

Dockerfile ADDED Viewed

	@@ -0,0 +1,68 @@

+FROM nvidia/cuda:11.8.0-devel-ubuntu22.04 as builder-llamacpp
+RUN apt-get update && \
+    apt-get install --no-install-recommends -y git vim build-essential python3 python3-pip python3-dev python3-venv libblas-dev liblapack-dev libopenblas-dev cmake && \
+    rm -rf /var/lib/apt/lists/* && \
+    pip3 install scikit-build
+RUN git clone --depth 1 --branch v0.1.49 https://github.com/abetlen/llama-cpp-python.git /build
+RUN git clone https://github.com/ggerganov/llama.cpp.git /build/vendor/llama.cpp
+WORKDIR /build
+RUN CMAKE_ARGS="-DLLAMA_OPENBLAS=on" FORCE_CMAKE=1 python3 setup.py bdist_wheel
+# dist/llama_cpp_python-0.1.49-cp310-cp310-linux_x86_64.whl
+FROM nvidia/cuda:11.8.0-runtime-ubuntu22.04
+LABEL maintainer="Wing Lian <[email protected]>"
+RUN apt-get update && \
+    apt-get install --no-install-recommends -y  \
+    build-essential curl libportaudio2 libasound-dev git python3 python3-pip make g++  \
+    libffi-dev libncurses5-dev zlib1g zlib1g-dev libreadline-dev libbz2-dev libsqlite3-dev libssl-dev \
+    libblas-dev liblapack-dev libopenblas-dev cmake git-lfs && \
+    git lfs install && \
+    rm -rf /var/lib/apt/lists/*
+RUN groupadd -g 1000 appuser && \
+    useradd -r -u 1000 -g appuser appuser -m -d /home/appuser
+RUN --mount=type=cache,target=/root/.cache/pip pip3 install virtualenv
+RUN mkdir /app
+RUN mkdir -p /opt/venv
+RUN chown -R appuser:appuser /app
+WORKDIR /app
+RUN virtualenv /opt/venv
+RUN . /opt/venv/bin/activate && \
+    pip3 install --no-cache-dir --upgrade pip setuptools wheel && \
+    pip3 install --no-cache-dir datasets "huggingface-hub>=0.12.1" "protobuf<4" "click<8.1" "bitsandbytes" "gradio" && \
+    pip3 install --no-cache-dir torch torchvision torchaudio
+COPY --from=builder-llamacpp /build/dist/llama_cpp_python-0.1.49-cp310-cp310-linux_x86_64.whl /app
+RUN . /opt/venv/bin/activate && \
+    pip3 uninstall llama_cpp_python && \
+    pip3 install /app/llama_cpp_python-0.1.49-cp310-cp310-linux_x86_64.whl && \
+    rm /app/llama_cpp_python-0.1.49-cp310-cp310-linux_x86_64.whl
+COPY requirements.txt /app/requirements.txt
+RUN . /opt/venv/bin/activate && \
+    pip3 install --no-cache-dir -r requirements.txt
+RUN cp /opt/venv/lib/python3.10/site-packages/bitsandbytes/libbitsandbytes_cuda118.so /opt/venv/lib/python3.10/site-packages/bitsandbytes/libbitsandbytes_cpu.so
+COPY . /app/
+RUN mkdir -p /opt/cache/huggingface/hub
+RUN chown -R appuser:appuser /app && find /app -type d -exec chmod 0755 {} \;
+RUN chown -R appuser:appuser /home/appuser
+RUN chmod +x /app/entrypoint.sh && \
+    chmod +x /app/app.py
+ENV TRANSFORMERS_CACHE=/opt/cache/huggingface/hub
+USER appuser
+ENTRYPOINT ["/app/entrypoint.sh"]

README.md CHANGED Viewed

@@ -3,7 +3,7 @@ title: Ggml Ui
 emoji: 🏃
 colorFrom: blue
 colorTo: gray
-sdk: gradio
 sdk_version: 3.29.0
 app_file: chat.py
 pinned: false

 emoji: 🏃
 colorFrom: blue
 colorTo: gray
+sdk: docker
 sdk_version: 3.29.0
 app_file: chat.py
 pinned: false

chat.py CHANGED Viewed

@@ -87,4 +87,4 @@ with blocks:
     submit.click(chat, inputs=[message, chat_history_state, system_msg], outputs=[chatbot, chat_history_state, message])
     message.submit(chat, inputs=[message, chat_history_state, system_msg], outputs=[chatbot, chat_history_state, message])
-blocks.queue(concurrency_count=10).launch(debug=True)

     submit.click(chat, inputs=[message, chat_history_state, system_msg], outputs=[chatbot, chat_history_state, message])
     message.submit(chat, inputs=[message, chat_history_state, system_msg], outputs=[chatbot, chat_history_state, message])
+blocks.queue(max_size=32, concurrency_count=3).launch(debug=True, server_name="0.0.0.0", server_port=7860)

entrypoint.sh ADDED Viewed

	@@ -0,0 +1,6 @@

+#!/bin/bash
+source /opt/venv/bin/activate
+export PROTOCOL_BUFFERS_PYTHON_IMPLEMENTATION=python
+python3 chat.py

requirements.txt CHANGED Viewed

@@ -1,3 +1 @@
-llama-cpp-python @ https://github.com/OpenAccess-AI-Collective/ggml-webui/releases/download/v0.1.49-rc6/llama_cpp_python-gpu-0.1.49-cp38-cp38-linux_x86_64.whl
 pyyaml
-requests



1	pyyaml