Qwen2-VL-2B / Dockerfile
lucianotonet's picture
Optimize Dockerfile: use RUN for server setup
596dfe2
raw
history blame
781 Bytes
FROM ollama/ollama:latest
RUN apt-get update && apt-get install -y \
git \
&& rm -rf /var/lib/apt/lists/*
# https://huggingface.co/docs/hub/spaces-sdks-docker-first-demo
RUN useradd -m -u 1000 user
USER user
ENV HOME=/home/user \
PATH=/home/user/.local/bin:$PATH \
OLLAMA_HOST=0.0.0.0
# Clonar o modelo do Hugging Face (substitua [nome-do-modelo] pelo modelo desejado)
# RUN git clone https://huggingface.co/[nome-do-modelo] $HOME/models/[nome-do-modelo]
# Copiar o Modelfile para o contêiner
COPY --chown=user:user Modelfile $HOME/Modelfile
# Iniciar o servidor Ollama, baixar o modelo e manter o servidor em execução
RUN ollama serve & sleep 5 && ollama pull lucianotonet/llamaclaude && pkill ollama
# Expor a porta do Ollama
EXPOSE 11434
CMD ["serve"]