Commit History

naprawa literówki
53cab83

wiklif commited on

8-bitowa kwantyzacja
f28f9e0

wiklif commited on

lepsze logowanie błędów, timeout zwiększony do 120s
e234eec

wiklif commited on

Zwiększyliśmy timeout dla TextIteratorStreamer do 60 sekund.
e3fd506

wiklif commited on

poprawki
8475fdd

wiklif commited on

Zamiast używać InferenceClient, ładujemy model lokalnie za pomocą AutoModelForCausalLM i AutoTokenizer.
f7fc778

wiklif commited on

dodany InferenceClient
b7844b5

wiklif commited on

Usunęliśmy globalną zmienną pipeline. Stworzyliśmy funkcję create_pipeline(), która tworzy pipeline za każdym razem, gdy jest potrzebny.
9d9f151

wiklif commited on

Usunięto inicjalizację pipeline'u przy starcie aplikacji. Dodano lazy loading dla pipeline'u w funkcji generate_response()
bbe0270

wiklif commited on

dodano accelerate i lepsze logowanie błędów
8ad8716

wiklif commited on

dodany token
f1cb75e

wiklif commited on

pierwszy commit
7938810

wiklif commited on

initial commit
f9490b8
verified

wiklif commited on