Commits · wiklif/my-api

naprawa literówki

53cab83

wiklif commited on Jul 24, 2024

8-bitowa kwantyzacja

f28f9e0

wiklif commited on Jul 24, 2024

lepsze logowanie błędów, timeout zwiększony do 120s

e234eec

wiklif commited on Jul 24, 2024

Zwiększyliśmy timeout dla TextIteratorStreamer do 60 sekund.

e3fd506

wiklif commited on Jul 24, 2024

poprawki

8475fdd

wiklif commited on Jul 24, 2024

Zamiast używać InferenceClient, ładujemy model lokalnie za pomocą AutoModelForCausalLM i AutoTokenizer.

f7fc778

wiklif commited on Jul 24, 2024

dodany InferenceClient

b7844b5

wiklif commited on Jul 24, 2024

Usunęliśmy globalną zmienną pipeline. Stworzyliśmy funkcję create_pipeline(), która tworzy pipeline za każdym razem, gdy jest potrzebny.

9d9f151

wiklif commited on Jul 24, 2024

Usunięto inicjalizację pipeline'u przy starcie aplikacji. Dodano lazy loading dla pipeline'u w funkcji generate_response()

bbe0270

wiklif commited on Jul 24, 2024

dodano accelerate i lepsze logowanie błędów

8ad8716

wiklif commited on Jul 24, 2024

dodany token

f1cb75e

wiklif commited on Jul 24, 2024

pierwszy commit

7938810

wiklif commited on Jul 24, 2024

initial commit

f9490b8
verified

wiklif commited on Jul 24, 2024

Spaces:

wiklif
/

my-api

Sleeping

Commit History

naprawa literówki

53cab83

8-bitowa kwantyzacja

f28f9e0

lepsze logowanie błędów, timeout zwiększony do 120s

e234eec

Zwiększyliśmy timeout dla TextIteratorStreamer do 60 sekund.

e3fd506

poprawki

8475fdd

Zamiast używać InferenceClient, ładujemy model lokalnie za pomocą AutoModelForCausalLM i AutoTokenizer.

f7fc778

dodany InferenceClient

b7844b5

Usunęliśmy globalną zmienną pipeline. Stworzyliśmy funkcję create_pipeline(), która tworzy pipeline za każdym razem, gdy jest potrzebny.

9d9f151

Usunięto inicjalizację pipeline'u przy starcie aplikacji. Dodano lazy loading dla pipeline'u w funkcji generate_response()

bbe0270

dodano accelerate i lepsze logowanie błędów

8ad8716

dodany token

f1cb75e

pierwszy commit

7938810

initial commit

f9490b8
verified

Commit History

naprawa literówki 53cab83

8-bitowa kwantyzacja f28f9e0

lepsze logowanie błędów, timeout zwiększony do 120s e234eec

Zwiększyliśmy timeout dla TextIteratorStreamer do 60 sekund. e3fd506

poprawki 8475fdd

Zamiast używać InferenceClient, ładujemy model lokalnie za pomocą AutoModelForCausalLM i AutoTokenizer. f7fc778

dodany InferenceClient b7844b5

Usunęliśmy globalną zmienną pipeline. Stworzyliśmy funkcję create_pipeline(), która tworzy pipeline za każdym razem, gdy jest potrzebny. 9d9f151

Usunięto inicjalizację pipeline'u przy starcie aplikacji. Dodano lazy loading dla pipeline'u w funkcji generate_response() bbe0270

dodano accelerate i lepsze logowanie błędów 8ad8716

dodany token f1cb75e

pierwszy commit 7938810

initial commit f9490b8 verified

naprawa literówki

53cab83

8-bitowa kwantyzacja

f28f9e0

lepsze logowanie błędów, timeout zwiększony do 120s

e234eec

Zwiększyliśmy timeout dla TextIteratorStreamer do 60 sekund.

e3fd506

poprawki

8475fdd

Zamiast używać InferenceClient, ładujemy model lokalnie za pomocą AutoModelForCausalLM i AutoTokenizer.

f7fc778

dodany InferenceClient

b7844b5

Usunęliśmy globalną zmienną pipeline. Stworzyliśmy funkcję create_pipeline(), która tworzy pipeline za każdym razem, gdy jest potrzebny.

9d9f151

Usunięto inicjalizację pipeline'u przy starcie aplikacji. Dodano lazy loading dla pipeline'u w funkcji generate_response()

bbe0270

dodano accelerate i lepsze logowanie błędów

8ad8716

dodany token

f1cb75e

pierwszy commit

7938810

initial commit

f9490b8
verified