Spaces:

linjunpop
/

livebooks

Sleeping

App Files Files Community

linjunpop commited on Aug 21, 2023

Commit

0194265

1 Parent(s): ff339d0

Update public-apps/summarine.livemd

Browse files

Files changed (1) hide show

public-apps/summarine.livemd +64 -39

public-apps/summarine.livemd CHANGED Viewed

@@ -17,30 +17,80 @@ Mix.install(
 Audio to text, then summary.
 ## App
 ```elixir
-{:ok, model_info} = Bumblebee.load_model({:hf, "openai/whisper-base"})
-{:ok, featurizer} = Bumblebee.load_featurizer({:hf, "openai/whisper-base"})
-{:ok, tokenizer} = Bumblebee.load_tokenizer({:hf, "openai/whisper-base"})
-{:ok, generation_config} = Bumblebee.load_generation_config({:hf, "openai/whisper-base"})
 generation_config = Bumblebee.configure(generation_config, max_new_tokens: 100)
 serving =
   Bumblebee.Audio.speech_to_text(model_info, featurizer, tokenizer, generation_config,
-    compile: [batch_size: 8],
     defn_options: [compiler: EXLA]
   )
 ```
 ```elixir
-audio_input = Kino.Input.audio("Audio", sampling_rate: featurizer.sampling_rate)
-form = Kino.Control.form([audio: audio_input], submit: "Run")
-frame = Kino.Frame.new()
 Kino.listen(form, fn %{data: %{audio: audio}} ->
   if audio do
-    Kino.Frame.render(frame, Kino.Text.new("Running..."))
     audio =
       audio.data
@@ -49,40 +99,15 @@ Kino.listen(form, fn %{data: %{audio: audio}} ->
       |> Nx.mean(axes: [1])
     %{results: [%{text: generated_text}]} = Nx.Serving.run(serving, audio)
-    Kino.Frame.render(frame, Kino.Text.new(generated_text))
-    payload = %{
-      model: "llama2-uncensored",
-      prompt: "Please summary the text: #{generated_text}"
-    }
-    {:ok, response} = Req.post("http://localhost:11434/api/generate", json: payload)
-    result =
-      response.body
-      |> String.split("\n")
-      |> Enum.map(fn
-        "" ->
-          nil
-        line ->
-          {:ok, data} = Jason.decode(line)
-          data
-      end)
-      |> Enum.reject(&is_nil/1)
-      |> Enum.map(fn
-        %{"response" => response} ->
-          response
-        _ ->
-          ""
-      end)
-      |> Enum.join("")
-    Kino.Frame.render(frame, Kino.Text.new(result))
   end
 end)
-Kino.Layout.grid([form, frame], boxed: true, gap: 16)
 ```

 Audio to text, then summary.
+## Setup Ollama module
+```elixir
+defmodule Ollama do
+  @api_endpoint "http://localhost:11434/api/generate"
+  @model "llama2-uncensored"
+  def generate(prompt) do
+    payload = %{
+      model: @model,
+      prompt: prompt
+    }
+    {:ok, response} = Req.post(@api_endpoint, json: payload)
+    process_response(response)
+  end
+  defp process_response(response) do
+    response.body
+    |> String.split("\n")
+    |> Enum.map(&process_chunk/1)
+    |> Enum.reject(&is_nil/1)
+    |> Enum.map(&get_content/1)
+    |> Enum.join("")
+  end
+  defp process_chunk("") do
+    nil
+  end
+  defp process_chunk(json_string) do
+    {:ok, data} = Jason.decode(json_string)
+    data
+  end
+  defp get_content(%{"response" => response}) do
+    response
+  end
+  defp get_content(_) do
+    ""
+  end
+end
+```
 ## App
 ```elixir
+model_name = "openai/whisper-base"
+{:ok, model_info} = Bumblebee.load_model({:hf, model_name})
+{:ok, featurizer} = Bumblebee.load_featurizer({:hf, model_name})
+{:ok, tokenizer} = Bumblebee.load_tokenizer({:hf, model_name})
+{:ok, generation_config} = Bumblebee.load_generation_config({:hf, model_name})
 generation_config = Bumblebee.configure(generation_config, max_new_tokens: 100)
 serving =
   Bumblebee.Audio.speech_to_text(model_info, featurizer, tokenizer, generation_config,
+    compile: [batch_size: 4],
     defn_options: [compiler: EXLA]
   )
 ```
 ```elixir
+audio_input = Kino.Input.audio("", sampling_rate: featurizer.sampling_rate)
+form = Kino.Control.form([audio: audio_input], submit: "Summary the audio")
+audio_frame = Kino.Frame.new(placeholder: false)
+summary_frame = Kino.Frame.new(placeholder: false)
 Kino.listen(form, fn %{data: %{audio: audio}} ->
   if audio do
+    Kino.Frame.render(audio_frame, Kino.Text.new("Running..."))
     audio =
       audio.data
       |> Nx.mean(axes: [1])
     %{results: [%{text: generated_text}]} = Nx.Serving.run(serving, audio)
+    Kino.Frame.render(audio_frame, Kino.Markdown.new("**Audio Content**: #{generated_text}"))
+    Kino.Frame.render(summary_frame, Kino.Markdown.new("Running"))
+    result = Ollama.generate("Please summary the text: #{generated_text}")
+    Kino.Frame.render(summary_frame, Kino.Markdown.new("**Summary**: #{result}"))
   end
 end)
+Kino.Layout.grid([form, audio_frame, summary_frame], boxed: true, gap: 16)
 ```