Spaces:
Sleeping
Sleeping
title: Dinercall Intent Demo | |
emoji: 🏆 | |
colorFrom: red | |
colorTo: gray | |
sdk: gradio | |
sdk_version: 5.25.0 | |
app_file: app.py | |
pinned: false | |
license: apache-2.0 | |
short_description: restaurant reservation intent detector | |
# 🍽️ 餐廳訂位意圖識別系統 (Mandarin Reservation Intent Classifier) | |
🎙️ 本系統讓使用者可以透過**語音錄音**或**文字輸入**,自動判斷是否具有「訂位意圖」,是語音助理或自動客服前端的理想元件之一。這個版本基於 **Gradio** 建構,具有簡單直觀的分頁式輸入模式切換(「麥克風」或「文字」)。 | |
--- | |
## 🔍 功能介紹 | |
- 🧠 **語音辨識**:使用 fine-tuned Whisper 模型 [`Jingmiao/whisper-small-zh_tw`](https://huggingface.co/Jingmiao/whisper-small-zh_tw) 將語音轉為繁體中文文字。 | |
- 🤖 **意圖分類**:使用微調的 ALBERT 中文模型或 Qwen 模型判斷輸入是否包含訂位意圖。 | |
- 📱 **支援手機與桌機**:介面具備良好響應性,適用於各類瀏覽器與行動裝置。 | |
- 🔊 **雙重輸入模式**:使用者可在「麥克風」和「文字」兩種模式間切換,以提供語音或手動輸入。 | |
--- | |
## 🚀 使用方式 | |
1. 選擇輸入模式: | |
- 「麥克風」:點擊錄音按鈕開始錄音,錄製完成後自動轉文字並判斷意圖。 | |
- 「文字」:直接在文字框中輸入語句,再點擊「執行辨識」按鈕。 | |
2. 從下拉選單選擇使用的模型(例如 ALBERT-tiny、ALBERT-base 或 Qwen)。 | |
3. 按下「執行辨識」後,系統將顯示轉換後的文字、意圖判斷結果,並以 TTS(語音合成)的方式回應。 | |
--- | |
## 🤗 使用模型 | |
### Whisper 語音辨識: | |
- [`Jingmiao/whisper-small-zh_tw`](https://huggingface.co/Jingmiao/whisper-small-zh_tw) | |
### 中文意圖分類模型: | |
- [`Luigi/albert-tiny-chinese-dinercall-intent`](https://huggingface.co/Luigi/albert-tiny-chinese-dinercall-intent) | |
- [`Luigi/albert-base-chinese-dinercall-intent`](https://huggingface.co/Luigi/albert-base-chinese-dinercall-intent) | |
- 或使用 [`Qwen/Qwen2.5-0.5B-Instruct`](https://huggingface.co/Qwen/Qwen2.5-0.5B-Instruct)(透過 Outlines 整合) | |
--- | |
## 📦 依賴環境 | |
```txt | |
llama-cpp-python | |
gradio>=5.0.0 | |
transformers | |
torch | |
soundfile | |
outlines | |
numpy>=1.24,<2.0 | |
kokoro | |
huggingface-hub | |
jieba | |
docopt | |
ordered-set | |
cn2an | |
pypinyin | |
sentencepiece | |
``` | |
--- | |
## 🛠️ 開發者備註 | |
- 本應用現改為 Gradio App,適合在 Hugging Face Spaces 上部署,並支援 Gradio V5 的最新功能。 | |
- 採用雙重輸入模式(麥克風與文字)讓使用者能靈活切換輸入方式。 | |
- 若需延伸本系統至其他語言或多輪對話,歡迎 fork 本專案進行改造! | |
--- | |
© 2024 by Luigi. Made with ❤️ using Hugging Face + Gradio. | |
--- |