這是一個用於下載、處理和轉錄影片音訊的專案。此專案使用 ffmpeg
進行影片處理,並使用 whisper
模型進行音訊轉錄。此外,還使用 Azure OpenAI 進行文本清理。
-
安裝 Poetry:
curl -sSL https://install.python-poetry.org | python3 -
-
安裝專案依賴:
poetry install
請依照您的作業系統安裝 FFmpeg:
-
macOS:
brew install ffmpeg
-
Ubuntu:
sudo apt update sudo apt install ffmpeg
-
Windows: 請參考 FFmpeg 官網 下載並安裝。
- 安裝 Whisper:
pip install git+https://github.com/openai/whisper.git
-
下載並轉錄影片音訊:
download_and_transcribe("影片網址")
-
清理文本內容:
clean_context("需要清理的文本")
請在專案根目錄下創建 .env 檔案,並設定以下環境變數: