AI 幫你「聽 Podcast → 整理摘要與重點」,使用者不需要真的聽完整集。
- 📡 輸入 RSS URL,自動列出 Episode 列表資訊
- ⬇️ 下載 MP3 音訊,並透過 FFmpeg 切段
- 🎙️ Whisper STT 語音轉文字
- 🗂️ 向量化後存入 Pinecone VectorStore
- 🤖 做 RAG Pipeline,再由 LLM 生成摘要與重點
RSS Feed URL
│
▼
┌─────────────────────┐
│ RSS Parser │ 取得 Episode 列表資訊
└─────────────────────┘
│
▼
┌─────────────────────┐
│ Audio Downloader │ 下載 MP3
└─────────────────────┘
│
▼
┌─────────────────────┐
│ FFmpeg Chunker │ 切成1分鐘Chunk,降低 Whisper 記憶體用量
└─────────────────────┘
│
▼
┌─────────────────────┐
│ Whisper STT │ openai-whisper — 語音轉文字
└─────────────────────┘
│
▼
┌─────────────────────┐
│ Embedding │ OpenAI text-embedding-3-small
└─────────────────────┘
│
▼
┌─────────────────────┐
│ Pinecone │ 將向量存入 VectorStore
└─────────────────────┘
│
├─── 摘要流程
│
▼
┌─────────────────────┐
│ RAG Pipeline │
│ LLM 生成摘要重點 │
└─────────────────────┘
│
▼
摘要 + 重點列表
| 用途 | 套件 |
|---|---|
| API Server | FastAPI |
| 音訊切段 | FFmpeg |
| 語音轉文字 | openai-whisper |
| Embedding | OpenAI text-embedding-3-small |
| Vector Store | Pinecone |
| LLM / Agent | LangChain + OpenAI GPT-4 |