VoiceInput

VoiceInput 是一款 macOS 上的語音輸入工具，讓您可以透過語音將文字輸入到任何應用程式中。受到 VoiceInk 的啟發，開發了這款工具，完全免費且自由，不需要授權。

功能特色

按住說話，放開轉寫：使用修飾鍵（Command、Option、Fn）作為快捷鍵，按住開始錄音，放開後自動將文字插入到當前焦點的輸入框
即時語音辨識：錄音期間即時顯示辨識結果
多語言支援：支援繁體中文、簡體中文、英文、日文
靈活的設定：可自訂快捷鍵、語言、切換自動插入功能
浮動面板：錄音時顯示美觀的浮動膠囊視窗
LLM 智慧修正：內建語言模型處理流程，可自動修正錯字與語句不順
自訂字典：支援個人化詞彙取代規則（如將「水平致中」取代為「水平置中」）

支援的快捷鍵

快捷鍵	說明
右邊 Command (⌘)	預設快捷鍵
左邊 Command (⌘)
右邊 Option (⌥)
左邊 Option (⌥)
Fn 鍵

系統需求

macOS 12.0 或更高版本
麥克風權限
語音辨識權限
輔助功能權限（用於模擬鍵盤輸入文字）

權限說明

首次使用時，系統會要求您授予以下權限：

麥克風權限：用於錄製您的語音
語音辨識權限：用於將語音轉換為文字
輔助功能權限：用於將文字輸入到其他應用程式中

安裝說明

從原始碼編譯

複製專案：

git clone https://github.com/tenyi/VoiceInput.git
cd VoiceInput

使用 Xcode 開啟 VoiceInput.xcodeproj
在 Xcode 中設定您的開發者簽名
編譯並執行 (⌘R)

設定權限

首次執行後，系統會彈出權限請求對話框，請點擊「允許」
若權限被拒絕，可前往 系統偏好設定 > 隱私權與安全性 手动开启
點擊選單列中的 VoiceInput 圖示，選擇「設定」來查看權限狀態

使用教學

基本操作

開始錄音：按住設定的快捷鍵（例如右邊 Command 或 fn 鍵）
說話：對著麥克風說話
停止並輸入：放開快捷鍵，語音會自動轉換為文字並插入到您正在使用的輸入框中

設定

點擊選單列中的 VoiceInput 圖示
選擇「設定」開啟設定視窗
您可以設定：
- 辨識語言：選擇語音辨識的語言
- 快捷鍵：選擇用於觸發錄音的按鍵
- 自動插入：切換轉錄完成後是否自動輸入文字

技術架構

語音辨識：
- Apple Speech Framework：macOS 內建的語音辨識服務，無需額外設定即可使用
- Whisper：支援本地端 Whisper 模型，可離線使用且辨識效果更佳
音訊處理：使用 AVAudioEngine 進行錄音
鍵盤模擬：使用 CGEvent 模擬 Cmd+V 貼上文字
快捷鍵監控：使用 CGEventTap 監聽鍵盤事件

LLM 智慧修正與自訂字典

除了本地端的語音辨識外，VoiceInput 也支援強大的後處理功能，讓輸入更精準：

智慧修正 (LLM Correction)

您可以設定 OpenAI 相容的 API 端點（支援官方 OpenAI、OpenRouter 等各種自訂供應商），讓語言模型自動為您修正轉錄文字的錯字。

💡 強烈推薦使用 google/gemini-2.5-flash-lite 模型：

速度極快：修正步驟造成的延遲時間短
價格極便宜：API 呼叫成本非常低，是日常大量語音輸入的完美選擇

自訂字典 (User Dictionary)

在設定中的「字典」分頁，您可以加入專屬的常用詞彙取代規則。系統會在最終文字輸出前，套用您的自訂字典，確保您的專有名詞或特定用語永遠正確無誤。

開發者

作者：Tenyi

授權

本專案採用 Apache License 2.0 授權。

Name		Name	Last commit message	Last commit date
Latest commit History 34 Commits
.claude		.claude
.serena		.serena
VoiceInput.xcodeproj		VoiceInput.xcodeproj
VoiceInput		VoiceInput
VoiceInputTests		VoiceInputTests
VoiceInputUITests		VoiceInputUITests
docs		docs
.gitignore		.gitignore
AGENTS.md		AGENTS.md
AppIcon.png		AppIcon.png
CLAUDE.md		CLAUDE.md
CodeReview-GLM47.md		CodeReview-GLM47.md
GEMINI.md		GEMINI.md
GoldenMicrophone.png		GoldenMicrophone.png
LICENSE		LICENSE
README.md		README.md
generate_icon.py		generate_icon.py
run-test.sh		run-test.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

VoiceInput

功能特色

支援的快捷鍵

系統需求

權限說明

安裝說明

從原始碼編譯

設定權限

使用教學

基本操作

設定

技術架構

推薦模型

聯發科 Breeze ASR 模型（繁體中文極力推薦）

LLM 智慧修正與自訂字典

智慧修正 (LLM Correction)

自訂字典 (User Dictionary)

開發者

授權

About

Uh oh!

Releases

Packages

Contributors 2

Uh oh!

Languages

License

tenyi/VoiceInput

Folders and files

Latest commit

History

Repository files navigation

VoiceInput

功能特色

支援的快捷鍵

系統需求

權限說明

安裝說明

從原始碼編譯

設定權限

使用教學

基本操作

設定

技術架構

推薦模型

聯發科 Breeze ASR 模型（繁體中文極力推薦）

LLM 智慧修正與自訂字典

智慧修正 (LLM Correction)

自訂字典 (User Dictionary)

開發者

授權

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Uh oh!

Languages

Packages