Google 悄悄推出可離線運作的 AI 聽寫應用

編輯評論

Google 這次以實驗性質推出的「Google AI Edge Eloquent」，暴露了科技巨頭在邊緣運算領域的最新布局策略。採用自家開源的 Gemma 模型作為 ASR（自動語音識別）引擎，而非依賴雲端 Gemini，這決策背後折射出兩個重要趨勢：一是隱私權意識高漲，用戶對於語音數據上傳雲端日益敏感；二是行動裝置算力已足以支撐中等規模的 AI 模型本地運行。

從技術角度觀察，這款應用的核心創新在於「語音後處理」層——不僅是單純的語音轉文字，而是包含填塞詞過濾、語意潤飾、風格轉換（正式/簡短/擴寫）等端到端的文字生成流程。這與傳統聽寫工具（如 Apple 的 Dictation 或 Google Assistant 的 Voice Typing）形成明顯區隔。值得注意的是，這類功能目前多由新創公司主導，如 Wispr Flow 獲得 Menlo Ventures 3000 萬美元融資、Willow 推出系統級鍵盤整合等，Google 此時入局勢必重新定義市場競爭態勢。

然而，技術成熟度仍是關鍵挑戰。從截圖中的誤識別案例（將「Transcription」聽錯）可看出，即使透過 Gemma 模型，準確率仍有提升空間。此外，App Store 描述曾提及 Android 版本但隨後移除，顯示這款產品可能仍處於早期測試階段，產品策略尚未定型。若測試反應正向，我們預期 Google 可能將這類邊緣 AI 聽寫能力整合進 Android 系統層級，甚至嵌入 Gboard 或 Google Messages 等既有產品線，這對 Wispr Flow、SuperWhisper 等新創將構成直接威脅。

結論摘要

Google 在 iOS 平台推出「Google AI Edge Eloquent」，一款離線優先的 AI 聽寫應用，採用 Gemma ASR 模型，可完全本地運行
應用具備自動過濾填塞詞（um、ah）、語意潤飾、文字風格轉換（正式/簡短/擴寫/重點摘要）等進階功能
支援雲端與純本地雙模式，可選擇性從 Gmail 匯入專有名詞與術語，亦可自訂詞彙表
提供完整歷史記錄搜尋、語速統計（每分鐘字數）與總字數分析等使用數據
App Store 描述曾提及 Android 版本與系統級鍵盤整合，但已移除相關文字，iOS 鍵盤功能標註「即將推出」

原文翻譯

（更新：2026 年 4 月 7 日晚間 10:30 PT）：公司已更新 App Store 商品頁面，移除對 Android 應用的提及。同時也新增了 iOS 鍵盤「即將推出」的說明。

Google 週一在 iOS 平台靜默上線一款名為「Google AI Edge Eloquent」的離線優先聽寫應用，目標鎖定 Wispr Flow、SuperWhisper、Willow 等競品。

該應用免費下載，下載完基於 Gemma 的自動語音識別（ASR）模型後即可開始聽寫。應用內可即時查看逐字稿，按下暫停時會自動過濾「um」、「ah」等填塞詞並潤飾文字。

逐字稿下方提供「重點」、「正式」、「簡短」、「擴寫」等選項，可轉換文字風格。

應用截圖

**圖片來源：**TechCrunch 截圖

您也可關閉雲端模式，完全採用本地處理。（雲端模式啟用時，應用會使用雲端 Gemini 模型進行文字清理。）Google AI Edge Eloquent 可選擇從您的 Gmail 帳戶匯入特定關鍵字、姓名與術語，此外也可自行新增自訂詞彙。

應用會顯示聽寫會話歷史，並支援搜尋所有記錄。還可展示上次會話的聽寫字數、每分鐘語速，以及總說話字數。

「Google AI Edge Eloquent 是一款先進聽寫應用，專為橋接自然說話與專業可用的文字而設計。與傳統逐字轉錄結巴與填塞詞的標準聽寫軟體不同，Eloquent 利用 AI 捕捉您的原意。它會自動編輯掉『嗯』、『啊』與句中自我修正，輸出乾淨準確的散文，」公司 App Store 描述寫道。

識別錯誤截圖

我說的是「Transcription」。該應用尚處早期階段。**圖片來源：**TechCrunch 截圖

雖然應用目前僅在 iOS 上架，但 App Store 描述曾提及 Android 版本。（我們已聯繫 Google 尋求更多資訊，若有回覆將更新報導。）

根據描述，Eloquent 將提供「無縫 Android 整合」，可設定為系統預設鍵盤，在任何文字欄位全域使用。此外應用將支援浮動按鈕功能，類似 Wispr Flow 在 Android 上的實作，方便隨處存取轉錄功能。

隨著語音轉文字模型持續進步，AI 驅動的轉錄應用正逐漸受用戶歡迎。透過這款實驗性應用，Google 正加入這股趨勢。若測試成功，我們未來或許能看到 Android 平台也迎來升級的轉錄功能。

編輯評論#

結論摘要#

原文翻譯#

編輯評論

結論摘要

原文翻譯