編輯評論
Google 這次以實驗性質推出的「Google AI Edge Eloquent」,暴露了科技巨頭在邊緣運算領域的最新布局策略。採用自家開源的 Gemma 模型作為 ASR(自動語音識別)引擎,而非依賴雲端 Gemini,這決策背後折射出兩個重要趨勢:一是隱私權意識高漲,用戶對於語音數據上傳雲端日益敏感;二是行動裝置算力已足以支撐中等規模的 AI 模型本地運行。
從技術角度觀察,這款應用的核心創新在於「語音後處理」層——不僅是單純的語音轉文字,而是包含填塞詞過濾、語意潤飾、風格轉換(正式/簡短/擴寫)等端到端的文字生成流程。這與傳統聽寫工具(如 Apple 的 Dictation 或 Google Assistant 的 Voice Typing)形成明顯區隔。值得注意的是,這類功能目前多由新創公司主導,如 Wispr Flow 獲得 Menlo Ventures 3000 萬美元融資、Willow 推出系統級鍵盤整合等,Google 此時入局勢必重新定義市場競爭態勢。
然而,技術成熟度仍是關鍵挑戰。從截圖中的誤識別案例(將「Transcription」聽錯)可看出,即使透過 Gemma 模型,準確率仍有提升空間。此外,App Store 描述曾提及 Android 版本但隨後移除,顯示這款產品可能仍處於早期測試階段,產品策略尚未定型。若測試反應正向,我們預期 Google 可能將這類邊緣 AI 聽寫能力整合進 Android 系統層級,甚至嵌入 Gboard 或 Google Messages 等既有產品線,這對 Wispr Flow、SuperWhisper 等新創將構成直接威脅。
結論摘要
- Google 在 iOS 平台推出「Google AI Edge Eloquent」,一款離線優先的 AI 聽寫應用,採用 Gemma ASR 模型,可完全本地運行
- 應用具備自動過濾填塞詞(um、ah)、語意潤飾、文字風格轉換(正式/簡短/擴寫/重點摘要)等進階功能
- 支援雲端與純本地雙模式,可選擇性從 Gmail 匯入專有名詞與術語,亦可自訂詞彙表
- 提供完整歷史記錄搜尋、語速統計(每分鐘字數)與總字數分析等使用數據
- App Store 描述曾提及 Android 版本與系統級鍵盤整合,但已移除相關文字,iOS 鍵盤功能標註「即將推出」
原文翻譯
(更新:2026 年 4 月 7 日晚間 10:30 PT):公司已更新 App Store 商品頁面,移除對 Android 應用的提及。同時也新增了 iOS 鍵盤「即將推出」的說明。
Google 週一在 iOS 平台靜默上線一款名為「Google AI Edge Eloquent」的離線優先聽寫應用,目標鎖定 Wispr Flow、SuperWhisper、Willow 等競品。
該應用免費下載,下載完基於 Gemma 的自動語音識別(ASR)模型後即可開始聽寫。應用內可即時查看逐字稿,按下暫停時會自動過濾「um」、「ah」等填塞詞並潤飾文字。
逐字稿下方提供「重點」、「正式」、「簡短」、「擴寫」等選項,可轉換文字風格。

**圖片來源:**TechCrunch 截圖
您也可關閉雲端模式,完全採用本地處理。(雲端模式啟用時,應用會使用雲端 Gemini 模型進行文字清理。)Google AI Edge Eloquent 可選擇從您的 Gmail 帳戶匯入特定關鍵字、姓名與術語,此外也可自行新增自訂詞彙。
應用會顯示聽寫會話歷史,並支援搜尋所有記錄。還可展示上次會話的聽寫字數、每分鐘語速,以及總說話字數。
「Google AI Edge Eloquent 是一款先進聽寫應用,專為橋接自然說話與專業可用的文字而設計。與傳統逐字轉錄結巴與填塞詞的標準聽寫軟體不同,Eloquent 利用 AI 捕捉您的原意。它會自動編輯掉『嗯』、『啊』與句中自我修正,輸出乾淨準確的散文,」公司 App Store 描述寫道。

我說的是「Transcription」。該應用尚處早期階段。**圖片來源:**TechCrunch 截圖
雖然應用目前僅在 iOS 上架,但 App Store 描述曾提及 Android 版本。(我們已聯繫 Google 尋求更多資訊,若有回覆將更新報導。)
根據描述,Eloquent 將提供「無縫 Android 整合」,可設定為系統預設鍵盤,在任何文字欄位全域使用。此外應用將支援浮動按鈕功能,類似 Wispr Flow 在 Android 上的實作,方便隨處存取轉錄功能。
隨著語音轉文字模型持續進步,AI 驅動的轉錄應用正逐漸受用戶歡迎。透過這款實驗性應用,Google 正加入這股趨勢。若測試成功,我們未來或許能看到 Android 平台也迎來升級的轉錄功能。