編輯評論

這篇文章揭示了一個當前企業 AI 導入浪潮中的核心矛盾:市場對 AI Agent 的期待與實際運作所需投入的巨大落差。SaaStr 以 3 人團隊營運八位數字生意的案例極具說服力,但更值得注意的是他們坦承「犯過很多錯」的誠實態度。

從投資角度來看,這篇文章實際上劃分了兩類企業:一類是將 AI Agent 視為「即買即用」的神奇工具,期待它能自動解決所有問題;另一類則將其視為需要深度訓練、持續管理的新員工。後者才是真正的贏家。文章中提到「訓練比選對供應商更重要」,這是一個違反直覺但極其關鍵的洞察。

對 B2B SaaS 公司而言,這篇文章帶出的最大啟示是:AI Agent 的競爭力不在於技術本身,而在於你餵給它的「商業脈絡」。這意味著擁有豐富銷售對話紀錄、完善 CRM 資料、清晰 ICP 定義的公司,將在 AI 導入上享有巨大優勢。這可能重新定義未來幾年 SaaS 公司的競爭格局——數位資產豐富者與貧乏者之間的差距將被 AI 急速拉大。

結論摘要

  • AI Agent 不是「設定後即可忘記」的工具,需要每日 20-30 分鐘的持續管理與監控
  • 高階主管必須親自參與部署與訓練至少 30 天,否則無法真正理解 AI 的能力與侷限
  • 如果現有流程本身已經損壞,導入 AI 只會讓問題以更快速度放大,而非修復它
  • 數據品質是 AI Agent 成敗的關鍵,骯髒的 CRM 資料會導致 AI 產生嚴重錯誤
  • 選擇 1-2 個供應商深度訓練 90 天,比同時測試 10 個工具但都淺嘗輒止更有效

原文翻譯

我們在 SaaStr 已經部署了 20 多個 AI Agent。我們以 3 人團隊加上一整個 Agent 艦隊,營運著一個八位數字(千萬美元級)的生意。我們發送了超過 10 萬封高度個性化的外銷電子郵件,自動預約了數百場會議,透過 AI 顧問進行了 275 萬次對話,並且從這些能在週六晚上 6:02 自動運作的 AI Agent 身上,產生了實實在在、已經成案的數百萬美元營收。

但在抵達這個境界之前,我們也犯過很多錯。我們也與數十位 B2B 領導者對談過,他們今年也犯了和我們一樣的錯誤,往往是以完全相同的順序,犯完全相同的錯。

以下是我們看到的 10 大錯誤。

1. 沒有親自先做一次。你必須這樣做。非做不可。

這是最常見的錯誤,也是會阻礙其他一切的事情。

我們最近與一家市值超過 100 億美元的上市 B2B 公司進行了顧問諮詢。這是一家你會認為是 AI 領導者的公司。我們與他們 20 位人員進行會議,問了一個簡單的問題:「你們有多少比例的 AI Agent 部署是你們親自做過的?」

一片寂靜。

他們以為可以把一個未經訓練的 Agent 交給一群 20 歲的 SDR(銷售開發代表),它就會自己銷售。事情完全不是這樣運作的。

如果你是銷售副總、行銷長、營收長或創辦人,而你沒有親自部署過 Agent、親自訓練它、修正它的錯誤,並觀察它運作 30 天,那你其實並不了解 AI Agent 能做什麼、不能做什麼。你的認知來自供應商的 Demo 和 LinkedIn 貼文。那是不夠的。

挑一個 Agent。親自部署它。親自上陣。親自做資料匯入。親自做訓練。到了第 30 天,你對 GTM(Go-to-Market)領域 AI 的了解會超越 80% 的同儕。

2. 將 Agent 視為「設定後即可忘記」

目前 GTM 領域沒有任何一款優秀的 AI Agent 是「買了就可以不管」的。一個都沒有。甚至連「設定後即可忘記」的都沒有。

每個供應商都這樣宣傳。那是行銷。現實是每日管理。不是每週,不是每月,是每天。

我們付出了慘痛代價才學到這點。我們的一個生產環境 Agent 悄悄停止了匯入新的訓練資料。沒有錯誤訊息。沒有警示。沒有當機。它只是基於日益陳舊的知識庫持續運作了四個月。輸出看起來仍然合理。回頭看來稍微有些偏差,但沒有錯到足以觸發警報。

我們只在我們開始覺得結果與現實世界的觀察有些微不一致時才發現。我們順著線索拉扯,發現這個 Agent 自從資料管線損壞以來,一直在靜默中品質下降。Agent 不知道。它也無從得知。而我們沒在看。

每個部署後就走開的人都會遇到這種事。問題是你會在兩週還是四個月後發現。

我們現在每天都會花 20 到 30 分鐘檢視整個 Agent 堆疊。不是因為我們喜歡這樣。而是因為我們學到了不這樣做的後果。

3. 跳過前 30 天的訓練

訓練比挑選完美的供應商更重要。我再說一次:訓練比挑選完美的供應商更重要。

我們部署的每一個 Agent 都需要至少 30 天的密集、每日訓練。每天一兩小時,修正錯誤、修正幻覺、調整語氣、上傳脈絡、精細化升級規則。

以下是「訓練」在實務上真正的樣子。術語聽起來很嚇人,但工作其實沒那麼難:

Ingestion(資料匯入)只是上傳你的東西。你的網站 URL、你的 wiki、你的訓練文件、你的募資說明書。Agent 會處理它。

Training(訓練)只是回答問題和修正錯誤。每一天,Agent 都會說一些蠢話。錯誤的日期。編造的案例研究。奇怪的措辭。你修正它。到了第 30 天,它就會變得相當不錯。

我們的一個 AI SDR 需要經過 47 次獨立的迭代,才能正確處理定價討論。它一直太激進。那不是 bug。那是讓 Agent 在一個細微主題上上手所需的正常工作量。

如果你不願意在行事曆上預留 30 天進行每日訓練,不要買這個工具。

4. 用 AI 修復已經損壞的東西

如果你的外銷(outbound)用人類做就不管用,AI 也不會修復它。如果你的訊息不對、你的 ICP(理想客戶輪廓)錯了、或者你的產品吸引力太弱,AI 只會讓你的失敗以更高的規模發生。

我常看到這種情況。「我們的外銷很糟,我們試試 AI 吧。」猜怎樣?AI 外銷也很糟。只是更快而已。

AI Agent 是放大器。它們把行得通的東西倍增。它們也把壞掉的東西倍增。在它們之上部署 AI 之前,你需要經過驗證的流程、有效的訊息和明確的成功指標。

先修復基本面。然後再用 Agent 擴張規模。

5. 進行太多供應商對比測試

我們最近與一位 CMO 談過,他同時運作 10 個 AI SDR 供應商的試用。邏輯是:「我會在投入真正金錢之前測試所有東西。」

現實是:你無法妥善訓練 10 個 Agent。你會把它們都訓練到一半。這場對比測試會產生全面的平庸結果,然後你會得出「AI 不管用」的結論。

Personio 的 CRO 也看到了同樣的模式。團隊評估了 10 個以上的工具,但沒有一個精通。無盡的測試,沒有深度。

更好的方法是:挑選一兩個供應商。深度訓練它們。承諾 90 天。基於來自妥善訓練 Agent 的真實結果做出明智決策。

你沒有透過避免承諾來省錢。你是在浪費幾個月並保證平庸的結果。

6. 通用的訓練

糟糕的訓練:「這是我們的網站,這是一些電子郵件範本,去吧。」

良好的訓練:從真實銷售對話中提取的具體證據點。基於實際收到的反對意見的詳細反對處理。清晰的升級規則。你的 ICP 的範例與非範例。符合你精確品牌語氣的回應框架。

我們早期有一個神奇時刻,當我們將活動募資說明書上傳給其中一個 Agent 時。它原本在回答來自我 4,600 篇部落格文章的一般內容問題時表現還可以。但當它拿到募資說明書後,它開始能勝任地處理贊助商問題。不是很好,但能勝任。它從能做 Qualified 能做的事情的 0%,提升到可能 20%。而當你在涵蓋非工作時間和假期時,20% 比零好得多。

你餵給 Agent 的脈絡就是護城河。不是技術。就像 Personio 的 CRO 所說:脈絡加上你的堆疊,總是比單獨的堆疊更強。沒有商業脈絡的 Agent 會失敗。它們需要你的組織脈絡、你的產業知識、你的客戶資料、你的競爭情報。

每個 Agent 都需要了解你的 ICP、你的銷售流程、你的競爭定位。否則你會得到聽起來合理但實際脫節的輸出。

7. 忽視你的資料品質

我們以為我們在 Salesforce 的資料品質還可以。其實不然。

當我們在 CRM 之上部署 Agent 時,它們暴露了一切。重複資料到處都是。欄位缺失。陳舊紀錄。我們三分之一的 Salesforce 資料是重複的。我們只發現這點是因為 AI Agent 把它浮現出來。

Agent 需要乾淨的資料才能運作。如果你的 CRM 一團糟,你的 Agent 會產生幻覺、鎖定錯誤的帳戶,或讓你難堪。我們有一個 AI SDR 聯繫了一位現有客戶,告訴對方他們會「非常受益」於一個他們已經在付費的產品。那是資料問題,不是 AI 問題。

在全面部署之前預算時間修復你的資料。稽核你的 CRM。清理重複資料。填補缺失欄位。標準化命名慣例。Agent 會暴露每個缺陷,所以最好主動修復它。

8. 沒有為每個 Agent 建立人工檢查節奏

你不會僱用一個 SDR 然後從不檢查他的工作。這裡也一樣。

我們管理約 12 個核心 Agent。每一個都需要每日關注,特別是在前 30 天。我們的 Chief AI Officer Amelia 每天早上花一小時檢視整個 Agent 堆疊的輸出。那是供應商不會提到的真實營運成本。

以下是我們自己犯過的錯。我們完全告訴大家不要做的事,但我們自己做了。我們設定了一個 Agent,觀察它的表現,然後走開了。我們沒有每日檢查。我們沒有定期檢視它的輸出。

誠實的原因是:它不是一個產生營收的 Agent。我們的核心 GTM Agent,那些直接與 pipeline 和客戶互動掛鉤的,這些我們每天密切監控。但這個很重要,但不緊急。有用,但不是以明顯方式至關重要。所以它退到了佇列後面。

它靜靜地失去了同步數月。並且繼續像一切都沒事一樣運作。

你最有可能忽視的 Agent,是那些不直接與營收掛鉤的。這些正是會在你注意到之前漂移最長時間的 Agent。你部署的每個 Agent 都值得檢查節奏。不必是每天。但不能是從不。

9. 試圖煮沸海洋

在我們早期的成功後,我們想一次部署所有東西。那是個錯誤。

每個 Agent 都需要每日管理。更多的 Agent 等於更多的認知負荷。一直是腦細胞,一直如此。Agent 不會哭,但在某些方面,它們比人類更耗費認知資源來管理。

我們發現我們每個月可以吸收約 1.5 個新 Agent,之後品質就會開始下滑。增加第 13 個核心工具的門檻極高,不是因為技術不存在,而是因為我們沒有人力頻寬來訓練和管理它。

正確的路徑:從 0 到 1 個 Agent(挑選一個水平且簡單的)。然後 1 到 3(垂直專業化)。然後 3 到 5。階梯式向上。不要試圖在第一個月部署 20 個 Agent。

跨職能的支持也很重要。Personio 發現每個成功的 Agent 專案都有來自 3 個或更多團隊的利益相關者:銷售、行銷、營收運營、資料、工程。沒有孤立的 AI 專案。

10. 期待你的供應商告訴你什麼時候壞了

這個錯誤讓我們付出了四個月的代價。

當最終發現導致我們 Agent 資料管線損壞的 bug 時,供應商很快修復了它。他們反應迅速且專業。但他們對其在我們特定 Agent 上的下游影響零可見性。bug 存在於他們的系統中。品質下降發生在我們的系統中。沒有任何儀器連接這兩個事實。

這是關於當前 AI Agent 工具現況的一個普遍真理。平台擅長運行 Agent。它們在監控 Agent 輸出和資料品質層級的健康狀態方面,處於更早期的旅程。這個落差是你必須解決的問題,不是他們的。

你的 Agent 平台不會告訴你你的 Agent 讇陳舊了。建立你自己的信號。如果你的 Agent 正常每週匯入 500 個資料點,上週只匯入了 12 個,這應該觸發警示。不是來自 Agent。來自一個獨立的監控層,正在監看管線。

在需要之前先寫好復原手冊。當 Agent 壞掉時,誰會收到通知?你如何回滾到已知良好的狀態?你告訴收到陳舊資訊的潛在客戶什麼?

AI Agent 的可觀測性工具正在快速成熟。但在 2026 年,假設你是自己一個人。

你不能只是買個工具就走開。或者只是交給你的團隊。

AI Agent 管用。真的管用。我們的 AI SDR 在量級上的表現超過人類 11 到 40 倍,而且回應率更好。我們的 inbound AI 負責 70% 已成案的交案。我們的 AI 顧問進行了數百萬次對話。我們的 London 活動營收有 15% 來自 Agent,正在處理人類不願意碰的線索。

但這些都沒有透過買個工具就走開而發生。它的發生是因為我們投入了時間。前期訓練、每日檢視、持續迭代、對資料品質的持續警惕,並把每個 Agent 當成需要管理的新僱員。

弄清楚這件事的公司將會有真正的優勢。那些等待,或買了工具然後祈禱最好的公司,會有很多會議,有人會問「等等,為什麼我們的 Agent 那樣說?」

不要成為那家公司。這個月部署一個 Agent。親自做。訓練它 30 天。然後回來告訴我你學到了什麼。


想看我們完整的 Agent 堆疊實際運作嗎?查看 saastr.ai/agents。對你的特定部署有疑問嗎?來參加 SaaStr AI Annual 2026 年 5 月 12-14 日,我們會現場演示。