Capital One 的 Max Kanat-Alexander 在本次演講中，從開發者體驗（Developer Experience）的角度切入，探討在 AI 編碼代理快速演進的時代，軟體工程組織應該做出哪些「穩賺不賠」的投資。他指出，僅靠 AI 代理並不能解決所有問題，組織需要同時改善開發環境、驗證機制、程式碼結構、文件管理和 Code Review 流程，才能真正釋放 AI 代理與開發者的生產力潛能。

原影片連結：https://www.youtube.com/watch?v=rT2Del5pwg4

影片重點

AI 編碼代理很強大，但不是軟體工程組織唯一需要投資的方向
開發環境應標準化，使用業界標準工具，避免對抗模型的 training set
代理需要 CLI 或 API 來執行操作，文字互動是最原生的介面
高品質的驗證（測試、linter）和清晰的錯誤訊息對代理至關重要
程式碼庫的結構直接影響代理的推理能力和效能
文件需記錄「為什麼」而非「是什麼」——代理無法讀取你的腦袋
寫程式碼已變成讀程式碼，每位工程師的主要工作正在變成 Code Reviewer
Code Review 的速度和品質都需要提升，否則會陷入惡性循環
核心原則：對人類好的東西，對 AI 也好

詳細內容

[00:20] 開場：前所未見的變革速度

Max 提到自己從事開發者體驗工作已經很長時間，但過去 12 個月的變化速度是他前所未見的。每隔 2 到 3 週，軟體工程師就會因為新工具的出現而感到震驚。對於負責開發者體驗的人來說，這個問題更加嚴峻——總是有人問「我能不能用這個新東西？」

這種不確定性讓很多 CTO 和技術領導者在問自己：「我的投資會不會白費？」很多人的結論是「就全投 AI 編碼代理吧」，但 Max 認為這不是唯一的答案。

[02:10] 兩個關鍵問題

Max 提出了兩個核心問題來釐清思路：

第一，如何利用我們對開發者體驗原則的理解，找到無論未來如何變化都有價值的投資方向？第二，我們需要在 AI 代理之外做什麼，才能從代理中獲得最大價值？

他強調，這些不是小問題——它們可能決定一家軟體企業的成敗。

[02:42] 標準化開發環境

第一個「穩賺不賠」的投資是開發環境。你應該使用業界標準工具，並且以業界標準的方式使用它們——因為那就是模型 training set 裡的內容。

雖然你可以寫 instruction files 試圖讓模型做一些非標準的事情，但你本質上是在對抗 training set。如果你發明了自己的套件管理器，你可能應該放棄它，回到外界通用的做法。這也意味著你不能再使用冷門的程式語言了——至少不能用在日常的 agentic 軟體開發工作中。

Max 也回應了一個常見疑問：這是否意味著我們永遠不會有新工具了？他認為不會，因為總會有愛好者推動創新，但企業環境中使用未經驗證的新技術，無論有沒有 AI，一直都是個問題。

[04:23] 為代理提供 CLI 和 API

代理需要 CLI 或 API 來執行操作。雖然可以讓代理使用 computer use 或寫 Playwright 來操作瀏覽器，但為什麼要這麼做呢？如果你能提供一個 CLI，讓代理以最原生的文字互動方式執行，準確度會大幅提升。

在準確度至關重要的場景下，選擇代理最擅長的互動方式——文字介面——才是正確的做法。

[04:55] 投資驗證機制

任何形式的客觀、確定性驗證都能提升代理的能力。不管驗證從哪裡來，關鍵是要有高品質的驗證並產生清晰的錯誤訊息。這和你一直以來對測試和 linter 的要求其實是一樣的，但對代理來說更加重要——因為代理無法從「500 Internal Error」這種模糊的錯誤中推斷問題所在。

然而，如果你讓代理在一個完全不可測試的程式碼庫上寫測試，它會寫出那種「我按了按鈕，按鈕成功被按了，測試通過」的假測試。很多企業都有大量 legacy 程式碼庫，它們不是為測試而設計的，只有高層級的端到端測試，缺乏代理能夠迭代運行的優質單元測試。

[06:40] 改善程式碼庫結構

程式碼庫的結構是另一項值得長期投資的領域。代理在結構良好的程式碼庫上表現更好。在大型企業中，存在一些人類都無法理解的 legacy 程式碼庫——因為理解所需的資訊不在程式碼中，而且程式碼結構本身就讓推理變得不可能。

代理也會遇到同樣的困境。雖然它們可以像人類一樣通過反覆試錯來摸索，但這會大幅降低代理的能力。如果程式碼庫唯一能做的就是「按按鈕然後看它有沒有爆炸」，代理也無能為力，除非先進行重構。

[08:00] 文件：記錄「為什麼」

文件一直是開發者體驗領域爭論不休的話題。工程師討厭寫文件，文件的價值也常被質疑。但從 AI 代理的角度來看，問題很清楚：代理無法讀取你的腦袋，它也沒有參加你那場沒有會議記錄的口頭會議。

很多公司依賴部落知識（tribal knowledge）來理解系統需求和規格。如果程式碼是可理解的（前面提到的步驟都做好了），你不需要重新解釋程式碼本身——你甚至可以直接問代理「幫我描述這個程式碼庫的結構」。但代理永遠不會知道「為什麼」你這樣寫，除非那被記錄在某個它能存取的地方。

基本原則是：任何不在程式碼中或無法存在於程式碼中的資訊，都需要被寫下來放在代理能存取的地方。

[09:44] 寫程式碼已經變成讀程式碼

我們一直都花更多時間讀程式碼而非寫程式碼。但今天的差異是：寫程式碼本身已經變成了讀程式碼。即使在「寫」程式碼的時候，我們花在閱讀上的時間也遠多於實際輸入。

這意味著每位軟體工程師的主要工作正在變成 Code Reviewer。而在深度採用 agentic coding 的團隊中，PR 的數量遠超以往，導致 Code Review 本身成為瓶頸。

[10:41] 提升 Code Review 速度

需要提升 Code Review 的速度——不是縮短整體 Code Review 的時間（因為那是品質流程），而是讓每一次回應都更快。同樣的邏輯也適用於和代理的迭代：你要追求正確的結果，而不是在時間限制內交出不能用的垃圾。

在團隊層級，Max 指出一個常見的「社交疾病」：人們在 Slack 群組發訊息請求 PR Review，結果總是同一個人做了所有的 review。當 PR 數量劇增時，這個人根本扛不住。解決方案是：將 review 分配給特定個人，建立分配系統，並設定 SLO（Service Level Objectives）。

另一個問題是 GitHub 目前不擅長顯示「現在輪到誰行動」。很多人依靠 Slack 告訴對方「你可以再看一次我的 PR 了」，這是一個糟糕又低效的系統。

[13:14] 堅持 Code Review 品質

Code Review 的品質同樣重要——無論是開發者和代理的互動，還是正式的 Code Review 流程。必須堅持高標準。

軟體設計的目標不是完美，而是「夠好且比之前更好」。但對於長期存在的系統，「夠好」的標準遠比大多數人想像的要高。如果你沒有能力拒絕不該合併的東西，agentic coder 的生產力增益會逐年遞減，因為系統會變得越來越難以維護。

問題在於，很多公司裡最擅長 Code Review 的人把所有時間花在開會和策略討論上，根本不做 Code Review，也沒有在教導資淺工程師。Max 認為必須透過師徒制（apprenticeship）讓最優秀的 reviewer 帶領新人，因為在他 20 多年的經驗中，他從未找到比「一起做 Code Review」更好的教學方式。

[14:54] 惡性循環 vs. 良性循環

如果不做前面提到的這些投資，會發生什麼？糟糕的程式碼庫配上混亂的環境，代理產出垃圾，開發者感到挫折後放棄掙扎直接送 PR，品質低落的 Code Review 讓一切橡皮圖章式地通過——大量的 rubber stamp PR 不斷湧入，陷入惡性循環。Max 預測，處於這種循環中的團隊，代理生產力會在一年內持續下降。

反過來，如果你投資改善這些基礎設施，代理能幫助開發者更有生產力，而更高的生產力又反過來加速改進，形成良性循環。雖然這些聽起來是昂貴的基礎投資，但現在正是做這些投資的時機，因為這是你能在軟體工程速度上拉開最大差距的時刻。

[16:30] 總結：穩賺不賠的投資清單

Max 最後總結了一系列「穩賺不賠」的投資方向：

標準化開發環境
為需要的功能建立 CLI 或 API（且必須能在開發階段運行，不只是 CI）
改善驗證機制
重構以提升可測試性和程式碼可推理性
將外部脈絡和設計意圖（the why）寫下來
加速 Code Review 的每一次回應
提升 Code Review 的品質標準

如果 CI 需要 15-20 分鐘才能跑完，而代理又比人類更容易犯錯、需要反覆執行，那開發者的生產力就完了。把回饋循環縮短到 30 秒，體驗會完全不同。

[17:34] 核心原則：對人類好的，對 AI 也好

所有這些投資的背後有一個共同原則：對人類好的東西，對 AI 也好。 這意味著當我們投資改善開發者體驗時，無論如何都會幫到開發者。即使有時候我們沒能幫到代理，我們至少保證幫到了人類。

我的想法

Max 的演講精準地點出了很多團隊在擁抱 AI 編碼代理時容易忽視的盲點。許多組織急於導入 AI 工具，卻忽略了「地基」的重要性——如果你的程式碼庫是一團亂、沒有測試、缺乏文件，那麼再強大的 AI 代理也只能在泥巴上蓋房子。

特別值得注意的是他對 Code Review 的觀點。在 agentic coding 時代，PR 數量爆炸性增長，但 Code Review 的能力並沒有跟著線性增長。如果不主動建立分配機制和品質標準，這個瓶頸只會越來越嚴重。他提到的「rubber stamp PR 惡性循環」是一個非常真實的風險。

「對人類好的，對 AI 也好」這個原則非常有力。它提供了一個簡潔的決策框架：在不確定該投資什麼的時候，優先改善對人類開發者有幫助的基礎設施，這樣無論 AI 技術如何演進，你的投資都不會白費。這也呼應了軟體工程中一個永恆的道理——好的工程實踐從來都是值得的，只是在 AI 時代變得更加不可或缺。

進階測驗：AI 編碼代理時代的開發者體驗

測驗目標：驗證你是否能在實際情境中應用 Max Kanat-Alexander 演講中的開發者體驗原則。
共 5 題，包含情境題與錯誤診斷題。

1. 你的團隊正在評估是否要讓 AI 編碼代理操作內部部署工具。目前這些工具只有 Web UI 介面，沒有程式化的存取方式。作為技術負責人，你應該優先做什麼？情境題

現況：
– 內部部署工具只有 Web UI
– AI 代理需要操作這些工具來完成自動化任務
– 團隊希望盡快讓代理投入使用

A. 讓代理使用 computer use 功能操作 Web UI，這是最快的解法
B. 為這些工具建立 CLI 或 API，讓代理以文字互動方式操作
C. 讓代理寫 Playwright 腳本來自動化瀏覽器操作
D. 暫時放棄讓代理操作這些工具，等工具廠商自己出 API

2. 你的團隊採用 agentic coding 後，PR 數量增加了 3 倍。目前 Code Review 是在 Slack 群組發訊息請人幫忙看，但 review 速度跟不上。你應該怎麼改善？情境題

現況：
– PR 數量從每週 20 個增加到每週 60 個
– 團隊 8 人，review 請求發在公共 Slack 頻道
– 統計顯示一個人完成了 70% 的 review
– 平均 review 等待時間從 2 小時增加到 8 小時

A. 引入 AI Code Review 工具來自動審查所有 PR，減少人工負擔
B. 降低 Code Review 標準，只檢查關鍵邏輯，加快通過速度
C. 建立自動分配系統將 review 指派給特定個人，並設定回應時間 SLO
D. 減少每人可同時開啟的 PR 數量，從源頭控制 review 需求

3. 你負責一個大型企業的 legacy 系統現代化專案。團隊想用 AI 代理加速開發，但代理在這個程式碼庫上的表現很差，經常產出不正確的程式碼。根據演講的建議，最有效的改善方向是什麼？情境題

程式碼庫現況：
– 15 年歷史的 monolith 應用
– 只有高層級的端到端測試，沒有單元測試
– 許多業務邏輯的「為什麼」只存在於資深工程師的腦中
– 程式碼結構複雜，模組間高度耦合

A. 更換更強大的 AI 模型，用更大的 context window 來理解程式碼
B. 寫詳細的 instruction files 教代理如何處理這個程式碼庫
C. 先讓代理自己寫測試，再用這些測試來驗證後續的修改
D. 先重構程式碼結構並補充單元測試，同時將業務脈絡文件化

4. 某團隊導入 AI 編碼代理半年後，發現生產力反而在逐月下降。以下是他們的工作流程，哪個環節最可能是根本原因？錯誤診斷

團隊工作流程：
開發者給代理下指令寫程式碼
代理在 legacy 程式碼庫上產出 PR
開發者花 5 分鐘快速瀏覽後就 approve
PR 合併，繼續下一個任務
CI 只在合併後才執行完整測試

結果：bug 數量逐月上升，修 bug 的時間越來越長

A. 代理的能力不足，應該使用更先進的 AI 模型
B. Code Review 品質太低，形成了 rubber stamp 的惡性循環
C. CI 流程放在合併後太慢，應該改為合併前執行
D. 開發者給代理的 prompt 不夠精確，需要培訓 prompt engineering

5. 一家公司為了提升代理效率，自行開發了一套內部套件管理工具和自定義的建構流程。但代理在使用時頻繁出錯。根據演講觀點，問題最可能出在哪裡？錯誤診斷

內部工具鏈：
– 自研套件管理器 “intpkg”（取代 npm/pip）
– 自定義建構腳本（非標準 Makefile/webpack）
– 私有程式語言 DSL 用於設定檔
– 代理的 instruction file 已寫了 500 行說明

代理錯誤率：約 60% 的操作需要人工修正

A. instruction file 寫得不夠詳細，需要補充更多範例
B. 代理的 context window 不夠大，無法同時理解所有自定義工具
C. 自研工具不在模型的 training set 中，代理在對抗訓練資料
D. 需要用這些內部工具的程式碼來 fine-tune 專屬模型

Developer Experience in the Age of AI Coding Agents — AI 編碼代理時代的開發者體驗

影片重點

詳細內容

[00:20] 開場：前所未見的變革速度

[02:10] 兩個關鍵問題

[02:42] 標準化開發環境

[04:23] 為代理提供 CLI 和 API

[04:55] 投資驗證機制

[06:40] 改善程式碼庫結構

[08:00] 文件：記錄「為什麼」

[09:44] 寫程式碼已經變成讀程式碼

[10:41] 提升 Code Review 速度

[13:14] 堅持 Code Review 品質

[14:54] 惡性循環 vs. 良性循環

[16:30] 總結：穩賺不賠的投資清單

[17:34] 核心原則：對人類好的，對 AI 也好

我的想法

進階測驗：AI 編碼代理時代的開發者體驗

1. 你的團隊正在評估是否要讓 AI 編碼代理操作內部部署工具。目前這些工具只有 Web UI 介面，沒有程式化的存取方式。作為技術負責人，你應該優先做什麼？情境題

2. 你的團隊採用 agentic coding 後，PR 數量增加了 3 倍。目前 Code Review 是在 Slack 群組發訊息請人幫忙看，但 review 速度跟不上。你應該怎麼改善？情境題

3. 你負責一個大型企業的 legacy 系統現代化專案。團隊想用 AI 代理加速開發，但代理在這個程式碼庫上的表現很差，經常產出不正確的程式碼。根據演講的建議，最有效的改善方向是什麼？情境題

4. 某團隊導入 AI 編碼代理半年後，發現生產力反而在逐月下降。以下是他們的工作流程，哪個環節最可能是根本原因？錯誤診斷

5. 一家公司為了提升代理效率，自行開發了一套內部套件管理工具和自定義的建構流程。但代理在使用時頻繁出錯。根據演講觀點，問題最可能出在哪裡？錯誤診斷

發佈留言取消回覆

影片重點

詳細內容

[00:20] 開場：前所未見的變革速度

[02:10] 兩個關鍵問題

[02:42] 標準化開發環境

[04:23] 為代理提供 CLI 和 API

[04:55] 投資驗證機制

[06:40] 改善程式碼庫結構

[08:00] 文件：記錄「為什麼」

[09:44] 寫程式碼已經變成讀程式碼

[10:41] 提升 Code Review 速度

[13:14] 堅持 Code Review 品質

[14:54] 惡性循環 vs. 良性循環

[16:30] 總結：穩賺不賠的投資清單

[17:34] 核心原則：對人類好的，對 AI 也好

我的想法

進階測驗：AI 編碼代理時代的開發者體驗

1. 你的團隊正在評估是否要讓 AI 編碼代理操作內部部署工具。目前這些工具只有 Web UI 介面，沒有程式化的存取方式。作為技術負責人，你應該優先做什麼？ 情境題

2. 你的團隊採用 agentic coding 後，PR 數量增加了 3 倍。目前 Code Review 是在 Slack 群組發訊息請人幫忙看，但 review 速度跟不上。你應該怎麼改善？ 情境題

3. 你負責一個大型企業的 legacy 系統現代化專案。團隊想用 AI 代理加速開發，但代理在這個程式碼庫上的表現很差，經常產出不正確的程式碼。根據演講的建議，最有效的改善方向是什麼？ 情境題

4. 某團隊導入 AI 編碼代理半年後，發現生產力反而在逐月下降。以下是他們的工作流程，哪個環節最可能是根本原因？ 錯誤診斷

5. 一家公司為了提升代理效率，自行開發了一套內部套件管理工具和自定義的建構流程。但代理在使用時頻繁出錯。根據演講觀點，問題最可能出在哪裡？ 錯誤診斷

相關文章

Spec-Driven Development: Agentic Coding at FAANG Scale and Quality — 規格驅動開發：在 FAANG 規模下實現高品質的 AI 輔助編程

I Shipped Code I Don’t Understand and I Bet You Have Too — 我交付了自己不理解的程式碼，我打賭你也是

Dispatch from the Future: Building an AI-native Company｜來自未來的報告：打造 AI 原生公司

發佈留言取消回覆

1. 你的團隊正在評估是否要讓 AI 編碼代理操作內部部署工具。目前這些工具只有 Web UI 介面，沒有程式化的存取方式。作為技術負責人，你應該優先做什麼？情境題

2. 你的團隊採用 agentic coding 後，PR 數量增加了 3 倍。目前 Code Review 是在 Slack 群組發訊息請人幫忙看，但 review 速度跟不上。你應該怎麼改善？情境題

3. 你負責一個大型企業的 legacy 系統現代化專案。團隊想用 AI 代理加速開發，但代理在這個程式碼庫上的表現很差，經常產出不正確的程式碼。根據演講的建議，最有效的改善方向是什麼？情境題

4. 某團隊導入 AI 編碼代理半年後，發現生產力反而在逐月下降。以下是他們的工作流程，哪個環節最可能是根本原因？錯誤診斷

5. 一家公司為了提升代理效率，自行開發了一套內部套件管理工具和自定義的建構流程。但代理在使用時頻繁出錯。根據演講觀點，問題最可能出在哪裡？錯誤診斷