McKinsey & Company 的 Martin Harrysson 與 Natasha Maniar 在 AI Engineer Code Summit 上，以調查 300 家企業的數據為基礎，探討 AI 時代下敏捷開發模式的瓶頸與轉型方向。他們指出多數大型企業僅看到 5-15% 的生產力提升，遠低於 AI 工具的真正潛力，關鍵在於企業需要徹底改變團隊結構、角色定義與工作流程，從「兩個披薩團隊」轉向更小的 3-5 人 Pod，並建立 AI 原生的工作模式。

原影片連結：https://www.youtube.com/watch?v=SZStlIhyTCY

影片重點

大多數企業雖然導入了 AI 工具，但整體生產力提升僅 5-15%，存在巨大的落差
AI 帶來的生產力提升高度不均勻——某些任務效果驚人，某些則不然
傳統敏捷模式（8-10 人團隊、兩週衝刺）已成為 AI 時代的瓶頸
頂尖企業導入 AI 原生工作流程的可能性是一般企業的 7 倍
團隊應從「兩個披薩」縮小為 3-5 人的「一個披薩 Pod」
角色需要重新定義：工程師從執行者轉為協調者，PM 直接用程式碼建立原型
某銀行客戶實驗中，Agent 使用量增加 60 倍，程式碼合併量增加 51%
變革管理是規模化的最大關鍵，需要同時做對 20-30 件小事

詳細內容

[00:00] AI 時代的典範轉移

Martin 開場回顧了過去數十年軟體開發方法論的演變。每一次重大技術突破都伴隨著開發範式的轉變——從瀑布式到敏捷，而現在 AI 正帶來下一次典範轉移。他回憶近 20 年前自己作為入門工程師時，親歷公司從傳統模式轉向敏捷的巨大變革：導入看板、站立會議和各種敏捷儀式。如今 AI 在軟體開發領域的影響，正預示著另一次同等規模的變革即將到來。

[02:30] 個人生產力 vs 組織生產力的落差

雖然 AI 工具在個人層面展現了驚人效果——過去需要數天的工作現在幾分鐘就能完成，但 McKinsey 對約 300 家企業的調查顯示，整體組織層面的生產力提升往往只有 5-15%。這個「潛力」與「現實」之間的巨大落差，源自一系列新瓶頸的出現：團隊協作方式沒有跟上速度變化、大量新生成的程式碼仍依賴人工審查，以及 Carnegie Mellon 研究指出的 AI 生成程式碼正在放大技術債務的問題。

[05:30] 工作分配與審查的瓶頸

Martin 指出兩個主要的速率限制器。第一是工作分配：AI 和 Agent 的效果高度不均——某些任務效果極佳，某些則否；團隊成員的 AI 使用經驗也參差不齊。這使得工程主管很難有效地分配工作和資源。第二是工作審查：Agent 收到的需求描述往往模糊不清，驗收標準不夠明確，導致產出的程式碼不符預期，最終只能依賴大量人工審查來把關，反而增加了手動工作量。

[08:00] 不同場景需要不同的運作模式

團隊指出改造產品開發生命週期（PDLC）並非一體適用。不同類型的工程任務需要不同的人機協作模式。例如：現代化遺留程式碼庫需要高度的程式碼上下文理解，但產出明確，適合採用「Agent 工廠」模式——人類提供初始規格和最終審查，中間由 Agent 自主完成。而全新功能開發則可能受益於非確定性的產出和更多變化，適合採用「迭代循環」模式，讓 Agent 作為共同創作者提供更多選項，促進更快的回饋循環。

[10:00] 頂尖企業的特徵：AI 原生工作流程與角色

McKinsey 的 300 家企業調查發現，頂尖表現者有明顯的共同特徵。他們導入 AI 原生工作流程的可能性是一般企業的 7 倍——這意味著在軟體開發生命週期中擴展超過四個 AI 用例，而非僅限於程式碼審查或輔助編碼。他們擁有 AI 原生角色的可能性是 6 倍——以更小的 Pod、不同的技能組合和全新角色來運作。這些轉變帶來了 5-6 倍的上市速度和交付速度提升，以及更高品質、更一致的產出。

具體來說，AI 原生工作流程意味著從季度規劃轉向持續規劃，工作單位從用戶故事驅動轉為規格驅動開發，PM 與 Agent 共同迭代規格而非撰寫冗長的產品需求文件（PRD）。

[12:30] 從「兩個披薩團隊」到「一個披薩 Pod」

在人才模型方面，AI 原生角色意味著從傳統的 8-10 人「兩個披薩團隊」縮減為 3-5 人的「一個披薩 Pod」。不再區分 QA、前端和後端工程師，而是整合為更全面的角色——「產品建造者」負責管理和協調 Agent，具備全端能力，並深入理解程式碼庫的完整架構。PM 開始直接用程式碼建立原型，而非反覆修改冗長的 PRD。

演講者提到他們在文章中研究了一些 AI 原生新創公司，發現它們已經實現了所有這些轉變，包括 Cursor 公司內部的運作方式。

[14:30] 銀行客戶案例：團隊層級的實驗

對於建立在敏捷模式上的大型企業，McKinsey 分享了與一家國際銀行合作的案例研究。他們針對敏捷儀式中的步驟順序、以及 Agent 和人類在衝刺週期中的角色進行了團隊層級的介入。

具體措施包括：團隊主管根據團隊速度和交付歷史數據，使用 Agent 分配衝刺故事；共同創建多個原型，與 Agent 迭代安全性和可觀察性的驗收標準；依工作流程重組小隊（bug 修復和全新開發分開）；使用背景 Agent 分析跨儲存庫影響以減少除錯時間；PM 直接觀察即時客戶回饋來重新排列功能優先序。

結果令人矚目：Agent 使用量增加超過 60 倍，程式碼合併量增加 51%，且交付速度直接與該銀行的業務優先事項掛鉤。

[17:30] 角色重新定義的緊迫性

演講者強調，目前約 70% 的受訪企業完全沒有改變角色定義。企業期待員工用新方式工作，但角色描述和職責理解仍停留在兩年前。實際上，工程師正從單純的程式碼撰寫轉向工作協調和 Agent 管理，產品經理的角色也在根本性地改變。

另一個客戶案例展示了從傳統的「兩個披薩團隊」模型轉向更小 Pod 的實驗。透過整合角色，用相同人數創建更多團隊，每個 Pod 維持原有的產出水準甚至更好，程式碼品質得到維持甚至提升。

[20:00] 規模化的關鍵：變革管理

Martin 指出，從團隊層級擴展到整個組織（往往涉及數百個團隊、數千甚至數萬人）時，最大的差異在於變革管理。那些僅看到 10% 改進的企業與看到顯著改進的企業之間的區別，在於能否同時做對 20-30 件甚至更多的小事——包括溝通方式、激勵機制和技能提升，所有環節必須協調配合。

他分享了一個技術公司的案例：最初推出 AI 工具時，使用率時高時低且效果不佳。團隊不得不進行全面重設——重新設定期望、提供更多實作培訓（帶自己的程式碼來練習）、安排教練陪伴最初幾個衝刺，並建立度量系統追蹤變化。

[23:00] 建立全面的度量體系

Natasha 強調建立優先考量「成果」而非僅關注「採用率」的度量系統至關重要。調查中表現最差的企業甚至沒有在衡量速度，僅 10% 在衡量生產力。

McKinsey 為客戶建立的全面度量體系涵蓋四個層次：投入（工具投資、培訓資源）、直接產出（AI 工具的廣度和深度帶來的速度與產能提升）、開發者體驗（NPS 分數、工作滿意度）與程式碼品質（安全性、韌性、Priority Bug 平均解決時間），以及經濟成果（營收目標達成速度、高品質功能的價格差異化、每個 Pod 的人力成本降低）。

[25:30] 未來展望與關鍵建議

展望未來，即使 Agent 智能持續提升、人類對 AI 更加熟練，他們相信「更短的衝刺週期、更小但更多的團隊」這個模型仍然適用。

Martin 最後給出關鍵建議：第一，立刻開始行動——這是一場關於人的變革，需要時間，也是一段旅程。第二，找出適合自己組織的模式，並設定大膽的目標。

我的想法

這場演講最有價值的觀點在於揭示了一個反直覺的現象：AI 工具明明很強大，但大多數企業的組織層面生產力提升卻很有限。這不是工具的問題，而是人和流程的問題。這讓我想到 Conway’s Law——系統的架構反映組織的溝通結構。當 AI 改變了「誰做什麼」和「怎麼做」，組織結構如果不跟著變，就會成為最大的瓶頸。

「從兩個披薩到一個披薩」的團隊模型值得關注。但這裡有個潛在風險：更小的團隊意味著每個人需要更廣的技能覆蓋，這對人才要求其實更高了。企業在縮小團隊的同時，需要大量投資在人才培養上，否則可能適得其反。

另外值得注意的是，他們提到的「規格驅動開發」取代「用戶故事驅動」，本質上是在說：當 Agent 成為主要的程式碼撰寫者時，給它的指令品質決定了產出品質。這把壓力從「寫程式碼」轉移到了「寫規格」——某種程度上，Prompt Engineering 的思維正在滲透到整個軟體開發流程中。

最後，70% 的企業完全沒有改變角色定義這個數據很驚人。這表明大多數組織仍在用舊框架理解新工具，等於是把跑車開在泥巴路上。對於正在推動 AI 轉型的技術主管來說，改變組織結構和角色定義可能比選擇哪個 AI 工具更重要。

進階測驗：告別敏捷 — AI 時代的軟體開發轉型

測驗目標：驗證你是否能在實際情境中應用 AI 時代軟體開發轉型的知識。
共 5 題，包含情境題與錯誤診斷題。

1. 選擇適合的人機協作模式情境題

你是一家大型銀行的工程總監，團隊正在進行兩個專案：
(A) 將一套 20 年歷史的 COBOL 系統遷移至現代架構
(B) 為行動 App 開發全新的投資組合分析功能

根據 McKinsey 的建議，你應該如何為這兩個專案配置 AI Agent 的協作模式？

A. 兩個專案都採用「Agent 工廠」模式，由人類提供初始規格後全權交給 Agent 執行
B. 遺留系統遷移採用「Agent 工廠」模式（人類給規格和最終審查），新功能開發採用「迭代循環」模式（Agent 作為共同創作者）
C. 兩個專案都採用「迭代循環」模式，讓 Agent 提供多種選項供團隊選擇
D. 遺留系統遷移採用「迭代循環」模式以探索更多可能性，新功能開發採用「Agent 工廠」模式以加快速度

2. 團隊重組決策情境題

你負責管理一個 40 人的開發部門，目前分為 4 個傳統敏捷團隊（每隊 10 人），
包含前端工程師、後端工程師、QA 工程師、產品經理等角色。
公司要求你導入 AI 原生的工作模式。

根據 McKinsey 的研究，最佳的重組策略是什麼？

A. 維持 4 個 10 人團隊，但為每個團隊增加 AI 工具訂閱，讓他們自行探索使用方式
B. 將 4 個團隊縮減為 2 個 20 人大團隊，集中資源最大化 AI 工具的投資報酬率
C. 重組為 8-10 個 3-5 人的小型 Pod，整合角色為具備全端能力的「產品建造者」，並重新定義 PM 角色
D. 先裁減一半人力至 20 人，再分成 4 個 5 人團隊，用節省的人力成本投資更多 AI 工具

3. 推動 AI 工具採用的策略情境題

你在一家科技公司推動 AI 開發工具的導入。上線兩個月後，
你發現使用率呈現「鋸齒狀」——初期有人嘗試但很快就放棄，
整體生產力幾乎沒有變化。新增使用者數量在增加，
但整體影響力卻停滯不前。

根據 McKinsey 的經驗，你的下一步應該是什麼？

A. 購買更先進的 AI 工具來取代現有工具，因為問題可能出在工具本身不夠好
B. 發布強制使用政策，要求所有開發者必須在每個 Sprint 中使用 AI 工具並提交使用報告
C. 增加更多使用者帳號，擴大覆蓋範圍，相信隨著使用人數增加，自然會看到效果
D. 全面重設期望，提供「帶自己的程式碼」實作培訓，安排教練陪伴最初幾個 Sprint，並建立度量系統追蹤變化

4. 診斷企業 AI 轉型失敗的原因錯誤診斷

某大型企業的 AI 轉型報告：

✅ 已投資：每位開發者配備 AI 程式碼助手
✅ 工具使用率：85% 的開發者每天使用 AI 工具
✅ 個人產出：部分任務速度提升 3-5 倍
❌ 結果：整體組織生產力僅提升 8%

管理層困惑：「工具明明有效，為什麼整體數字這麼低？」

A. AI 工具的品質不夠好，需要切換到更強大的模型
B. 85% 的使用率還不夠高，需要達到 100% 才能看到效果
C. 只導入了工具但沒有改變工作流程、團隊結構和角色定義，協作方式與審查流程仍是舊模式，形成新的瓶頸
D. 開發者的 AI 操作技能不足，需要加強 Prompt Engineering 培訓

5. 診斷度量體系的缺陷錯誤診斷

某企業的 AI 開發效能儀表板顯示：

📊 目前追蹤的指標：
  – AI 工具月活躍使用者數：1,200 人（↑ 40%）
  – AI 工具每日使用次數：15,000 次（↑ 55%）
  – AI 輔助產生的程式碼行數：每月 50 萬行（↑ 120%）
  – AI 工具授權費用：每月 $180,000

管理層認為：「數字都在大幅成長，AI 轉型非常成功！」
但六個月後，產品交付速度和客戶滿意度都沒有明顯改善。

這套度量體系最根本的問題是什麼？

A. 追蹤的指標數量太少，需要增加更多使用率相關的細分指標
B. 只衡量了「採用率」輸入指標，缺少交付速度、程式碼品質、開發者體驗和經濟成果等產出與成效指標
C. 授權費用太高，應該尋找更便宜的替代工具來降低成本
D. 程式碼行數這個指標有誤導性，應該只追蹤合併到主分支的程式碼行數

Moving away from Agile: What’s Next — 告別敏捷：下一步是什麼？

影片重點

詳細內容

[00:00] AI 時代的典範轉移

[02:30] 個人生產力 vs 組織生產力的落差

[05:30] 工作分配與審查的瓶頸

[08:00] 不同場景需要不同的運作模式

[10:00] 頂尖企業的特徵：AI 原生工作流程與角色

[12:30] 從「兩個披薩團隊」到「一個披薩 Pod」

[14:30] 銀行客戶案例：團隊層級的實驗

[17:30] 角色重新定義的緊迫性

[20:00] 規模化的關鍵：變革管理

[23:00] 建立全面的度量體系

[25:30] 未來展望與關鍵建議

我的想法

進階測驗：告別敏捷 — AI 時代的軟體開發轉型

1. 選擇適合的人機協作模式情境題

2. 團隊重組決策情境題

3. 推動 AI 工具採用的策略情境題

4. 診斷企業 AI 轉型失敗的原因錯誤診斷

5. 診斷度量體系的缺陷錯誤診斷

發佈留言取消回覆

影片重點

詳細內容

[00:00] AI 時代的典範轉移

[02:30] 個人生產力 vs 組織生產力的落差

[05:30] 工作分配與審查的瓶頸

[08:00] 不同場景需要不同的運作模式

[10:00] 頂尖企業的特徵：AI 原生工作流程與角色

[12:30] 從「兩個披薩團隊」到「一個披薩 Pod」

[14:30] 銀行客戶案例：團隊層級的實驗

[17:30] 角色重新定義的緊迫性

[20:00] 規模化的關鍵：變革管理

[23:00] 建立全面的度量體系

[25:30] 未來展望與關鍵建議

我的想法

進階測驗：告別敏捷 — AI 時代的軟體開發轉型

1. 選擇適合的人機協作模式 情境題

2. 團隊重組決策 情境題

3. 推動 AI 工具採用的策略 情境題

4. 診斷企業 AI 轉型失敗的原因 錯誤診斷

5. 診斷度量體系的缺陷 錯誤診斷

相關文章

My Current Tech Stack — 我目前使用的技術棧

發佈留言取消回覆

1. 選擇適合的人機協作模式情境題

2. 團隊重組決策情境題

3. 推動 AI 工具採用的策略情境題

4. 診斷企業 AI 轉型失敗的原因錯誤診斷

5. 診斷度量體系的缺陷錯誤診斷