VS Code 團隊工程經理呂鵬（Penn）分享了 VS Code 在 AI 智能體整合方面的最新進展。從 2025 年 2 月推出 Agent 模式以來，團隊已發展出本地前台、後台、雲端三種智能體類型，並正在探索如何統一管理這些多元化的智能體會話。本次對談深入探討了大型程式碼庫面臨的專案就緒度、程式碼審查瓶頸，以及如何將 AI 工作流融入日常開發實踐。

原影片連結：https://www.bilibili.com/video/BV11zkVBHED3

影片重點

VS Code 已推出自訂智能體、完整 MCP 支援、規劃模式等大量 AI 功能
團隊將智能體分為三類：本地前台（互動式）、後台（非干擾式）、雲端（完全自主）
七月引入 Coding Agent 整合，可從 GitHub Issue 觸發智能體自動處理問題
Copilot CLI 已整合至 VS Code，統一各類智能體體驗
大型專案（如 VS Code 本身）需要「專案就緒度」設定才能有效使用後台/雲端智能體
AI 生成程式碼的審查成為新瓶頸——人類反而成了流程中最慢的環節
工作流優化是持續演進的過程：從手動指令到共享工具再到自訂代理
設計規範文件可同時作為開發計畫和測試計畫，是團隊協作的核心

詳細內容

[00:00] 講者介紹與功能概覽

呂鵬（Penn）是 VS Code 團隊的工程經理，2016 年加入團隊，先後負責 Monaco 編輯器、VS Code 與 GitHub 整合、原生 Notebook 功能等開發。近年來深度投入 AI 整合與 Copilot 工作。

自 2025 年 2 月推出智能體模式以來，VS Code 已陸續推出自訂智能體、完整規格 MCP 支援、規劃模式等功能。Penn 和 Ben 的小團隊重點聚焦在智能體與智能體會話管理領域。

[01:03] Coding Agent 整合與統一智能體體驗

七月份，VS Code 引入了 Coding Agent 整合功能。使用者可以在 github.com 上建立 Issue，智能體會代為處理該問題，或在 GitHub Action 中遠端修復漏洞。當使用者返回 VS Code 時，可以瀏覽和審查修改內容，並與智能體互動協作。

下一步是將 Copilot CLI 整合到 VS Code，統一智能體體驗。透過與 Codex 擴充功能的整合，使用者可以使用各種類型的代理——無論是雲端版本、終端介面、後台運行還是前台運行。

[01:49] 三種智能體類型的定義

隨著多種不同類型的代理出現，管理它們成為新挑戰。世界正從「單一代理同步運行在前台」轉向「可管理多種類型代理的大規模並行代理會話」時代。團隊將智能體分為三類：

本地/前台智能體：就是每天在側邊欄使用的那個。它需要響應迅速、具備互動性，使用者期待快速回應，不想等十分鐘才得到回覆。

後台智能體：更像是「這是任務和上下文，你去執行吧」的模式。它不會干擾當前的編輯器和終端，不會不斷詢問權限，需要一定程度的自主行動能力。它仍在同一台機器運行，可存取已設定的 MCP 服務器。完成後會發送通知提醒使用者查看結果。

雲端智能體：運行更隔離，完全在雲端遠端運行，可從任何地方啟動。典型工作流程是在 Issue 上觸發，也可以在離開電腦前將活躍的前台任務發送至雲端繼續運行。

[05:51] 統一視圖管理的挑戰

最初本地代理、後台代理和雲代理都在聊天編輯器中，但各類代理行為不同，造成使用者困惑。這推動團隊思考如何提供統一的視圖管理，同時讓使用者理解各類代理有不同的預期和能力。

[06:35] 專案就緒度問題

對 VS Code 這樣擁有數百萬行程式碼的大型專案，讓後台或雲端智能體有效運作需要仔細的專案設定。例如，要在後台代理中執行測試（單元測試、整合測試、冒煙測試），加上 Playwright 這樣的 MCP 服務器來啟動瀏覽器和截圖，都需要確保 MCP 服務器生成的內容不僅供人類查看，還要供代理審查和迭代。

如果專案未正確設定就推送到後台，可能得不到好結果——甚至運行結束後程式碼仍無法編譯。團隊認為可以透過定義 Hook、技能（Skill）、Prompt 規則或工作流程來降低使用門檻，提高後台和雲端代理的成功率。

[08:56] 代理產物的展示挑戰

目前 VS Code 在每次會話後會展示程式碼更改，但程式碼並非唯一的產物。例如使用代理運行測試可能花費 20-30 分鐘，過程中產生的截圖和推理過程也很重要。Penn 表示他不會百分之百信任代理的輸出，仍想瀏覽推理過程和關鍵截圖。目前 VS Code 工作台還沒有很好的方式展示這些非程式碼產物。

[09:51] 大型專案的程式碼審查困境

對於個人小型專案，Penn 不太介意 AI 生成的程式碼——如果不好用，撤銷重寫也只需一小時。但 VS Code 是龐大的開源產品，對程式碼品質、架構預期和程式碼異味都有很高要求。

想像一下：VS Code 每月有三千個 Issue，其中很多是 Bug。如果搭建完美的自動化流水線——分析程式碼庫、找出根本原因、進行修改、編譯驗證——每月可能產出大量 PR。但這時，人類成了流程中的審查瓶頸。這正是 VS Code 團隊需要在工具層面解決的問題，讓開發者既能保持創意和專注關鍵路徑，又能有效地與代理協作。

[11:36] 工作流優化的演進模式

Penn 分享了他個人在工作流優化上的持續演進。最初需要明確的程式碼規範指令，因為代理常常忘記遵循。但隨著模型越來越智能，它已能自行讀取 package.json、執行 npm install、處理 Node 版本問題。

他觀察到一個模式：先與代理協作完成前台工作，觀察代理犯了哪些錯誤，如果自己不斷重複同樣的糾正，就將其提取為共享工具。一個五步流程可以變成自訂代理、技能（Skill），或加上 Hook。這是一個從「觀察痛點」到「結構化工具」的持續優化循環。

[13:04] 設計規範作為活文件

Penn 傾向於將規劃保存為文件文件，作為「活文件」（Living Document）使用。當團隊為 VS Code 構建功能時，從一個 Issue 開始，列出常見場景和使用方式，成為團隊的北極星指引。

現在他將這些規範交給代理自主工作，最終希望另一個代理也能測試功能。有趣的是，同一份設計規範既是開發計畫，也可以轉變為測試計畫——讓代理驗證變更是否按步驟正確執行。這種「自然語言規範即計畫即測試」的模式在小型專案中效果顯著，但對中大型專案仍需要更多思考。

[14:24] 多代理並行與持續學習

Penn 提到現在可以同時運行多個代理會話。之前只能運行一個時，他的策略是在同一對話中不斷加入新提示。現在支持並行異步運行多個代理後，後台機制的核心在於隔離性——防火牆隔離、環境隔離、甚至設備隔離。

最後，Penn 強烈鼓勵大家親身嘗試，將 AI 智能體融入日常工作流程，感受其中的「小摩擦」，然後反饋給團隊以改進產品。

我的想法

這場對談讓我印象最深的是 Penn 提出的「人類成為瓶頸」這個觀點。當 AI 代理能夠自動分析 Bug、修改程式碼、通過測試時，反而是人類的程式碼審查速度跟不上了。這是一個有趣的角色反轉——過去我們擔心 AI 不夠好，現在卻要思考如何在保證品質的前提下加速人類的審核流程。

三種智能體類型（本地/後台/雲端）的分類框架非常實用。這不僅是 VS Code 的設計思路，也為所有開發者提供了一個思考如何分配 AI 任務的心智模型：需要即時互動的用前台代理，定義明確的任務用後台代理，完全自主的長時間任務用雲端代理。

另一個值得關注的是「專案就緒度」的概念。這提醒我們，光有強大的 AI 工具還不夠，專案本身的基礎設施（測試覆蓋率、MCP 配置、CI/CD 流程）才是決定 AI 代理能否有效工作的關鍵。對於想充分發揮 AI 代理能力的團隊，投資在專案的可自動化程度上可能比選擇哪個 AI 模型更重要。

進階測驗：VS Code 團隊的 AI 工作流進化論

測驗目標：驗證你是否能在實際情境中應用 VS Code AI 工作流的概念。
共 5 題，包含情境題與錯誤診斷題。

1. 選擇合適的智能體類型情境題

你正在 VS Code 中開發一個功能，同時需要讓 AI 幫你處理一個 GitHub Issue 上報告的 Bug。
你希望 Bug 修復過程不要干擾你目前的編輯器和終端，但仍然在同一台機器上運行，
並且可以存取你已設定的 MCP 服務器。完成後通知你查看結果。

你應該使用哪種智能體類型？

A. 本地前台智能體——在側邊欄直接互動處理
B. 後台智能體——不干擾當前會話，完成後通知
C. 雲端智能體——完全隔離在雲端遠端運行
D. 同時開啟兩個前台智能體會話並行處理

2. 大型專案的 AI 代理策略情境題

你的團隊維護一個擁有數百萬行程式碼的大型開源專案，
想要讓雲端智能體自動處理每月數千個 Bug Issue。
但你發現代理經常生成無法編譯的程式碼，測試也未通過。

根據 VS Code 團隊的經驗，你應該優先做什麼？

A. 更換更強大的 AI 模型以提高程式碼品質
B. 增加更多人力來審查 AI 生成的 PR
C. 提升專案就緒度——設定 Hook、MCP 服務器、測試流程，確保代理能正確編譯和驗證
D. 限制代理只處理簡單的文件修改，避免觸碰核心程式碼

3. 工作流優化的演進路徑情境題

你發現自己每次和前台代理協作時，都要重複提醒它：
「先執行 lint 檢查，再跑測試，最後確認 build 通過」。
這個五步流程你已經手動重複了十幾次。

根據 Penn 分享的工作流優化模式，下一步最佳做法是什麼？

A. 寫一份詳細的提示範本，每次複製貼上給代理
B. 將這個流程提取為自訂代理、技能（Skill）或 Hook，使其成為可共享的結構化工具
C. 放棄使用代理，自己手動完成這些步驟會更快
D. 等待模型變得更聰明，自動學會這些步驟

4. 代理產物審查的盲點錯誤診斷

團隊設定了一套自動化流程：
1. 雲端智能體接收 GitHub Issue
2. 代理分析程式碼庫並找出根本原因
3. 代理進行程式碼修改
4. 代理使用 Playwright MCP 執行 E2E 測試（耗時 25 分鐘）
5. 代理回報：「所有測試通過，已建立 PR」

團隊直接合併了這個 PR，但上線後出現了 UI 錯位問題。
最可能的問題出在哪裡？

A. Playwright 測試框架本身有 Bug，無法正確檢測 UI 問題
B. 雲端智能體的運算能力不足，導致測試不完整
C. GitHub Issue 的描述不夠詳細，代理理解錯了需求
D. 團隊未審查代理的推理過程和測試截圖等非程式碼產物，僅依賴代理的文字總結就信任了結果

5. 多代理管理的混亂錯誤診斷

小華同時啟動了三個代理會話：
– 會話 A：前台代理，正在修改 auth 模組
– 會話 B：後台代理，正在重構 database 層
– 會話 C：雲端代理，正在處理一個 UI Bug

小華發現會話 B 完成後，他的前台編輯器中打開的檔案突然出現了
意外的修改，和會話 A 的工作產生了衝突。

根據 VS Code 團隊對三種智能體的設計原則，最可能的根本原因是什麼？

A. 雲端代理（會話 C）意外修改了本地檔案
B. 後台代理（會話 B）未具備足夠的環境隔離，直接修改了與前台代理共享的工作區檔案
C. 前台代理（會話 A）自行拉取了會話 B 的變更
D. 三個代理使用了不同的 AI 模型，導致程式碼風格衝突

VS Code 呂鵬：VS Code 團隊的 AI 工作流進化論

影片重點

詳細內容

[00:00] 講者介紹與功能概覽

[01:03] Coding Agent 整合與統一智能體體驗

[01:49] 三種智能體類型的定義

[05:51] 統一視圖管理的挑戰

[06:35] 專案就緒度問題

[08:56] 代理產物的展示挑戰

[09:51] 大型專案的程式碼審查困境

[11:36] 工作流優化的演進模式

[13:04] 設計規範作為活文件

[14:24] 多代理並行與持續學習

我的想法

進階測驗：VS Code 團隊的 AI 工作流進化論

1. 選擇合適的智能體類型情境題

2. 大型專案的 AI 代理策略情境題

3. 工作流優化的演進路徑情境題

4. 代理產物審查的盲點錯誤診斷

5. 多代理管理的混亂錯誤診斷

發佈留言取消回覆

影片重點

詳細內容

[00:00] 講者介紹與功能概覽

[01:03] Coding Agent 整合與統一智能體體驗

[01:49] 三種智能體類型的定義

[05:51] 統一視圖管理的挑戰

[06:35] 專案就緒度問題

[08:56] 代理產物的展示挑戰

[09:51] 大型專案的程式碼審查困境

[11:36] 工作流優化的演進模式

[13:04] 設計規範作為活文件

[14:24] 多代理並行與持續學習

我的想法

進階測驗：VS Code 團隊的 AI 工作流進化論

1. 選擇合適的智能體類型 情境題

2. 大型專案的 AI 代理策略 情境題

3. 工作流優化的演進路徑 情境題

4. 代理產物審查的盲點 錯誤診斷

5. 多代理管理的混亂 錯誤診斷

發佈留言取消回覆

1. 選擇合適的智能體類型情境題

2. 大型專案的 AI 代理策略情境題

3. 工作流優化的演進路徑情境題

4. 代理產物審查的盲點錯誤診斷

5. 多代理管理的混亂錯誤診斷