You’re Falling Behind. It’s Time to Catch Up.

Theo 以 Karpathy 的一篇貼文為引子,深入探討當前程式設計師面臨的 AI 衝擊。他認為 AI 輔助開發已經不再是「早期嘗鮮」,而是「你已經遲到了」的階段。影片中他分享了自己如何利用 AI 工具(如 Claude Code、Cursor)完成 90% 的程式碼撰寫,並提出一套系統性的趕上策略:從找到工具極限、跳脫框架思考,到編排多個 AI Agent 協同工作,幫助開發者在這場變革中不掉隊。


原影片連結:https://www.youtube.com/watch?v=Z9UxjmNF7b0

影片重點

  • Karpathy 承認自己作為程式設計師從未感到如此落後,這場 AI 變革已是不可逆的現實
  • Theo 個人 90% 的程式碼由 AI 生成,他帶領的團隊至少 70% 是 AI 生成的程式碼
  • 第一步:用實際工作任務測試 AI 工具,找到它們的能力極限
  • 第二步:跳脫框架思考,將過去「不值得寫程式解決」的問題交給 AI
  • 第三步:學習編排(Orchestration),將多個 Agent 和工具串聯起來
  • Ramp 公司 AI 負責人 Rahul 的實戰建議:給 Agent 工具、投資 Agent 文件、建立 Eval
  • 程式碼品質的保障:善用型別系統、Linting、Claude MD 檔案來引導 AI 輸出
  • 對企業管理者的呼籲:讓工程師使用最好的 AI 工具,否則人才將會流失

詳細內容

[00:00] Karpathy 的警鐘:程式設計師正在落後

Theo 以 Andrej Karpathy 的一篇社群貼文開場。Karpathy 寫道:「作為一名程式設計師,我從未感到如此落後。這個職業正在被劇烈重構,程式設計師貢獻的程式碼在整體中佔比越來越少。」他提到有一整層新的可程式化抽象層需要掌握,包括 Agent、Sub-agent、Prompt、Context、Memory、Mode、Permission、Tool、Plugin、Skill、Hook、MCP 等等。

Theo 對此深有同感,他回憶起做 GPT-5 影片時就感受到了第一波震動——AI 不再只是幫忙自動補全和建立 API 檔案的工具,而是能真正建構完整應用程式的存在。他強調,他認識的所有聰明的開發者現在都在用 AI 做瘋狂的事情,不論是把 AI 當作產品的一部分,還是用來完成大部分開發工作。

[03:30] 你已經遲到了:AI 開發已成現實

Theo 一向主張「晚入場好過早入場」,他看過太多人 all-in 在最後證明沒用的東西上。但他明確表示:AI 輔助程式開發已經過了那個觀望期。他自己現在超過 90% 的程式碼是用 AI 寫的,團隊至少 70%,他接觸的投資公司和合作夥伴也是類似的數字。

他提到 AI 目前在做決策方面還不夠好,但在討論決策時很有幫助。他直言:「如果你覺得你做的東西太複雜、AI 處理不了,去告訴那些用它建構編譯器的人、建構程式語言的人、建構部署系統的人。」這已經會對就業市場產生實質影響,方向和程度未知,但影響是確定的。

[06:30] 步驟一:找到 AI 工具的極限

Theo 建議的第一步是:去試用目前最熱門的工具(Claude Code、Cursor、OpenCode 等),搭配最新的模型(當時是 Opus 4.5 或 GPT-5),然後把它們推到極限。具體做法是拿一個你一直想實作的功能,交給 Agent 去做,觀察它的計畫和輸出。

他推薦使用 Plan Mode——像是和同事在白板前討論如何實作一個功能。觀察 Agent 如何瀏覽程式碼庫、如何思考問題,這本身就是學習的過程。兩個核心目標是:建立對這些工具能做什麼和不能做什麼的直覺,以及在不降低品質信心的前提下增加程式碼產出量

他建議建立自己的「偽基準測試」:把過去一週完成的任務拿出來,在任務開始前的版本上讓 AI 重做,比較你的做法和 AI 的做法,逐步提高任務難度。

[10:30] 步驟二:跳脫框架思考

Theo 分享了一個個人經歷:他有一堆大學時期 Android 手機備份的照片和影片,散落在各個資料夾中,手動整理了六個月的八年資料後放棄了。後來他讓 Claude Code 在 Windows 上處理這件事,AI 寫了一堆腳本(包括一個 30,000 行的 JavaScript 檔案),成功重新整理和轉碼了所有檔案。

這就是他說的「跳脫框架思考」——很多問題理論上可以用程式碼解決,但過去不值得花那個時間去寫。現在寫程式碼的成本大幅下降,你需要重新看待世界。他用滑板做了一個有趣的類比:滑板玩久了,你走在街上會不自覺地思考哪裡可以滑、樓梯有幾階能不能跳;學了程式設計也一樣,你看到錯誤畫面會想背後的原因。現在你需要再次重新連結大腦,開始看到「哪些問題可以用 AI 輕鬆解決」。

他舉了更多例子:花 10 分鐘用 Vibe Coding 建了一個自動比較不同 AI 模型寫作風格的工具、隨時用 Claude Code 建立 Shell 別名來自動化重複操作、為自己的魚缸遊戲 Vibe Code 了三套資產管理工具。

[18:30] 步驟三:編排(Orchestration)

Theo 坦言自己還在學習這一塊。編排指的是如何啟動不同的 Agent、將各個部分串聯起來、撰寫(或讓 AI 撰寫)將工具和功能連結在一起的膠水程式碼。

他以自己的魚缸遊戲為例,建立了一個「Fish Bible」——一個 Markdown 檔案,記錄遊戲中所有魚和寵物的資訊。他在 Claude MD 中指定這個檔案是權威參考,任何遊戲變動都要同步更新。這種做法讓他不需要時時盯著程式碼,而是通過文件來管理 AI 的行為。

他提到 Pete(Peter Steinberger)的 Clawdbot 是一個很好的編排範例——透過 Telegram 或 WhatsApp 控制一台電腦上的 AI Agent。他也提到,剛開始你需要「強迫自己」去找可以自動化的地方,但一旦找到感覺,就會發現生活中有無數瑣碎的事情以前不值得自動化,現在絕對值得。

[23:00] Ramp 的 AI 領導者實戰建議

Theo 引用了 Ramp 公司 Applied AI 負責人 Rahul(Rahul Sengottuvelu)的一篇文章,分享了一系列企業級的 AI 開發建議:

給 Agent 工具存取權:讓 Agent 能存取 Linear、GitHub、Datadog、Sentry 等開發工具。如果 Agent 因為缺乏上下文而受限,那是你的問題。Ramp 內部建了一個 Inspect Bot,能自動找出 Sentry 上最常見的 20 個錯誤,然後為每一個建立修復 PR。

投資程式碼庫專屬的 Agent 文件:不要抱怨 AI 做不好某件事,而是改善 Prompt、Agent MD 檔案、Linting 規則。Claude Code 團隊每天多次修改內部 repo 的 Claude MD 檔案。每一次你手動修改 AI 生成的程式碼,都是一次改善 Agent MD 的機會。

善用型別系統與 LSP:使用有型別的程式語言,讓型別錯誤能回饋給 Agent 自動修正。Claude Code、OpenCode、Cursor 都支援這種錯誤回饋迴路。

建立背景 Agent 基礎設施:在 VM 和沙箱中建立完整的開發環境,讓工程師能同時平行執行多個 Agent。程式碼審查很快會成為瓶頸。

[28:30] 不要逆轉,持續推進極限

Theo 提到有些開發者(如 Clawdbot 的 Pete)堅持「從不逆轉」的策略——如果 AI 的輸出不滿意,不是回到之前的版本,而是繼續 Prompt 直到修正。但 Nean(Naman Goel,Meta StyleX 的作者)在直播聊天中指出,這和模型有關:Codex 比較擅長修正自己的錯誤,而 Opus 則更適合逆轉重來。

Theo 強調,不管哪種策略,重點是持續實驗、持續推動極限。「如果你還沒看到價值,表示你還沒到那一步,繼續推進直到你看到為止。」

[30:30] 更多實戰建議與對管理者的喊話

Rahul 的文章還提到幾個重要觀點:

  • 建立 Eval(評測)很重要:用 Vibe Coding 建立自己的基準測試,比較不同模型的表現
  • 永遠用最新一代的模型:還在用 GPT-4.1 和 Claude 3.5 Sonnet 做 Code Review 是在浪費錢
  • 用 Embedding 語意搜尋取代模糊搜尋
  • Custom Fine-tuning 已死:前沿模型進步太快,花 8 週做 Fine-tune 不值得
  • 不要太擔心推論費用:成本下降速度很快,按週計算而非按年

最後 Theo 對企業管理者喊話:讓你的工程師使用最好的 AI 工具。最好的工程師已經在用了,如果你不允許,他們會離開,你的公司會失敗。抵抗 AI 不是什麼高尚的立場,而是在阻止你的團隊贏得勝利。

我的想法

這支影片的核心訊息很清楚:AI 輔助開發已經從「觀望期」進入了「你已經遲到了」的階段。Theo 的三步策略(找極限、跳脫框架、學習編排)提供了一個很務實的路徑。

特別值得注意的是「Fish Bible」這個做法——用 Markdown 文件作為 AI 的權威參考來源,配合 Claude MD 來管理 AI 的行為。這其實是一種「文件驅動開發」的新範式,很適合在 AI 協作的場景下實踐。

不過我認為影片中有一個隱含的前提值得思考:Theo 的工作性質(內容創作者 + 獨立開發者)讓他有更大的自由度去實驗。對於在大型企業、受嚴格監管的產業中工作的開發者來說,「先斬後奏」的策略可能需要更謹慎。但核心觀點不變——至少要開始了解這些工具的能力邊界,否則確實會被甩在後面。

另一個有趣的觀點是關於「程式碼品質的分級」:不是所有程式碼都需要同等品質標準。個人工具、自動化腳本、原型可以接受較低品質的 AI 生成程式碼(所謂的 Slop Code),但生產環境的關鍵邏輯仍需要嚴格把關。這種分級思維對於有效運用 AI 開發很關鍵。

9

進階測驗:You’re Falling Behind. It’s Time to Catch Up.

測驗目標:驗證你是否能在實際情境中應用 AI 輔助開發的策略與觀念。
共 5 題,包含情境題與錯誤診斷題。

1. AI Agent 反覆犯相同的架構錯誤 情境題

你正在使用 Claude Code 進行一個中型專案的開發。你發現 Agent 每次生成程式碼時, 都會把資料庫查詢邏輯直接寫在 API Route Handler 裡,而不是放在你團隊規範的 Service Layer 中。 你已經手動修正了三次相同的問題。

根據影片中的建議,最有效的長期解決方式是什麼?

  • A. 每次手動修正後,用更詳細的 Prompt 提醒 Agent 下次注意
  • B. 在 Claude MD 檔案中加入架構規範,明確指定資料庫查詢應放在 Service Layer
  • C. 改用其他 AI 模型,因為目前的模型不適合你的專案架構
  • D. 放棄讓 AI 處理有架構要求的任務,只用它來做簡單的工具函式

2. 評估是否該投入 AI 工具的時機 情境題

你的同事小華非常興奮地推薦一個剛發布一週的全新 AI 開發工具, 號稱能完全取代現有的 IDE。這個工具目前還沒有太多使用者回饋, 但官方 Demo 看起來很厲害。小華建議整個團隊立刻遷移過去。

根據 Theo 在影片中的觀點,你應該怎麼做?

  • A. 立刻跟進,因為 Theo 說現在入場已經算遲了,不能再等
  • B. 完全忽略,等到工具穩定兩年以上再考慮
  • C. 自己先試用找到極限,但等它真正為人們每天提供價值後再讓團隊投入
  • D. 建議公司花預算購買企業版,讓全團隊一起測試

3. 如何建立 AI 工具能力的直覺 情境題

你剛開始使用 AI 程式開發工具,想要系統性地了解這些工具的能力邊界。 你手上有一個上個月花了一週完成的功能,包括需求文件和完整的 Git 歷史記錄。

根據 Theo 的建議,最好的做法是什麼?

  • A. 從零開始一個全新的專案,讓 AI 從頭建構來看它的能力
  • B. 複製你完成功能前的 repo 版本,寫下任務描述,讓 AI 重做,比較結果
  • C. 直接把整個 repo 交給 AI,讓它自由發揮改善任何它覺得需要改的地方
  • D. 上網搜尋 AI 工具的基準測試分數,根據排行榜來決定使用哪個工具

4. Agent 輸出品質低落的根本原因 錯誤診斷

小明的團隊開始使用 AI Agent 寫程式碼,但發現 Agent 經常: – 使用已棄用的 API – 生成不符合團隊程式碼風格的程式碼 – 在函式命名上不一致 小明的團隊使用 JavaScript(沒有 TypeScript),沒有設定 Linter, 也沒有撰寫任何 Claude MD 或 Agent MD 檔案。 小明認為是 AI 模型本身能力不足,打算等下一代模型再說。

根據影片中的觀點,小明的判斷最可能錯在哪裡?

  • A. 模型確實不行,應該換用更貴的模型就能解決
  • B. AI 本來就不適合團隊協作的程式碼風格統一工作
  • C. 缺少型別系統、Linting 和 Agent MD 檔案導致 Agent 沒有足夠的回饋和指引
  • D. JavaScript 本身不適合 AI 開發,應該先遷移到 Rust

5. AI 導入策略的錯誤判斷 錯誤診斷

某公司的技術主管做了以下決策: 1. 為了控制成本,統一使用 GPT-4.1 做所有 AI 功能,不升級到最新模型 2. 投入 8 週時間針對公司業務資料 Fine-tune 了一個專屬模型 3. 嚴格限制 AI 推論預算,每月不得超過 $500 4. 禁止工程師自行選擇 AI 工具,統一使用公司指定的單一工具 三個月後,團隊的 AI 導入效果遠不如預期,工程師抱怨連連。

根據 Rahul 和 Theo 在影片中的建議,上述決策中哪一項最不成問題?

  • A. 統一使用舊模型不升級
  • B. 花 8 週做 Fine-tune
  • C. 嚴格限制推論預算
  • D. 以上每一項都有嚴重問題,都是影片中明確反對的做法

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *