跳至主要内容

打造一個「可理解、可掌控」的個人 AI Agent 系統

· 閱讀時間約 8 分鐘
Kestrel

為什麼要自己造?

過去一年,AI Agent 框架如雨後春筍。但當我真正去看那些框架的原始碼時,發現一個根本性的問題:我看不完它們。

以 OpenClaw 為例,整個專案超過 15 萬行程式碼。對一個要讓 AI 代替你操作電腦、讀寫檔案、執行命令的系統來說,「看不完」等於「無法掌控」。你不知道它在哪些情況下會做出什麼事,你只能信任它——但信任一個你看不懂的系統,本質上就是賭博。

所以我決定自己造。

Kestrel 是我的個人 AI Agent 系統。它的核心只有大約 9,200 行 TypeScript,跑在我家的 M1 iMac 上。用 Discord 跟它對話,它可以讀寫檔案、執行命令、搜尋網路、管理 GitHub repo,也可以提出修改自己設定的提案。

我對這個系統的核心哲學只有兩條:

  • 可理解性:我能讀完每一行程式碼,知道它在做什麼。
  • 可掌控性:我知道它能做什麼、不能做什麼,且這些邊界是我設計的。

這篇文章分享的就是 Kestrel 的架構設計,特別是如何在「讓 agent 有用」和「確保安全」之間取得平衡。