2026-06-16 · Paul Lukic · 1 分鐘閱讀 · ai-costs context-window code-graph developer-tools

你不是超預算,你是超配額。

Claude Code 的每週上限和 Copilot 新的按額度計費,懲罰的是同一件事：代理本該讀 4 個檔案,卻讀了 20 個。解法不是更大的方案,而是更小的上下文。

週三,你的團隊就已經撞牆了。Claude Code 的每週配額用光,Max 席位被限流,週四週五本該交付的東西沒人做出來。你不是花超了,你是把配額用完了。

這就是問題的新形態。截至 2026 年 6 月,計費表從兩個方向同時跑。Claude Code 在 5 小時滾動視窗之上又加了一道每週算力上限——Anthropic 在 3 月底公開承認,使用者觸達限額的速度「遠快於預期」。而 6 月 1 日,GitHub Copilot 切換到按用量計費：AI Credits,每個一美分,按 token 以各模型公布的費率扣除。無論哪種,你的代理每多讀一個檔案,都是一筆記在那個週中就會見底的預算上的開銷。

沒人願意說出口的真相是：那些檔案大多根本不需要讀。你的代理靠關鍵字搜尋或向量相似度找程式碼——這些鈍器會把一切與某個詞沾邊的東西都撈回來,把模型淹沒在雜訊裡。一個資深工程師會掃一眼專案結構、順著真正的依賴鏈走、只讀重要的部分。你的代理目前還做不到。所以它讀 20 個檔案去改 4 個,而你來買單——用錢、用配額、用那個週三就讓團隊停擺的限流。

RAG 時代正在落幕——而它正把你的配額一起帶走

兩年來,「代理如何找程式碼」的答案一直是檢索：把程式碼庫做成嵌入,按查詢搜尋,把命中度最高的幾個塞進上下文。這個套路如今正肉眼可見地崩解。2026 年正在流行的產業術語是上下文架構(context architecture)——人們認識到,檢索增強生成(RAG)在設計上就會過度抓取,而代理需要的是一個結構化的上下文層,不是一堆「可能相關」的匹配。

原因很簡單。檢索最佳化的是召回率：把任何可能相關的都回傳。這對程式設計代理是錯誤的目標,因為在程式碼裡,真正重要的關係不是字面相似,而是依賴邊。OrderService.place_order() 呼叫一個 repository,後者用到一個快取策略。這些檔案構成了鏈條。沒有關鍵字能找到這層關係,沒有嵌入能捕捉它。

為什麼關鍵字搜尋浪費配額

關鍵字搜尋確定且快,所以它無處不在。把每個詞建索引,常數時間查到。但確定不等於正確。在後端裡搜 “order”,你會拿到訂單服務——沒錯——外加每個提到訂單的路由處理器、每個測試夾具、那個 import 了訂單 DTO 的計費服務、一個遷移檔案,還有稽核日誌裡的註解。你的代理收到一股鬆散相關程式碼的洪流,只能花推理 token 去判斷哪些是雜訊。

為什麼向量搜尋也不是解藥

向量搜尋更聰明——它知道「verify user identity」和「authentication」很近。但它回傳的仍是可能的匹配,不是確定的匹配。它仍然過度抓取。而且做嵌入意味著把你的程式碼庫送到外部服務：一道安全邊界、一筆延遲成本、又一張月度帳單。你只是把關鍵字洪流換成了語意洪流。

關鍵字搜尋 vs. 依賴圖：入門

依賴圖到底知道什麼

有向圖：一個服務模組呼叫校驗器,校驗器呼叫型別模組,邊標註 'imports' 和 'calls';一個不相關的日誌模組在被追蹤路徑之外

依賴圖是這樣一種結構：節點是函式、類別和檔案,邊是「X 呼叫 Y」或「X 匯入 Y」。你只需解析一次程式碼庫——imports、函式呼叫、類別繼承、匯出——把這些關係存進一個可查詢的資料庫。

現在當代理問「這次改動會牽動什麼?」時,你從進入點走訪圖,只回傳可達的節點。從那個函式開始,順著它的呼叫走,追蹤它的依賴,停。代理一次查詢就拿到鏈條——而且只有鏈條。零猜測,零來自註解或命名衝突的誤報。

這就是上下文架構在程式碼上的實際含義：用確定性的圖走訪取代機率性的檢索。代理讀更少的檔案,裝更少的雜訊,犯更少的錯誤——也燒掉更少那個週三就要見底的配額。

量化浪費：已提交的基準

長條圖對比單個任務的 token 消耗：樸素關鍵字搜尋 4,764 token,依賴圖 969 token,約 80% 的降幅

Coograph 把基準測試隨儲存庫一起發布,這樣你不必憑信任接受結論。它是一個單一固定任務——「給 OrderService.place_order() 加快取」——跑在一個單一已提交的夾具(bench/fixtures/sample-app/)上。兩者都簽入了。任何人都能重跑並得到同樣的數字。這份誠實比一個更唬人的標題更重要：一個你無法重現的基準是行銷,不是測量。

在這個任務上：

樸素 grep + 讀取所有匹配檔案： 20 個檔案,約 4,764 個輸入 token,21 次工具呼叫。
圖最小上下文查詢 + 讀取回傳檔案： 4 個檔案,約 969 個輸入 token,5 次工具呼叫。

這是 約 80% 的 token 降幅 和 約 4 倍的工具呼叫下降——在一個有代表性的重構任務上。真實節省取決於儲存庫規模和任務形態：程式碼庫越大、改動越聚焦,圖的優勢越大。這是一個任務,不是普適保證。但機制每次都一樣——讀鏈條,跳過洪流。

每個任務少燒約 80% 的 token 能換來什麼?兩樣計費表在意的東西。在 Copilot 的按額度計費上,它是每次改動更小的一筆帳。在 Claude Code 的每週上限上,它是撞牆前能多做的任務——代理用零頭的上下文做同樣的工作,同樣的配額就能撐到週裡更深的地方。我們不給「省下幾天配額」安一個數字——那完全取決於你的工作量——但方向並不微妙。

給關心金額的人算一筆：按 Sonnet 4.6 每百萬輸入 token 3 美元的費率,這一個任務的差價大約是 0.014 美元對 0.003 美元——零點幾分錢。token 帳單從來不是嚇人的部分,限流才是。每任務更少的 token,就是更少的任務被上限擋下。

更少的工具呼叫,更快的循環

token 是故事的一半,工具呼叫是另一半。當代理缺上下文時,它會反覆查詢——搜尋、讀取、「不對」、再搜尋。在基準上那是 21 次往返對 5 次。每次往返都是開發者要乾等的延遲。把工具呼叫砍掉約 4 倍,代理就能一遍組好上下文,而不是四遍,這是保持心流和盯著轉圈之間的區別。

自建 vs. 購買的權衡

自建這條路

在內部搭一套依賴圖系統,看著像一個衝刺,最後變成一支常駐團隊。語言異構(Python、TypeScript、Go 各有不同的 import 語意)。一旦圖超出記憶體就要持久化和查詢模式。增量更新,好讓圖不會在你建好十分鐘後就過期。解析器的邊緣情況——裝飾器鏈、動態匯入、條件 require——2% 的漏判率意味著你的代理每 50 個任務就錯 1 個。一個能跑的 v1 是幾週;一個正確的 v1 才是那個永遠做不完的部分。

Coograph 這條路：開源、本地、MIT

Coograph 是一個開源的解析器和圖引擎。它用 tree-sitter 處理 Python、TypeScript、JavaScript、Go、Rust、Java、C#、Ruby 等等,並以正規表示式作為兜底,讓不支援的語言降級而不是讓建置失敗。它產出一個檔案——.code-graph/graph.db,一個 SQLite 資料庫——本地存放,永不離開你的機器。沒有外部嵌入服務,沒有第三方看到你的程式碼,沒有 API key。

安裝只需幾分鐘。把 Coograph 複製為同級目錄,在你的 AI 工具裡執行 /coograph-init(Claude Code、Copilot、Cursor、Windsurf、Codex CLI、OpenCode、Aider、Cline),讓它建置圖——或者直接用 uv run --with-requirements .github/code-graph/requirements.txt .github/code-graph/server.py --build 建置。一個 git 鉤子在每次提交時只重新解析 SHA 變了的檔案,所以圖在毫秒級保持最新。整個儲存庫是 MIT 授權、永久免費——沒有任何被鎖的功能。

Coograph 如何給你的代理餵更好的上下文

你的代理透過 MCP 工具——get_minimal_context、query_graph 等等——查詢這張圖,而不是跑關鍵字搜尋。MCP 伺服器只是 SQLite 檔案之上一層帶型別的便捷封裝;你願意的話也可以直接用 sqlite3 查。文件規定的兜底順序是先 MCP,再 sqlite3,只有在圖確實不存在時才退到 grep。

它能和你已經在用的代理一起工作——它不替換你的代理,而是給它餵依賴鏈而非關鍵字堆。因為圖在本地,所以零網路延遲,零資料離開你的機器。

對想要超出 OSS 核心的團隊,Coograph Pro 是服務,不是一個 SaaS 方案：客製整合、為內部語言客製解析器、針對你真實工作量的持續基準測試。合作通常從一個限定時間的 2–4 週首階段開始。沒有任何功能藏在付費牆後——儲存庫裡的一切都是開源的。

Coograph 到底能省多少?

在已提交的基準任務上(給 OrderService.place_order() 加快取,跑在 bench/fixtures/sample-app/ 上),Coograph 把輸入 token 削減約 80%(4,764 → 969),工具呼叫削減約 4 倍(21 → 5)。這是一個固定、可重現的任務——不是普適保證。你的節省隨儲存庫規模和改動的聚焦程度而變。

這對 Claude Code 的每週上限或 Copilot 的額度有幫助嗎?

間接,但直接到足以有意義。兩種計費表都按 token 收費。讀 4 個檔案而不是 20 個,意味著每個任務只花零頭的上下文,所以同樣的每週配額能鋪到更多任務上,每次 Copilot 改動也是更小的額度開銷。我們不去量化「省下幾天配額」——那取決於你的工作量——但每任務更少的 token,明確就是更少的任務被限流擋下。

Coograph 能和我們已經在用的代理配合嗎?

能。它透過 MCP 伺服器與 Claude Code、VS Code Copilot、Cursor、Windsurf、Codex CLI、OpenCode、Aider 和 Cline 整合。它是一個上下文層,不是替代品——你保留自己的代理,只是給它依賴鏈而非關鍵字結果。

安裝或維護麻煩嗎?

不麻煩。把 Coograph 複製為同級目錄,執行 /coograph-init,讓它建置圖——或者直接跑建置命令。產出是單個 SQLite 檔案(.code-graph/graph.db)。一個 git 鉤子在每次提交時只重新解析變更的檔案,所以沒有伺服器要跑,也沒有持續開銷。

開源還是付費?

整個儲存庫是 MIT 授權、永久免費——沒有被鎖的功能。Coograph Pro 是客製服務(整合、客製解析器、基準測試),不是產品的某個鎖定方案。

你不是超預算,你是超配額——而根源是一個代理在讀它從不需要的檔案。用快速開始指南產生你的第一張圖,在程式碼圖頁面看看裡面有什麼,或者如果你的團隊需要動手整合,來聊聊 Coograph Pro。基準已經提交,自己重跑一遍。

分享文章 hacker news reddit

削減你的 AI 編程帳單 30–80%。Coograph 採用 MIT 授權、永久免費。Pro 提供客製服務。

立即開始 Coograph Pro