2026-05-23 · Paul Lukic · 3 分鐘閱讀 · ai-costs github-copilot context-optimization llm-efficiency pricing

6 月 1 日，Copilot 改成按 token 計費。你的上下文膨脹，從此是一行帳單。

GitHub Copilot 將於 2026 年 6 月 1 日把所有付費方案切換到按使用量的 AI Credits 計費。原本藏在每月 $10 訂閱裡的 token 浪費，會即時蠶食你的 credit 餘額。本文給出數字帳，以及程式碼圖譜如何砍掉約 80%。

2026 年 6 月 1 日，GitHub 會按下一個開關，悄無聲息地改寫每一位 Copilot 付費使用者的 AI 編程成本結構。Premium Request Unit（PRU）下線，GitHub AI Credits 上線：每一次 chat、每一次 Copilot Chat 工具呼叫、每一次 agent 模式步進、每一次 Code Review 都按 token 計入你當月的 credit 餘額。

“Copilot Pro：$10/月，包含 $10 的月度 AI Credits。” ——GitHub Copilot is moving to usage-based billing

訂閱價沒動，底下的算式動了。算式對那些每次回覆都多塞 10 萬個無關 token 的 AI 助理很不友善。

並排示意圖：2026-06-01 前的 Copilot Pro 在 PRU 下顯示 premium 配額條、每輪對話的 token 成本被 GitHub 吸收且看不見、超額時回落到便宜模型；右側 2026-06-01 後的 AI Credits 介面顯示 $10 餘額正在被消耗、每輪對話明示扣 41 credits、不再有回落

6 月 1 日到底變了什麼

五件事，一句一件：

**按 token 計費，不再按請求。**輸入、輸出、快取 token 全算錢，每個模型一套每百萬 token 單價。
**1 AI Credit = $0.01 美元。**訂閱裡包含固定額度：Pro $10、Pro+ $39、Business $19/人、Enterprise $39/人，按月。
程式碼補全與 Next Edit 仍然免費，不消耗 credit。就是你在編輯器裡看到的灰色幽靈文字、Tab 接受那套。
**其它一切都燒 credit。**Chat、agent 模式、多檔編輯、呼叫模型的斜線命令、Copilot Code Review（順便還燒 GitHub Actions 分鐘數），任何「問助理」互動。
**不再悄悄回落到便宜模型。**PRU 時代的安全網沒了。Credit 燒光就只能停手、加錢，或者被管理員的預算策略卡住。

官方費率在 models & pricing 參考文件。每百萬 token 的幾個樣例（費率隨時可能調整）：

模型	輸入	快取	輸出
GPT-5 mini（輕量）	$0.25	$0.025	$2.00
GPT-5.4（通用）	$2.50	$0.25	$15.00
Claude Sonnet 4.5（通用）	$3.00	$0.30	$15.00
Gemini 3.5 Flash（輕量）	$1.50	$0.15	$9.00

直接用過 Anthropic、OpenAI、Google 原生 API 的人對這張表不陌生。新鮮的是 一位普通 Copilot Pro 使用者，從此開始第一次直面 API 級的成本結構。

原本被遮住的東西，現在出現在你的儀表板上

PRU 時代，你只知道「premium chat 有限制」，偶爾被節流提示一下。某次具體對話燒了多少 token，你看不見。GitHub 替你吸收波動。

6 月 1 日起，儀表板上會有「AI Credits 剩餘」這個數字。一次塞滿上下文的對話，可以肉眼可見地把它往下拽一截。一次 agent 模式跑長，搭配馬虎的檔案檢索，一個下午就能吃掉每月 $10 裡不小的一塊。

這一刻，上下文膨脹的成本從「廠商後台的事」變成了你的事。

我們在更早一篇關於 AI 工具預算的文章裡寫過上下文膨脹，那時面向的是直接對接 Anthropic 和 OpenAI API 的自架 agent 團隊。那篇裡說的每一件事現在都適用，只多了一條：現在也適用於每一位 $10 Copilot Pro 訂閱使用者。經濟成本沿著供應鏈一路下傳。

算一次：同一輪 chat，兩種檢索策略

$柱狀圖對比：關鍵字檢索每輪 chat 41 AI Credits（80 個檔案，120k 輸入 token，$0.41），程式碼圖譜檢索每輪 11 AI Credits（5 個檔案，22k 輸入 token，$0.11），標註每輪差值 −30 credits$

把同一輪 chat 用兩種檢索策略算一遍。任務：「新增一個按 ID 取使用者的 GET 端點，附權限檢查。」模型：Claude Sonnet 4.5。費率取上表。

**策略 A——關鍵字／向量檢索（多數編輯器今天的預設）。**助理拉進 80 個含 “user”、“endpoint”、“permission”、“route” 的檔案。輸入約 120,000 token，輸出約 3,000，快取約 20,000（來自本會話早些時候）。

輸入：120k × $3.00 / 1M = $0.36
快取：20k × $0.30 / 1M = $0.006
輸出：3k × $15.00 / 1M = $0.045
合計約 $0.41 = 41 AI Credits

**策略 B——程式碼圖譜檢索。**助理查一個預先建立的相依圖，拿到正好 5 個檔案（user 模型、路由檔、權限 middleware、一個測試、一個型別檔）。輸入約 22,000 token，輸出約 3,000，快取約 6,000。

輸入：22k × $3.00 / 1M = $0.066
快取：6k × $0.30 / 1M = $0.0018
輸出：3k × $15.00 / 1M = $0.045
合計約 $0.11 = 11 AI Credits

單輪省 30 AI Credits，聽起來不多。一天來 20 次，一週五天。策略 A 在 大約 24 個工作日 就能把 Pro 的整月 $10 燒光。策略 B 還綽綽有餘。整年下來，光 Pro 這一檔，策略 A 和 B 的差距就是「訂閱一直停在 $120」與「訂閱加超額衝到 $400–$500」——做同樣的工作。

10 人小隊、每人 Business（$19/座 = $19 credit/座）這題更猛。策略 A 在月中第二週就溢出額度。策略 B 不會。

「不再回落便宜模型」這條最痛

PRU 時代，premium 請求燒完後 Copilot 會偷偷換便宜模型繼續聊。煩，但你還能繼續工作。

AI Credits 時代，這條退路沒了。原話：

“Fallback experiences eliminated — users no longer drop to cheaper models when exhausted; instead governed by available credits and admin budget controls.”

Credit 燒完，三選一：

停掉付費功能等下個月。
公司卡上付超額。
等管理員加預算——在 Business 與 Enterprise 檔，那是一個共享池，誰家失控的 chat 都能把它抽乾。

這就是為什麼上下文膨脹現在不只是貴，還是個 營運風險。**一個吵雜的會話能把團隊同事卡在月底沒 agent 模式可用。**最佳化每輪的 token 成本不再是財務部的小算盤，是「同事今天能不能發版」的問題。

程式碼圖譜怎麼砍掉大部分浪費

修法不是更聰明的 prompt、不是換模型、也不是換 RAG 廠商。是給助理一個對「這次任務到底要哪些檔案」的精確答案——這是每個檢索系統都答錯的問題。

程式碼圖譜把你的儲存庫解析進一個小小的 SQLite 資料庫：節點是檔案、類別、函式、方法；邊是 import、呼叫、定義。agent 拿到工單後，第一次工具呼叫就回傳這次改動相關的 4–6 個檔案——基於你自己程式碼的 import 與呼叫結構，不是基於詞面比對或 embedding 相似度。其它檔案永遠進不了上下文視窗，token 帳單跟著掉。

Coograph 給的就是這個：

**開源、MIT、在本機跑。**幾秒鐘建好圖。程式碼不離開你的機器。
**一個 MCP server，覆蓋所有支援的 agent。**Claude Code、VS Code Copilot、Codex CLI、OpenCode、Cursor、Windsurf、Aider、Cline 都能查。Copilot Chat 接它的方式跟接任何 MCP server 一樣。
get_minimal_context(task) 回傳 4–6 個檔案而不是 200 個。只有圖確實沒答案時，agent 才回落到 grep。
**自動更新。**Git hook 只重新解析 SHA-1 變動的檔案。每次提交後毫秒級更新。

不換編輯器、不換模型、不改工作流。只換 agent 看到新任務時 第一次工具呼叫 做的事——從「全庫 grep」換成「問圖」。下游一切跟著變便宜。

6 月 1 日前，這週該做什麼

按對你 6 月帳單影響大小排序，五件事：

**盤點哪些會話用的是 chat 而不是補全。**補全免費，chat 不免費。如果你「用 Copilot」一半其實是行內灰字，沒事——那部分帳單是 0。如果一大半是 chat 或 agent 模式，繼續往下看。
**打開 GitHub 5 月放出的預覽帳單。**它會用你 5 月的行為預測 6 月成本。數字嚇人的話，你還有一週時間補救。
**給 chat agent 前面裝一個程式碼圖譜。**Coograph 大約兩分鐘就能裝好——見 getting started。多數使用者在第一次任務上看到 chat token 用量降 60–80%。
**別讓 agent 亂 grep。**如果你們團隊的 Copilot Chat 流程開頭是「找所有提到 X 的檔案」，那一行就是帳單。換成 get_minimal_context(task) 或對應工具的等價物。
**給 cost center 設預算上限。**Business 與 Enterprise 管理員 6 月 1 日前就設。當成 AWS 預算警示，不要當成一年一次的採購流程。

一年後看會是什麼樣

AI 助理按使用量計費這件事，會像雲端運算按使用量計費一樣最終被馴化。前六個月會很亂。團隊會被帳單嚇到，先怪廠商、再怪助理，最後怪流程。然後他們開始按任務量化 token，就像按請求量化 CPU 一樣。

贏這次過渡的團隊，是那些把 「上下文視窗裡到底進了什麼」 當成銷貨成本（COGS）來認真處理、並相應做埋點的團隊。不這麼做的團隊，會在下一年裡要麼付超額，要麼看著開發者乾等下個月的 credit。

好消息：解藥很小、本機、開源，今天就能用。壞消息：正是這種「很小的解藥」最容易拖到本月預算燒光以後才想起來。

我只用 Copilot 的行內補全，這事影響我嗎？

不直接影響。程式碼補全與 Next Edit 在按使用量計費下仍然免費。如果你完全不碰 Copilot Chat、agent 模式或 Copilot Code Review，訂閱費一分不變。只要你開始 chat，影響就開始。

Coograph 也能省我的純補全用量嗎？

補全免費，那邊沒有 token 可省。Coograph 的價值在 chat 與 agent 流程裡——也就是 Copilot 即將開始計費的部分。chat 用得越多，省得越多。

能在 VS Code 的 Copilot Chat 裡用程式碼圖譜嗎？

能。Copilot Chat 支援 MCP server，Coograph 自帶一個獨立 MCP server。agent 讀檔前先呼叫 get_minimal_context，跟在 Claude Code 或 Codex CLI 上一樣。看 code-graph 文件。

買的是 Copilot 年付方案怎麼辦？

按 GitHub 說法：年付方案在到期前保留 PRU 計價，到期續訂時轉入按使用量計費。省錢論證仍然成立——差別只是你的計時是從 6 月開始，還是從你年付到期那天開始。

Coograph 跟 RAG 或 embedding 檢索比怎麼樣？

Embedding 按表面相似度排序；程式碼圖譜按真實結構相依排序。兩者回答不同問題。「哪些文字看起來像這條 prompt」適合文件檢索；「從這個函式能到達哪些程式碼」才是改這個函式前你想要的答案。我們在上下文膨脹那篇裡寫過差別。

本機跑一個 MCP server 會不會有風險？

Coograph 的 MCP server 開源、本機執行、無網路呼叫，只讀你儲存庫裡的一個 SQLite 檔。我們另外寫過 agent shell 稽核——見按會話稽核日誌那篇——想精確知道每個 agent 跑過什麼，可以疊在程式碼圖譜之上一起用。

如果你的團隊在用 Copilot Chat 或 agent 模式，又沒算過單次任務的 token 成本，6 月 1 日前算一遍。然後試一下 Coograph，安裝大約兩分鐘，再算一遍同樣的任務。省不下來，一個下午沉沒成本。省得下來，相當於把全年的月度 credit 配額給自己回購了。

延伸閱讀：上下文膨脹那篇 · Coograph code-graph 文件 · GitHub 公告 · GitHub models & pricing 參考。

分享文章 hacker news reddit

削減你的 AI 編程帳單 30–80%。Coograph 採用 MIT 授權、永久免費。Pro 提供客製服務。

立即開始 Coograph Pro