6 月 1 日,Copilot 改成按 token 計費。你的上下文膨脹,從此是一行帳單。
GitHub Copilot 將於 2026 年 6 月 1 日把所有付費方案切換到按使用量的 AI Credits 計費。原本藏在每月 $10 訂閱裡的 token 浪費,會即時蠶食你的 credit 餘額。本文給出數字帳,以及程式碼圖譜如何砍掉約 80%。
2026 年 6 月 1 日,GitHub 會按下一個開關,悄無聲息地改寫每一位 Copilot 付費使用者的 AI 編程成本結構。Premium Request Unit(PRU)下線,GitHub AI Credits 上線:每一次 chat、每一次 Copilot Chat 工具呼叫、每一次 agent 模式步進、每一次 Code Review 都按 token 計入你當月的 credit 餘額。
“Copilot Pro:$10/月,包含 $10 的月度 AI Credits。” ——GitHub Copilot is moving to usage-based billing
訂閱價沒動,底下的算式動了。算式對那些每次回覆都多塞 10 萬個無關 token 的 AI 助理很不友善。
6 月 1 日到底變了什麼
五件事,一句一件:
- **按 token 計費,不再按請求。**輸入、輸出、快取 token 全算錢,每個模型一套每百萬 token 單價。
- **1 AI Credit = $0.01 美元。**訂閱裡包含固定額度:Pro $10、Pro+ $39、Business $19/人、Enterprise $39/人,按月。
- 程式碼補全與 Next Edit 仍然免費,不消耗 credit。就是你在編輯器裡看到的灰色幽靈文字、Tab 接受那套。
- **其它一切都燒 credit。**Chat、agent 模式、多檔編輯、呼叫模型的斜線命令、Copilot Code Review(順便還燒 GitHub Actions 分鐘數),任何「問助理」互動。
- **不再悄悄回落到便宜模型。**PRU 時代的安全網沒了。Credit 燒光就只能停手、加錢,或者被管理員的預算策略卡住。
官方費率在 models & pricing 參考文件。每百萬 token 的幾個樣例(費率隨時可能調整):
| 模型 | 輸入 | 快取 | 輸出 |
|---|---|---|---|
| GPT-5 mini(輕量) | $0.25 | $0.025 | $2.00 |
| GPT-5.4(通用) | $2.50 | $0.25 | $15.00 |
| Claude Sonnet 4.5(通用) | $3.00 | $0.30 | $15.00 |
| Gemini 3.5 Flash(輕量) | $1.50 | $0.15 | $9.00 |
直接用過 Anthropic、OpenAI、Google 原生 API 的人對這張表不陌生。新鮮的是 一位普通 Copilot Pro 使用者,從此開始第一次直面 API 級的成本結構。
原本被遮住的東西,現在出現在你的儀表板上
PRU 時代,你只知道「premium chat 有限制」,偶爾被節流提示一下。某次具體對話燒了多少 token,你看不見。GitHub 替你吸收波動。
6 月 1 日起,儀表板上會有「AI Credits 剩餘」這個數字。一次塞滿上下文的對話,可以肉眼可見地把它往下拽一截。一次 agent 模式跑長,搭配馬虎的檔案檢索,一個下午就能吃掉每月 $10 裡不小的一塊。
這一刻,上下文膨脹的成本從「廠商後台的事」變成了你的事。
我們在 更早一篇關於 AI 工具預算的文章 裡寫過上下文膨脹,那時面向的是直接對接 Anthropic 和 OpenAI API 的自架 agent 團隊。那篇裡說的每一件事現在都適用,只多了一條:現在也適用於每一位 $10 Copilot Pro 訂閱使用者。經濟成本沿著供應鏈一路下傳。
算一次:同一輪 chat,兩種檢索策略
把同一輪 chat 用兩種檢索策略算一遍。任務:「新增一個按 ID 取使用者的 GET 端點,附權限檢查。」模型:Claude Sonnet 4.5。費率取上表。
**策略 A——關鍵字/向量檢索(多數編輯器今天的預設)。**助理拉進 80 個含 “user”、“endpoint”、“permission”、“route” 的檔案。輸入約 120,000 token,輸出約 3,000,快取約 20,000(來自本會話早些時候)。
- 輸入:120k × $3.00 / 1M = $0.36
- 快取:20k × $0.30 / 1M = $0.006
- 輸出:3k × $15.00 / 1M = $0.045
- 合計約 $0.41 = 41 AI Credits
**策略 B——程式碼圖譜檢索。**助理查一個預先建立的相依圖,拿到正好 5 個檔案(user 模型、路由檔、權限 middleware、一個測試、一個型別檔)。輸入約 22,000 token,輸出約 3,000,快取約 6,000。
- 輸入:22k × $3.00 / 1M = $0.066
- 快取:6k × $0.30 / 1M = $0.0018
- 輸出:3k × $15.00 / 1M = $0.045
- 合計約 $0.11 = 11 AI Credits
單輪省 30 AI Credits,聽起來不多。一天來 20 次,一週五天。策略 A 在 大約 24 個工作日 就能把 Pro 的整月 $10 燒光。策略 B 還綽綽有餘。整年下來,光 Pro 這一檔,策略 A 和 B 的差距就是「訂閱一直停在 $120」與「訂閱加超額衝到 $400–$500」——做同樣的工作。
10 人小隊、每人 Business($19/座 = $19 credit/座)這題更猛。策略 A 在月中第二週就溢出額度。策略 B 不會。
「不再回落便宜模型」這條最痛
PRU 時代,premium 請求燒完後 Copilot 會偷偷換便宜模型繼續聊。煩,但你還能繼續工作。
AI Credits 時代,這條退路沒了。原話:
“Fallback experiences eliminated — users no longer drop to cheaper models when exhausted; instead governed by available credits and admin budget controls.”
Credit 燒完,三選一:
- 停掉付費功能等下個月。
- 公司卡上付超額。
- 等管理員加預算——在 Business 與 Enterprise 檔,那是一個共享池,誰家失控的 chat 都能把它抽乾。
這就是為什麼上下文膨脹現在不只是貴,還是個 營運風險。**一個吵雜的會話能把團隊同事卡在月底沒 agent 模式可用。**最佳化每輪的 token 成本不再是財務部的小算盤,是「同事今天能不能發版」的問題。
程式碼圖譜怎麼砍掉大部分浪費
修法不是更聰明的 prompt、不是換模型、也不是換 RAG 廠商。是給助理一個對「這次任務到底要哪些檔案」的精確答案——這是每個檢索系統都答錯的問題。
程式碼圖譜把你的儲存庫解析進一個小小的 SQLite 資料庫:節點是檔案、類別、函式、方法;邊是 import、呼叫、定義。agent 拿到工單後,第一次工具呼叫就回傳這次改動相關的 4–6 個檔案——基於你自己程式碼的 import 與呼叫結構,不是基於詞面比對或 embedding 相似度。其它檔案永遠進不了上下文視窗,token 帳單跟著掉。
Coograph 給的就是這個:
- **開源、MIT、在本機跑。**幾秒鐘建好圖。程式碼不離開你的機器。
- **一個 MCP server,覆蓋所有支援的 agent。**Claude Code、VS Code Copilot、Codex CLI、OpenCode、Cursor、Windsurf、Aider、Cline 都能查。Copilot Chat 接它的方式跟接任何 MCP server 一樣。
get_minimal_context(task)回傳 4–6 個檔案而不是 200 個。只有圖確實沒答案時,agent 才回落到 grep。- **自動更新。**Git hook 只重新解析 SHA-1 變動的檔案。每次提交後毫秒級更新。
不換編輯器、不換模型、不改工作流。只換 agent 看到新任務時 第一次工具呼叫 做的事——從「全庫 grep」換成「問圖」。下游一切跟著變便宜。
6 月 1 日前,這週該做什麼
按對你 6 月帳單影響大小排序,五件事:
- **盤點哪些會話用的是 chat 而不是補全。**補全免費,chat 不免費。如果你「用 Copilot」一半其實是行內灰字,沒事——那部分帳單是 0。如果一大半是 chat 或 agent 模式,繼續往下看。
- **打開 GitHub 5 月放出的預覽帳單。**它會用你 5 月的行為預測 6 月成本。數字嚇人的話,你還有一週時間補救。
- **給 chat agent 前面裝一個程式碼圖譜。**Coograph 大約兩分鐘就能裝好——見 getting started。多數使用者在第一次任務上看到 chat token 用量降 60–80%。
- **別讓 agent 亂 grep。**如果你們團隊的 Copilot Chat 流程開頭是「找所有提到 X 的檔案」,那一行就是帳單。換成
get_minimal_context(task)或對應工具的等價物。 - **給 cost center 設預算上限。**Business 與 Enterprise 管理員 6 月 1 日前就設。當成 AWS 預算警示,不要當成一年一次的採購流程。
一年後看會是什麼樣
AI 助理按使用量計費這件事,會像雲端運算按使用量計費一樣最終被馴化。前六個月會很亂。團隊會被帳單嚇到,先怪廠商、再怪助理,最後怪流程。然後他們開始按任務量化 token,就像按請求量化 CPU 一樣。
贏這次過渡的團隊,是那些把 「上下文視窗裡到底進了什麼」 當成銷貨成本(COGS)來認真處理、並相應做埋點的團隊。不這麼做的團隊,會在下一年裡要麼付超額,要麼看著開發者乾等下個月的 credit。
好消息:解藥很小、本機、開源,今天就能用。壞消息:正是這種「很小的解藥」最容易拖到本月預算燒光以後才想起來。
我只用 Copilot 的行內補全,這事影響我嗎?
不直接影響。程式碼補全與 Next Edit 在按使用量計費下仍然免費。如果你完全不碰 Copilot Chat、agent 模式或 Copilot Code Review,訂閱費一分不變。只要你開始 chat,影響就開始。
Coograph 也能省我的純補全用量嗎?
補全免費,那邊沒有 token 可省。Coograph 的價值在 chat 與 agent 流程裡——也就是 Copilot 即將開始計費的部分。chat 用得越多,省得越多。
能在 VS Code 的 Copilot Chat 裡用程式碼圖譜嗎?
能。Copilot Chat 支援 MCP server,Coograph 自帶一個獨立 MCP server。agent 讀檔前先呼叫 get_minimal_context,跟在 Claude Code 或 Codex CLI 上一樣。看 code-graph 文件。
買的是 Copilot 年付方案怎麼辦?
按 GitHub 說法:年付方案在到期前保留 PRU 計價,到期續訂時轉入按使用量計費。省錢論證仍然成立——差別只是你的計時是從 6 月開始,還是從你年付到期那天開始。
Coograph 跟 RAG 或 embedding 檢索比怎麼樣?
Embedding 按表面相似度排序;程式碼圖譜按真實結構相依排序。兩者回答不同問題。「哪些文字看起來像這條 prompt」適合文件檢索;「從這個函式能到達哪些程式碼」才是改這個函式前你想要的答案。我們在 上下文膨脹那篇 裡寫過差別。
本機跑一個 MCP server 會不會有風險?
Coograph 的 MCP server 開源、本機執行、無網路呼叫,只讀你儲存庫裡的一個 SQLite 檔。我們另外寫過 agent shell 稽核——見 按會話稽核日誌那篇——想精確知道每個 agent 跑過什麼,可以疊在程式碼圖譜之上一起用。
如果你的團隊在用 Copilot Chat 或 agent 模式,又沒算過單次任務的 token 成本,6 月 1 日前算一遍。然後 試一下 Coograph,安裝大約兩分鐘,再算一遍同樣的任務。省不下來,一個下午沉沒成本。省得下來,相當於把全年的月度 credit 配額給自己回購了。
延伸閱讀:上下文膨脹那篇 · Coograph code-graph 文件 · GitHub 公告 · GitHub models & pricing 參考。
削減你的 AI 編程帳單 30–80%。Coograph 採用 MIT 授權、永久免費。Pro 提供客製服務。