· Paul Lukic · 3 分鐘閱讀 · ai-costsgithub-copilotcontext-optimizationllm-efficiencypricing

6 月 1 日,Copilot 改成按 token 計費。你的上下文膨脹,從此是一行帳單。

GitHub Copilot 將於 2026 年 6 月 1 日把所有付費方案切換到按使用量的 AI Credits 計費。原本藏在每月 $10 訂閱裡的 token 浪費,會即時蠶食你的 credit 餘額。本文給出數字帳,以及程式碼圖譜如何砍掉約 80%。

本文目錄

2026 年 6 月 1 日,GitHub 會按下一個開關,悄無聲息地改寫每一位 Copilot 付費使用者的 AI 編程成本結構。Premium Request Unit(PRU)下線,GitHub AI Credits 上線:每一次 chat、每一次 Copilot Chat 工具呼叫、每一次 agent 模式步進、每一次 Code Review 都按 token 計入你當月的 credit 餘額。

“Copilot Pro:$10/月,包含 $10 的月度 AI Credits。” ——GitHub Copilot is moving to usage-based billing

訂閱價沒動,底下的算式動了。算式對那些每次回覆都多塞 10 萬個無關 token 的 AI 助理很不友善。

並排示意圖:2026-06-01 前的 Copilot Pro 在 PRU 下顯示 premium 配額條、每輪對話的 token 成本被 GitHub 吸收且看不見、超額時回落到便宜模型;右側 2026-06-01 後的 AI Credits 介面顯示 $10 餘額正在被消耗、每輪對話明示扣 41 credits、不再有回落

6 月 1 日到底變了什麼

五件事,一句一件:

  1. **按 token 計費,不再按請求。**輸入、輸出、快取 token 全算錢,每個模型一套每百萬 token 單價。
  2. **1 AI Credit = $0.01 美元。**訂閱裡包含固定額度:Pro $10、Pro+ $39、Business $19/人、Enterprise $39/人,按月。
  3. 程式碼補全與 Next Edit 仍然免費,不消耗 credit。就是你在編輯器裡看到的灰色幽靈文字、Tab 接受那套。
  4. **其它一切都燒 credit。**Chat、agent 模式、多檔編輯、呼叫模型的斜線命令、Copilot Code Review(順便還燒 GitHub Actions 分鐘數),任何「問助理」互動。
  5. **不再悄悄回落到便宜模型。**PRU 時代的安全網沒了。Credit 燒光就只能停手、加錢,或者被管理員的預算策略卡住。

官方費率在 models & pricing 參考文件。每百萬 token 的幾個樣例(費率隨時可能調整):

模型輸入快取輸出
GPT-5 mini(輕量)$0.25$0.025$2.00
GPT-5.4(通用)$2.50$0.25$15.00
Claude Sonnet 4.5(通用)$3.00$0.30$15.00
Gemini 3.5 Flash(輕量)$1.50$0.15$9.00

直接用過 Anthropic、OpenAI、Google 原生 API 的人對這張表不陌生。新鮮的是 一位普通 Copilot Pro 使用者,從此開始第一次直面 API 級的成本結構

原本被遮住的東西,現在出現在你的儀表板上

PRU 時代,你只知道「premium chat 有限制」,偶爾被節流提示一下。某次具體對話燒了多少 token,你看不見。GitHub 替你吸收波動。

6 月 1 日起,儀表板上會有「AI Credits 剩餘」這個數字。一次塞滿上下文的對話,可以肉眼可見地把它往下拽一截。一次 agent 模式跑長,搭配馬虎的檔案檢索,一個下午就能吃掉每月 $10 裡不小的一塊。

這一刻,上下文膨脹的成本從「廠商後台的事」變成了你的事

我們在 更早一篇關於 AI 工具預算的文章 裡寫過上下文膨脹,那時面向的是直接對接 Anthropic 和 OpenAI API 的自架 agent 團隊。那篇裡說的每一件事現在都適用,只多了一條:現在也適用於每一位 $10 Copilot Pro 訂閱使用者。經濟成本沿著供應鏈一路下傳。

算一次:同一輪 chat,兩種檢索策略

柱狀圖對比:關鍵字檢索每輪 chat 41 AI Credits(80 個檔案,120k 輸入 token,$0.41),程式碼圖譜檢索每輪 11 AI Credits(5 個檔案,22k 輸入 token,$0.11),標註每輪差值 −30 credits

把同一輪 chat 用兩種檢索策略算一遍。任務:「新增一個按 ID 取使用者的 GET 端點,附權限檢查。」模型:Claude Sonnet 4.5。費率取上表。

**策略 A——關鍵字/向量檢索(多數編輯器今天的預設)。**助理拉進 80 個含 “user”、“endpoint”、“permission”、“route” 的檔案。輸入約 120,000 token,輸出約 3,000,快取約 20,000(來自本會話早些時候)。

  • 輸入:120k × $3.00 / 1M = $0.36
  • 快取:20k × $0.30 / 1M = $0.006
  • 輸出:3k × $15.00 / 1M = $0.045
  • 合計約 $0.41 = 41 AI Credits

**策略 B——程式碼圖譜檢索。**助理查一個預先建立的相依圖,拿到正好 5 個檔案(user 模型、路由檔、權限 middleware、一個測試、一個型別檔)。輸入約 22,000 token,輸出約 3,000,快取約 6,000。

  • 輸入:22k × $3.00 / 1M = $0.066
  • 快取:6k × $0.30 / 1M = $0.0018
  • 輸出:3k × $15.00 / 1M = $0.045
  • 合計約 $0.11 = 11 AI Credits

單輪省 30 AI Credits,聽起來不多。一天來 20 次,一週五天。策略 A 在 大約 24 個工作日 就能把 Pro 的整月 $10 燒光。策略 B 還綽綽有餘。整年下來,光 Pro 這一檔,策略 A 和 B 的差距就是「訂閱一直停在 $120」與「訂閱加超額衝到 $400–$500」——做同樣的工作。

10 人小隊、每人 Business($19/座 = $19 credit/座)這題更猛。策略 A 在月中第二週就溢出額度。策略 B 不會。

「不再回落便宜模型」這條最痛

PRU 時代,premium 請求燒完後 Copilot 會偷偷換便宜模型繼續聊。煩,但你還能繼續工作。

AI Credits 時代,這條退路沒了。原話:

“Fallback experiences eliminated — users no longer drop to cheaper models when exhausted; instead governed by available credits and admin budget controls.”

Credit 燒完,三選一:

  1. 停掉付費功能等下個月。
  2. 公司卡上付超額。
  3. 等管理員加預算——在 Business 與 Enterprise 檔,那是一個共享池,誰家失控的 chat 都能把它抽乾。

這就是為什麼上下文膨脹現在不只是貴,還是個 營運風險。**一個吵雜的會話能把團隊同事卡在月底沒 agent 模式可用。**最佳化每輪的 token 成本不再是財務部的小算盤,是「同事今天能不能發版」的問題。

程式碼圖譜怎麼砍掉大部分浪費

修法不是更聰明的 prompt、不是換模型、也不是換 RAG 廠商。是給助理一個對「這次任務到底要哪些檔案」的精確答案——這是每個檢索系統都答錯的問題。

程式碼圖譜把你的儲存庫解析進一個小小的 SQLite 資料庫:節點是檔案、類別、函式、方法;邊是 import、呼叫、定義。agent 拿到工單後,第一次工具呼叫就回傳這次改動相關的 4–6 個檔案——基於你自己程式碼的 import 與呼叫結構,不是基於詞面比對或 embedding 相似度。其它檔案永遠進不了上下文視窗,token 帳單跟著掉。

Coograph 給的就是這個:

  • **開源、MIT、在本機跑。**幾秒鐘建好圖。程式碼不離開你的機器。
  • **一個 MCP server,覆蓋所有支援的 agent。**Claude Code、VS Code Copilot、Codex CLI、OpenCode、Cursor、Windsurf、Aider、Cline 都能查。Copilot Chat 接它的方式跟接任何 MCP server 一樣。
  • get_minimal_context(task) 回傳 4–6 個檔案而不是 200 個。只有圖確實沒答案時,agent 才回落到 grep。
  • **自動更新。**Git hook 只重新解析 SHA-1 變動的檔案。每次提交後毫秒級更新。

不換編輯器、不換模型、不改工作流。只換 agent 看到新任務時 第一次工具呼叫 做的事——從「全庫 grep」換成「問圖」。下游一切跟著變便宜。

6 月 1 日前,這週該做什麼

按對你 6 月帳單影響大小排序,五件事:

  1. **盤點哪些會話用的是 chat 而不是補全。**補全免費,chat 不免費。如果你「用 Copilot」一半其實是行內灰字,沒事——那部分帳單是 0。如果一大半是 chat 或 agent 模式,繼續往下看。
  2. **打開 GitHub 5 月放出的預覽帳單。**它會用你 5 月的行為預測 6 月成本。數字嚇人的話,你還有一週時間補救。
  3. **給 chat agent 前面裝一個程式碼圖譜。**Coograph 大約兩分鐘就能裝好——見 getting started。多數使用者在第一次任務上看到 chat token 用量降 60–80%。
  4. **別讓 agent 亂 grep。**如果你們團隊的 Copilot Chat 流程開頭是「找所有提到 X 的檔案」,那一行就是帳單。換成 get_minimal_context(task) 或對應工具的等價物。
  5. **給 cost center 設預算上限。**Business 與 Enterprise 管理員 6 月 1 日前就設。當成 AWS 預算警示,不要當成一年一次的採購流程。

一年後看會是什麼樣

AI 助理按使用量計費這件事,會像雲端運算按使用量計費一樣最終被馴化。前六個月會很亂。團隊會被帳單嚇到,先怪廠商、再怪助理,最後怪流程。然後他們開始按任務量化 token,就像按請求量化 CPU 一樣。

贏這次過渡的團隊,是那些把 「上下文視窗裡到底進了什麼」 當成銷貨成本(COGS)來認真處理、並相應做埋點的團隊。不這麼做的團隊,會在下一年裡要麼付超額,要麼看著開發者乾等下個月的 credit。

好消息:解藥很小、本機、開源,今天就能用。壞消息:正是這種「很小的解藥」最容易拖到本月預算燒光以後才想起來。


我只用 Copilot 的行內補全,這事影響我嗎?

不直接影響。程式碼補全與 Next Edit 在按使用量計費下仍然免費。如果你完全不碰 Copilot Chat、agent 模式或 Copilot Code Review,訂閱費一分不變。只要你開始 chat,影響就開始。

Coograph 也能省我的純補全用量嗎?

補全免費,那邊沒有 token 可省。Coograph 的價值在 chat 與 agent 流程裡——也就是 Copilot 即將開始計費的部分。chat 用得越多,省得越多。

能在 VS Code 的 Copilot Chat 裡用程式碼圖譜嗎?

能。Copilot Chat 支援 MCP server,Coograph 自帶一個獨立 MCP server。agent 讀檔前先呼叫 get_minimal_context,跟在 Claude Code 或 Codex CLI 上一樣。看 code-graph 文件

買的是 Copilot 年付方案怎麼辦?

按 GitHub 說法:年付方案在到期前保留 PRU 計價,到期續訂時轉入按使用量計費。省錢論證仍然成立——差別只是你的計時是從 6 月開始,還是從你年付到期那天開始。

Coograph 跟 RAG 或 embedding 檢索比怎麼樣?

Embedding 按表面相似度排序;程式碼圖譜按真實結構相依排序。兩者回答不同問題。「哪些文字看起來像這條 prompt」適合文件檢索;「從這個函式能到達哪些程式碼」才是改這個函式前你想要的答案。我們在 上下文膨脹那篇 裡寫過差別。

本機跑一個 MCP server 會不會有風險?

Coograph 的 MCP server 開源、本機執行、無網路呼叫,只讀你儲存庫裡的一個 SQLite 檔。我們另外寫過 agent shell 稽核——見 按會話稽核日誌那篇——想精確知道每個 agent 跑過什麼,可以疊在程式碼圖譜之上一起用。


如果你的團隊在用 Copilot Chat 或 agent 模式,又沒算過單次任務的 token 成本,6 月 1 日前算一遍。然後 試一下 Coograph,安裝大約兩分鐘,再算一遍同樣的任務。省不下來,一個下午沉沒成本。省得下來,相當於把全年的月度 credit 配額給自己回購了。

延伸閱讀:上下文膨脹那篇 · Coograph code-graph 文件 · GitHub 公告 · GitHub models & pricing 參考

削減你的 AI 編程帳單 30–80%。Coograph 採用 MIT 授權、永久免費。Pro 提供客製服務。