成本與用量
AI 不像傳統 SaaS 按座位計費。每一次對話都在消耗 Token,每一個 Token 都有成本。 這個分類讓你搞清楚錢流向哪、怎麼省。
你需要知道的三件事
1. realvco 訂閱費 ≠ AI 使用費
- realvco 月費:付給 realvco 的主機與維運費用
- AI 使用費:付給 OpenAI / Anthropic / Google 等 API 供應商
兩筆費用分開計算。訂閱 realvco 你拿到一台主機 + 三個夥伴框架,AI 模型 API Key 是你自己的(或 realvco 代購方案)。
2. Token 是計價單位,不是訊息數
- 1 個中文字 ≈ 1.5-2 Tokens
- 1 個英文單字 ≈ 1.3 Tokens
- AI 的回應也算 Tokens(通常 output 比 input 貴 3-5 倍)
- 長對話會累積,因為每次請求都帶整段歷史
一段日常對話(你問 100 字、AI 答 300 字)大約 1,000 Tokens。
3. 模型差距很大
同樣處理一段內容,不同模型的價差可達 10 倍以上。請看下方預設模型清單逐款價格對照 — 日常對話用便宜款就夠,不用預設最貴。
預設模型清單
買了 預裝 API 額度 之後,realvco 在 Rose 的 OpenClaw 容器預先裝好下列 4 款 OpenRouter 模型,對話中輸入指令 /model <別名> 即可瞬間切換(完整 alias 機制見 OpenClaw 概況):
| 別名 | 模型 | 輸入 / 百萬 Tokens | 輸出 / 百萬 Tokens | 適合的任務 |
|---|---|---|---|---|
gm | OpenAI GPT-5.4 Mini | 依即時報價 | 依即時報價 | 日常穩定主力 / 設定調整 / config / env 檢查 / 一般 OpenClaw / Hermes-Agent 操作 |
ds | DeepSeek V4 Pro | $0.435 | $0.87 | 重任務與長上下文 / 複雜 log / 多步驟排錯 |
hk | Anthropic Claude Haiku 4.5 | $1.00 | $5.00 | 高風險守門 / Claude 系穩定判斷 |
gf | Google Gemini 3.5 Flash | 依即時報價 | 依即時報價 | 多模態與高階備援 / 價格較貴 / 最終選項 |
價格說明:2 款 OpenRouter 公開行情(ds / hk)為 2026-05-26 公告;新換 / 升版的 2 款(gm / gf)以 admin-panel 的 用量 子分頁即時報價為準。越往下能力越強、成本越高。
模型升級策略:兩次卡住就跳下一級
預設 gm 處理大部分工作。遇到搞不定的事不要硬撐,依任務性質直接挑對應模型:
- 預設 GPT-5.4 Mini(
/model gm)— 日常穩定主力,設定 / config / env 檢查 / 一般 OpenClaw 跟 Hermes-Agent 操作都靠她。 - 遇到複雜 log、多步驟排錯、長上下文 → 切 DeepSeek V4 Pro(輸入指令
/model ds)— 重任務首選。 - 涉及金額、合規、需要 Claude 系穩定判斷 → 切 Claude Haiku 4.5(輸入指令
/model hk)— 高風險守門。 - 要看圖、多模態、其他模型都試過還是卡 → 切 Gemini 3.5 Flash(輸入指令
/model gf)— 價格較貴,當最終備援。
「兩次規則」:每款試了兩次還沒搞定就跳下一級,別在一款上耗超過兩次浪費 token。
怎麼切:在跟 Rose 對話時輸入指令 /model <別名>(例如 /model ds、/model hk)然後送出,下一則就用新模型回。
為什麼這樣安排:模型各有強項弱項 — 設定類用 gm 已經夠用;遇到 log / 排錯 那種長 context 任務 ds 表現比較穩;涉及金額 / 合規這類「不能搞砸」的場景 hk 守門最安全;最後 gf 留給多模態需求跟所有都試過還沒通的場景。
Ada / Vi(Hermes-Agent)的模型怎麼選? Hermes-Agent 沒有 OpenClaw 那種固定別名清單;Ada / Vi 第一次用時在 admin-panel 設定 子分頁挑模型即可。可挑的範圍跟 OpenRouter 模型池一致。
使用舊版預設模型的客戶:Rose 早期裝機時預裝的是 4 款(
km/mm/sn/op,已下架的模型);現行預設是gm/ds/hk/gf,想切到新組合在 版本升級 重拉預設即可。
深入主題
Usage Dashboard 解讀
管理儀表板(Admin Panel) 的 用量分頁 每個數字代表什麼
Token 計價原理
為什麼 1,000 字的對話可能花到 5 美分
預算警示
設定月預算上限、每日告警、超額關閉
成本優化
換模型、壓縮 context、快取、限流
快速省錢 TOP 5
如果你現在覺得花太多,優先做這五件事:
- 切換日常對話到便宜模型 — Rose 預設是
gm(GPT-5.4 Mini);如果你曾切到hk(Haiku)或gf(Gemini)當主模型,切回gm立刻省幾倍 - 開啟 Context 壓縮 — 長對話自動摘要舊訊息,少帶歷史省錢
- 限制單次回應長度 — 設定
maxTokens,避免 AI 寫出一整本小說 - 設月預算上限 — 超過就停,避免失控
- 量大任務丟給 Ada / Vi(Hermes-Agent) — 反應快、成本省,跟 Rose 分流
每項都在成本優化有詳細步驟。
相關文件
- 預裝 API 額度與 OpenRouter 設定 — 結帳時加購的「裝機階段 AI 啟動金」怎麼用
- 管理儀表板 總覽
- Rose、Ada 與 Vi 各自擅長什麼 — 不同預裝軟體也影響成本