
前言
在探索AI服務部署的過程中,我發現了一個非常實用的項目 - Gemini Balance。這是一個專為 Gemini API 設計的輪詢代理服務,能夠實現負載均衡、API密鑰管理和使用監控等功能。本文將分享我從零開始部署這個服務的完整體驗和心得。
什麼是 Gemini Balance?
Gemini Balance 是一個開源的 Gemini API 代理服務,主要特色包括:
- 🔄 負載均衡:支援多個 API 密鑰輪詢使用
- 📊 使用監控:提供詳細的 API 使用統計和監控面板
- 🔐 訪問控制:支援自定義訪問令牌管理
- 💾 數據持久化:支援 SQLite 和其他數據庫存儲
- 🌐 易於部署:支援多種部署平台
技術架構分析
核心組件
Gemini Balance 的技術架構包含以下核心組件:
- 代理服務器:處理 API 請求轉發和負載均衡
- 監控模組:收集和展示使用統計數據
- 數據存儲:SQLite 數據庫存儲配置和統計信息
- Web 界面:提供管理和監控功能
負載均衡策略
服務採用輪詢(Round Robin)策略進行負載均衡:
- 請求分發:按順序將請求分配給不同的 API 密鑰
- 故障轉移:當某個密鑰出現問題時自動切換
- 使用統計:記錄每個密鑰的使用情況和響應時間
架構流程圖
這個架構確保了:
- 高可用性:多個 API 密鑰提供冗余
- 負載分散:避免單一密鑰過載
- 透明代理:客戶端無需關心底層實現
為什麼選擇 Gemini Balance?
在實際使用 Gemini API 的過程中,我遇到了幾個常見問題:
1. API 配額限制
單個 API 密鑰的請求限制往往無法滿足高頻使用需求,需要多個密鑰輪詢使用。
2. 使用監控困難
缺乏直觀的方式來監控 API 使用情況和成本控制。
3. 訪問管理複雜
在團隊環境中,需要統一的訪問控制和密鑰管理機制。
'Retrying langchain_google_genai.llms._completion_with_retry.<locals>._completion_with_retry in 4.0 seconds as it raised ResourceExhausted: 429 You exceeded your current quota, please check your plan and billing details. For more information on this error, head to: https://ai.google.dev/gemini-api/docs/rate-limits. [violations {
quota_metric: "generativelanguage.googleapis.com/generate_content_free_tier_requests"
quota_id: "GenerateRequestsPerMinutePerProjectPerModel-FreeTier"
quota_dimensions {
key: "model"
value: "gemini-2.5-flash"
}
quota_dimensions {
key: "location"
value: "global"
}
quota_value: 10
}
, links {
description: "Learn more about Gemini API quotas"
url: "https://ai.google.dev/gemini-api/docs/rate-limits"
}
, retry_delay {
seconds: 28
}
].
Gemini Balance 正好解決了這些痛點,提供了一個完整的代理服務解決方案。
ClawCloud 部署實戰
平台選擇考量
我選擇在 ClawCloud 上部署 ,主要考慮因素:
- 💰 成本效益:ClawCloud 提供免費額度,適合個人項目
github登入了話,只要滿180天的賬號,就有一個入門的伺服器可以架設
- 🚀 部署簡便:支援 Docker 容器化部署
- 🔧 配置靈活:環境變量配置方式簡單直觀
部署步驟詳解
這個doc寫的蠻詳細的,不過有遇到一個問題,可以在我的文章説明
https://gb-docs.snaily.top/guide/setup-clawcloud-sqlite.html
1. 先準備MySQL
根據官方doc的設置,注冊aiven的賬號就可以。
https://gb-docs.snaily.top/guide/setup-hf.html
https://console.aiven.io/
將下面的MySQL的欄位的内容記下來。
2. 注冊clawcloud
https://gb-docs.snaily.top/guide/setup-clawcloud-sqlite.html
我是選擇German地區,主要要看每一個地區的伺服器負載,選擇不要紅色的基本上很快就可以部署好了
3. 設置 gemini balance 配置
將你手上有的google ai studio的API令牌停入下面這個密鑰列表中。
然後你要自己設定一個允許的令牌列表,這個簡單來説就是gemini balance會整合你提供的所有的Gemini API,然後輸出一個獨特的token,這個token是經過gemini balance處理過後的token。
接下來記得按下保存配置。
4.驗證是否成功
下載cherry studio
https://www.cherry-ai.com/
安裝完之後,打開cherry studio的設置,點擊模型提供者,按下新增。
提供者名稱隨意。
供應商可以選擇OPENAI或Gemini 。
將API金鑰填入你剛才設置的[允許的令牌認證]。
API主機地址填入你的claw cloud的公網地址。
按下檢查之後,應該就可以看到 連接成功。
你可以按下管理來新增你想要使用的模型。
然後在左邊的導航欄選擇對話,然後在最上面的下拉式選單選擇GeminiBalance,測試看看能不能使用。
設置在vscode cline
進入VSCODE, 點擊extention,搜尋cline后安裝。

安裝完之後,可以看到要你選擇API provider。
- 選擇Google Gemini,然後Gemini API Key選擇gemini balance的token。
- 接下來勾選 Use custom base URL。
- 這個也是要填入你的claw cloud的公網地址。
設定完成之後,就可以測試看看。
他應該會給你回復,并且在gemini balance的監控面板,也可以看到狀態應該是success。
總結
通過這次 Gemini Balance 部署實戰,我深刻體會到了這個開源專案的實用價值。整個部署過程雖然涉及多個步驟,但每個環節都有詳細的文檔支援,即使是初學者也能順利完成。
主要收穫
- 成本控制:透過多個 API 密鑰輪詢,有效避免了單一密鑰的配額限制問題
- 監控便利:統一的監控面板讓 API 使用情況一目了然,便於成本管理
- 部署靈活:ClawCloud 的免費額度搭配 Docker 容器化,為個人開發者提供了低成本的部署方案
- 整合性強:支援多種客戶端(Cherry Studio、VSCode Cline 等),適用性廣泛
使用建議
- 適合場景:個人開發者、小型團隊、學習研究用途
- 注意事項:建議定期檢查 API 使用情況
- 擴展性:後續可考慮升級到 MySQL 版本以獲得更好的效能和穩定性