Claude、GPT、Gemini 向け LLM API Proxy
すべての LLM トラフィックを単一のプロキシでルーティング。1 つのキー、1 つの残高、Claude、GPT、Gemini 間の自動フェイルオーバー——3 つの統合を管理する必要はありません。
ClaudeN は複数のプロバイダーの前に位置する LLM API proxy として機能します。リクエストを 1 つの OpenAI 互換エンドポイントに送信すると、proxy が適切なモデルにルーティングします。課金は統合され、キーは簡素化され、アプリケーションコードを変更せずにプロバイダー間でフェイルオーバーできます。
LLM API Proxy を使う理由
1 回の統合で複数モデル
コードを単一の base URL に向けるだけ。モデル名を変更するだけでプロバイダーを切り替え。
統合された課金とキー
すべてのモデルで 1 つのプリペイド残高と 1 つの API キー。複数のベンダーダッシュボードを切り替える必要なし。
フェイルオーバーとルーティング
あるプロバイダーが遅いまたはレート制限された場合、次のリクエストをコード変更なしで別のプロバイダーにルーティング可能。
コンプライアンスと運用を簡素化
ログ、支出制御、レート制限を 3 箇所ではなく 1 箇所で一元管理。
LLM Proxy の使い方
- ClaudeN にサインアップ — アカウントを作成し、USDT または PayPal でプリペイド残高にチャージ。
- クライアントを設定 — base URL を https://clauden.ai/v1 に設定し、任意の OpenAI 互換クライアントで ClaudeN キーを使用。
- リクエストごとにモデルを選択 — 必要に応じて model を claude-...、gpt-... または gemini-... に設定。Proxy がルーティングを処理。
- 1 箇所で使用状況を監視 — すべての支出が同じ残高に記録されます。容量が必要になったら追加チャージ。
例:単一 Proxy でモデルを切り替える
SDK または curl リクエストを一度 ClaudeN に向け、model 名だけを変えて Claude、GPT、Gemini にルーティングします。
from openai import OpenAI
client = OpenAI(
api_key="$CLAUDEN_API_KEY",
base_url="https://clauden.ai/v1",
)
messages = [{"role": "user", "content": "Compare these two options"}]
claude = client.chat.completions.create(model="claude-3-5-sonnet", messages=messages)
gpt = client.chat.completions.create(model="gpt-4o", messages=messages)
gemini = client.chat.completions.create(model="gemini-1.5-pro", messages=messages)
curl https://clauden.ai/v1/chat/completions \
-H "Authorization: Bearer $CLAUDEN_API_KEY" \
-H "Content-Type: application/json" \
-d '{"model":"claude-3-5-sonnet","messages":[{"role":"user","content":"Hello from one LLM proxy"}]}'
リソース
LLM API Proxy — よくある質問
LLM API Proxy とは何ですか?
LLM API Proxy は、リクエストを受け取り、1 つ以上の上流プロバイダーに転送するサービスです。ClaudeN は proxy として、Claude、GPT、Gemini の上に統合課金、キー管理、フェイルオーバーを追加します。
API Gateway と同じですか?
非常に似ています。この文脈では、「proxy」と「gateway」はどちらも複数の LLM バックエンドの前に位置し、認証、課金、ルーティングを処理する単一のレイヤーを意味します。
プロバイダーに直接呼び出しを続けることはできますか?
はい。proxy の使用は任意です。好みであれば、引き続き Anthropic、OpenAI、Google に直接呼び出しを続け、他のトラフィックやバックアップとして ClaudeN を使用できます。
proxy を使うと遅延は増えますか?
ルーティングによる追加遅延は通常数十ミリ秒程度です。ほとんどのアプリケーションでは、モデルの思考時間に比べて無視できるレベルです。
登録で $5 分の無料クレジットを獲得
すべての LLM トラフィックを単一のプロキシでルーティング。1 つのキー、1 つの残高、Claude、GPT、Gemini 間の自動フェイルオーバー——3 つの統合を管理する必要はありません。
無料で始める