Technical reference

API-Nutzung und Kosten

Dieses Dokument listet Funktionen, die API-Schlüssel verwenden können, und wo ihre Kosten erscheinen. Es konzentriert sich auf OmeniaClaw-Funktionen, die Provider-Nutzung oder kostenpflichtige API-Aufrufe erzeugen können.

Wo Kosten erscheinen (Chat + CLI)

Kostenschnappschuss pro Sitzung

  • /status zeigt das aktuelle Sitzungsmodell, die Kontextnutzung und die Token der letzten Antwort.
  • Wenn das Modell API-Schlüssel-Authentifizierung verwendet, zeigt /status auch die geschätzten Kosten für die letzte Antwort.
  • Wenn Live-Sitzungsmetadaten spärlich sind, kann /status Token-/Cache- Zähler und die Bezeichnung des aktiven Laufzeitmodells aus dem neuesten Nutzungs- Eintrag im Transkript wiederherstellen. Vorhandene von null verschiedene Live-Werte haben weiterhin Vorrang, und promptgroße Transkript-Gesamtsummen können sich durchsetzen, wenn gespeicherte Gesamtsummen fehlen oder kleiner sind.

Kostenfußzeile pro Nachricht

  • /usage full hängt an jede Antwort eine Nutzungsfußzeile an, einschließlich geschätzter Kosten (nur API-Schlüssel).
  • /usage tokens zeigt nur Token; OAuth-/Token- und CLI-Abläufe im Abonnementstil blenden Dollarkosten aus.
  • Hinweis zur Gemini CLI: Wenn die CLI JSON-Ausgabe zurückgibt, liest OmeniaClaw die Nutzung aus stats, normalisiert stats.cached zu cacheRead und leitet Eingabe-Token bei Bedarf aus stats.input_tokens - stats.cached ab.

Hinweis zu Anthropic: Anthropic-Mitarbeitende haben uns mitgeteilt, dass Claude-CLI-Nutzung im OmeniaClaw-Stil wieder erlaubt ist. Daher behandelt OmeniaClaw die Wiederverwendung der Claude CLI und die Nutzung von claude -p für diese Integration als genehmigt, sofern Anthropic keine neue Richtlinie veröffentlicht. Anthropic stellt weiterhin keine Dollarschätzung pro Nachricht bereit, die OmeniaClaw in /usage full anzeigen kann.

CLI-Nutzungsfenster (Provider-Kontingente)

  • OmeniaClaw status --usage und OmeniaClaw channels list zeigen Nutzungsfenster des Providers (Kontingentschnappschüsse, keine Kosten pro Nachricht).
  • Die menschenlesbare Ausgabe wird Provider-übergreifend auf X% left normalisiert.
  • Aktuelle Provider für Nutzungsfenster: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi und z.ai.
  • Hinweis zu MiniMax: Die Rohfelder usage_percent / usagePercent bedeuten verbleibendes Kontingent, daher invertiert OmeniaClaw sie vor der Anzeige. Zählbasierte Felder haben weiterhin Vorrang, wenn sie vorhanden sind. Wenn der Provider model_remains zurückgibt, bevorzugt OmeniaClaw den Chatmodell-Eintrag, leitet die Fensterbezeichnung bei Bedarf aus Zeitstempeln ab und fügt den Modellnamen in die Planbezeichnung ein.
  • Die Nutzungs-Authentifizierung für diese Kontingentfenster stammt aus Provider-spezifischen Hooks, wenn verfügbar; andernfalls greift OmeniaClaw auf passende OAuth-/API-Schlüssel- Zugangsdaten aus Auth-Profilen, Umgebung oder Konfiguration zurück.

Details und Beispiele finden Sie unter Token-Nutzung & Kosten.

Wie Schlüssel erkannt werden

OmeniaClaw kann Zugangsdaten aus folgenden Quellen übernehmen:

  • Auth-Profile (pro Agent, gespeichert in auth-profiles.json).
  • Umgebungsvariablen (z. B. OPENAI_API_KEY, BRAVE_API_KEY, FIRECRAWL_API_KEY).
  • Konfiguration (models.providers.*.apiKey, plugins.entries.*.config.webSearch.apiKey, plugins.entries.firecrawl.config.webFetch.apiKey, memorySearch.*, talk.providers.*.apiKey).
  • Skills (skills.entries.<name>.apiKey), die Schlüssel in die Prozessumgebung des Skills exportieren können.

Funktionen, die Schlüssel verbrauchen können

1) Kern-Modellantworten (Chat + Tools)

Jede Antwort oder jeder Tool-Aufruf verwendet den aktuellen Modell-Provider (OpenAI, Anthropic usw.). Dies ist die primäre Quelle für Nutzung und Kosten.

Dies umfasst auch gehostete Provider im Abonnementstil, die weiterhin außerhalb der lokalen OmeniaClaw-Oberfläche abrechnen, z. B. OpenAI Codex, Alibaba Cloud Model Studio Coding Plan, MiniMax Coding Plan, Z.AI / GLM Coding Plan und Anthropics OmeniaClaw-Claude-Anmeldepfad mit aktiviertem Extra Usage.

Siehe Modelle für Preiskonfiguration und Token-Nutzung & Kosten für die Anzeige.

2) Medienverständnis (Audio/Bild/Video)

Eingehende Medien können zusammengefasst/transkribiert werden, bevor die Antwort ausgeführt wird. Dies verwendet Modell-/Provider-APIs.

  • Audio: OpenAI / Groq / Deepgram / DeepInfra / Google / Mistral.
  • Bild: OpenAI / OpenRouter / Anthropic / DeepInfra / Google / MiniMax / Moonshot / Qwen / Z.AI.
  • Video: Google / Qwen / Moonshot.

Siehe Medienverständnis.

3) Bild- und Videogenerierung

Gemeinsame Generierungsfähigkeiten können ebenfalls Provider-Schlüssel verbrauchen:

  • Bildgenerierung: OpenAI / Google / DeepInfra / fal / MiniMax
  • Videogenerierung: DeepInfra / Qwen

Die Bildgenerierung kann einen authentifizierungsgestützten Provider-Standard ableiten, wenn agents.defaults.imageGenerationModel nicht gesetzt ist. Die Videogenerierung erfordert derzeit ein explizites agents.defaults.videoGenerationModel, z. B. qwen/wan2.6-t2v.

Siehe Bildgenerierung, Qwen Cloud und Modelle.

4) Memory-Embeddings + semantische Suche

Die semantische Memory-Suche verwendet Embedding-APIs, wenn sie für Remote-Provider konfiguriert ist:

  • memorySearch.provider = "openai" → OpenAI-Embeddings
  • memorySearch.provider = "gemini" → Gemini-Embeddings
  • memorySearch.provider = "voyage" → Voyage-Embeddings
  • memorySearch.provider = "mistral" → Mistral-Embeddings
  • memorySearch.provider = "deepinfra" → DeepInfra-Embeddings
  • memorySearch.provider = "lmstudio" → LM Studio-Embeddings (lokal/selbst gehostet)
  • memorySearch.provider = "ollama" → Ollama-Embeddings (lokal/selbst gehostet; normalerweise keine Abrechnung über eine gehostete API)
  • Optionaler Fallback auf einen Remote-Provider, wenn lokale Embeddings fehlschlagen

Sie können es lokal halten mit memorySearch.provider = "local" (keine API-Nutzung).

Siehe Memory.

5) Web-Suchtool

web_search kann je nach Ihrem Provider Nutzungsgebühren verursachen:

  • Brave Search API: BRAVE_API_KEY oder plugins.entries.brave.config.webSearch.apiKey
  • Exa: EXA_API_KEY oder plugins.entries.exa.config.webSearch.apiKey
  • Firecrawl: FIRECRAWL_API_KEY oder plugins.entries.firecrawl.config.webSearch.apiKey
  • Gemini (Google Search): GEMINI_API_KEY oder plugins.entries.google.config.webSearch.apiKey
  • Grok (xAI): XAI_API_KEY oder plugins.entries.xai.config.webSearch.apiKey
  • Kimi (Moonshot): KIMI_API_KEY, MOONSHOT_API_KEY oder plugins.entries.moonshot.config.webSearch.apiKey
  • MiniMax Search: MINIMAX_CODE_PLAN_KEY, MINIMAX_CODING_API_KEY, MINIMAX_API_KEY oder plugins.entries.minimax.config.webSearch.apiKey
  • Ollama Web Search: schlüsselfrei für einen erreichbaren angemeldeten lokalen Ollama-Host; direkte Suche über https://ollama.com verwendet OLLAMA_API_KEY, und authentifizierungsgeschützte Hosts können normale Ollama-Provider-Bearer-Authentifizierung wiederverwenden
  • Perplexity Search API: PERPLEXITY_API_KEY, OPENROUTER_API_KEY oder plugins.entries.perplexity.config.webSearch.apiKey
  • Tavily: TAVILY_API_KEY oder plugins.entries.tavily.config.webSearch.apiKey
  • DuckDuckGo: schlüsselfreier Fallback (keine API-Abrechnung, aber inoffiziell und HTML-basiert)
  • SearXNG: SEARXNG_BASE_URL oder plugins.entries.searxng.config.webSearch.baseUrl (schlüsselfrei/selbst gehostet; keine Abrechnung über eine gehostete API)

Legacy-Provider-Pfade tools.web.search.* werden weiterhin über den temporären Kompatibilitäts-Shim geladen, sind aber nicht mehr die empfohlene Konfigurationsoberfläche.

Kostenloses Brave Search-Guthaben: Jeder Brave-Plan enthält $5/Monat an erneuerbarem kostenlosem Guthaben. Der Search-Plan kostet $5 pro 1.000 Anfragen, sodass das Guthaben 1.000 Anfragen/Monat kostenlos abdeckt. Setzen Sie Ihr Nutzungslimit im Brave-Dashboard, um unerwartete Gebühren zu vermeiden.

Siehe Web-Tools.

5) Web-Abruf-Tool (Firecrawl)

web_fetch kann Firecrawl aufrufen, wenn ein API-Schlüssel vorhanden ist:

  • FIRECRAWL_API_KEY oder plugins.entries.firecrawl.config.webFetch.apiKey

Wenn Firecrawl nicht konfiguriert ist, fällt das Tool auf direkten Abruf plus das gebündelte Plugin web-readability zurück (keine kostenpflichtige API). Deaktivieren Sie plugins.entries.web-readability.enabled, um die lokale Readability-Extraktion zu überspringen.

Siehe Web-Tools.

6) Provider-Nutzungsschnappschüsse (Status/Integrität)

Einige Statusbefehle rufen Provider-Nutzungsendpunkte auf, um Kontingentfenster oder Authentifizierungsstatus anzuzeigen. Dies sind normalerweise Aufrufe mit geringem Volumen, sie treffen aber dennoch Provider-APIs:

  • OmeniaClaw status --usage
  • OmeniaClaw models status --json

Siehe Modelle-CLI.

7) Zusammenfassung durch Compaction-Schutz

Der Compaction-Schutz kann den Sitzungsverlauf mit dem aktuellen Modell zusammenfassen, wodurch Provider-APIs aufgerufen werden, wenn er ausgeführt wird.

Siehe Sitzungsverwaltung + Compaction.

8) Modellscan / Probe

OmeniaClaw models scan kann OpenRouter-Modelle sondieren und verwendet OPENROUTER_API_KEY, wenn die Sondierung aktiviert ist.

Siehe Modelle-CLI.

9) Talk (Sprache)

Der Talk-Modus kann ElevenLabs aufrufen, wenn er konfiguriert ist:

  • ELEVENLABS_API_KEY oder talk.providers.elevenlabs.apiKey

Siehe Talk-Modus.

10) Skills (Drittanbieter-APIs)

Skills können apiKey in skills.entries.<name>.apiKey speichern. Wenn ein Skill diesen Schlüssel für externe APIs verwendet, können entsprechend dem Provider des Skills Kosten entstehen.

Siehe Skills.

Verwandte Themen

Was this useful?
On this page

On this page