Technical reference

API-Nutzung und Kosten

Dieses Dokument listet Funktionen, die API-Schlüssel verwenden können, und wo ihre Kosten erscheinen. Es konzentriert sich auf OmeniaClaw-Funktionen, die Provider-Nutzung oder kostenpflichtige API-Aufrufe erzeugen können.

Wo Kosten erscheinen (Chat + CLI)

Kostenschnappschuss pro Sitzung

/status zeigt das aktuelle Sitzungsmodell, die Kontextnutzung und die Token der letzten Antwort.
Wenn das Modell API-Schlüssel-Authentifizierung verwendet, zeigt /status auch die geschätzten Kosten für die letzte Antwort.
Wenn Live-Sitzungsmetadaten spärlich sind, kann /status Token-/Cache- Zähler und die Bezeichnung des aktiven Laufzeitmodells aus dem neuesten Nutzungs- Eintrag im Transkript wiederherstellen. Vorhandene von null verschiedene Live-Werte haben weiterhin Vorrang, und promptgroße Transkript-Gesamtsummen können sich durchsetzen, wenn gespeicherte Gesamtsummen fehlen oder kleiner sind.

Kostenfußzeile pro Nachricht

/usage full hängt an jede Antwort eine Nutzungsfußzeile an, einschließlich geschätzter Kosten (nur API-Schlüssel).
/usage tokens zeigt nur Token; OAuth-/Token- und CLI-Abläufe im Abonnementstil blenden Dollarkosten aus.
Hinweis zur Gemini CLI: Wenn die CLI JSON-Ausgabe zurückgibt, liest OmeniaClaw die Nutzung aus stats, normalisiert stats.cached zu cacheRead und leitet Eingabe-Token bei Bedarf aus stats.input_tokens - stats.cached ab.

Hinweis zu Anthropic: Anthropic-Mitarbeitende haben uns mitgeteilt, dass Claude-CLI-Nutzung im OmeniaClaw-Stil wieder erlaubt ist. Daher behandelt OmeniaClaw die Wiederverwendung der Claude CLI und die Nutzung von claude -p für diese Integration als genehmigt, sofern Anthropic keine neue Richtlinie veröffentlicht. Anthropic stellt weiterhin keine Dollarschätzung pro Nachricht bereit, die OmeniaClaw in /usage full anzeigen kann.

CLI-Nutzungsfenster (Provider-Kontingente)

OmeniaClaw status --usage und OmeniaClaw channels list zeigen Nutzungsfenster des Providers (Kontingentschnappschüsse, keine Kosten pro Nachricht).
Die menschenlesbare Ausgabe wird Provider-übergreifend auf X% left normalisiert.
Aktuelle Provider für Nutzungsfenster: Anthropic, GitHub Copilot, Gemini CLI, OpenAI Codex, MiniMax, Xiaomi und z.ai.
Hinweis zu MiniMax: Die Rohfelder usage_percent / usagePercent bedeuten verbleibendes Kontingent, daher invertiert OmeniaClaw sie vor der Anzeige. Zählbasierte Felder haben weiterhin Vorrang, wenn sie vorhanden sind. Wenn der Provider model_remains zurückgibt, bevorzugt OmeniaClaw den Chatmodell-Eintrag, leitet die Fensterbezeichnung bei Bedarf aus Zeitstempeln ab und fügt den Modellnamen in die Planbezeichnung ein.
Die Nutzungs-Authentifizierung für diese Kontingentfenster stammt aus Provider-spezifischen Hooks, wenn verfügbar; andernfalls greift OmeniaClaw auf passende OAuth-/API-Schlüssel- Zugangsdaten aus Auth-Profilen, Umgebung oder Konfiguration zurück.

Details und Beispiele finden Sie unter Token-Nutzung & Kosten.

Wie Schlüssel erkannt werden

OmeniaClaw kann Zugangsdaten aus folgenden Quellen übernehmen:

Auth-Profile (pro Agent, gespeichert in auth-profiles.json).
Umgebungsvariablen (z. B. OPENAI_API_KEY, BRAVE_API_KEY, FIRECRAWL_API_KEY).
Konfiguration (models.providers.*.apiKey, plugins.entries.*.config.webSearch.apiKey, plugins.entries.firecrawl.config.webFetch.apiKey, memorySearch.*, talk.providers.*.apiKey).
Skills (skills.entries.<name>.apiKey), die Schlüssel in die Prozessumgebung des Skills exportieren können.

Funktionen, die Schlüssel verbrauchen können

1) Kern-Modellantworten (Chat + Tools)

Jede Antwort oder jeder Tool-Aufruf verwendet den aktuellen Modell-Provider (OpenAI, Anthropic usw.). Dies ist die primäre Quelle für Nutzung und Kosten.

Dies umfasst auch gehostete Provider im Abonnementstil, die weiterhin außerhalb der lokalen OmeniaClaw-Oberfläche abrechnen, z. B. OpenAI Codex, Alibaba Cloud Model Studio Coding Plan, MiniMax Coding Plan, Z.AI / GLM Coding Plan und Anthropics OmeniaClaw-Claude-Anmeldepfad mit aktiviertem Extra Usage.

Siehe Modelle für Preiskonfiguration und Token-Nutzung & Kosten für die Anzeige.

2) Medienverständnis (Audio/Bild/Video)

Eingehende Medien können zusammengefasst/transkribiert werden, bevor die Antwort ausgeführt wird. Dies verwendet Modell-/Provider-APIs.

Audio: OpenAI / Groq / Deepgram / DeepInfra / Google / Mistral.
Bild: OpenAI / OpenRouter / Anthropic / DeepInfra / Google / MiniMax / Moonshot / Qwen / Z.AI.
Video: Google / Qwen / Moonshot.

Siehe Medienverständnis.

3) Bild- und Videogenerierung

Gemeinsame Generierungsfähigkeiten können ebenfalls Provider-Schlüssel verbrauchen:

Bildgenerierung: OpenAI / Google / DeepInfra / fal / MiniMax
Videogenerierung: DeepInfra / Qwen

Die Bildgenerierung kann einen authentifizierungsgestützten Provider-Standard ableiten, wenn agents.defaults.imageGenerationModel nicht gesetzt ist. Die Videogenerierung erfordert derzeit ein explizites agents.defaults.videoGenerationModel, z. B. qwen/wan2.6-t2v.

Siehe Bildgenerierung, Qwen Cloud und Modelle.

4) Memory-Embeddings + semantische Suche

Die semantische Memory-Suche verwendet Embedding-APIs, wenn sie für Remote-Provider konfiguriert ist:

memorySearch.provider = "openai" → OpenAI-Embeddings
memorySearch.provider = "gemini" → Gemini-Embeddings
memorySearch.provider = "voyage" → Voyage-Embeddings
memorySearch.provider = "mistral" → Mistral-Embeddings
memorySearch.provider = "deepinfra" → DeepInfra-Embeddings
memorySearch.provider = "lmstudio" → LM Studio-Embeddings (lokal/selbst gehostet)
memorySearch.provider = "ollama" → Ollama-Embeddings (lokal/selbst gehostet; normalerweise keine Abrechnung über eine gehostete API)
Optionaler Fallback auf einen Remote-Provider, wenn lokale Embeddings fehlschlagen

Sie können es lokal halten mit memorySearch.provider = "local" (keine API-Nutzung).

Siehe Memory.

5) Web-Suchtool

web_search kann je nach Ihrem Provider Nutzungsgebühren verursachen:

Brave Search API: BRAVE_API_KEY oder plugins.entries.brave.config.webSearch.apiKey
Exa: EXA_API_KEY oder plugins.entries.exa.config.webSearch.apiKey
Firecrawl: FIRECRAWL_API_KEY oder plugins.entries.firecrawl.config.webSearch.apiKey
Gemini (Google Search): GEMINI_API_KEY oder plugins.entries.google.config.webSearch.apiKey
Grok (xAI): XAI_API_KEY oder plugins.entries.xai.config.webSearch.apiKey
Kimi (Moonshot): KIMI_API_KEY, MOONSHOT_API_KEY oder plugins.entries.moonshot.config.webSearch.apiKey
MiniMax Search: MINIMAX_CODE_PLAN_KEY, MINIMAX_CODING_API_KEY, MINIMAX_API_KEY oder plugins.entries.minimax.config.webSearch.apiKey
Ollama Web Search: schlüsselfrei für einen erreichbaren angemeldeten lokalen Ollama-Host; direkte Suche über https://ollama.com verwendet OLLAMA_API_KEY, und authentifizierungsgeschützte Hosts können normale Ollama-Provider-Bearer-Authentifizierung wiederverwenden
Perplexity Search API: PERPLEXITY_API_KEY, OPENROUTER_API_KEY oder plugins.entries.perplexity.config.webSearch.apiKey
Tavily: TAVILY_API_KEY oder plugins.entries.tavily.config.webSearch.apiKey
DuckDuckGo: schlüsselfreier Fallback (keine API-Abrechnung, aber inoffiziell und HTML-basiert)
SearXNG: SEARXNG_BASE_URL oder plugins.entries.searxng.config.webSearch.baseUrl (schlüsselfrei/selbst gehostet; keine Abrechnung über eine gehostete API)

Legacy-Provider-Pfade tools.web.search.* werden weiterhin über den temporären Kompatibilitäts-Shim geladen, sind aber nicht mehr die empfohlene Konfigurationsoberfläche.

Kostenloses Brave Search-Guthaben: Jeder Brave-Plan enthält $5/Monat an erneuerbarem kostenlosem Guthaben. Der Search-Plan kostet $5 pro 1.000 Anfragen, sodass das Guthaben 1.000 Anfragen/Monat kostenlos abdeckt. Setzen Sie Ihr Nutzungslimit im Brave-Dashboard, um unerwartete Gebühren zu vermeiden.

Siehe Web-Tools.

5) Web-Abruf-Tool (Firecrawl)

web_fetch kann Firecrawl aufrufen, wenn ein API-Schlüssel vorhanden ist:

FIRECRAWL_API_KEY oder plugins.entries.firecrawl.config.webFetch.apiKey

Wenn Firecrawl nicht konfiguriert ist, fällt das Tool auf direkten Abruf plus das gebündelte Plugin web-readability zurück (keine kostenpflichtige API). Deaktivieren Sie plugins.entries.web-readability.enabled, um die lokale Readability-Extraktion zu überspringen.

Siehe Web-Tools.

6) Provider-Nutzungsschnappschüsse (Status/Integrität)

Einige Statusbefehle rufen Provider-Nutzungsendpunkte auf, um Kontingentfenster oder Authentifizierungsstatus anzuzeigen. Dies sind normalerweise Aufrufe mit geringem Volumen, sie treffen aber dennoch Provider-APIs:

OmeniaClaw status --usage
OmeniaClaw models status --json

Siehe Modelle-CLI.

7) Zusammenfassung durch Compaction-Schutz

Der Compaction-Schutz kann den Sitzungsverlauf mit dem aktuellen Modell zusammenfassen, wodurch Provider-APIs aufgerufen werden, wenn er ausgeführt wird.

Siehe Sitzungsverwaltung + Compaction.

8) Modellscan / Probe

OmeniaClaw models scan kann OpenRouter-Modelle sondieren und verwendet OPENROUTER_API_KEY, wenn die Sondierung aktiviert ist.

Siehe Modelle-CLI.

9) Talk (Sprache)

Der Talk-Modus kann ElevenLabs aufrufen, wenn er konfiguriert ist:

ELEVENLABS_API_KEY oder talk.providers.elevenlabs.apiKey

Siehe Talk-Modus.

10) Skills (Drittanbieter-APIs)

Skills können apiKey in skills.entries.<name>.apiKey speichern. Wenn ein Skill diesen Schlüssel für externe APIs verwendet, können entsprechend dem Provider des Skills Kosten entstehen.

Siehe Skills.