CLI commands

Inferenz-CLI

OmeniaClaw infer ist die kanonische Headless-Oberfläche für Provider-gestützte Inferenz-Workflows.

Es stellt absichtlich Capability-Familien bereit, nicht rohe Gateway-RPC-Namen und nicht rohe Agent-Tool-IDs.

infer in einen Skill umwandeln

Kopieren Sie dies und fügen Sie es in einen Agenten ein:

text

Read https://omeniaclaw.com/cli/infer, then create a skill that routes my common workflows to `OmeniaClaw infer`.Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.

Ein guter infer-basierter Skill sollte:

häufige Benutzerabsichten dem richtigen infer-Unterbefehl zuordnen
einige kanonische infer-Beispiele für die abgedeckten Workflows enthalten
in Beispielen und Vorschlägen OmeniaClaw infer ... bevorzugen
vermeiden, die gesamte infer-Oberfläche im Skill-Text erneut zu dokumentieren

Typische Abdeckung eines infer-fokussierten Skill:

OmeniaClaw infer model run
OmeniaClaw infer image generate
OmeniaClaw infer audio transcribe
OmeniaClaw infer tts convert
OmeniaClaw infer web search
OmeniaClaw infer embedding create

Warum infer verwenden

OmeniaClaw infer bietet eine konsistente CLI für Provider-gestützte Inferenzaufgaben innerhalb von OmeniaClaw.

Vorteile:

Verwenden Sie die bereits in OmeniaClaw konfigurierten Provider und Modelle, anstatt einmalige Wrapper für jedes Backend einzurichten.
Halten Sie Workflows für Modell, Bild, Audiotranskription, TTS, Video, Web und Embedding unter einem Befehlsbaum.
Verwenden Sie eine stabile --json-Ausgabeform für Skripte, Automatisierung und Agent-gesteuerte Workflows.
Bevorzugen Sie eine OmeniaClaw-Erstanbieteroberfläche, wenn die Aufgabe im Kern „Inferenz ausführen“ lautet.
Verwenden Sie für die meisten infer-Befehle den normalen lokalen Pfad, ohne den Gateway zu benötigen.

Für End-to-End-Provider-Prüfungen sollten Sie OmeniaClaw infer ... bevorzugen, sobald Low-Level-Provider-Tests grün sind. Es prüft die ausgelieferte CLI, das Laden der Konfiguration, die Auflösung des Standard-Agenten, die Aktivierung gebündelter Plugins und die gemeinsame Capability-Laufzeit, bevor die Provider-Anfrage gestellt wird.

Befehlsbaum

text

 OmeniaClaw infer  list  inspect   model    run    list    inspect    providers    auth login    auth logout    auth status   image    generate    edit    describe    describe-many    providers   audio    transcribe    providers   tts    convert    voices    providers    status    enable    disable    set-provider   video    generate    describe    providers   web    search    fetch    providers   embedding    create    providers

Häufige Aufgaben

Diese Tabelle ordnet häufige Inferenzaufgaben dem entsprechenden infer-Befehl zu.

Aufgabe	Befehl	Hinweise
Einen Text-/Modell-Prompt ausführen	`OmeniaClaw infer model run --prompt "..." --json`	Verwendet standardmäßig den normalen lokalen Pfad
Einen Modell-Prompt mit Bildern ausführen	`OmeniaClaw infer model run --prompt "Describe this" --file ./image.png --model provider/model`	Wiederholen Sie `--file` für mehrere Bildeingaben
Ein Bild generieren	`OmeniaClaw infer image generate --prompt "..." --json`	Verwenden Sie `image edit`, wenn Sie mit einer vorhandenen Datei beginnen
Eine Bilddatei beschreiben	`OmeniaClaw infer image describe --file ./image.png --prompt "..." --json`	`--model` muss ein bildfähiges `<provider/model>` sein
Audio transkribieren	`OmeniaClaw infer audio transcribe --file ./memo.m4a --json`	`--model` muss `<provider/model>` sein
Sprache synthetisieren	`OmeniaClaw infer tts convert --text "..." --output ./speech.mp3 --json`	`tts status` ist Gateway-orientiert
Ein Video generieren	`OmeniaClaw infer video generate --prompt "..." --json`	Unterstützt Provider-Hinweise wie `--resolution`
Eine Videodatei beschreiben	`OmeniaClaw infer video describe --file ./clip.mp4 --json`	`--model` muss `<provider/model>` sein
Das Web durchsuchen	`OmeniaClaw infer web search --query "..." --json`
Eine Webseite abrufen	`OmeniaClaw infer web fetch --url https://example.com --json`
Embeddings erstellen	`OmeniaClaw infer embedding create --text "..." --json`

Verhalten

OmeniaClaw infer ... ist die primäre CLI-Oberfläche für diese Workflows.
Verwenden Sie --json, wenn die Ausgabe von einem anderen Befehl oder Skript verarbeitet wird.
Verwenden Sie --provider oder --model provider/model, wenn ein bestimmtes Backend erforderlich ist.
Verwenden Sie model run --thinking <level>, um eine einmalige Thinking-/Reasoning-Stufe (off, minimal, low, medium, high, adaptive, xhigh oder max) zu übergeben und den Lauf dabei roh zu halten.
Für image describe, audio transcribe und video describe muss --model die Form <provider/model> verwenden.
Für image describe führt ein explizites --model dieses Provider/Modell direkt aus. Das Modell muss im Modellkatalog oder in der Provider-Konfiguration bildfähig sein. codex/<model> führt einen begrenzten Bildverständnis-Turn des Codex-App-Servers aus; openai-codex/<model> verwendet den OAuth-Provider-Pfad von OpenAI Codex.
Zustandslose Ausführungsbefehle verwenden standardmäßig lokal.
Gateway-verwaltete Zustandsbefehle verwenden standardmäßig den Gateway.
Der normale lokale Pfad erfordert nicht, dass der Gateway läuft.
Lokales model run ist eine schlanke einmalige Provider-Completion. Es löst das konfigurierte Agentenmodell und die Authentifizierung auf, startet aber keinen Chat-Agent-Turn, lädt keine Tools und öffnet keine gebündelten MCP-Server.
model run --file akzeptiert Bilddateien, erkennt deren MIME-Typ und sendet sie mit dem angegebenen Prompt an das ausgewählte Modell. Wiederholen Sie --file für mehrere Bilder.
model run --file lehnt Nicht-Bildeingaben ab. Verwenden Sie infer audio transcribe für Audiodateien und infer video describe für Videodateien.
model run --gateway prüft Gateway-Routing, gespeicherte Authentifizierung, Provider-Auswahl und die eingebettete Laufzeit, läuft aber weiterhin als roher Modell-Probe: Es sendet den angegebenen Prompt und etwaige Bildanhänge ohne vorheriges Sitzungstranskript, Bootstrap-/AGENTS-Kontext, Context-Engine-Zusammenstellung, Tools oder gebündelte MCP-Server.
model run --gateway --model <provider/model> erfordert vertrauenswürdige Operator-Gateway-Anmeldedaten, da die Anfrage den Gateway auffordert, einen einmaligen Provider/Modell-Override auszuführen.
Lokales model run --thinking verwendet den schlanken Provider-Completion-Pfad; Provider-spezifische Stufen wie adaptive und max werden der nächstliegenden portablen Simple-Completion-Stufe zugeordnet.

Modell

Verwenden Sie model für Provider-gestützte Textinferenz und Modell-/Provider-Inspektion.

bash

OmeniaClaw infer model run --prompt "Reply with exactly: smoke-ok" --jsonOmeniaClaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --jsonOmeniaClaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --jsonOmeniaClaw infer model run --prompt "Use more reasoning here" --thinking high --jsonOmeniaClaw infer model providers --jsonOmeniaClaw infer model inspect --name gpt-5.5 --json

Verwenden Sie vollständige <provider/model>-Referenzen, um einen bestimmten Provider per Smoke-Test zu prüfen, ohne den Gateway zu starten oder die vollständige Agent-Tool-Oberfläche zu laden:

bash

OmeniaClaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model openai/gpt-4.1 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --json

Hinweise:

Lokales model run ist der engste CLI-Smoke-Test für Provider-/Modell-/Authentifizierungszustand, da es für Nicht-Codex-Provider nur den angegebenen Prompt an das ausgewählte Modell sendet.
Lokales model run --model <provider/model> kann exakte gebündelte statische Katalogzeilen aus models list --all verwenden, bevor dieser Provider in die Konfiguration geschrieben wurde. Provider-Authentifizierung ist weiterhin erforderlich; fehlende Anmeldedaten schlagen als Authentifizierungsfehler fehl, nicht als Unknown model.
Lassen Sie bei Reasoning-Probes für Mistral Medium 3.5 die Temperatur ungesetzt bzw. auf dem Standardwert. Mistral lehnt reasoning_effort="high" plus temperature: 0 ab; verwenden Sie mistral/mistral-medium-3-5 mit Standardtemperatur oder einem Reasoning-Modus-Wert ungleich null, etwa 0.7.
Lokale openai-codex/*-Probes sind die enge Ausnahme: OmeniaClaw fügt eine minimale Systemanweisung hinzu, damit der Codex-Responses-Transport sein erforderliches instructions-Feld befüllen kann, ohne vollständigen Agentenkontext, Tools, Memory oder Sitzungstranskript hinzuzufügen.
Lokales model run --file behält diesen schlanken Pfad bei und hängt Bildinhalte direkt an die einzelne Benutzernachricht an. Gängige Bilddateien wie PNG, JPEG und WebP funktionieren, wenn ihr MIME-Typ als image/* erkannt wird; nicht unterstützte oder nicht erkannte Dateien schlagen fehl, bevor der Provider aufgerufen wird.
model run --file ist am besten geeignet, wenn Sie das ausgewählte multimodale Textmodell direkt testen möchten. Verwenden Sie infer image describe, wenn Sie OmeniaClaws Provider-Auswahl für Bildverständnis und das Standardrouting für Bildmodelle nutzen möchten.
Das ausgewählte Modell muss Bildeingaben unterstützen; reine Textmodelle können die Anfrage auf Provider-Ebene ablehnen.
model run --prompt muss Text enthalten, der nicht nur aus Leerraum besteht; leere Prompts werden abgelehnt, bevor lokale Provider oder der Gateway aufgerufen werden.
Lokales model run beendet sich mit einem Exitcode ungleich null, wenn der Provider keine Textausgabe zurückgibt, sodass nicht erreichbare lokale Provider und leere Completions nicht wie erfolgreiche Probes aussehen.
Verwenden Sie model run --gateway, wenn Sie Gateway-Routing, Agent-Laufzeit-Setup oder Gateway-verwalteten Provider-Zustand testen müssen, während die Modelleingabe roh bleibt. Verwenden Sie OmeniaClaw agent oder Chat-Oberflächen, wenn Sie den vollständigen Agentenkontext, Tools, Memory und Sitzungstranskript benötigen.
model auth login, model auth logout und model auth status verwalten den gespeicherten Provider-Authentifizierungszustand.

Bild

Verwenden Sie image für Generierung, Bearbeitung und Beschreibung.

bash

OmeniaClaw infer image generate --prompt "friendly lobster illustration" --jsonOmeniaClaw infer image generate --prompt "cinematic product photo of headphones" --jsonOmeniaClaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --jsonOmeniaClaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --jsonOmeniaClaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --jsonOmeniaClaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --jsonOmeniaClaw infer image describe --file ./photo.jpg --jsonOmeniaClaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --jsonOmeniaClaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --jsonOmeniaClaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --jsonOmeniaClaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --json

Hinweise:

Verwenden Sie image edit, wenn Sie mit vorhandenen Eingabedateien beginnen.
Verwenden Sie --size, --aspect-ratio oder --resolution mit image edit für Provider/Modelle, die Geometriehinweise bei Bearbeitungen von Referenzbildern unterstützen.
Verwenden Sie --output-format png --background transparent mit --model openai/gpt-image-1.5 für OpenAI-PNG-Ausgaben mit transparentem Hintergrund; --openai-background bleibt als OpenAI-spezifischer Alias verfügbar. Provider, die keine Hintergrundunterstützung deklarieren, melden den Hinweis als ignorierte Überschreibung.
Verwenden Sie image providers --json, um zu prüfen, welche gebündelten Bild-Provider auffindbar, konfiguriert und ausgewählt sind und welche Generierungs-/Bearbeitungsfunktionen jeder Provider bereitstellt.
Verwenden Sie image generate --model <provider/model> --json als engsten Live- CLI-Smoke-Test für Änderungen an der Bildgenerierung. Beispiel:
bash
```
OmeniaClaw infer image providers --jsonOmeniaClaw infer image generate \  --model google/gemini-3.1-flash-image-preview \  --prompt "Minimal flat test image: one blue square on a white background, no text." \  --output ./OmeniaClaw-infer-image-smoke.png \  --json
```
Die JSON-Antwort meldet ok, provider, model, attempts und geschriebene Ausgabepfade. Wenn --output gesetzt ist, kann die finale Erweiterung dem vom Provider zurückgegebenen MIME-Typ folgen.
Verwenden Sie für image describe und image describe-many --prompt, um dem Vision-Modell eine aufgabenspezifische Anweisung wie OCR, Vergleich, UI-Prüfung oder knappe Bildbeschreibung zu geben.
Verwenden Sie --timeout-ms bei langsamen lokalen Vision-Modellen oder Kaltstarts von Ollama.
Für image describe muss --model ein bildfähiges <provider/model> sein.
Für lokale Ollama-Vision-Modelle laden Sie zuerst das Modell herunter und setzen OLLAMA_API_KEY auf einen beliebigen Platzhalterwert, zum Beispiel ollama-local. Siehe Ollama.

Audio

Verwenden Sie audio für Dateitranskription.

bash

OmeniaClaw infer audio transcribe --file ./memo.m4a --jsonOmeniaClaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --jsonOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Hinweise:

audio transcribe ist für Dateitranskription gedacht, nicht für die Verwaltung von Echtzeitsitzungen.
--model muss <provider/model> sein.

TTS

Verwenden Sie tts für Sprachsynthese und den TTS-Provider-Status.

bash

OmeniaClaw infer tts convert --text "hello from OmeniaClaw" --output ./hello.mp3 --jsonOmeniaClaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --jsonOmeniaClaw infer tts providers --jsonOmeniaClaw infer tts status --json

Hinweise:

tts status verwendet standardmäßig den Gateway, weil der Befehl den vom Gateway verwalteten TTS-Status widerspiegelt.
Verwenden Sie tts providers, tts voices und tts set-provider, um TTS-Verhalten zu prüfen und zu konfigurieren.

Video

Verwenden Sie video für Generierung und Beschreibung.

bash

OmeniaClaw infer video generate --prompt "cinematic sunset over the ocean" --jsonOmeniaClaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --json

Hinweise:

video generate akzeptiert --size, --aspect-ratio, --resolution, --duration, --audio, --watermark und --timeout-ms und leitet sie an die Laufzeit für Videogenerierung weiter.
--model muss für video describe <provider/model> sein.

Web

Verwenden Sie web für Such- und Abrufworkflows.

bash

OmeniaClaw infer web search --query "OmeniaClaw docs" --jsonOmeniaClaw infer web search --query "OmeniaClaw infer web providers" --jsonOmeniaClaw infer web fetch --url https://omeniaclaw.com/cli/infer --jsonOmeniaClaw infer web providers --json

Hinweise:

Verwenden Sie web providers, um verfügbare, konfigurierte und ausgewählte Provider zu prüfen.

Embedding

Verwenden Sie embedding für Vektorerstellung und Prüfung von Embedding-Providern.

bash

OmeniaClaw infer embedding create --text "friendly lobster" --jsonOmeniaClaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --jsonOmeniaClaw infer embedding providers --json

JSON-Ausgabe

Infer-Befehle normalisieren JSON-Ausgaben unter einer gemeinsamen Hülle:

json

{  "ok": true,  "capability": "image.generate",  "transport": "local",  "provider": "openai",  "model": "gpt-image-2",  "attempts": [],  "outputs": []}

Felder auf oberster Ebene sind stabil:

ok
capability
transport
provider
model
attempts
outputs
error

Für Befehle mit generierten Medien enthält outputs Dateien, die von OmeniaClaw geschrieben wurden. Verwenden Sie path, mimeType, size und alle medienspezifischen Abmessungen in diesem Array für Automatisierung, statt menschenlesbare Standardausgabe zu parsen.

Häufige Fallstricke

bash

# BadOmeniaClaw infer media image generate --prompt "friendly lobster" # GoodOmeniaClaw infer image generate --prompt "friendly lobster"

bash

# BadOmeniaClaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json # GoodOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Hinweise

OmeniaClaw capability ... ist ein Alias für OmeniaClaw infer ....

Inferenz-CLI

infer in einen Skill umwandeln

Warum infer verwenden

Befehlsbaum

Häufige Aufgaben

Verhalten

Modell

Bild

Audio

TTS

Video

Web

Embedding

JSON-Ausgabe

Häufige Fallstricke

Hinweise

Verwandte Themen

On this page

Molty