CLI commands

CLI d’inférence

OmeniaClaw infer est la surface headless canonique pour les workflows d’inférence adossés à des fournisseurs.

Il expose volontairement des familles de capacités, pas les noms RPC bruts du Gateway ni les identifiants bruts d’outils d’agent.

Transformer infer en Skill

Copiez-collez ceci dans un agent :

text

Read https://omeniaclaw.com/cli/infer, then create a skill that routes my common workflows to `OmeniaClaw infer`.Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.

Une bonne Skill basée sur infer doit :

associer les intentions utilisateur courantes à la bonne sous-commande infer
inclure quelques exemples infer canoniques pour les workflows qu’elle couvre
préférer OmeniaClaw infer ... dans les exemples et suggestions
éviter de redocumenter toute la surface infer dans le corps de la Skill

Couverture typique d’une Skill centrée sur infer :

OmeniaClaw infer model run
OmeniaClaw infer image generate
OmeniaClaw infer audio transcribe
OmeniaClaw infer tts convert
OmeniaClaw infer web search
OmeniaClaw infer embedding create

Pourquoi utiliser infer

OmeniaClaw infer fournit une CLI cohérente pour les tâches d’inférence adossées à des fournisseurs dans OmeniaClaw.

Avantages :

Utilisez les fournisseurs et modèles déjà configurés dans OmeniaClaw au lieu de câbler des wrappers ponctuels pour chaque backend.
Gardez les workflows de modèle, image, transcription audio, TTS, vidéo, web et embedding sous une seule arborescence de commandes.
Utilisez une forme de sortie --json stable pour les scripts, l’automatisation et les workflows pilotés par agent.
Préférez une surface OmeniaClaw de première partie lorsque la tâche consiste fondamentalement à « exécuter une inférence ».
Utilisez le chemin local normal sans exiger le Gateway pour la plupart des commandes infer.

Pour les vérifications de fournisseur de bout en bout, préférez OmeniaClaw infer ... une fois les tests de fournisseur de plus bas niveau au vert. Cela exerce la CLI distribuée, le chargement de configuration, la résolution de l’agent par défaut, l’activation des plugins groupés et le runtime de capacités partagé avant l’émission de la requête au fournisseur.

Arborescence des commandes

text

 OmeniaClaw infer  list  inspect   model    run    list    inspect    providers    auth login    auth logout    auth status   image    generate    edit    describe    describe-many    providers   audio    transcribe    providers   tts    convert    voices    providers    status    enable    disable    set-provider   video    generate    describe    providers   web    search    fetch    providers   embedding    create    providers

Tâches courantes

Ce tableau associe les tâches d’inférence courantes à la commande infer correspondante.

Tâche	Commande	Remarques
Exécuter un prompt texte/modèle	`OmeniaClaw infer model run --prompt "..." --json`	Utilise le chemin local normal par défaut
Exécuter un prompt de modèle sur des images	`OmeniaClaw infer model run --prompt "Describe this" --file ./image.png --model provider/model`	Répétez `--file` pour plusieurs entrées image
Générer une image	`OmeniaClaw infer image generate --prompt "..." --json`	Utilisez `image edit` en partant d’un fichier existant
Décrire un fichier image	`OmeniaClaw infer image describe --file ./image.png --prompt "..." --json`	`--model` doit être un `<provider/model>` capable de traiter des images
Transcrire de l’audio	`OmeniaClaw infer audio transcribe --file ./memo.m4a --json`	`--model` doit être `<provider/model>`
Synthétiser la parole	`OmeniaClaw infer tts convert --text "..." --output ./speech.mp3 --json`	`tts status` est orienté Gateway
Générer une vidéo	`OmeniaClaw infer video generate --prompt "..." --json`	Prend en charge les indications de fournisseur comme `--resolution`
Décrire un fichier vidéo	`OmeniaClaw infer video describe --file ./clip.mp4 --json`	`--model` doit être `<provider/model>`
Rechercher sur le web	`OmeniaClaw infer web search --query "..." --json`
Récupérer une page web	`OmeniaClaw infer web fetch --url https://example.com --json`
Créer des embeddings	`OmeniaClaw infer embedding create --text "..." --json`

Comportement

OmeniaClaw infer ... est la surface CLI principale pour ces workflows.
Utilisez --json lorsque la sortie sera consommée par une autre commande ou un script.
Utilisez --provider ou --model provider/model lorsqu’un backend spécifique est requis.
Utilisez model run --thinking <level> pour transmettre un niveau de réflexion/raisonnement ponctuel (off, minimal, low, medium, high, adaptive, xhigh ou max) tout en gardant l’exécution brute.
Pour image describe, audio transcribe et video describe, --model doit utiliser la forme <provider/model>.
Pour image describe, un --model explicite exécute directement ce fournisseur/modèle. Le modèle doit être capable de traiter des images dans le catalogue de modèles ou la configuration du fournisseur. codex/<model> exécute un tour borné de compréhension d’image du serveur d’application Codex ; openai-codex/<model> utilise le chemin du fournisseur OAuth OpenAI Codex.
Les commandes d’exécution sans état utilisent local par défaut.
Les commandes d’état gérées par le Gateway utilisent le Gateway par défaut.
Le chemin local normal n’exige pas que le Gateway soit en cours d’exécution.
model run local est une complétion fournisseur ponctuelle légère. Il résout le modèle et l’authentification de l’agent configuré, mais ne démarre pas de tour d’agent de chat, ne charge pas d’outils et n’ouvre pas les serveurs MCP groupés.
model run --file accepte les fichiers image, détecte leur type MIME et les envoie avec le prompt fourni au modèle sélectionné. Répétez --file pour plusieurs images.
model run --file rejette les entrées non image. Utilisez infer audio transcribe pour les fichiers audio et infer video describe pour les fichiers vidéo.
model run --gateway exerce le routage Gateway, l’authentification enregistrée, la sélection de fournisseur et le runtime intégré, mais s’exécute toujours comme une sonde de modèle brute : il envoie le prompt fourni et les éventuelles pièces jointes image sans transcript de session antérieur, contexte bootstrap/AGENTS, assemblage du moteur de contexte, outils ou serveurs MCP groupés.
model run --gateway --model <provider/model> exige un identifiant Gateway d’opérateur approuvé, car la requête demande au Gateway d’exécuter un remplacement ponctuel de fournisseur/modèle.
model run --thinking local utilise le chemin léger de complétion fournisseur ; les niveaux propres aux fournisseurs comme adaptive et max sont mappés au niveau de complétion simple portable le plus proche.

Modèle

Utilisez model pour l’inférence texte adossée à un fournisseur et l’inspection des modèles/fournisseurs.

bash

OmeniaClaw infer model run --prompt "Reply with exactly: smoke-ok" --jsonOmeniaClaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --jsonOmeniaClaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --jsonOmeniaClaw infer model run --prompt "Use more reasoning here" --thinking high --jsonOmeniaClaw infer model providers --jsonOmeniaClaw infer model inspect --name gpt-5.5 --json

Utilisez des références <provider/model> complètes pour effectuer un smoke-test d’un fournisseur spécifique sans démarrer le Gateway ni charger toute la surface d’outils de l’agent :

bash

OmeniaClaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model openai/gpt-4.1 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --json

Remarques :

model run local est le smoke CLI le plus étroit pour l’état de santé fournisseur/modèle/authentification, car, pour les fournisseurs non-Codex, il envoie uniquement le prompt fourni au modèle sélectionné.
model run --model <provider/model> local peut utiliser les lignes exactes du catalogue statique groupé depuis models list --all avant que ce fournisseur soit écrit dans la configuration. L’authentification du fournisseur reste requise ; les identifiants manquants échouent comme erreurs d’authentification, pas comme Unknown model.
Pour les sondes de raisonnement Mistral Medium 3.5, laissez la température non définie/par défaut. Mistral rejette reasoning_effort="high" plus temperature: 0 ; utilisez mistral/mistral-medium-3-5 avec la température par défaut ou une valeur de mode raisonnement non nulle comme 0.7.
Les sondes locales openai-codex/* sont l’exception étroite : OmeniaClaw ajoute une instruction système minimale afin que le transport Codex Responses puisse renseigner son champ instructions requis, sans ajouter le contexte complet de l’agent, les outils, la mémoire ou le transcript de session.
model run --file local garde ce chemin léger et joint le contenu image directement au message utilisateur unique. Les fichiers image courants comme PNG, JPEG et WebP fonctionnent lorsque leur type MIME est détecté comme image/* ; les fichiers non pris en charge ou non reconnus échouent avant l’appel au fournisseur.
model run --file est préférable lorsque vous voulez tester directement le modèle texte multimodal sélectionné. Utilisez infer image describe lorsque vous voulez la sélection de fournisseur de compréhension d’image d’OmeniaClaw et le routage par défaut du modèle image.
Le modèle sélectionné doit prendre en charge les entrées image ; les modèles texte uniquement peuvent rejeter la requête au niveau du fournisseur.
model run --prompt doit contenir du texte non composé uniquement d’espaces ; les prompts vides sont rejetés avant l’appel aux fournisseurs locaux ou au Gateway.
model run local se termine avec un code non nul lorsque le fournisseur ne renvoie aucune sortie texte, afin que les fournisseurs locaux inaccessibles et les complétions vides ne ressemblent pas à des sondes réussies.
Utilisez model run --gateway lorsque vous devez tester le routage Gateway, la configuration du runtime d’agent ou l’état fournisseur géré par le Gateway tout en gardant l’entrée du modèle brute. Utilisez OmeniaClaw agent ou les surfaces de chat lorsque vous voulez le contexte complet de l’agent, les outils, la mémoire et le transcript de session.
model auth login, model auth logout et model auth status gèrent l’état d’authentification fournisseur enregistré.

Image

Utilisez image pour la génération, la modification et la description.

bash

OmeniaClaw infer image generate --prompt "friendly lobster illustration" --jsonOmeniaClaw infer image generate --prompt "cinematic product photo of headphones" --jsonOmeniaClaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --jsonOmeniaClaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --jsonOmeniaClaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --jsonOmeniaClaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --jsonOmeniaClaw infer image describe --file ./photo.jpg --jsonOmeniaClaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --jsonOmeniaClaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --jsonOmeniaClaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --jsonOmeniaClaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --json

Remarques :

Utilisez image edit lorsque vous partez de fichiers d’entrée existants.
Utilisez --size, --aspect-ratio ou --resolution avec image edit pour les fournisseurs/modèles qui prennent en charge les indications de géométrie lors des modifications d’images de référence.
Utilisez --output-format png --background transparent avec --model openai/gpt-image-1.5 pour produire une sortie PNG OpenAI avec arrière-plan transparent ; --openai-background reste disponible comme alias propre à OpenAI. Les fournisseurs qui ne déclarent pas la prise en charge de l’arrière-plan signalent l’indication comme une surcharge ignorée.
Utilisez image providers --json pour vérifier quels fournisseurs d’images intégrés sont détectables, configurés, sélectionnés, et quelles capacités de génération/modification chaque fournisseur expose.
Utilisez image generate --model <provider/model> --json comme test de fumée CLI en direct le plus ciblé pour les changements de génération d’images. Exemple :
bash
```
OmeniaClaw infer image providers --jsonOmeniaClaw infer image generate \  --model google/gemini-3.1-flash-image-preview \  --prompt "Minimal flat test image: one blue square on a white background, no text." \  --output ./OmeniaClaw-infer-image-smoke.png \  --json
```
La réponse JSON indique ok, provider, model, attempts et les chemins de sortie écrits. Lorsque --output est défini, l’extension finale peut suivre le type MIME renvoyé par le fournisseur.
Pour image describe et image describe-many, utilisez --prompt afin de donner au modèle de vision une instruction propre à la tâche, comme l’OCR, la comparaison, l’inspection d’interface utilisateur ou un sous-titrage concis.
Utilisez --timeout-ms avec les modèles de vision locaux lents ou les démarrages à froid d’Ollama.
Pour image describe, --model doit être un <provider/model> compatible avec l’image.
Pour les modèles de vision Ollama locaux, récupérez d’abord le modèle et définissez OLLAMA_API_KEY sur n’importe quelle valeur d’espace réservé, par exemple ollama-local. Consultez Ollama.

Audio

Utilisez audio pour la transcription de fichiers.

bash

OmeniaClaw infer audio transcribe --file ./memo.m4a --jsonOmeniaClaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --jsonOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Remarques :

audio transcribe sert à transcrire des fichiers, pas à gérer des sessions en temps réel.
--model doit être <provider/model>.

TTS

Utilisez tts pour la synthèse vocale et l’état du fournisseur TTS.

bash

OmeniaClaw infer tts convert --text "hello from OmeniaClaw" --output ./hello.mp3 --jsonOmeniaClaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --jsonOmeniaClaw infer tts providers --jsonOmeniaClaw infer tts status --json

Remarques :

tts status utilise Gateway par défaut, car il reflète l’état TTS géré par Gateway.
Utilisez tts providers, tts voices et tts set-provider pour inspecter et configurer le comportement TTS.

Vidéo

Utilisez video pour la génération et la description.

bash

OmeniaClaw infer video generate --prompt "cinematic sunset over the ocean" --jsonOmeniaClaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --json

Remarques :

video generate accepte --size, --aspect-ratio, --resolution, --duration, --audio, --watermark et --timeout-ms, puis les transmet au runtime de génération vidéo.
--model doit être <provider/model> pour video describe.

Web

Utilisez web pour les flux de recherche et de récupération.

bash

OmeniaClaw infer web search --query "OmeniaClaw docs" --jsonOmeniaClaw infer web search --query "OmeniaClaw infer web providers" --jsonOmeniaClaw infer web fetch --url https://omeniaclaw.com/cli/infer --jsonOmeniaClaw infer web providers --json

Remarques :

Utilisez web providers pour inspecter les fournisseurs disponibles, configurés et sélectionnés.

Plongement vectoriel

Utilisez embedding pour la création de vecteurs et l’inspection des fournisseurs de plongements vectoriels.

bash

OmeniaClaw infer embedding create --text "friendly lobster" --jsonOmeniaClaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --jsonOmeniaClaw infer embedding providers --json

Sortie JSON

Les commandes d’inférence normalisent la sortie JSON dans une enveloppe partagée :

json

{  "ok": true,  "capability": "image.generate",  "transport": "local",  "provider": "openai",  "model": "gpt-image-2",  "attempts": [],  "outputs": []}

Les champs de premier niveau sont stables :

ok
capability
transport
provider
model
attempts
outputs
error

Pour les commandes de médias générés, outputs contient les fichiers écrits par OmeniaClaw. Utilisez path, mimeType, size et toute dimension propre au média dans ce tableau pour l’automatisation, au lieu d’analyser la sortie stdout lisible par l’humain.

Pièges courants

bash

# BadOmeniaClaw infer media image generate --prompt "friendly lobster" # GoodOmeniaClaw infer image generate --prompt "friendly lobster"

bash

# BadOmeniaClaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json # GoodOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Remarques

OmeniaClaw capability ... est un alias de OmeniaClaw infer ....

Associés

Was this useful?

CLI d’inférence

Transformer infer en Skill

Pourquoi utiliser infer

Arborescence des commandes

Tâches courantes

Comportement

Modèle

Image

Audio

TTS

Vidéo

Web

Plongement vectoriel

Sortie JSON

Pièges courants

Remarques

Associés

On this page

Molty