CLI commands

CLI inferencji

OmeniaClaw infer to kanoniczny bezgłowy interfejs dla przepływów pracy wnioskowania wspieranych przez dostawców.

Celowo udostępnia rodziny możliwości, a nie surowe nazwy RPC Gateway ani surowe identyfikatory narzędzi agentów.

Przekształć infer w umiejętność

Skopiuj i wklej to do agenta:

text

Read https://omeniaclaw.com/cli/infer, then create a skill that routes my common workflows to `OmeniaClaw infer`.Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.

Dobra umiejętność oparta na infer powinna:

mapować typowe intencje użytkownika na właściwe podpolecenie infer
zawierać kilka kanonicznych przykładów infer dla obsługiwanych przepływów pracy
preferować OmeniaClaw infer ... w przykładach i sugestiach
unikać ponownego dokumentowania całego interfejsu infer w treści umiejętności

Typowy zakres umiejętności skoncentrowanej na infer:

OmeniaClaw infer model run
OmeniaClaw infer image generate
OmeniaClaw infer audio transcribe
OmeniaClaw infer tts convert
OmeniaClaw infer web search
OmeniaClaw infer embedding create

Dlaczego warto używać infer

OmeniaClaw infer zapewnia jedno spójne CLI dla zadań wnioskowania wspieranych przez dostawców w OmeniaClaw.

Korzyści:

Używaj dostawców i modeli już skonfigurowanych w OmeniaClaw zamiast tworzyć jednorazowe wrappery dla każdego backendu.
Trzymaj przepływy pracy związane z modelami, obrazami, transkrypcją audio, TTS, wideo, siecią i embeddingami w jednym drzewie poleceń.
Używaj stabilnego kształtu wyjścia --json dla skryptów, automatyzacji i przepływów pracy sterowanych przez agentów.
Preferuj własny interfejs OmeniaClaw, gdy zadanie zasadniczo polega na „uruchomieniu wnioskowania”.
Używaj normalnej ścieżki lokalnej bez wymagania Gateway dla większości poleceń infer.

Do kompleksowych kontroli dostawców preferuj OmeniaClaw infer ..., gdy testy dostawców niższego poziomu są już zielone. Sprawdza to dostarczane CLI, ładowanie konfiguracji, rozwiązywanie domyślnego agenta, aktywację dołączonego pluginu oraz współdzielone środowisko wykonawcze możliwości, zanim zostanie wykonane żądanie do dostawcy.

Drzewo poleceń

text

 OmeniaClaw infer  list  inspect   model    run    list    inspect    providers    auth login    auth logout    auth status   image    generate    edit    describe    describe-many    providers   audio    transcribe    providers   tts    convert    voices    providers    status    enable    disable    set-provider   video    generate    describe    providers   web    search    fetch    providers   embedding    create    providers

Typowe zadania

Ta tabela mapuje typowe zadania wnioskowania na odpowiadające im polecenie infer.

Zadanie	Polecenie	Uwagi
Uruchom prompt tekstowy/modelu	`OmeniaClaw infer model run --prompt "..." --json`	Domyślnie używa normalnej ścieżki lokalnej
Uruchom prompt modelu na obrazach	`OmeniaClaw infer model run --prompt "Describe this" --file ./image.png --model provider/model`	Powtórz `--file` dla wielu wejść obrazów
Wygeneruj obraz	`OmeniaClaw infer image generate --prompt "..." --json`	Użyj `image edit`, gdy zaczynasz od istniejącego pliku
Opisz plik obrazu	`OmeniaClaw infer image describe --file ./image.png --prompt "..." --json`	`--model` musi być modelem `<provider/model>` obsługującym obrazy
Przepisz audio	`OmeniaClaw infer audio transcribe --file ./memo.m4a --json`	`--model` musi mieć postać `<provider/model>`
Zsyntetyzuj mowę	`OmeniaClaw infer tts convert --text "..." --output ./speech.mp3 --json`	`tts status` jest zorientowane na Gateway
Wygeneruj wideo	`OmeniaClaw infer video generate --prompt "..." --json`	Obsługuje podpowiedzi dostawcy, takie jak `--resolution`
Opisz plik wideo	`OmeniaClaw infer video describe --file ./clip.mp4 --json`	`--model` musi mieć postać `<provider/model>`
Przeszukaj sieć	`OmeniaClaw infer web search --query "..." --json`
Pobierz stronę internetową	`OmeniaClaw infer web fetch --url https://example.com --json`
Utwórz embeddingi	`OmeniaClaw infer embedding create --text "..." --json`

Zachowanie

OmeniaClaw infer ... jest podstawowym interfejsem CLI dla tych przepływów pracy.
Używaj --json, gdy wyjście będzie używane przez inne polecenie lub skrypt.
Używaj --provider albo --model provider/model, gdy wymagany jest konkretny backend.
Używaj model run --thinking <level>, aby przekazać jednorazowy poziom myślenia/rozumowania (off, minimal, low, medium, high, adaptive, xhigh albo max) przy zachowaniu surowego uruchomienia.
Dla image describe, audio transcribe i video describe opcja --model musi używać formy <provider/model>.
Dla image describe jawny --model uruchamia bezpośrednio ten model/dostawcę. Model musi obsługiwać obrazy w katalogu modeli lub konfiguracji dostawcy. codex/<model> uruchamia ograniczony przebieg rozumienia obrazu przez serwer aplikacji Codex; openai-codex/<model> używa ścieżki dostawcy OAuth OpenAI Codex.
Bezstanowe polecenia wykonania domyślnie działają lokalnie.
Polecenia stanu zarządzanego przez Gateway domyślnie używają Gateway.
Normalna ścieżka lokalna nie wymaga działania Gateway.
Lokalne model run to lekka jednorazowa kompletacja dostawcy. Rozwiązuje skonfigurowany model agenta i uwierzytelnianie, ale nie uruchamia tury agenta czatu, nie ładuje narzędzi ani nie otwiera dołączonych serwerów MCP.
model run --file przyjmuje pliki obrazów, wykrywa ich typ MIME i wysyła je z podanym promptem do wybranego modelu. Powtórz --file dla wielu obrazów.
model run --file odrzuca wejścia inne niż obrazy. Użyj infer audio transcribe dla plików audio i infer video describe dla plików wideo.
model run --gateway sprawdza trasowanie Gateway, zapisane uwierzytelnianie, wybór dostawcy i osadzone środowisko wykonawcze, ale nadal działa jako surowa próba modelu: wysyła podany prompt i ewentualne załączniki obrazów bez wcześniejszego transkryptu sesji, kontekstu bootstrap/AGENTS, składania przez silnik kontekstu, narzędzi ani dołączonych serwerów MCP.
model run --gateway --model <provider/model> wymaga zaufanego poświadczenia operatora Gateway, ponieważ żądanie prosi Gateway o uruchomienie jednorazowego nadpisania dostawcy/modelu.
Lokalne model run --thinking używa lekkiej ścieżki kompletacji dostawcy; poziomy specyficzne dla dostawcy, takie jak adaptive i max, są mapowane na najbliższy przenośny poziom prostej kompletacji.

Model

Użyj model do wnioskowania tekstowego wspieranego przez dostawcę oraz inspekcji modeli/dostawców.

bash

OmeniaClaw infer model run --prompt "Reply with exactly: smoke-ok" --jsonOmeniaClaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --jsonOmeniaClaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --jsonOmeniaClaw infer model run --prompt "Use more reasoning here" --thinking high --jsonOmeniaClaw infer model providers --jsonOmeniaClaw infer model inspect --name gpt-5.5 --json

Używaj pełnych odwołań <provider/model>, aby wykonać smoke test konkretnego dostawcy bez uruchamiania Gateway ani ładowania pełnego interfejsu narzędzi agenta:

bash

OmeniaClaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model openai/gpt-4.1 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --json

Uwagi:

Lokalne model run to najwęższy smoke test CLI dla kondycji dostawcy/modelu/uwierzytelniania, ponieważ dla dostawców innych niż Codex wysyła do wybranego modelu tylko podany prompt.
Lokalne model run --model <provider/model> może używać dokładnych dołączonych statycznych wierszy katalogu z models list --all, zanim ten dostawca zostanie zapisany w konfiguracji. Uwierzytelnianie dostawcy nadal jest wymagane; brakujące poświadczenia kończą się błędami uwierzytelniania, a nie Unknown model.
Dla prób rozumowania Mistral Medium 3.5 pozostaw temperaturę nieustawioną/domyślną. Mistral odrzuca reasoning_effort="high" plus temperature: 0; użyj mistral/mistral-medium-3-5 z domyślną temperaturą albo niezerową wartością trybu rozumowania, taką jak 0.7.
Lokalne próby openai-codex/* są wąskim wyjątkiem: OmeniaClaw dodaje minimalną instrukcję systemową, aby transport Codex Responses mógł wypełnić wymagane pole instructions, bez dodawania pełnego kontekstu agenta, narzędzi, pamięci ani transkryptu sesji.
Lokalne model run --file zachowuje tę lekką ścieżkę i dołącza zawartość obrazu bezpośrednio do pojedynczej wiadomości użytkownika. Typowe pliki obrazów, takie jak PNG, JPEG i WebP, działają, gdy ich typ MIME zostanie wykryty jako image/*; nieobsługiwane lub nierozpoznane pliki kończą się błędem przed wywołaniem dostawcy.
model run --file jest najlepsze, gdy chcesz bezpośrednio przetestować wybrany multimodalny model tekstowy. Użyj infer image describe, gdy chcesz skorzystać z wyboru dostawcy rozumienia obrazów w OmeniaClaw i domyślnego trasowania modelu obrazowego.
Wybrany model musi obsługiwać wejście obrazowe; modele tylko tekstowe mogą odrzucić żądanie na warstwie dostawcy.
model run --prompt musi zawierać tekst inny niż białe znaki; puste prompty są odrzucane przed wywołaniem lokalnych dostawców lub Gateway.
Lokalne model run kończy się kodem niezerowym, gdy dostawca nie zwróci żadnego wyjścia tekstowego, więc niedostępni lokalni dostawcy i puste kompletacje nie wyglądają jak udane próby.
Użyj model run --gateway, gdy musisz przetestować trasowanie Gateway, konfigurację środowiska wykonawczego agenta lub stan dostawcy zarządzany przez Gateway, zachowując surowe wejście modelu. Użyj OmeniaClaw agent albo interfejsów czatu, gdy chcesz pełnego kontekstu agenta, narzędzi, pamięci i transkryptu sesji.
model auth login, model auth logout i model auth status zarządzają zapisanym stanem uwierzytelniania dostawcy.

Obraz

Użyj image do generowania, edycji i opisu.

bash

OmeniaClaw infer image generate --prompt "friendly lobster illustration" --jsonOmeniaClaw infer image generate --prompt "cinematic product photo of headphones" --jsonOmeniaClaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --jsonOmeniaClaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --jsonOmeniaClaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --jsonOmeniaClaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --jsonOmeniaClaw infer image describe --file ./photo.jpg --jsonOmeniaClaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --jsonOmeniaClaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --jsonOmeniaClaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --jsonOmeniaClaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --json

Uwagi:

Używaj image edit, gdy zaczynasz od istniejących plików wejściowych.
Używaj --size, --aspect-ratio lub --resolution z image edit dla dostawców/modeli, które obsługują wskazówki geometrii przy edycjach obrazów referencyjnych.
Używaj --output-format png --background transparent z --model openai/gpt-image-1.5 dla wyjścia OpenAI PNG z przezroczystym tłem; --openai-background pozostaje dostępne jako alias specyficzny dla OpenAI. Dostawcy, którzy nie deklarują obsługi tła, zgłaszają tę wskazówkę jako zignorowane nadpisanie.
Używaj image providers --json, aby sprawdzić, którzy dołączani dostawcy obrazów są wykrywalni, skonfigurowani, wybrani oraz jakie możliwości generowania/edycji udostępnia każdy dostawca.
Używaj image generate --model <provider/model> --json jako najwęższego aktywnego testu CLI dla zmian w generowaniu obrazów. Przykład:
bash
```
OmeniaClaw infer image providers --jsonOmeniaClaw infer image generate \  --model google/gemini-3.1-flash-image-preview \  --prompt "Minimal flat test image: one blue square on a white background, no text." \  --output ./OmeniaClaw-infer-image-smoke.png \  --json
```
Odpowiedź JSON raportuje ok, provider, model, attempts oraz zapisane ścieżki wyjściowe. Gdy ustawiono --output, końcowe rozszerzenie może wynikać ze zwróconego przez dostawcę typu MIME.
Dla image describe i image describe-many używaj --prompt, aby przekazać modelowi wizyjnemu instrukcję specyficzną dla zadania, taką jak OCR, porównanie, inspekcja UI lub zwięzły podpis.
Używaj --timeout-ms z wolnymi lokalnymi modelami wizyjnymi lub zimnymi startami Ollama.
Dla image describe parametr --model musi być obsługującym obrazy <provider/model>.
Dla lokalnych modeli wizyjnych Ollama najpierw pobierz model i ustaw OLLAMA_API_KEY na dowolną wartość zastępczą, na przykład ollama-local. Zobacz Ollama.

Dźwięk

Używaj audio do transkrypcji plików.

bash

OmeniaClaw infer audio transcribe --file ./memo.m4a --jsonOmeniaClaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --jsonOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Uwagi:

audio transcribe służy do transkrypcji plików, a nie do zarządzania sesjami w czasie rzeczywistym.
--model musi mieć postać <provider/model>.

TTS

Używaj tts do syntezy mowy i stanu dostawcy TTS.

bash

OmeniaClaw infer tts convert --text "hello from OmeniaClaw" --output ./hello.mp3 --jsonOmeniaClaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --jsonOmeniaClaw infer tts providers --jsonOmeniaClaw infer tts status --json

Uwagi:

tts status domyślnie używa Gateway, ponieważ odzwierciedla stan TTS zarządzany przez Gateway.
Używaj tts providers, tts voices i tts set-provider, aby sprawdzać i konfigurować zachowanie TTS.

Wideo

Używaj video do generowania i opisu.

bash

OmeniaClaw infer video generate --prompt "cinematic sunset over the ocean" --jsonOmeniaClaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --json

Uwagi:

video generate akceptuje --size, --aspect-ratio, --resolution, --duration, --audio, --watermark i --timeout-ms oraz przekazuje je do środowiska wykonawczego generowania wideo.
--model musi mieć postać <provider/model> dla video describe.

Sieć

Używaj web do przepływów pracy wyszukiwania i pobierania.

bash

OmeniaClaw infer web search --query "OmeniaClaw docs" --jsonOmeniaClaw infer web search --query "OmeniaClaw infer web providers" --jsonOmeniaClaw infer web fetch --url https://omeniaclaw.com/cli/infer --jsonOmeniaClaw infer web providers --json

Uwagi:

Używaj web providers, aby sprawdzać dostępnych, skonfigurowanych i wybranych dostawców.

Osadzanie

Używaj embedding do tworzenia wektorów i inspekcji dostawców osadzania.

bash

OmeniaClaw infer embedding create --text "friendly lobster" --jsonOmeniaClaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --jsonOmeniaClaw infer embedding providers --json

Dane wyjściowe JSON

Polecenia infer normalizują dane wyjściowe JSON w ramach wspólnej koperty:

json

{  "ok": true,  "capability": "image.generate",  "transport": "local",  "provider": "openai",  "model": "gpt-image-2",  "attempts": [],  "outputs": []}

Pola najwyższego poziomu są stabilne:

ok
capability
transport
provider
model
attempts
outputs
error

Dla poleceń generujących media outputs zawiera pliki zapisane przez OmeniaClaw. Do automatyzacji używaj path, mimeType, size oraz wszelkich wymiarów specyficznych dla mediów w tej tablicy, zamiast parsować czytelny dla człowieka stdout.

Częste pułapki

bash

# BadOmeniaClaw infer media image generate --prompt "friendly lobster" # GoodOmeniaClaw infer image generate --prompt "friendly lobster"

bash

# BadOmeniaClaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json # GoodOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Uwagi

OmeniaClaw capability ... jest aliasem dla OmeniaClaw infer ....

Powiązane

Was this useful?

CLI inferencji

Przekształć infer w umiejętność

Dlaczego warto używać infer

Drzewo poleceń

Typowe zadania

Zachowanie

Model

Obraz

Dźwięk

TTS

Wideo

Sieć

Osadzanie

Dane wyjściowe JSON

Częste pułapki

Uwagi

Powiązane

On this page

Molty