CLI commands

Çıkarım CLI

OmeniaClaw infer, sağlayıcı destekli çıkarım iş akışları için kanonik başsız yüzeydir.

Bilinçli olarak ham Gateway RPC adlarını veya ham agent tool kimliklerini değil, yetenek ailelerini açığa çıkarır.

infer'ı bir skill'e dönüştürme

Bunu bir agent'a kopyalayıp yapıştırın:

text
Read https://omeniaclaw.com/cli/infer, then create a skill that routes my common workflows to `OmeniaClaw infer`.Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.

İyi bir infer tabanlı skill şunları yapmalıdır:

  • yaygın kullanıcı niyetlerini doğru infer alt komutuna eşleştirmelidir
  • kapsadığı iş akışları için birkaç kanonik infer örneği içermelidir
  • örneklerde ve önerilerde OmeniaClaw infer ... kullanımını tercih etmelidir
  • skill gövdesi içinde infer yüzeyinin tamamını yeniden belgelemekten kaçınmalıdır

Tipik infer odaklı skill kapsamı:

  • OmeniaClaw infer model run
  • OmeniaClaw infer image generate
  • OmeniaClaw infer audio transcribe
  • OmeniaClaw infer tts convert
  • OmeniaClaw infer web search
  • OmeniaClaw infer embedding create

Neden infer kullanılmalı

OmeniaClaw infer, OmeniaClaw içinde sağlayıcı destekli çıkarım görevleri için tutarlı tek bir CLI sağlar.

Avantajlar:

  • Her arka uç için tek seferlik sarmalayıcılar bağlamak yerine OmeniaClaw'da zaten yapılandırılmış sağlayıcıları ve modelleri kullanın.
  • Model, görüntü, ses yazıya dökme, TTS, video, web ve embedding iş akışlarını tek bir komut ağacının altında tutun.
  • Betikler, otomasyon ve agent odaklı iş akışları için kararlı bir --json çıktı yapısı kullanın.
  • Görev temelde "çıkarım çalıştırmak" olduğunda birinci taraf OmeniaClaw yüzeyini tercih edin.
  • Çoğu infer komutu için Gateway gerektirmeden normal yerel yolu kullanın.

Uçtan uca sağlayıcı kontrolleri için, daha düşük seviyeli sağlayıcı testleri başarılı olduktan sonra OmeniaClaw infer ... tercih edin. Bu, sağlayıcı isteği yapılmadan önce yayınlanan CLI'yi, yapılandırma yüklemeyi, varsayılan-agent çözümlemeyi, paketli Plugin etkinleştirmeyi ve paylaşılan yetenek çalışma zamanını çalıştırır.

Komut ağacı

text
 OmeniaClaw infer  list  inspect   model    run    list    inspect    providers    auth login    auth logout    auth status   image    generate    edit    describe    describe-many    providers   audio    transcribe    providers   tts    convert    voices    providers    status    enable    disable    set-provider   video    generate    describe    providers   web    search    fetch    providers   embedding    create    providers

Yaygın görevler

Bu tablo, yaygın çıkarım görevlerini karşılık gelen infer komutuyla eşleştirir.

Görev Komut Notlar
Bir metin/model istemi çalıştırma OmeniaClaw infer model run --prompt "..." --json Varsayılan olarak normal yerel yolu kullanır
Görüntüler üzerinde model istemi çalıştırma OmeniaClaw infer model run --prompt "Describe this" --file ./image.png --model provider/model Birden fazla görüntü girdisi için --file öğesini yineleyin
Görüntü oluşturma OmeniaClaw infer image generate --prompt "..." --json Mevcut bir dosyadan başlarken image edit kullanın
Bir görüntü dosyasını açıklama OmeniaClaw infer image describe --file ./image.png --prompt "..." --json --model, görüntü destekleyen bir <provider/model> olmalıdır
Sesi yazıya dökme OmeniaClaw infer audio transcribe --file ./memo.m4a --json --model, <provider/model> olmalıdır
Konuşma sentezleme OmeniaClaw infer tts convert --text "..." --output ./speech.mp3 --json tts status Gateway odaklıdır
Video oluşturma OmeniaClaw infer video generate --prompt "..." --json --resolution gibi sağlayıcı ipuçlarını destekler
Bir video dosyasını açıklama OmeniaClaw infer video describe --file ./clip.mp4 --json --model, <provider/model> olmalıdır
Web'de arama OmeniaClaw infer web search --query "..." --json
Bir web sayfası getirme OmeniaClaw infer web fetch --url https://example.com --json
Embedding oluşturma OmeniaClaw infer embedding create --text "..." --json

Davranış

  • OmeniaClaw infer ..., bu iş akışları için birincil CLI yüzeyidir.
  • Çıktı başka bir komut veya betik tarafından tüketilecekse --json kullanın.
  • Belirli bir arka uç gerektiğinde --provider veya --model provider/model kullanın.
  • Çalıştırmayı ham tutarken tek seferlik bir düşünme/akıl yürütme seviyesi (off, minimal, low, medium, high, adaptive, xhigh veya max) iletmek için model run --thinking <level> kullanın.
  • image describe, audio transcribe ve video describe için --model, <provider/model> biçimini kullanmalıdır.
  • image describe için açık bir --model, ilgili sağlayıcı/modeli doğrudan çalıştırır. Model, model kataloğunda veya sağlayıcı yapılandırmasında görüntü destekli olmalıdır. codex/<model>, sınırlandırılmış bir Codex uygulama sunucusu görüntü anlama turu çalıştırır; openai-codex/<model>, OpenAI Codex OAuth sağlayıcı yolunu kullanır.
  • Durumsuz yürütme komutları varsayılan olarak yereldir.
  • Gateway tarafından yönetilen durum komutları varsayılan olarak Gateway kullanır.
  • Normal yerel yol, Gateway'in çalışıyor olmasını gerektirmez.
  • Yerel model run, yalın tek seferlik bir sağlayıcı tamamlama işlemidir. Yapılandırılmış agent modelini ve kimlik doğrulamayı çözümler, ancak bir sohbet-agent turu başlatmaz, araçları yüklemez veya paketli MCP sunucularını açmaz.
  • model run --file, görüntü dosyalarını kabul eder, MIME türlerini algılar ve bunları sağlanan istemle birlikte seçili modele gönderir. Birden fazla görüntü için --file öğesini yineleyin.
  • model run --file, görüntü olmayan girdileri reddeder. Ses dosyaları için infer audio transcribe, video dosyaları için infer video describe kullanın.
  • model run --gateway, Gateway yönlendirmesini, kaydedilmiş kimlik doğrulamayı, sağlayıcı seçimini ve gömülü çalışma zamanını çalıştırır, ancak yine de ham model yoklaması olarak çalışır: sağlanan istemi ve varsa görüntü eklerini önceki oturum dökümü, bootstrap/AGENTS bağlamı, context-engine derlemesi, araçlar veya paketli MCP sunucuları olmadan gönderir.
  • model run --gateway --model <provider/model>, istek Gateway'den tek seferlik sağlayıcı/model geçersiz kılması çalıştırmasını istediği için güvenilir operatör Gateway kimlik bilgisi gerektirir.
  • Yerel model run --thinking, yalın sağlayıcı tamamlama yolunu kullanır; adaptive ve max gibi sağlayıcıya özgü seviyeler en yakın taşınabilir basit tamamlama seviyesine eşlenir.

Model

Sağlayıcı destekli metin çıkarımı ve model/sağlayıcı incelemesi için model kullanın.

bash
OmeniaClaw infer model run --prompt "Reply with exactly: smoke-ok" --jsonOmeniaClaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --jsonOmeniaClaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --jsonOmeniaClaw infer model run --prompt "Use more reasoning here" --thinking high --jsonOmeniaClaw infer model providers --jsonOmeniaClaw infer model inspect --name gpt-5.5 --json

Gateway'i başlatmadan veya tam agent araç yüzeyini yüklemeden belirli bir sağlayıcıyı smoke-test etmek için tam <provider/model> referanslarını kullanın:

bash
OmeniaClaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model openai/gpt-4.1 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --json

Notlar:

  • Yerel model run, sağlayıcı/model/kimlik doğrulama sağlığı için en dar CLI smoke kontrolüdür çünkü Codex dışı sağlayıcılarda yalnızca sağlanan istemi seçili modele gönderir.
  • Yerel model run --model <provider/model>, ilgili sağlayıcı yapılandırmaya yazılmadan önce models list --all içindeki tam paketli statik katalog satırlarını kullanabilir. Sağlayıcı kimlik doğrulaması yine de gereklidir; eksik kimlik bilgileri Unknown model olarak değil, kimlik doğrulama hataları olarak başarısız olur.
  • Mistral Medium 3.5 akıl yürütme yoklamaları için sıcaklığı ayarlanmamış/varsayılan bırakın. Mistral, reasoning_effort="high" ile temperature: 0 birleşimini reddeder; varsayılan sıcaklıkla veya 0.7 gibi sıfır olmayan bir akıl yürütme modu değeriyle mistral/mistral-medium-3-5 kullanın.
  • openai-codex/* yerel yoklamaları dar istisnadır: OmeniaClaw, Codex Responses taşımasının gerekli instructions alanını doldurabilmesi için tam agent bağlamı, araçlar, bellek veya oturum dökümü eklemeden asgari bir sistem yönergesi ekler.
  • Yerel model run --file, bu yalın yolu korur ve görüntü içeriğini doğrudan tek kullanıcı mesajına ekler. PNG, JPEG ve WebP gibi yaygın görüntü dosyaları, MIME türleri image/* olarak algılandığında çalışır; desteklenmeyen veya tanınmayan dosyalar sağlayıcı çağrılmadan önce başarısız olur.
  • model run --file, seçili çok kipli metin modelini doğrudan test etmek istediğinizde en uygunudur. OmeniaClaw'ın görüntü anlama sağlayıcı seçimini ve varsayılan görüntü-model yönlendirmesini istediğinizde infer image describe kullanın.
  • Seçili model görüntü girdisini desteklemelidir; yalnızca metin modelleri isteği sağlayıcı katmanında reddedebilir.
  • model run --prompt, boşluk dışı metin içermelidir; boş istemler yerel sağlayıcılar veya Gateway çağrılmadan önce reddedilir.
  • Yerel model run, sağlayıcı metin çıktısı döndürmediğinde sıfırdan farklı kodla çıkar; böylece ulaşılamayan yerel sağlayıcılar ve boş tamamlamalar başarılı yoklamalar gibi görünmez.
  • Model girdisini ham tutarken Gateway yönlendirmesini, agent çalışma zamanı kurulumunu veya Gateway tarafından yönetilen sağlayıcı durumunu test etmeniz gerektiğinde model run --gateway kullanın. Tam agent bağlamını, araçları, belleği ve oturum dökümünü istediğinizde OmeniaClaw agent veya sohbet yüzeylerini kullanın.
  • model auth login, model auth logout ve model auth status, kaydedilmiş sağlayıcı kimlik doğrulama durumunu yönetir.

Görüntü

Oluşturma, düzenleme ve açıklama için image kullanın.

bash
OmeniaClaw infer image generate --prompt "friendly lobster illustration" --jsonOmeniaClaw infer image generate --prompt "cinematic product photo of headphones" --jsonOmeniaClaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --jsonOmeniaClaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --jsonOmeniaClaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --jsonOmeniaClaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --jsonOmeniaClaw infer image describe --file ./photo.jpg --jsonOmeniaClaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --jsonOmeniaClaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --jsonOmeniaClaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --jsonOmeniaClaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --json

Notlar:

  • Mevcut girdi dosyalarından başlarken image edit kullanın.

  • Referans görsel düzenlemelerinde geometri ipuçlarını destekleyen sağlayıcılar/modeller için image edit ile --size, --aspect-ratio veya --resolution kullanın.

  • Şeffaf arka planlı OpenAI PNG çıktısı için --model openai/gpt-image-1.5 ile --output-format png --background transparent kullanın; --openai-background OpenAI'e özel bir takma ad olarak kullanılmaya devam eder. Arka plan desteği bildirmeyen sağlayıcılar, ipucunu yoksayılan bir geçersiz kılma olarak raporlar.

  • Hangi paketlenmiş görüntü sağlayıcılarının keşfedilebilir, yapılandırılmış, seçilmiş olduğunu ve her sağlayıcının hangi üretim/düzenleme yeteneklerini sunduğunu doğrulamak için image providers --json kullanın.

  • Görüntü üretimi değişiklikleri için en dar canlı CLI smoke testi olarak image generate --model <provider/model> --json kullanın. Örnek:

    bash
    OmeniaClaw infer image providers --jsonOmeniaClaw infer image generate \  --model google/gemini-3.1-flash-image-preview \  --prompt "Minimal flat test image: one blue square on a white background, no text." \  --output ./OmeniaClaw-infer-image-smoke.png \  --json

    JSON yanıtı ok, provider, model, attempts ve yazılan çıktı yollarını raporlar. --output ayarlandığında, son uzantı sağlayıcının döndürdüğü MIME türünü izleyebilir.

  • image describe ve image describe-many için, görme modeline OCR, karşılaştırma, kullanıcı arayüzü incelemesi veya kısa başlık oluşturma gibi göreve özgü bir talimat vermek üzere --prompt kullanın.

  • Yavaş yerel görme modelleri veya soğuk Ollama başlangıçlarıyla --timeout-ms kullanın.

  • image describe için --model, görüntü destekli bir <provider/model> olmalıdır.

  • Yerel Ollama görme modelleri için önce modeli çekin ve OLLAMA_API_KEY değerini herhangi bir yer tutucu değere, örneğin ollama-local olarak ayarlayın. Bkz. Ollama.

Ses

Dosya transkripsiyonu için audio kullanın.

bash
OmeniaClaw infer audio transcribe --file ./memo.m4a --jsonOmeniaClaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --jsonOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Notlar:

  • audio transcribe, gerçek zamanlı oturum yönetimi için değil, dosya transkripsiyonu içindir.
  • --model, <provider/model> olmalıdır.

TTS

Konuşma sentezi ve TTS sağlayıcı durumu için tts kullanın.

bash
OmeniaClaw infer tts convert --text "hello from OmeniaClaw" --output ./hello.mp3 --jsonOmeniaClaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --jsonOmeniaClaw infer tts providers --jsonOmeniaClaw infer tts status --json

Notlar:

  • tts status, Gateway tarafından yönetilen TTS durumunu yansıttığı için varsayılan olarak Gateway kullanır.
  • TTS davranışını incelemek ve yapılandırmak için tts providers, tts voices ve tts set-provider kullanın.

Video

Üretim ve açıklama için video kullanın.

bash
OmeniaClaw infer video generate --prompt "cinematic sunset over the ocean" --jsonOmeniaClaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --json

Notlar:

  • video generate, --size, --aspect-ratio, --resolution, --duration, --audio, --watermark ve --timeout-ms kabul eder ve bunları video üretimi çalışma zamanına iletir.
  • video describe için --model, <provider/model> olmalıdır.

Web

Arama ve getirme iş akışları için web kullanın.

bash
OmeniaClaw infer web search --query "OmeniaClaw docs" --jsonOmeniaClaw infer web search --query "OmeniaClaw infer web providers" --jsonOmeniaClaw infer web fetch --url https://omeniaclaw.com/cli/infer --jsonOmeniaClaw infer web providers --json

Notlar:

  • Kullanılabilir, yapılandırılmış ve seçilmiş sağlayıcıları incelemek için web providers kullanın.

Gömme

Vektör oluşturma ve gömme sağlayıcısı incelemesi için embedding kullanın.

bash
OmeniaClaw infer embedding create --text "friendly lobster" --jsonOmeniaClaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --jsonOmeniaClaw infer embedding providers --json

JSON çıktısı

Infer komutları JSON çıktısını paylaşılan bir zarf altında normalleştirir:

json
{  "ok": true,  "capability": "image.generate",  "transport": "local",  "provider": "openai",  "model": "gpt-image-2",  "attempts": [],  "outputs": []}

Üst düzey alanlar kararlıdır:

  • ok
  • capability
  • transport
  • provider
  • model
  • attempts
  • outputs
  • error

Üretilen medya komutları için outputs, OmeniaClaw tarafından yazılan dosyaları içerir. Otomasyon için insan tarafından okunabilir stdout'u ayrıştırmak yerine bu dizideki path, mimeType, size ve medya türüne özgü boyutları kullanın.

Yaygın hatalar

bash
# BadOmeniaClaw infer media image generate --prompt "friendly lobster" # GoodOmeniaClaw infer image generate --prompt "friendly lobster"
bash
# BadOmeniaClaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json # GoodOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

Notlar

  • OmeniaClaw capability ..., OmeniaClaw infer ... için bir takma addır.

İlgili

Was this useful?
On this page

On this page