CLI commands

CLI استنتاج

OmeniaClaw infer سطح headless متعارف برای جریان‌های کاری استنتاجِ متکی به provider است.

این دستور عمداً خانواده‌های capability را نمایش می‌دهد، نه نام‌های خام RPC مربوط به gateway و نه شناسه‌های خام ابزار agent.

تبدیل infer به یک skill

این متن را در یک agent کپی و جای‌گذاری کنید:

text

Read https://omeniaclaw.com/cli/infer, then create a skill that routes my common workflows to `OmeniaClaw infer`.Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.

یک skill خوب مبتنی بر infer باید:

نیت‌های رایج کاربر را به زیر‌دستور درست infer نگاشت کند
چند نمونه متعارف infer برای جریان‌های کاری‌ای که پوشش می‌دهد شامل شود
در نمونه‌ها و پیشنهادها OmeniaClaw infer ... را ترجیح دهد
از مستندسازی دوباره کل سطح infer در بدنه skill خودداری کند

پوشش معمول skill متمرکز بر infer:

OmeniaClaw infer model run
OmeniaClaw infer image generate
OmeniaClaw infer audio transcribe
OmeniaClaw infer tts convert
OmeniaClaw infer web search
OmeniaClaw infer embedding create

چرا از infer استفاده کنیم

OmeniaClaw infer یک CLI یکپارچه برای وظایف استنتاجِ متکی به provider در OmeniaClaw فراهم می‌کند.

مزایا:

به‌جای اتصال wrapperهای موردی برای هر backend، از providerها و مدل‌هایی استفاده کنید که از قبل در OmeniaClaw پیکربندی شده‌اند.
جریان‌های کاری مدل، تصویر، رونویسی صوت، TTS، ویدئو، وب و embedding را زیر یک درخت دستور نگه دارید.
برای اسکریپت‌ها، خودکارسازی و جریان‌های کاری agentمحور از شکل خروجی پایدار --json استفاده کنید.
وقتی وظیفه اساساً «اجرای استنتاج» است، یک سطح رسمی OmeniaClaw را ترجیح دهید.
برای بیشتر دستورهای infer از مسیر محلی معمول استفاده کنید، بدون اینکه به gateway نیاز باشد.

برای بررسی‌های انتهابه‌انتهای provider، پس از سبز شدن تست‌های سطح پایین‌تر provider، OmeniaClaw infer ... را ترجیح دهید. این کار CLI منتشرشده، بارگذاری config، resolve کردن default-agent، فعال‌سازی Pluginهای bundled، و runtime مشترک capability را پیش از ارسال درخواست provider تمرین می‌دهد.

درخت دستور

text

 OmeniaClaw infer  list  inspect   model    run    list    inspect    providers    auth login    auth logout    auth status   image    generate    edit    describe    describe-many    providers   audio    transcribe    providers   tts    convert    voices    providers    status    enable    disable    set-provider   video    generate    describe    providers   web    search    fetch    providers   embedding    create    providers

وظایف رایج

این جدول وظایف رایج استنتاج را به دستور infer متناظر نگاشت می‌کند.

وظیفه	دستور	نکات
اجرای یک prompt متنی/مدلی	`OmeniaClaw infer model run --prompt "..." --json`	به‌طور پیش‌فرض از مسیر محلی معمول استفاده می‌کند
اجرای prompt مدل روی تصویرها	`OmeniaClaw infer model run --prompt "Describe this" --file ./image.png --model provider/model`	برای چند ورودی تصویر، `--file` را تکرار کنید
تولید یک تصویر	`OmeniaClaw infer image generate --prompt "..." --json`	هنگام شروع از یک فایل موجود از `image edit` استفاده کنید
توصیف یک فایل تصویر	`OmeniaClaw infer image describe --file ./image.png --prompt "..." --json`	`--model` باید یک `<provider/model>` دارای قابلیت تصویر باشد
رونویسی صوت	`OmeniaClaw infer audio transcribe --file ./memo.m4a --json`	`--model` باید `<provider/model>` باشد
سنتز گفتار	`OmeniaClaw infer tts convert --text "..." --output ./speech.mp3 --json`	`tts status` معطوف به gateway است
تولید یک ویدئو	`OmeniaClaw infer video generate --prompt "..." --json`	از اشاره‌های provider مانند `--resolution` پشتیبانی می‌کند
توصیف یک فایل ویدئو	`OmeniaClaw infer video describe --file ./clip.mp4 --json`	`--model` باید `<provider/model>` باشد
جست‌وجوی وب	`OmeniaClaw infer web search --query "..." --json`
دریافت یک صفحه وب	`OmeniaClaw infer web fetch --url https://example.com --json`
ایجاد embeddingها	`OmeniaClaw infer embedding create --text "..." --json`

رفتار

OmeniaClaw infer ... سطح CLI اصلی برای این جریان‌های کاری است.
وقتی خروجی توسط دستور یا اسکریپت دیگری مصرف می‌شود از --json استفاده کنید.
وقتی به یک backend مشخص نیاز است از --provider یا --model provider/model استفاده کنید.
برای پاس دادن یک سطح یک‌باره thinking/reasoning (off، minimal، low، medium، high، adaptive، xhigh، یا max) و در عین حال خام نگه داشتن اجرا، از model run --thinking <level> استفاده کنید.
برای image describe، audio transcribe و video describe، --model باید از قالب <provider/model> استفاده کند.
برای image describe، یک --model صریح همان provider/model را مستقیماً اجرا می‌کند. مدل باید در model catalog یا config provider قابلیت تصویر داشته باشد. codex/<model> یک نوبت محدود درک تصویر در app-server مربوط به Codex اجرا می‌کند؛ openai-codex/<model> از مسیر provider مربوط به OpenAI Codex OAuth استفاده می‌کند.
دستورهای اجرای stateless به‌طور پیش‌فرض local هستند.
دستورهای state مدیریت‌شده توسط Gateway به‌طور پیش‌فرض gateway هستند.
مسیر محلی معمول نیاز ندارد gateway در حال اجرا باشد.
model run محلی یک completion سبک و یک‌باره provider است. مدل و auth پیکربندی‌شده agent را resolve می‌کند، اما نوبت chat-agent را شروع نمی‌کند، ابزارها را بارگذاری نمی‌کند، یا سرورهای bundled MCP را باز نمی‌کند.
model run --file فایل‌های تصویر را می‌پذیرد، نوع MIME آن‌ها را تشخیص می‌دهد، و آن‌ها را همراه با prompt ارائه‌شده به مدل انتخاب‌شده می‌فرستد. برای چند تصویر، --file را تکرار کنید.
model run --file ورودی‌های غیرتصویری را رد می‌کند. برای فایل‌های صوتی از infer audio transcribe و برای فایل‌های ویدئویی از infer video describe استفاده کنید.
model run --gateway مسیریابی Gateway، auth ذخیره‌شده، انتخاب provider، و runtime تعبیه‌شده را تمرین می‌دهد، اما همچنان به‌صورت یک probe خام مدل اجرا می‌شود: prompt ارائه‌شده و هر پیوست تصویر را بدون transcript قبلی session، زمینه bootstrap/AGENTS، مونتاژ context-engine، ابزارها، یا سرورهای bundled MCP ارسال می‌کند.
model run --gateway --model <provider/model> به یک credential مورد اعتماد operator gateway نیاز دارد، زیرا درخواست از Gateway می‌خواهد یک override موردی provider/model اجرا کند.
model run --thinking محلی از مسیر provider-completion سبک استفاده می‌کند؛ سطح‌های مخصوص provider مانند adaptive و max به نزدیک‌ترین سطح portable simple-completion نگاشت می‌شوند.

مدل

برای استنتاج متنی متکی به provider و بازرسی model/provider از model استفاده کنید.

bash

OmeniaClaw infer model run --prompt "Reply with exactly: smoke-ok" --jsonOmeniaClaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --jsonOmeniaClaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --jsonOmeniaClaw infer model run --prompt "Use more reasoning here" --thinking high --jsonOmeniaClaw infer model providers --jsonOmeniaClaw infer model inspect --name gpt-5.5 --json

برای smoke-test کردن یک provider مشخص بدون راه‌اندازی Gateway یا بارگذاری سطح کامل ابزار agent از refهای کامل <provider/model> استفاده کنید:

bash

OmeniaClaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model openai/gpt-4.1 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --json

نکات:

model run محلی باریک‌ترین smoke در CLI برای سلامت provider/model/auth است، زیرا برای providerهای غیر Codex فقط prompt ارائه‌شده را به مدل انتخاب‌شده می‌فرستد.
model run --model <provider/model> محلی می‌تواند پیش از نوشته شدن آن provider در config، از ردیف‌های دقیق bundled static catalog از models list --all استفاده کند. auth مربوط به provider همچنان لازم است؛ credentialهای گمشده به‌صورت خطاهای auth شکست می‌خورند، نه Unknown model.
برای probeهای reasoning مربوط به Mistral Medium 3.5، temperature را تنظیم‌نشده/پیش‌فرض بگذارید. Mistral ترکیب reasoning_effort="high" با temperature: 0 را رد می‌کند؛ از mistral/mistral-medium-3-5 با temperature پیش‌فرض یا یک مقدار reasoning-mode غیرصفر مانند 0.7 استفاده کنید.
probeهای محلی openai-codex/* استثنای محدود هستند: OmeniaClaw یک system instruction حداقلی اضافه می‌کند تا transport مربوط به Codex Responses بتواند فیلد الزامی instructions خود را پر کند، بدون افزودن زمینه کامل agent، ابزارها، memory، یا transcript session.
model run --file محلی همان مسیر سبک را نگه می‌دارد و محتوای تصویر را مستقیماً به پیام واحد user پیوست می‌کند. فایل‌های تصویر رایج مانند PNG، JPEG و WebP وقتی نوع MIME آن‌ها به‌صورت image/* تشخیص داده شود کار می‌کنند؛ فایل‌های پشتیبانی‌نشده یا شناسایی‌نشده پیش از فراخوانی provider شکست می‌خورند.
model run --file زمانی بهترین گزینه است که می‌خواهید مدل متنی multimodal انتخاب‌شده را مستقیماً تست کنید. وقتی انتخاب provider درک تصویر OmeniaClaw و مسیریابی پیش‌فرض image-model را می‌خواهید، از infer image describe استفاده کنید.
مدل انتخاب‌شده باید از ورودی تصویر پشتیبانی کند؛ مدل‌های فقط‌متن ممکن است درخواست را در لایه provider رد کنند.
model run --prompt باید متن غیر whitespace داشته باشد؛ promptهای خالی پیش از فراخوانی providerهای محلی یا Gateway رد می‌شوند.
model run محلی وقتی provider هیچ خروجی متنی برنگرداند با کد غیرصفر خارج می‌شود، بنابراین providerهای محلی غیرقابل‌دسترسی و completionهای خالی شبیه probeهای موفق به نظر نمی‌رسند.
وقتی نیاز دارید مسیریابی Gateway، راه‌اندازی agent-runtime، یا state provider مدیریت‌شده توسط Gateway را در حالی تست کنید که ورودی مدل خام بماند، از model run --gateway استفاده کنید. وقتی زمینه کامل agent، ابزارها، memory و transcript session را می‌خواهید، از OmeniaClaw agent یا سطوح chat استفاده کنید.
model auth login، model auth logout و model auth status state ذخیره‌شده auth مربوط به provider را مدیریت می‌کنند.

تصویر

برای تولید، ویرایش و توصیف از image استفاده کنید.

bash

OmeniaClaw infer image generate --prompt "friendly lobster illustration" --jsonOmeniaClaw infer image generate --prompt "cinematic product photo of headphones" --jsonOmeniaClaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --jsonOmeniaClaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --jsonOmeniaClaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --jsonOmeniaClaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --jsonOmeniaClaw infer image describe --file ./photo.jpg --jsonOmeniaClaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --jsonOmeniaClaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --jsonOmeniaClaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --jsonOmeniaClaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --json

یادداشت‌ها:

هنگام شروع از فایل‌های ورودی موجود، از image edit استفاده کنید.
برای providerها/مدل‌هایی که از راهنمایی‌های هندسی در ویرایش‌های تصویر مرجع پشتیبانی می‌کنند، از --size، --aspect-ratio، یا --resolution همراه با image edit استفاده کنید.
برای خروجی PNG با پس‌زمینه شفاف OpenAI، از --output-format png --background transparent همراه با --model openai/gpt-image-1.5 استفاده کنید؛ --openai-background همچنان به‌عنوان نام مستعار اختصاصی OpenAI در دسترس است. providerهایی که پشتیبانی از پس‌زمینه را اعلام نمی‌کنند، این راهنما را به‌عنوان یک بازنویسی نادیده‌گرفته‌شده گزارش می‌کنند.
برای بررسی اینکه کدام providerهای تصویرِ همراه قابل کشف، پیکربندی‌شده، انتخاب‌شده هستند و هر provider کدام قابلیت‌های تولید/ویرایش را ارائه می‌کند، از image providers --json استفاده کنید.
از image generate --model <provider/model> --json به‌عنوان محدودترین smoke زنده CLI برای تغییرات تولید تصویر استفاده کنید. مثال:
bash
```
OmeniaClaw infer image providers --jsonOmeniaClaw infer image generate \  --model google/gemini-3.1-flash-image-preview \  --prompt "Minimal flat test image: one blue square on a white background, no text." \  --output ./OmeniaClaw-infer-image-smoke.png \  --json
```
پاسخ JSON، ok،‏ provider،‏ model،‏ attempts و مسیرهای خروجی نوشته‌شده را گزارش می‌کند. وقتی --output تنظیم شده باشد، پسوند نهایی ممکن است از نوع MIME بازگردانده‌شده توسط provider پیروی کند.
برای image describe و image describe-many، از --prompt استفاده کنید تا به مدل بینایی یک دستور ویژه‌ی کار بدهید، مانند OCR، مقایسه، بررسی UI، یا کپشن‌نویسی کوتاه.
از --timeout-ms برای مدل‌های بینایی محلی کند یا شروع‌های سرد Ollama استفاده کنید.
برای image describe،‏ --model باید یک <provider/model> دارای قابلیت تصویر باشد.
برای مدل‌های بینایی محلی Ollama، ابتدا مدل را pull کنید و OLLAMA_API_KEY را روی هر مقدار جای‌نگهدار تنظیم کنید، برای مثال ollama-local. Ollama را ببینید.

صوت

از audio برای رونویسی فایل استفاده کنید.

bash

OmeniaClaw infer audio transcribe --file ./memo.m4a --jsonOmeniaClaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --jsonOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

یادداشت‌ها:

audio transcribe برای رونویسی فایل است، نه مدیریت نشست بلادرنگ.
--model باید <provider/model> باشد.

TTS

از tts برای سنتز گفتار و وضعیت providerهای TTS استفاده کنید.

bash

OmeniaClaw infer tts convert --text "hello from OmeniaClaw" --output ./hello.mp3 --jsonOmeniaClaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --jsonOmeniaClaw infer tts providers --jsonOmeniaClaw infer tts status --json

یادداشت‌ها:

tts status به‌طور پیش‌فرض روی Gateway است، زیرا وضعیت TTS مدیریت‌شده توسط Gateway را بازتاب می‌دهد.
برای بررسی و پیکربندی رفتار TTS، از tts providers،‏ tts voices و tts set-provider استفاده کنید.

ویدئو

از video برای تولید و توصیف استفاده کنید.

bash

OmeniaClaw infer video generate --prompt "cinematic sunset over the ocean" --jsonOmeniaClaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --json

یادداشت‌ها:

video generate گزینه‌های --size،‏ --aspect-ratio،‏ --resolution،‏ --duration،‏ --audio،‏ --watermark و --timeout-ms را می‌پذیرد و آن‌ها را به runtime تولید ویدئو ارسال می‌کند.
برای video describe،‏ --model باید <provider/model> باشد.

وب

از web برای گردش‌کارهای جست‌وجو و واکشی استفاده کنید.

bash

OmeniaClaw infer web search --query "OmeniaClaw docs" --jsonOmeniaClaw infer web search --query "OmeniaClaw infer web providers" --jsonOmeniaClaw infer web fetch --url https://omeniaclaw.com/cli/infer --jsonOmeniaClaw infer web providers --json

یادداشت‌ها:

برای بررسی providerهای موجود، پیکربندی‌شده و انتخاب‌شده، از web providers استفاده کنید.

embedding

از embedding برای ساخت بردار و بررسی providerهای embedding استفاده کنید.

bash

OmeniaClaw infer embedding create --text "friendly lobster" --jsonOmeniaClaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --jsonOmeniaClaw infer embedding providers --json

خروجی JSON

دستورهای infer خروجی JSON را زیر یک envelope مشترک نرمال‌سازی می‌کنند:

json

{  "ok": true,  "capability": "image.generate",  "transport": "local",  "provider": "openai",  "model": "gpt-image-2",  "attempts": [],  "outputs": []}

فیلدهای سطح بالا پایدار هستند:

ok
capability
transport
provider
model
attempts
outputs
error

برای دستورهای رسانه تولیدشده، outputs شامل فایل‌هایی است که OmeniaClaw نوشته است. برای خودکارسازی، به‌جای parse کردن stdout خوانا برای انسان، از path،‏ mimeType،‏ size و هر ابعاد ویژه‌ی رسانه در آن آرایه استفاده کنید.

خطاهای رایج

bash

# BadOmeniaClaw infer media image generate --prompt "friendly lobster" # GoodOmeniaClaw infer image generate --prompt "friendly lobster"

bash

# BadOmeniaClaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json # GoodOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --json

یادداشت‌ها

OmeniaClaw capability ... نام مستعار OmeniaClaw infer ... است.

مرتبط

Was this useful?

CLI استنتاج

تبدیل infer به یک skill

چرا از infer استفاده کنیم

درخت دستور

وظایف رایج

رفتار

مدل

تصویر

صوت

TTS

ویدئو

وب

embedding

خروجی JSON

خطاهای رایج

یادداشت‌ها

مرتبط

On this page

Molty