CLI commands
CLI استنتاج
OmeniaClaw infer سطح headless متعارف برای جریانهای کاری استنتاجِ متکی به provider است.
این دستور عمداً خانوادههای capability را نمایش میدهد، نه نامهای خام RPC مربوط به gateway و نه شناسههای خام ابزار agent.
تبدیل infer به یک skill
این متن را در یک agent کپی و جایگذاری کنید:
Read https://omeniaclaw.com/cli/infer, then create a skill that routes my common workflows to `OmeniaClaw infer`.Focus on model runs, image generation, video generation, audio transcription, TTS, web search, and embeddings.یک skill خوب مبتنی بر infer باید:
- نیتهای رایج کاربر را به زیردستور درست infer نگاشت کند
- چند نمونه متعارف infer برای جریانهای کاریای که پوشش میدهد شامل شود
- در نمونهها و پیشنهادها
OmeniaClaw infer ...را ترجیح دهد - از مستندسازی دوباره کل سطح infer در بدنه skill خودداری کند
پوشش معمول skill متمرکز بر infer:
OmeniaClaw infer model runOmeniaClaw infer image generateOmeniaClaw infer audio transcribeOmeniaClaw infer tts convertOmeniaClaw infer web searchOmeniaClaw infer embedding create
چرا از infer استفاده کنیم
OmeniaClaw infer یک CLI یکپارچه برای وظایف استنتاجِ متکی به provider در OmeniaClaw فراهم میکند.
مزایا:
- بهجای اتصال wrapperهای موردی برای هر backend، از providerها و مدلهایی استفاده کنید که از قبل در OmeniaClaw پیکربندی شدهاند.
- جریانهای کاری مدل، تصویر، رونویسی صوت، TTS، ویدئو، وب و embedding را زیر یک درخت دستور نگه دارید.
- برای اسکریپتها، خودکارسازی و جریانهای کاری agentمحور از شکل خروجی پایدار
--jsonاستفاده کنید. - وقتی وظیفه اساساً «اجرای استنتاج» است، یک سطح رسمی OmeniaClaw را ترجیح دهید.
- برای بیشتر دستورهای infer از مسیر محلی معمول استفاده کنید، بدون اینکه به gateway نیاز باشد.
برای بررسیهای انتهابهانتهای provider، پس از سبز شدن تستهای سطح پایینتر
provider، OmeniaClaw infer ... را ترجیح دهید. این کار CLI منتشرشده، بارگذاری config،
resolve کردن default-agent، فعالسازی Pluginهای bundled، و runtime مشترک capability
را پیش از ارسال درخواست provider تمرین میدهد.
درخت دستور
OmeniaClaw infer list inspect model run list inspect providers auth login auth logout auth status image generate edit describe describe-many providers audio transcribe providers tts convert voices providers status enable disable set-provider video generate describe providers web search fetch providers embedding create providersوظایف رایج
این جدول وظایف رایج استنتاج را به دستور infer متناظر نگاشت میکند.
| وظیفه | دستور | نکات |
|---|---|---|
| اجرای یک prompt متنی/مدلی | OmeniaClaw infer model run --prompt "..." --json |
بهطور پیشفرض از مسیر محلی معمول استفاده میکند |
| اجرای prompt مدل روی تصویرها | OmeniaClaw infer model run --prompt "Describe this" --file ./image.png --model provider/model |
برای چند ورودی تصویر، --file را تکرار کنید |
| تولید یک تصویر | OmeniaClaw infer image generate --prompt "..." --json |
هنگام شروع از یک فایل موجود از image edit استفاده کنید |
| توصیف یک فایل تصویر | OmeniaClaw infer image describe --file ./image.png --prompt "..." --json |
--model باید یک <provider/model> دارای قابلیت تصویر باشد |
| رونویسی صوت | OmeniaClaw infer audio transcribe --file ./memo.m4a --json |
--model باید <provider/model> باشد |
| سنتز گفتار | OmeniaClaw infer tts convert --text "..." --output ./speech.mp3 --json |
tts status معطوف به gateway است |
| تولید یک ویدئو | OmeniaClaw infer video generate --prompt "..." --json |
از اشارههای provider مانند --resolution پشتیبانی میکند |
| توصیف یک فایل ویدئو | OmeniaClaw infer video describe --file ./clip.mp4 --json |
--model باید <provider/model> باشد |
| جستوجوی وب | OmeniaClaw infer web search --query "..." --json |
|
| دریافت یک صفحه وب | OmeniaClaw infer web fetch --url https://example.com --json |
|
| ایجاد embeddingها | OmeniaClaw infer embedding create --text "..." --json |
رفتار
OmeniaClaw infer ...سطح CLI اصلی برای این جریانهای کاری است.- وقتی خروجی توسط دستور یا اسکریپت دیگری مصرف میشود از
--jsonاستفاده کنید. - وقتی به یک backend مشخص نیاز است از
--providerیا--model provider/modelاستفاده کنید. - برای پاس دادن یک سطح یکباره thinking/reasoning (
off،minimal،low،medium،high،adaptive،xhigh، یاmax) و در عین حال خام نگه داشتن اجرا، ازmodel run --thinking <level>استفاده کنید. - برای
image describe،audio transcribeوvideo describe،--modelباید از قالب<provider/model>استفاده کند. - برای
image describe، یک--modelصریح همان provider/model را مستقیماً اجرا میکند. مدل باید در model catalog یا config provider قابلیت تصویر داشته باشد.codex/<model>یک نوبت محدود درک تصویر در app-server مربوط به Codex اجرا میکند؛openai-codex/<model>از مسیر provider مربوط به OpenAI Codex OAuth استفاده میکند. - دستورهای اجرای stateless بهطور پیشفرض local هستند.
- دستورهای state مدیریتشده توسط Gateway بهطور پیشفرض gateway هستند.
- مسیر محلی معمول نیاز ندارد gateway در حال اجرا باشد.
model runمحلی یک completion سبک و یکباره provider است. مدل و auth پیکربندیشده agent را resolve میکند، اما نوبت chat-agent را شروع نمیکند، ابزارها را بارگذاری نمیکند، یا سرورهای bundled MCP را باز نمیکند.model run --fileفایلهای تصویر را میپذیرد، نوع MIME آنها را تشخیص میدهد، و آنها را همراه با prompt ارائهشده به مدل انتخابشده میفرستد. برای چند تصویر،--fileرا تکرار کنید.model run --fileورودیهای غیرتصویری را رد میکند. برای فایلهای صوتی ازinfer audio transcribeو برای فایلهای ویدئویی ازinfer video describeاستفاده کنید.model run --gatewayمسیریابی Gateway، auth ذخیرهشده، انتخاب provider، و runtime تعبیهشده را تمرین میدهد، اما همچنان بهصورت یک probe خام مدل اجرا میشود: prompt ارائهشده و هر پیوست تصویر را بدون transcript قبلی session، زمینه bootstrap/AGENTS، مونتاژ context-engine، ابزارها، یا سرورهای bundled MCP ارسال میکند.model run --gateway --model <provider/model>به یک credential مورد اعتماد operator gateway نیاز دارد، زیرا درخواست از Gateway میخواهد یک override موردی provider/model اجرا کند.model run --thinkingمحلی از مسیر provider-completion سبک استفاده میکند؛ سطحهای مخصوص provider مانندadaptiveوmaxبه نزدیکترین سطح portable simple-completion نگاشت میشوند.
مدل
برای استنتاج متنی متکی به provider و بازرسی model/provider از model استفاده کنید.
OmeniaClaw infer model run --prompt "Reply with exactly: smoke-ok" --jsonOmeniaClaw infer model run --prompt "Summarize this changelog entry" --model openai/gpt-5.4 --jsonOmeniaClaw infer model run --prompt "Describe this image in one sentence" --file ./photo.jpg --model google/gemini-2.5-flash --jsonOmeniaClaw infer model run --prompt "Use more reasoning here" --thinking high --jsonOmeniaClaw infer model providers --jsonOmeniaClaw infer model inspect --name gpt-5.5 --jsonبرای smoke-test کردن یک provider مشخص بدون
راهاندازی Gateway یا بارگذاری سطح کامل ابزار agent از refهای کامل <provider/model> استفاده کنید:
OmeniaClaw infer model run --local --model anthropic/claude-sonnet-4-6 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model cerebras/zai-glm-4.7 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model google/gemini-2.5-flash --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model groq/llama-3.1-8b-instant --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-medium-3-5 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model mistral/mistral-small-latest --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model openai/gpt-4.1 --prompt "Reply with exactly: pong" --jsonOmeniaClaw infer model run --local --model ollama/qwen2.5vl:7b --prompt "Describe this image." --file ./photo.jpg --jsonنکات:
model runمحلی باریکترین smoke در CLI برای سلامت provider/model/auth است، زیرا برای providerهای غیر Codex فقط prompt ارائهشده را به مدل انتخابشده میفرستد.model run --model <provider/model>محلی میتواند پیش از نوشته شدن آن provider در config، از ردیفهای دقیق bundled static catalog ازmodels list --allاستفاده کند. auth مربوط به provider همچنان لازم است؛ credentialهای گمشده بهصورت خطاهای auth شکست میخورند، نهUnknown model.- برای probeهای reasoning مربوط به Mistral Medium 3.5، temperature را تنظیمنشده/پیشفرض بگذارید. Mistral ترکیب
reasoning_effort="high"باtemperature: 0را رد میکند؛ ازmistral/mistral-medium-3-5با temperature پیشفرض یا یک مقدار reasoning-mode غیرصفر مانند0.7استفاده کنید. - probeهای محلی
openai-codex/*استثنای محدود هستند: OmeniaClaw یک system instruction حداقلی اضافه میکند تا transport مربوط به Codex Responses بتواند فیلد الزامیinstructionsخود را پر کند، بدون افزودن زمینه کامل agent، ابزارها، memory، یا transcript session. model run --fileمحلی همان مسیر سبک را نگه میدارد و محتوای تصویر را مستقیماً به پیام واحد user پیوست میکند. فایلهای تصویر رایج مانند PNG، JPEG و WebP وقتی نوع MIME آنها بهصورتimage/*تشخیص داده شود کار میکنند؛ فایلهای پشتیبانینشده یا شناسایینشده پیش از فراخوانی provider شکست میخورند.model run --fileزمانی بهترین گزینه است که میخواهید مدل متنی multimodal انتخابشده را مستقیماً تست کنید. وقتی انتخاب provider درک تصویر OmeniaClaw و مسیریابی پیشفرض image-model را میخواهید، ازinfer image describeاستفاده کنید.- مدل انتخابشده باید از ورودی تصویر پشتیبانی کند؛ مدلهای فقطمتن ممکن است درخواست را در لایه provider رد کنند.
model run --promptباید متن غیر whitespace داشته باشد؛ promptهای خالی پیش از فراخوانی providerهای محلی یا Gateway رد میشوند.model runمحلی وقتی provider هیچ خروجی متنی برنگرداند با کد غیرصفر خارج میشود، بنابراین providerهای محلی غیرقابلدسترسی و completionهای خالی شبیه probeهای موفق به نظر نمیرسند.- وقتی نیاز دارید مسیریابی Gateway، راهاندازی agent-runtime، یا state provider مدیریتشده توسط Gateway را در حالی تست کنید که ورودی مدل خام بماند، از
model run --gatewayاستفاده کنید. وقتی زمینه کامل agent، ابزارها، memory و transcript session را میخواهید، ازOmeniaClaw agentیا سطوح chat استفاده کنید. model auth login،model auth logoutوmodel auth statusstate ذخیرهشده auth مربوط به provider را مدیریت میکنند.
تصویر
برای تولید، ویرایش و توصیف از image استفاده کنید.
OmeniaClaw infer image generate --prompt "friendly lobster illustration" --jsonOmeniaClaw infer image generate --prompt "cinematic product photo of headphones" --jsonOmeniaClaw infer image generate --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "simple red circle sticker on a transparent background" --jsonOmeniaClaw infer image generate --prompt "slow image backend" --timeout-ms 180000 --jsonOmeniaClaw infer image edit --file ./logo.png --model openai/gpt-image-1.5 --output-format png --background transparent --prompt "keep the logo, remove the background" --jsonOmeniaClaw infer image edit --file ./poster.png --prompt "make this a vertical story ad" --size 2160x3840 --aspect-ratio 9:16 --resolution 4K --jsonOmeniaClaw infer image describe --file ./photo.jpg --jsonOmeniaClaw infer image describe --file ./receipt.jpg --prompt "Extract the merchant, date, and total" --jsonOmeniaClaw infer image describe-many --file ./before.png --file ./after.png --prompt "Compare the screenshots and list visible UI changes" --jsonOmeniaClaw infer image describe --file ./ui-screenshot.png --model openai/gpt-4.1-mini --jsonOmeniaClaw infer image describe --file ./photo.jpg --model ollama/qwen2.5vl:7b --prompt "Describe the image in one sentence" --timeout-ms 300000 --jsonیادداشتها:
-
هنگام شروع از فایلهای ورودی موجود، از
image editاستفاده کنید. -
برای providerها/مدلهایی که از راهنماییهای هندسی در ویرایشهای تصویر مرجع پشتیبانی میکنند، از
--size،--aspect-ratio، یا--resolutionهمراه باimage editاستفاده کنید. -
برای خروجی PNG با پسزمینه شفاف OpenAI، از
--output-format png --background transparentهمراه با--model openai/gpt-image-1.5استفاده کنید؛--openai-backgroundهمچنان بهعنوان نام مستعار اختصاصی OpenAI در دسترس است. providerهایی که پشتیبانی از پسزمینه را اعلام نمیکنند، این راهنما را بهعنوان یک بازنویسی نادیدهگرفتهشده گزارش میکنند. -
برای بررسی اینکه کدام providerهای تصویرِ همراه قابل کشف، پیکربندیشده، انتخابشده هستند و هر provider کدام قابلیتهای تولید/ویرایش را ارائه میکند، از
image providers --jsonاستفاده کنید. -
از
image generate --model <provider/model> --jsonبهعنوان محدودترین smoke زنده CLI برای تغییرات تولید تصویر استفاده کنید. مثال:bash OmeniaClaw infer image providers --jsonOmeniaClaw infer image generate \ --model google/gemini-3.1-flash-image-preview \ --prompt "Minimal flat test image: one blue square on a white background, no text." \ --output ./OmeniaClaw-infer-image-smoke.png \ --jsonپاسخ JSON،
ok،provider،model،attemptsو مسیرهای خروجی نوشتهشده را گزارش میکند. وقتی--outputتنظیم شده باشد، پسوند نهایی ممکن است از نوع MIME بازگرداندهشده توسط provider پیروی کند. -
برای
image describeوimage describe-many، از--promptاستفاده کنید تا به مدل بینایی یک دستور ویژهی کار بدهید، مانند OCR، مقایسه، بررسی UI، یا کپشننویسی کوتاه. -
از
--timeout-msبرای مدلهای بینایی محلی کند یا شروعهای سرد Ollama استفاده کنید. -
برای
image describe،--modelباید یک<provider/model>دارای قابلیت تصویر باشد. -
برای مدلهای بینایی محلی Ollama، ابتدا مدل را pull کنید و
OLLAMA_API_KEYرا روی هر مقدار جاینگهدار تنظیم کنید، برای مثالollama-local. Ollama را ببینید.
صوت
از audio برای رونویسی فایل استفاده کنید.
OmeniaClaw infer audio transcribe --file ./memo.m4a --jsonOmeniaClaw infer audio transcribe --file ./team-sync.m4a --language en --prompt "Focus on names and action items" --jsonOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --jsonیادداشتها:
audio transcribeبرای رونویسی فایل است، نه مدیریت نشست بلادرنگ.--modelباید<provider/model>باشد.
TTS
از tts برای سنتز گفتار و وضعیت providerهای TTS استفاده کنید.
OmeniaClaw infer tts convert --text "hello from OmeniaClaw" --output ./hello.mp3 --jsonOmeniaClaw infer tts convert --text "Your build is complete" --output ./build-complete.mp3 --jsonOmeniaClaw infer tts providers --jsonOmeniaClaw infer tts status --jsonیادداشتها:
tts statusبهطور پیشفرض روی Gateway است، زیرا وضعیت TTS مدیریتشده توسط Gateway را بازتاب میدهد.- برای بررسی و پیکربندی رفتار TTS، از
tts providers،tts voicesوtts set-providerاستفاده کنید.
ویدئو
از video برای تولید و توصیف استفاده کنید.
OmeniaClaw infer video generate --prompt "cinematic sunset over the ocean" --jsonOmeniaClaw infer video generate --prompt "slow drone shot over a forest lake" --resolution 768P --duration 6 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --jsonOmeniaClaw infer video describe --file ./clip.mp4 --model openai/gpt-4.1-mini --jsonیادداشتها:
video generateگزینههای--size،--aspect-ratio،--resolution،--duration،--audio،--watermarkو--timeout-msرا میپذیرد و آنها را به runtime تولید ویدئو ارسال میکند.- برای
video describe،--modelباید<provider/model>باشد.
وب
از web برای گردشکارهای جستوجو و واکشی استفاده کنید.
OmeniaClaw infer web search --query "OmeniaClaw docs" --jsonOmeniaClaw infer web search --query "OmeniaClaw infer web providers" --jsonOmeniaClaw infer web fetch --url https://omeniaclaw.com/cli/infer --jsonOmeniaClaw infer web providers --jsonیادداشتها:
- برای بررسی providerهای موجود، پیکربندیشده و انتخابشده، از
web providersاستفاده کنید.
embedding
از embedding برای ساخت بردار و بررسی providerهای embedding استفاده کنید.
OmeniaClaw infer embedding create --text "friendly lobster" --jsonOmeniaClaw infer embedding create --text "customer support ticket: delayed shipment" --model openai/text-embedding-3-large --jsonOmeniaClaw infer embedding providers --jsonخروجی JSON
دستورهای infer خروجی JSON را زیر یک envelope مشترک نرمالسازی میکنند:
{ "ok": true, "capability": "image.generate", "transport": "local", "provider": "openai", "model": "gpt-image-2", "attempts": [], "outputs": []}فیلدهای سطح بالا پایدار هستند:
okcapabilitytransportprovidermodelattemptsoutputserror
برای دستورهای رسانه تولیدشده، outputs شامل فایلهایی است که OmeniaClaw نوشته است. برای خودکارسازی، بهجای parse کردن stdout خوانا برای انسان، از path، mimeType، size و هر ابعاد ویژهی رسانه در آن آرایه استفاده کنید.
خطاهای رایج
# BadOmeniaClaw infer media image generate --prompt "friendly lobster" # GoodOmeniaClaw infer image generate --prompt "friendly lobster"# BadOmeniaClaw infer audio transcribe --file ./memo.m4a --model whisper-1 --json # GoodOmeniaClaw infer audio transcribe --file ./memo.m4a --model openai/whisper-1 --jsonیادداشتها
OmeniaClaw capability ...نام مستعارOmeniaClaw infer ...است.