CLI commands

Browser

OmeniaClaw browser

Verwalten Sie die Browser-Steuerungsoberfläche von OmeniaClaw und führen Sie Browser-Aktionen aus (Lebenszyklus, Profile, Tabs, Snapshots, Screenshots, Navigation, Eingabe, Zustandsemulation und Debugging).

Verwandt:

Häufige Flags

  • --url <gatewayWsUrl>: Gateway-WebSocket-URL (standardmäßig aus der Konfiguration).
  • --token <token>: Gateway-Token (falls erforderlich).
  • --timeout <ms>: Anforderungs-Timeout (ms).
  • --expect-final: auf eine finale Gateway-Antwort warten.
  • --browser-profile <name>: ein Browser-Profil auswählen (Standard aus der Konfiguration).
  • --json: maschinenlesbare Ausgabe (wo unterstützt).

Schnellstart (lokal)

bash
OmeniaClaw browser profilesOmeniaClaw browser --browser-profile OmeniaClaw startOmeniaClaw browser --browser-profile OmeniaClaw open https://example.comOmeniaClaw browser --browser-profile OmeniaClaw snapshot

Agenten können dieselbe Bereitschaftsprüfung mit browser({ action: "doctor" }) ausführen.

Schnelle Fehlerbehebung

Wenn start mit not reachable after start fehlschlägt, prüfen Sie zuerst die CDP-Bereitschaft. Wenn start und tabs erfolgreich sind, aber open oder navigate fehlschlägt, ist die Browser-Steuerungsebene intakt und der Fehler liegt üblicherweise an der Navigations-SSRF-Richtlinie.

Minimale Sequenz:

bash
OmeniaClaw browser --browser-profile OmeniaClaw doctorOmeniaClaw browser --browser-profile OmeniaClaw startOmeniaClaw browser --browser-profile OmeniaClaw tabsOmeniaClaw browser --browser-profile OmeniaClaw open https://example.com

Ausführliche Anleitung: Browser-Fehlerbehebung

Lebenszyklus

bash
OmeniaClaw browser statusOmeniaClaw browser doctorOmeniaClaw browser doctor --deepOmeniaClaw browser startOmeniaClaw browser start --headlessOmeniaClaw browser stopOmeniaClaw browser --browser-profile OmeniaClaw reset-profile

Hinweise:

  • doctor --deep fügt eine Live-Snapshot-Prüfung hinzu. Das ist nützlich, wenn die grundlegende CDP-Bereitschaft grün ist, Sie aber einen Nachweis möchten, dass der aktuelle Tab inspiziert werden kann.
  • Für attachOnly- und Remote-CDP-Profile schließt OmeniaClaw browser stop die aktive Steuerungssitzung und löscht temporäre Emulationsüberschreibungen, selbst wenn OmeniaClaw den Browser-Prozess nicht selbst gestartet hat.
  • Bei lokal verwalteten Profilen stoppt OmeniaClaw browser stop den gestarteten Browser-Prozess.
  • OmeniaClaw browser start --headless gilt nur für diese Startanforderung und nur, wenn OmeniaClaw einen lokal verwalteten Browser startet. Es schreibt browser.headless oder die Profilkonfiguration nicht um und hat bei einem bereits laufenden Browser keine Wirkung.
  • Auf Linux-Hosts ohne DISPLAY oder WAYLAND_DISPLAY laufen lokal verwaltete Profile automatisch im Headless-Modus, es sei denn, OmeniaClaw_BROWSER_HEADLESS=0, browser.headless=false oder browser.profiles.<name>.headless=false fordert ausdrücklich einen sichtbaren Browser an.

Wenn der Befehl fehlt

Wenn OmeniaClaw browser ein unbekannter Befehl ist, prüfen Sie plugins.allow in ~/.OmeniaClaw/OmeniaClaw.json.

Wenn plugins.allow vorhanden ist, führen Sie das gebündelte Browser-Plugin explizit auf, es sei denn, die Konfiguration hat bereits einen Root-browser-Block:

json5
{  plugins: {    allow: ["telegram", "browser"],  },}

Ein expliziter Root-browser-Block, zum Beispiel browser.enabled=true oder browser.profiles.<name>, aktiviert das gebündelte Browser-Plugin ebenfalls unter einer restriktiven Plugin-Allowlist.

Verwandt: Browser-Tool

Profile

Profile sind benannte Browser-Routing-Konfigurationen. In der Praxis:

  • OmeniaClaw: startet eine dedizierte von OmeniaClaw verwaltete Chrome-Instanz (isoliertes Benutzerdatenverzeichnis) oder hängt sich daran an.
  • user: steuert Ihre bestehende angemeldete Chrome-Sitzung über Chrome DevTools MCP.
  • benutzerdefinierte CDP-Profile: verweisen auf einen lokalen oder Remote-CDP-Endpunkt.
bash
OmeniaClaw browser profilesOmeniaClaw browser create-profile --name work --color "#FF5A36"OmeniaClaw browser create-profile --name chrome-live --driver existing-sessionOmeniaClaw browser create-profile --name remote --cdp-url https://browser-host.example.comOmeniaClaw browser delete-profile --name work

Ein bestimmtes Profil verwenden:

bash
OmeniaClaw browser --browser-profile work tabs

Tabs

bash
OmeniaClaw browser tabsOmeniaClaw browser tab new --label docsOmeniaClaw browser tab label t1 docsOmeniaClaw browser tab select 2OmeniaClaw browser tab close 2OmeniaClaw browser open https://omeniaclaw.com --label docsOmeniaClaw browser focus docsOmeniaClaw browser close t1

tabs gibt zuerst suggestedTargetId zurück, dann die stabile tabId wie t1, das optionale Label und die rohe targetId. Agenten sollten suggestedTargetId an focus, close, Snapshots und Aktionen zurückgeben. Sie können ein Label mit open --label, tab new --label oder tab label zuweisen; Labels, Tab-IDs, rohe Ziel-IDs und eindeutige Ziel-ID-Präfixe werden alle akzeptiert. Wenn Chromium das zugrunde liegende rohe Ziel während einer Navigation oder Formularübermittlung ersetzt, behält OmeniaClaw die stabile tabId bzw. das Label am Ersatztab, wenn die Zuordnung nachgewiesen werden kann. Rohe Ziel-IDs bleiben flüchtig; bevorzugen Sie suggestedTargetId.

Snapshot / Screenshot / Aktionen

Snapshot:

bash
OmeniaClaw browser snapshotOmeniaClaw browser snapshot --urls

Screenshot:

bash
OmeniaClaw browser screenshotOmeniaClaw browser screenshot --full-pageOmeniaClaw browser screenshot --ref e12OmeniaClaw browser screenshot --labels

Hinweise:

  • --full-page ist nur für Seitenerfassungen gedacht; es kann nicht mit --ref oder --element kombiniert werden.
  • existing-session-/user-Profile unterstützen Seiten-Screenshots und --ref-Screenshots aus Snapshot-Ausgaben, aber keine CSS---element-Screenshots.
  • --labels blendet aktuelle Snapshot-Refs über dem Screenshot ein.
  • snapshot --urls hängt erkannte Linkziele an KI-Snapshots an, damit Agenten direkte Navigationsziele auswählen können, statt nur anhand des Linktexts zu raten.

Navigieren/Klicken/Tippen (ref-basierte UI-Automatisierung):

bash
OmeniaClaw browser navigate https://example.comOmeniaClaw browser click <ref>OmeniaClaw browser click-coords 120 340OmeniaClaw browser type <ref> "hello"OmeniaClaw browser press EnterOmeniaClaw browser hover <ref>OmeniaClaw browser scrollintoview <ref>OmeniaClaw browser drag <startRef> <endRef>OmeniaClaw browser select <ref> OptionA OptionBOmeniaClaw browser fill --fields '[{"ref":"1","value":"Ada"}]'OmeniaClaw browser wait --text "Done"OmeniaClaw browser evaluate --fn '(el) => el.textContent' --ref <ref>

Aktionsantworten geben die aktuelle rohe targetId nach einem durch eine Aktion ausgelösten Seitenersatz zurück, wenn OmeniaClaw den Ersatztab nachweisen kann. Skripte sollten für langlebige Workflows weiterhin suggestedTargetId/Labels speichern und übergeben.

Datei- und Dialog-Helfer:

bash
OmeniaClaw browser upload /tmp/OmeniaClaw/uploads/file.pdf --ref <ref>OmeniaClaw browser waitfordownloadOmeniaClaw browser download <ref> report.pdfOmeniaClaw browser dialog --accept

Verwaltete Chrome-Profile speichern gewöhnliche per Klick ausgelöste Downloads im OmeniaClaw-Download-Verzeichnis (/tmp/OmeniaClaw/downloads standardmäßig oder im konfigurierten temporären Root). Verwenden Sie waitfordownload oder download, wenn der Agent auf eine bestimmte Datei warten und deren Pfad zurückgeben muss; diese expliziten Wartefunktionen besitzen den nächsten Download.

Zustand und Speicher

Viewport + Emulation:

bash
OmeniaClaw browser resize 1280 720OmeniaClaw browser set viewport 1280 720OmeniaClaw browser set offline onOmeniaClaw browser set media darkOmeniaClaw browser set timezone Europe/LondonOmeniaClaw browser set locale en-GBOmeniaClaw browser set geo 51.5074 -0.1278 --accuracy 25OmeniaClaw browser set device "iPhone 14"OmeniaClaw browser set headers '{"x-test":"1"}'OmeniaClaw browser set credentials myuser mypass

Cookies + Speicher:

bash
OmeniaClaw browser cookiesOmeniaClaw browser cookies set session abc123 --url https://example.comOmeniaClaw browser cookies clearOmeniaClaw browser storage local getOmeniaClaw browser storage local set token abc123OmeniaClaw browser storage session clear

Debugging

bash
OmeniaClaw browser console --level errorOmeniaClaw browser pdfOmeniaClaw browser responsebody "**/api"OmeniaClaw browser highlight <ref>OmeniaClaw browser errors --clearOmeniaClaw browser requests --filter apiOmeniaClaw browser trace startOmeniaClaw browser trace stop --out trace.zip

Bestehendes Chrome über MCP

Verwenden Sie das integrierte user-Profil oder erstellen Sie Ihr eigenes existing-session-Profil:

bash
OmeniaClaw browser --browser-profile user tabsOmeniaClaw browser create-profile --name chrome-live --driver existing-sessionOmeniaClaw browser create-profile --name brave-live --driver existing-session --user-data-dir "~/Library/Application Support/BraveSoftware/Brave-Browser"OmeniaClaw browser --browser-profile chrome-live tabs

Dieser Pfad ist nur für den Host vorgesehen. Für Docker, Headless-Server, Browserless oder andere Remote-Setups verwenden Sie stattdessen ein CDP-Profil.

Aktuelle Einschränkungen von existing-session:

  • Snapshot-gesteuerte Aktionen verwenden Refs, keine CSS-Selektoren
  • browser.actionTimeoutMs setzt unterstützte act-Anforderungen standardmäßig auf 60000 ms, wenn Aufrufer timeoutMs weglassen; timeoutMs pro Aufruf hat weiterhin Vorrang.
  • click ist nur Linksklick
  • type unterstützt slowly=true nicht
  • press unterstützt delayMs nicht
  • hover, scrollintoview, drag, select, fill und evaluate lehnen Timeout-Überschreibungen pro Aufruf ab
  • select unterstützt nur einen Wert
  • wait --load networkidle wird nicht unterstützt
  • Datei-Uploads erfordern --ref / --input-ref, unterstützen kein CSS---element und unterstützen derzeit jeweils nur eine Datei
  • Dialog-Hooks unterstützen --timeout nicht
  • Screenshots unterstützen Seitenerfassungen und --ref, aber kein CSS---element
  • responsebody, Download-Abfangung, PDF-Export und Batch-Aktionen erfordern weiterhin einen verwalteten Browser oder ein rohes CDP-Profil

Remote-Browser-Steuerung (Node-Host-Proxy)

Wenn der Gateway auf einer anderen Maschine läuft als der Browser, führen Sie einen Node-Host auf der Maschine aus, die Chrome/Brave/Edge/Chromium hat. Der Gateway leitet Browser-Aktionen an diesen Node weiter (kein separater Browser-Steuerungsserver erforderlich).

Verwenden Sie gateway.nodes.browser.mode, um das automatische Routing zu steuern, und gateway.nodes.browser.node, um einen bestimmten Node festzulegen, wenn mehrere verbunden sind.

Sicherheit + Remote-Einrichtung: Browser-Tool, Remote-Zugriff, Tailscale, Sicherheit

Verwandt

Was this useful?
On this page

On this page