Providers

SenseAudio

SenseAudio می‌تواند پیوست‌های صوتی و یادداشت‌های صوتی ورودی را از طریق خط لوله مشترک tools.media.audio در OmeniaClaw رونویسی کند. OmeniaClaw صوت چندبخشی را به نقطه پایانی رونویسی سازگار با OpenAI ارسال می‌کند و متن برگشتی را به‌صورت {{Transcript}} به‌همراه یک بلوک [Audio] تزریق می‌کند.

ویژگی مقدار
شناسه ارائه‌دهنده senseaudio
Plugin همراه، enabledByDefault: true
قرارداد mediaUnderstandingProviders (صوت)
متغیر محیطی احراز هویت SENSEAUDIO_API_KEY
مدل پیش‌فرض senseaudio-asr-pro-1.5-260319
URL پیش‌فرض https://api.senseaudio.cn/v1
وب‌سایت senseaudio.cn
مستندات senseaudio.cn/docs

شروع به کار

  • کلید API خود را تنظیم کنید

    bash
    export SENSEAUDIO_API_KEY="..."
  • ارائه‌دهنده صوتی را فعال کنید

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "senseaudio", model: "senseaudio-asr-pro-1.5-260319" }],      },    },  },}
  • یک یادداشت صوتی ارسال کنید

    یک پیام صوتی را از طریق هر کانال متصل ارسال کنید. OmeniaClaw صوت را در SenseAudio بارگذاری می‌کند و از رونویسی در خط لوله پاسخ استفاده می‌کند.

  • گزینه‌ها

    گزینه مسیر توضیح
    model tools.media.audio.models[].model شناسه مدل ASR در SenseAudio
    language tools.media.audio.models[].language راهنمای اختیاری زبان
    prompt tools.media.audio.prompt اعلان اختیاری رونویسی
    baseUrl tools.media.audio.baseUrl یا مدل بازنویسی پایه سازگار با OpenAI
    headers tools.media.audio.request.headers سرآیندهای اضافی درخواست

    مرتبط

    Was this useful?
    On this page

    On this page