Providers

Deepgram

Deepgram هي واجهة API لتحويل الكلام إلى نص. وفي OmeniaClaw تُستخدم لنسخ الصوت/الملاحظات الصوتية الواردة عبر tools.media.audio، وللنسخ المتدفق في Voice Call عبر plugins.entries.voice-call.config.streaming.

في النسخ الدفعي، يرفع OmeniaClaw ملف الصوت كاملًا إلى Deepgram ويحقن النص المنسوخ في مسار الرد ({{Transcript}} + كتلة [Audio]). أما في النسخ المتدفق لـ Voice Call، فيمرّر OmeniaClaw إطارات G.711 u-law الحية عبر نقطة نهاية WebSocket ‏listen الخاصة بـ Deepgram ويصدر نصوصًا جزئية أو نهائية عندما تعيدها Deepgram.

التفصيل القيمة
الموقع deepgram.com
المستندات developers.deepgram.com
المصادقة DEEPGRAM_API_KEY
النموذج الافتراضي nova-3

البدء

  • عيّن مفتاح API الخاص بك

    أضف مفتاح Deepgram API إلى البيئة:

    Code
    DEEPGRAM_API_KEY=dg_...
  • فعّل موفّر الصوت

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}
  • أرسل ملاحظة صوتية

    أرسل رسالة صوتية عبر أي قناة متصلة. سيقوم OmeniaClaw بنسخها عبر Deepgram وحقن النص في مسار الرد.

  • خيارات التهيئة

    الخيار المسار الوصف
    model tools.media.audio.models[].model معرّف نموذج Deepgram (الافتراضي: nova-3)
    language tools.media.audio.models[].language تلميح اللغة (اختياري)
    detect_language tools.media.audio.providerOptions.deepgram.detect_language تمكين اكتشاف اللغة (اختياري)
    punctuate tools.media.audio.providerOptions.deepgram.punctuate تمكين علامات الترقيم (اختياري)
    smart_format tools.media.audio.providerOptions.deepgram.smart_format تمكين التنسيق الذكي (اختياري)

    مع تلميح اللغة

    json5
    {  tools: {    media: {      audio: {        enabled: true,        models: [{ provider: "deepgram", model: "nova-3", language: "en" }],      },    },  },}

    مع خيارات Deepgram

    json5
    {  tools: {    media: {      audio: {        enabled: true,        providerOptions: {          deepgram: {            detect_language: true,            punctuate: true,            smart_format: true,          },        },        models: [{ provider: "deepgram", model: "nova-3" }],      },    },  },}

    النسخ المتدفق في Voice Call

    تسجّل Plugin المجمّعة deepgram أيضًا موفّر نسخ فوري لـ Plugin الخاصة بـ Voice Call.

    الإعداد مسار التهيئة الافتراضي
    مفتاح API plugins.entries.voice-call.config.streaming.providers.deepgram.apiKey يعود إلى DEEPGRAM_API_KEY
    النموذج ...deepgram.model nova-3
    اللغة ...deepgram.language (غير معيّنة)
    الترميز ...deepgram.encoding mulaw
    معدل العينة ...deepgram.sampleRate 8000
    Endpointing ...deepgram.endpointingMs 800
    النتائج المرحلية ...deepgram.interimResults true
    json5
    {  plugins: {    entries: {      "voice-call": {        config: {          streaming: {            enabled: true,            provider: "deepgram",            providers: {              deepgram: {                apiKey: "${DEEPGRAM_API_KEY}",                model: "nova-3",                endpointingMs: 800,                language: "en-US",              },            },          },        },      },    },  },}

    ملاحظات

    المصادقة

    تتبع المصادقة ترتيب auth القياسي الخاص بالموفّر. ويُعد DEEPGRAM_API_KEY أبسط مسار.

    Proxy ونقاط النهاية المخصصة

    تجاوز نقاط النهاية أو الرؤوس باستخدام tools.media.audio.baseUrl و tools.media.audio.headers عند استخدام proxy.

    سلوك الإخراج

    يتبع الإخراج قواعد الصوت نفسها كما في الموفّرين الآخرين (حدود الحجم، والمهلات، وحقن النص المنسوخ).

    ذو صلة

    Was this useful?
    On this page

    On this page