البنية التحتية ديجيو

نماذج الذكاء الاصطناعي ووحدة معالجة الرسومات

قم بتشغيل الوكلاء على النماذج الحدودية المُدارة اليوم - أو استأجر سعة وحدة معالجة الرسومات، وانشر أوزانك الخاصة، وقم بتوجيه مهام Digio إلى نقاط نهاية خاصة في نفس مساحة العمل.

كلود، جي بي تي، الجوزاء اختيار نموذج لكل وكيل تأجير GPU وBYOM
النماذج المدارة

النماذج المتوفرة في Digio اليوم

قم بتعيين نموذج افتراضي لكل وكيل أو تجاوز لكل مهمة. يتم قياس الاستخدام في Digio Tokens من رصيد خطتك - نفس المحفظة سواء اتصل الوكيل بـ Sonnet أو GPT-4o أو Gemini Flash.

كلود أنثروبي

  • Claude Opus 4.7 المنطق الرئيسي والسياق الطويل والهندسة المعمارية والعمل الاستراتيجي.
  • Claude Opus 4.6 الجيل السابق من Opus لتحليل مستقر وعالي الجودة.
  • Claude Sonnet 4.6 برنامج التشغيل اليومي - الترميز والكتابة وحلقات الوكيل متعددة الخطوات.
  • Claude Sonnet 4.5 / 4 طبقات Sonnet سريعة مع تخزين مؤقت فوري على أعباء العمل المدعومة.
  • Claude Haiku 4.5 المسودات ذات زمن الوصول المنخفض، والتصنيف، والمهام الفرعية ذات الحجم الكبير.

تسمية واجهة المستخدم لموقع B2B SaaS. ترجمة إلى اللغة الطبيعية: OpenAI

  • GPT-5.5 / GPT-5.4 / GPT-5.2 أحدث عائلة GPT-5 لأحمال العمل العامة والوكلاء.
  • GPT-4.1 & GPT-4o دردشة موثوقة متعددة الوسائط واستخدام الأدوات لوكلاء الإنتاج.
  • GPT-4o mini توجيه فعال من حيث التكلفة للملخصات والخطوات خفيفة الوزن.
  • o3 / o3-pro / o3-mini / o4-mini نماذج تركز على المنطق للرياضيات والتخطيط والتحقق.
  • GPT-5.3 Codex & Codex mini مهارات إنشاء الأكواد وإعادة البناء ومهارات الوكيل المدركة للريبو.

جوجل الجوزاء

  • Gemini 2.5 Pro البحث طويل السياق والاستخراج المنظم.
  • Gemini 2.5 Flash خطوات وكيل عالية الإنتاجية بأسعار رمزية تنافسية.
  • Gemini 2.0 Flash تمريرات فائقة السرعة للتحليل ووضع العلامات والمهام المجمعة.

واجهات برمجة التطبيقات المفتوحة والمتخصصة

  • DeepSeek Chat & Reasoner قيمة قوية لمهام الدردشة وأسلوب سلسلة الأفكار.
  • Mistral Large خيار مستضاف في أوروبا لفرق الوكلاء متعددة اللغات.
  • Llama 3.3 70B نموذج فئة الأوزان المفتوحة عبر واجهة برمجة التطبيقات — يقترن بشكل جيد مع وحدة معالجة الرسومات الخاصة.
  • Grok 3 نموذج موجه في الوقت الفعلي لوكلاء الأخبار والمراقبة الاجتماعية.
  • Sonar Pro إجابات مبنية على البحث لوكلاء الأبحاث.
  • Command R+ دردشة مؤسسية صديقة لـ RAG وسير عمل الاسترجاع.

Model list and token economics evolve with provider releases. Your workspace shows live options when you assign a model to an agent; Digio Tokens debit from the same balance as in pricing.

الاستخدام

كيف يختار الوكلاء النموذج

يمكن للمنسق أن يوصي بنموذج Sonnet vs Opus مقابل نموذج فلاش أرخص بناءً على نوع المهمة. يقوم المستخدمون المتميزون بتعيين الإعدادات الافتراضية لكل دور وكيل - البحث على Sonnet، والمراجعة النهائية على Opus، ووضع العلامات المجمعة على Haiku أو Gemini Flash.

  • Per agent — default model in agent settings; override in To do or chat when needed.

  • Metered fairly — input, output, and cached tokens map to Digio Token charges (see usage in your wallet).

  • Skills stay the same — tools and integrations work across models; only latency and cost profile change.

  • Plan limits — more agents and monthly Digio Tokens on higher tiers; top up anytime on the pricing page.

تأجير GPU

استأجر GPU وقم بتشغيل النماذج الخاصة بك

هل تحتاج إلى ضبط دقيق، أو نقطة تفتيش معزولة بالهواء، أو تسعير استدلالي يمكن التنبؤ به؟ أضف سعة GPU مخصصة إلى مساحة عمل Digio الخاصة بك، وقم بتثبيت حزمة الخدمة التي تفضلها، وحدد الوكلاء عند نقطة النهاية الخاصة بك.

حالات مخصصة

عقد GPU كل ساعة أو شهرية (الفئة A100، H100، L40S) المرتبطة بالمستأجر الخاص بك - معزولة عن العملاء الآخرين.

الأوزان الخاصة بك

قم بتحميل أدوات الأمان، أو GGUF، أو اسحبها من السجل الخاص بك؛ قم بتشغيل Llama وMistral وQwen والإيقاعات الدقيقة المخصصة.

خدمة قياسية

vLLM أو TGI أو Ollama أو صور الحاوية التي تحتفظ بها - يستدعي وكلاء Digio عنوان URL الأساسي المتوافق مع OpenAI.

نفس التنسيق

للقيام بذلك، تظل الدردشة الجماعية والمهارات والتعاون دون تغيير - فقط الواجهة الخلفية للاستدلال هي ملكك.

التوجيه الهجين

أرسل خطوات حساسة إلى وحدة معالجة الرسومات الخاصة واستخدم Claude أو GPT للبحث العام في سير عمل واحد.

ضوابط المؤسسة

نظير VPC، والخروج الثابت، وسجلات التدقيق، والقوائم المسموح بها للنماذج للفرق الخاضعة للتنظيم.

إحضار النموذج الخاص بك

تثبيت وتوصيل نموذج مخصص

الإعداد النموذجي من الصفر إلى الوكلاء الذين يتصلون بنقطة النهاية الخاصة بك:

  1. احتياطي GPU

    اختر VRAM والمنطقة ووقت التشغيل (الاندفاع مقابل التشغيل دائمًا). يتم شحن تخزين الأوزان مع المثيل أو تركيب الدلو الخاص بك.

  2. نشر المكدس

    ابدأ تشغيل صورة التقديم أو SSH، ثم قم بتثبيت برامج تشغيل CUDA، وقم بتحميل نقاط التفتيش. تؤكد الفحوصات الصحية أن النموذج جاهز.

  3. تسجيل نقطة النهاية

    أضف عنوان URL الأساسي ومفتاح API ومعرف النموذج في إعدادات مساحة العمل. يتحقق Digio من وقت الاستجابة وتنسيق الرمز المميز قبل بدء البث المباشر.

  4. تعيين للوكلاء

    اختر نموذجك الخاص كنموذج افتراضي للوكلاء المحددين؛ تظل نماذج Claude/GPT المُدارة متاحة جنبًا إلى جنب.

تتم محاسبة استئجار وحدة معالجة الرسومات بشكل منفصل عن اشتراكات خطة Digio. اتصل بنا لتخطيط السعة واتفاقيات مستوى الخدمة والانتقال من مجموعة الاستدلال الموجودة.

التعليمات

النماذج وأسئلة GPU

اختيار واجهات برمجة التطبيقات المُدارة مقابل الاستدلال المستضاف ذاتيًا على Digio.

هل أدفع مرتين — الخطة بالإضافة إلى واجهة برمجة التطبيقات (API)؟

يغطي اشتراك Digio الخاص بك البنية التحتية والوكلاء ورموز Digio المضمنة. يقوم استخدام النموذج المُدار بخصم رصيد الرمز المميز من خلال رموز الإدخال/الإخراج الفعلية. يعد استئجار وحدة معالجة الرسومات بمثابة وظيفة إضافية للأجهزة التي تتحكم فيها.

هل يمكن للوكلاء المختلفين استخدام نماذج مختلفة؟

نعم، يمكن أن يكون لكل وكيل خياره الافتراضي الخاص. يمكن تجاوز المهام والدردشات لتشغيل واحد دون تغيير الإعداد الافتراضي العام.

ما هو الفرق بين السوناتة وأوبوس؟

تم ضبط Opus من أجل تفكير أصعب وخطط أطول متماسكة. تعتبر Sonnet أسرع وأرخص بالنسبة لحلقات الوكيل اليومية. تعتبر نماذج Haiku وFlash هي الأفضل للمهام الفرعية ذات الحجم الكبير.

هل يمكنني تشغيل النموذج الخاص بي فقط وحظر واجهات برمجة التطبيقات السحابية؟

يمكن لمساحات عمل المؤسسة تقييد موفري النماذج الصادرة وتوجيه كل حركة مرور الوكيل إلى نقطة نهاية وحدة معالجة الرسومات (GPU) الخاصة بك. الوضع المختلط هو الوضع الافتراضي لمعظم الفرق.

ما هي أحجام GPU المتاحة؟

تعتمد العروض على المنطقة والطلب - عادةً طبقات VRAM سعة 24-80 جيجابايت لنماذج فئة 7B-70B وعقد وحدات معالجة الرسومات المتعددة للمجموعات الأكبر حجمًا. نحن نساعد في تحديد حجم VRAM من عدد المعلمات والتكميم.

هل لا يزال استخدام وحدة معالجة الرسومات الخاصة يستهلك رموز Digio؟

يبقى التنسيق (الوكلاء، المهام، التخزين) ضمن خطتك. يتم حساب الاستدلال على وحدة معالجة الرسومات الخاصة بك على أنه وقت وحدة معالجة الرسومات؛ يمكنك اختياريًا قياس الاستخدام على شكل رمز مميز لرد المبالغ المدفوعة داخليًا.

اختر النماذج المُدارة أو أحضر وحدة معالجة الرسومات الخاصة بك

ابدأ باستخدام Claude وGPT اليوم، ثم أضف وحدة معالجة الرسومات المخصصة عندما تكون مستعدًا لاستضافة أوزان مخصصة - نفس الوكلاء، نفس المهام، واستدلالك.