مختبر الذكاء الاصطناعي نشط
الذكاء بالتصميم
اثنا عشر نموذجاً للذكاء الاصطناعي مُدرَّبة على بنيتنا التحتية. لغة، رؤية، ترجمة، توصيات — كلها مبنية داخلياً.
12
نموذج في الإنتاج
8×
وحدة GPU A100
99.97%
وقت تشغيل النماذج
<50ms
متوسط الاستجابة
نماذج الإنتاج
مجموعة BULLI AI
bulli-lm_v2.model
إنتاج
BULLI-LM v2
Large Language Model
// المعاملات7B
// الأجهزة8× A100 80GB
// الاستدلال~40 tok/s
// حالات الاستخدام
Content genSummarizationQ&ATranslation
bulli-lm_v1.model
إنتاج
BULLI-LM v1
Language Model (Legacy)
// المعاملات1.3B
// الأجهزة4× A100 40GB
// الاستدلال~90 tok/s
// حالات الاستخدام
SEO contentMetadataHeadlines
bulli-vision.model
إنتاج
BULLI-Vision
Computer Vision
// المعاملات500M
// الأجهزة4× A100 40GB
// الاستدلال<10ms/img
// حالات الاستخدام
ModerationClassificationOCR
bulli-translate.model
إنتاج
BULLI-Translate
Neural MT
// المعاملات600M
// الأجهزة2× A100 40GB
// الاستدلال200 wps
// حالات الاستخدام
24 langsLocalization
bulli-rank.model
إنتاج
BULLI-Rank
Recommendation
// المعاملات120M
// الأجهزة2× A100
// الاستدلال<5ms
// حالات الاستخدام
CTR optAd targeting
bulli-lm_v3.model
تدريب
BULLI-LM v3
Next-Gen LLM
// المعاملات70B
// الأجهزة32× H100 80GB
// الاستدلالTBD
// حالات الاستخدام
ReasoningCode genMultimodal
البنية التحتية
طبقات البنية التحتية
أربع طبقات من الحوسبة إلى المستخدمين النهائيين. انقر على أي طبقة للتفاصيل.
8× NVIDIA A100 80GB · NVLink · 640GB VRAM · 2.5 PF FP16 · 2026: 32× H100
Custom FastAPI · 4-node load balance · autoscaling · <50ms P99 · 10K req/s
24 microservices · content pipelines · SEO loops · ad targeting · mobile backends
1,000+ websites · 5 mobile apps · B2B APIs · 50M+ daily users
الأداء المباشر
مقاييس الأداء
99.97%
AI Cluster Uptime
Last 365 days
47ms
P50 Latency
Inference API
8400
Requests/sec
Peak capacity
2.5PF
FP16 Compute
Total FLOPS
وصول API
استخدم ذكاءنا الاصطناعي
في منتجك
الوصول إلى BULLI-LM و BULLI-Vision و BULLI-Translate عبر REST API.