MiniMax M2.5: نموذج ذكاء اصطناعي صيني ينافس Claude Opus بعُشر التكلفة

أطلقت شركة الذكاء الاصطناعي الصينية الناشئة MiniMax نموذجها الرائد M2.5 في 12 فبراير 2026، محققاً أداءً متقدماً في البرمجة واستخدام الأدوات الوكيلية وأتمتة المهام المكتبية — بجزء بسيط من تكلفة المنافسين الغربيين.
أبرز النقاط
- 80.2% على SWE-Bench Verified، المعيار الصناعي لمهام البرمجة الواقعية
- 51.3% على Multi-SWE-Bench، للتعامل مع قواعد الأكواد المعقدة متعددة المستودعات
- 76.3% على BrowseComp، مما يُظهر قدرات متقدمة في تصفح الويب والبحث
- أسرع بنسبة 37% من سابقه M2.1 في معايير البرمجة
- أوزان مفتوحة متاحة على Hugging Face بموجب ترخيص MIT معدّل
أداء يضاهي الأفضل
ينافس M2.5 مباشرة Claude Opus 4.6 من Anthropic و GPT-5 من OpenAI في المعايير الرئيسية. على SWE-Bench Verified، يُكمل النموذج المهام في 22.8 دقيقة — وهو ما يطابق تقريباً 22.9 دقيقة لـ Claude Opus 4.6 — مع استخدام عدد جولات بحث أقل بنحو 20%.
على معيار VIBE-Pro لتطوير واجهات المستخدم والمنتجات، يؤدي M2.5 بمستوى مماثل لـ Claude Opus 4.5. وفي مهام الإنتاجية المكتبية المقاسة بـ GDPval-MM، يحقق النموذج معدل فوز متوسط يبلغ 59.0% مقارنة بالنماذج المتقدمة المنافسة.
ثورة في الأسعار
الجانب الأكثر لفتاً للانتباه في M2.5 هو هيكل تسعيره. تقدم MiniMax النموذج باعتباره "أول نموذج متقدم لا يحتاج المستخدمون فيه للقلق بشأن التكلفة":
- M2.5-Lightning: 0.30 دولار لكل مليون رمز إدخال، 2.40 دولار لكل مليون رمز إخراج
- M2.5 القياسي: نصف تكلفة Lightning
- تكلفة التشغيل: حوالي دولار واحد في الساعة بمعدل 100 رمز في الثانية
هذا يجعل M2.5 أرخص بين 10 إلى 20 مرة من Claude Opus و Gemini 3 Pro و GPT-5 لأحمال العمل المماثلة.
كيف بنته MiniMax
وراء أداء M2.5 يقف إطار عمل Forge الخاص بـ MiniMax، وهو نظام تعلم معزز مُصمم للوكلاء حقق تسريعاً في التدريب بمقدار 40 ضعفاً. تم تدريب النموذج على أكثر من 200,000 سيناريو برمجة واقعي يغطي أكثر من 10 لغات برمجة.
تضمن خوارزمية CISPO المبتكرة استقرار التدريب لبنية Mixture of Experts (MoE) واسعة النطاق، بينما تراقب مكافآت العمليات جودة التوليد أثناء عمليات الوكيل طويلة السياق.
من السلوكيات الملفتة التي ظهرت: طوّر M2.5 "ميلاً لكتابة المواصفات" أثناء التدريب، حيث يقوم تلقائياً بتحليل وتخطيط الميزات قبل كتابة الكود — متصرفاً كمهندس برمجيات خبير وليس مجرد مُبرمج سطر بسطر.
الاعتماد الفعلي
تشير MiniMax إلى أن M2.5 يتعامل حالياً مع 30% من المهام الداخلية للشركة بشكل مستقل، حيث يمثل الكود الذي يولده M2.5 نسبة 80% من الإيداعات الجديدة في مستودعاتهم. يتكامل النموذج أصلياً مع منصة MiniMax Agent، مع مهارات موحدة لأتمتة Word و PowerPoint و Excel.
ماذا يعني هذا
يُكثّف هذا الإطلاق حرب الأسعار في مجال الذكاء الاصطناعي بين المختبرات الصينية والغربية. بعد Qwen 3.5-Plus من Alibaba والاضطرابات السابقة من DeepSeek، يُثبت MiniMax M2.5 أن قدرات الذكاء الاصطناعي المتقدمة لم تعد حكراً على العروض الأغلى ثمناً.
بالنسبة للمطورين والمؤسسات، يقدم M2.5 خياراً مقنعاً: أداء شبه مطابق لأغلى النماذج بتكاليف أقل بشكل كبير، مع أوزان مفتوحة تتيح النشر المحلي والتخصيص.
المصدر: MiniMax
ناقش مشروعك معنا
نحن هنا للمساعدة في احتياجات تطوير الويب الخاصة بك. حدد موعدًا لمناقشة مشروعك وكيف يمكننا مساعدتك.
دعنا نجد أفضل الحلول لاحتياجاتك.