DeepSeek V4: سياق 1 مليون رمز مميز، خفض التكلفة بنسبة 73%

الكلمات المفتاحية: deepseek v4، الموقع الرسمي لـ deepseek، دروس deepseek، سعر deepseek v4

تاريخ النشر: 24 أبريل 2026

المؤلف: DeepSeek HK

DeepSeek V4: سياق 1 مليون رمز مميز، خفض التكلفة بنسبة 73%

اليوم، أعلنت DeepSeek رسميًا عن إصدار وفتح مصدر نسخة المعاينة من سلسلة DeepSeek-V4، وهي نظام النموذج الرائد للجيل التالي الذي يأتي بعد V3.2. يتضمن هذا الإصدار نموذجين: DeepSeek-V4-Pro و DeepSeek-V4-Flash، وكلاهما يعتمد بنية MoE بمقياس معلمات إجمالي يبلغ 1.6 تيرا (49 مليار مفعل) و 284 مليار (13 مليار مفعل) على التوالي، وكلاهما يدعم حد أقصى لسياق 1 مليون رمز مميز.

أوضحت DeepSeek الرسمي أيضًا أنه نظرًا لقيود القوة الحسابية عالية الجودة، فإن إنتاجية الخدمة الحالية لـ DeepSeek-V4-Pro محدودة جدًا. ومن المتوقع بعد الإطلاق الجماعي للعقد الفائقة Ascend 950 في النصف الثاني من العام، أن ينخفض سعره بشكل كبير. بالإضافة إلى ذلك، حصلت DeepSeek-V4 على دعم تكيف يوم 0 من Cambricon، وتم فتح مصدر كود التكيف ذي الصلة إلى مجتمع GitHub.

اختلافات تحديد موضع النموذج

يركز DeepSeek-V4-Pro على الحد الأقصى للأداء، مقارنة بالنماذج الرائدة مغلقة المصدر؛ بينما يقلل DeepSeek-V4-Flash بشكل كبير من مقياس المعلمات ومقياس التنشيط في مقابل زمن انتقال أقل وتكلفة أقل. مقارنة بالنموذج من الجيل السابق، فقد تحسن بشكل أكبر في قدرات الوكيل والمعرفة العالمية ومهام الاستدلال المعقد، ولأول مرة، يتم فتح “سياق 1 مليون رمز مميز” كقدرة افتراضية.

قدرات الوكيل المحسنة بشكل كبير

من حيث قدرات الوكيل، تم تحسين قدرات الوكيل لـ DeepSeek-V4-Pro بشكل كبير. لقد دخل الطبقة الأولى من المصادر المفتوحة في التقييمات مثل البرمجة الوكيلية. تظهر التقييمات الداخلية أن جودة تسليمه قريبة من وضع عدم التفكير لـ Claude Opus 4.6، ولكن لا توجد فجوة مقارنة بوضع التفكير الخاص به.

لقد تفوق DeepSeek-V4-Pro على النماذج مفتوحة المصدر المقيمة علنًا حاليًا في المهام الصعبة مثل الرياضيات و STEM وكود المسابقة، وأدائه العام قريب أو حتى قابل للمقارنة مع النماذج الرائدة مغلقة المصدر مثل GPT-5.4 و Claude Opus 4.6-Max.

انخفاض كبير في تكلفة السياق الطويل

في الوقت نفسه، قدمت DeepSeek-V4 مجموعة من التحسينات الأكثر جذرية في كفاءة السياق الطويل: في سيناريوهات 1 مليون رمز مميز، فإن حسابة الاستدلال للرمز المميز الواحد لا تمثل سوى 27% من V3.2، وينخفض استخدام ذاكرة التخزين المؤقت KV إلى حوالي 10%، مما يقلل بشكل كبير من تكلفة القوة الحسابية وذاكرة الفيديو لمهام الروابط الطويلة.

خطة تسعير API

السعر الرسمي المعلن لـ API لسلسلة DeepSeek-V4:

DeepSeek-V4-Pro: 1 يوان / مليون رمز مميز للإدخال المخزن مؤقتًا، 12 يوان / مليون رمز مميز للإدخال غير المخزن مؤقتًا، 24 يوان / مليون رمز مميز للإخراج
DeepSeek-V4-Flash: فقط 0.2 يوان / مليون رمز مميز للإدخال المخزن مؤقتًا، 1 يوان / مليون رمز مميز للإدخال غير المخزن مؤقتًا، 2 يوان / مليون رمز مميز للإخراج

حاليًا، تم إطلاق سلسلة DeepSeek-V4 على الموقع الرسمي والتطبيق، وتم فتح واجهات برمجة التطبيقات وأوزان النماذج في نفس الوقت.

التجربة العملية: تحسين شامل للقدرات

لقد اختبرنا أولًا تغييرات DeepSeek-V4، حيث اختبرنا بشكل رئيسي نموذج DeepSeek-V4-Pro.

تحسن كبير في قدرة البرمجة الوكيلية

في حالة الويب الأمامي لمرة واحدة، أظهر DeepSeek-V4-Pro كفاءة تنفيذ عالية. نظرًا لأن المتطلبات لم تكن معقدة، استغرق النموذج 5 ثوانٍ فقط للتفكير، ثم طور بسرعة، وهو أمر مختلف بشكل كبير عن نمط نموذج DeepSeek السابق الذي يضيع الكثير من الرموز المميزة في التفكير. بعد الدخول إلى عملية التوليد الفعلية، يبلغ طول إخراج DeepSeek-V4-Pro بشكل كبير أطول من نماذج DeepSeek الأخرى، بسرعة توليد سريعة، حيث يتم الإخراج بشكل أساسي بوحدات 5 أسطر من الكود، ودرجة إكمال صفحة الويب أعلى من DeepSeek-V3.2، بتصميم أكثر ثراء.

في اختبار المهمة الذي يجمع بين قدرات الوكيل والبرمجة، يمكن لـ DeepSeek-V4-Pro إجراء مكالمات أدوات معقدة متعددة الجولات، كما ازداد عدد إدخالات البحث عبر الإنترنت مقارنة بالنماذج السابقة، وجمع المعلومات أكثر شمولية. خطة السفر المولدة النهائية مخططة بشكل معقول، ومجهزة بموقع كل معلم جذب سياحي، ويمكن استخدامها مباشرة في تطبيق الملاحة بعد النقر، وهو أمر مريح جدًا. في مهام الوكيل، يمكن ملاحظة أن أفعاله حاسمة جدًا، ويتم حل مكالمات الأدوات والتفكير في غضون بضع ثوانٍ، وكفاءة الرمز المميز جيدة.

اختبار عملي لسياق 1 مليون رمز مميز

تدعم نماذج سلسلة DeepSeek-V4 سياق 1 مليون رمز مميز. قمنا بتحميل ثلاثية “الجسد الثلاثي” الكاملة (حوالي 540 ألف رمز مميز إجماليًا) للاختبار، ويمكن للنموذج تحديد المحتوى المحدد بسرعة، مما يحقق بنجاح استرجاع المعلومات في النصوص الطويلة للغاية.

يظهر اختبار تاريخ قطع المعرفة أن تاريخ قطع المعرفة لـ DeepSeek-V4-Pro لا يزال في عام 2025. بالإضافة إلى ذلك، لا يدعم هذا النموذج القدرات المرئية حتى الآن. بعد تحميل الصور، لا يزال يقوم باستخراج النص، وستظهر الصور بدون نص أنه لا يمكن معالجتها.

ابتكار البنية التقنية

التغيير الأكثر مباشر لجيل V4 هذا هو أن “السياق الطويل” أصبح قدرة افتراضية. على عكس الطريقة التقليدية المتمثلة في ببساطة توسيع النافذة، يقدم DeepSeek-V4-Pro بنية اهتمام هجينة جديدة، وتجمع بين الانتباه المتناثر المضغوط والانتباه عالي الضغط (HCA)، ويتعاون مع الانتباه المتناثر DSA للضغط في بُعد الرمز المميز.

بالإضافة إلى ذلك، يقدم النموذج اتصالًا فائقًا مقيدًا بالتشعب (mHC) لتحسين الوصلات المتبقية التقليدية، ويستخدم مُحسن Muon لتحسين سرعة التقارب وثبات التدريب. تمكن هذه السلسلة من التصاميم النموذج من التحكم الفعال في تكلفة الحساب بينما “يتذكر لفترة أطول”.

وفقًا للبيانات الرسمية، في سياق 1 مليون رمز مميز، انخفضت عمليات TFLOP لاستدلال الرمز المميز الواحد لـ DeepSeek-V4-Pro بحوالي 3.7 مرة إلى 9.8 مرة مقارنة بـ DeepSeek-V3.2، وانخفض استخدام ذاكرة التخزين المؤقت KV بمقدار 9.5 مرة إلى 13.7 مرة. هذا يعني أن مهام الروابط الفائقة الطويلة التي كان من الصعب تشغيلها فعليًا في الماضي (مثل التخطيط الوكيل متعدد الجولات، ومعالجة المستندات الطويلة) بدأت تدخل نطاق التنفيذ القابل للتنفيذ.

الأداء: السقف الجديد للنماذج مفتوحة المصدر

من منظور بنية القدرة، فإن تحسين DeepSeek-V4-Pro هو التحسين المتزامن لقدرات الاستدلال والمعرفة والوكيل:

قدرات المعرفة والاستدلال

في مهام المعرفة والاستدلال، يتفوق على النماذج مفتوحة المصدر السائدة الحالية في التقييمات مثل SimpleQA و Apex و Codeforces، وهو قريب من GPT-5.4 و Gemini 3.1 Pro في العديد من المهام. على سبيل المثال، حصل على 90.2 نقطة في القائمة القصيرة لـ Apex، متجاوزًا بالفعل النماذج الرائدة مغلقة المصدر؛ كما يحافظ على مستوى الطبقة الأولى في مهام المسابقة مثل Codeforces.

قدرات الوكيل

في المهام المتعلقة بقدرة الوكيل، يؤدي DeepSeek-V4-Pro أداءً مستقرًا في مؤشرات مثل SWE Verified و Terminal Bench. يصل SWE Verified إلى 80.6، قريبًا من Claude Opus 4.6، وارتفاعًا كبيرًا عن معظم النماذج مفتوحة المصدر. في Terminal Bench 2.0، يتفوق أداؤه أيضًا على النماذج مثل GLM-5.1 Thinking و Kimi K2.6 Thinking.

بشكل عام، يعتبر DeepSeek-V4-Pro حاليًا “السقف” للنماذج مفتوحة المصدر.

التحسين الخاص لسيناريوهات الوكيل

يعزز جيل DeepSeek-V4 هذا بشكل كبير التكيف مع سيناريوهات الوكيل. لقد أجرى تحسينات خاصة لأطر الوكيل السائدة مثل Claude Code و OpenClaw و CodeBuddy، ويعمل بشكل أكثر استقرارًا في المهام متعددة الخطوات مثل توليد الكود وتوليد المستندات.

من منظور تحديد الموضع الفعلي، تم استخدام DeepSeek-V4-Pro كنموذج برمجة وكيلية داخل DeepSeek، مع التركيز على “إكمال المهام”. بالنسبة للمهام البسيطة، يقترب V4-Flash بالفعل من الإصدار Pro، ولكن لا تزال هناك فجوة كبيرة في المهام المعقدة، وهو ما يوفر بشكل أساسي “ترسين قوة حساب” لتطبيقات الوكيل.

الخاتمة

إن إصدار DeepSeek-V4 لا يوضح فقط تراكم الفريق في التكنولوجيا والبنية، ولكنه يمثل أيضًا قدرة الهبوط الفعلية للنماذج الكبيرة مفتوحة المصدر ضمن النظام البيئي للقوة الحسابية المحلية. بعد التكيف والتحسين للرقائق المحلية مثل Huawei Ascend و Cambricon، حققت سلسلة DeepSeek-V4 دعمًا مستقرًا واستدلالًا فعالًا لسياق 1 مليون رمز مميز، مما يجعل مهام الروابط الطويلة وتنفيذ الوكيل متعدد الخطوات ممكنًا.

ينفذ هذا الإصدار تحديد الموضع المختلف لـ Pro و Flash، مقتربًا من النماذج الرائدة مغلقة المصدر في الأداء، ويحافظ على فعالية تكلفة عالية في التكلفة، مما يوفر خيارات مفتوحة غير مسبوقة للمطورين المحليين. والأهم من ذلك، يظهر هذا الإصدار أن النماذج مفتوحة المصدر لا يمكنها فقط ترسيخ أقدامها في المنافسة العالمية، ولكنها يمكنها أيضًا تحويل الإمكانات التقنية إلى إنتاجية عملية بمساعدة القوة الحسابية المحلية والبنية المُحسّنة.

قد يكون DeepSeek-V4 خطوة رئيسية اتخذتها القوة المفتوحة المصدر الصينية في مسار الذكاء الاصطناعي عالي الأداء، ويوفر أيضًا إرشادًا واضحًا لابتكار وهبوط النظام البيئي للذكاء الاصطناعي المحلي.

ابدأ استخدام DeepSeek