بعد انتظار دام 15 شهراً، DeepSeek تكشف أخيراً عن معاينة V4: تحليل شامل

يستكشف هذا المقال الميزات التقنية وأداء وإرشادات استخدام DeepSeek V4، ويقدم تحليلاً شاملاً للمزايا الأساسية لهذا الجيل الجديد من نماذج اللغة الكبيرة. يتم كتابة المحتوى بأسلوب سهل الوصول مناسب لكل من المهتمين بالتكنولوجيا والمطورين.

الكلمات المفتاحية: deepseek v4، موقع deepseek الرسمي، دليل deepseek، سعر deepseek v4.

تاريخ النشر: 25 أبريل 2026 المؤلف: DeepSeek HK

ابدأ باستخدام DeepSeek

تحليل شامل لمعاينة DeepSeek V4

1. إطلاق DeepSeek V4 Preview رسمياً

في 24 أبريل، أعلنت DeepSeek رسمياً عن إطلاق V4 Preview. يأتي هذا التحديث الكبير بعد 15 شهراً من إطلاق V3.2، مما يمثل اختراقاً مهماً آخر في خارطة طريق تقنية النماذج الكبيرة لدى DeepSeek.

وفقاً للمقدمة الرسمية، تتضمن سلسلة V4 نموذجين MoE:

DeepSeek-V4-Pro: إجمالي 1.6 تريليون معامل، 49 مليار معامل مفعل
DeepSeek-V4-Flash: إجمالي 284 مليار معامل، 13 مليار معامل مفعل

يدعم كلا النموذجين أصلاً سياق مليون رمز، مما يمثل قفزة نوعية في قدرات معالجة النصوص الطويلة. من الجدير بالملاحظة أنه تحت إعدادات سياق 1M:

FLOPs الاستدلال لكل رمز لـ V4-Pro هي فقط 27% من V3.2، مع KV Cache بنسبة 10% فقط
V4-Flash أكثر تطرفاً، مما يقلل هذه المقاييس إلى 10% و 7% على التوالي

هذا يعني أنه بينما توسعت طول السياق تقريباً 8 مرات من 128K في V3.2 إلى 1M في V4، انخفضت متطلبات الحوسبة لكل رمز بشكل كبير، مما حقق اختراقات في كل من قدرة السياق الطويل وكفاءة الاستدلال.

توضح مسؤولو DeepSeek بوضوح أن V4 Preview موضع كتحديث للبنية التحتية، ويعيد بناء هيكل تكاليف السياق الطويل بشكل أساسي لتمهيد الطريق للمرحلة التالية من التوسع في وقت الاختبار والمهام طويلة المدى. لا يزال مستوى قدراته الحالية متأخراً عن GPT-5.4 وGemini-3.1-Pro، مع مسار تطوير متأخر بحوالي 3-6 أشهر عن نماذج المصدر المغلق المتطورة.

2. نموذجان، ثلاثة أوضاع استدلال: الميزات الأساسية لـ V4

2.1 معاملات النموذج ومزايا التكلفة

أبرز ما يميز سلسلة V4 هو التحسين الكبير في منحنى التكلفة. تحت إعدادات سياق 1M رمز:

V4-Pro: FLOPs الاستدلال لكل رمز هي فقط 27% من V3.2، KV Cache فقط 10%
V4-Flash: FLOPs الاستدلال لكل رمز هي فقط 10% من V3.2، KV Cache فقط 7%

يقلل هذا التحسين في الكفاءة من تكلفة الاستدلال لسياق المستوى المليون بشكل كبير، مما يوفر حلاً اقتصادياً قابلاً للتطبيق لمعالجة النصوص الطويلة وتحليل المستندات وسيناريوهات أخرى.

2.2 نظام تسعير واجهة برمجة التطبيقات

تواصل DeepSeek استراتيجية التسعير المتسقة عالية القيمة:

V4-Pro: ¥1 لكل مليون رمز إدخال (إصابة ذاكرة التخزين المؤقت) أو ¥12 (فشل ذاكرة التخزين المؤقت)، ¥24 لكل مليون رمز إخراج
V4-Flash: ¥0.2 لكل مليون رمز إدخال (إصابة ذاكرة التخزين المؤقت) أو ¥1 (فشل ذاكرة التخزين المؤقت)، ¥2 لكل مليون رمز إخراج

2.3 ثلاثة مستويات لشدة الاستدلال

يقدم كل نموذج ثلاثة أوضاع استدلال لتلبية متطلبات السيناريو المختلفة:

Non-think: وضع الإخراج المباشر، أسرع سرعة استجابة
Think High: وضع التفكير العميق العادي، موازنة السرعة والجودة
Think Max: يحقق تعليمات قوية، يزيد من طول السياق والإخراج إلى أقصى حد، ويطلق العنان لقدرات النموذج الكاملة

يحسن وضع Max بشكل كبير من أداء النموذج: ترتفع درجات V4-Pro-Max من 34.5 إلى 37.7 في اختبارات HLE، ومن 85.5 إلى 90.2 في اختبارات Apex Shortlist، على حساب مضاعفة عدد الرموز المخرجة.

3. أداء اختبارات المعايير

وفقاً لبيانات الاختبار الرسمية الصادرة عن DeepSeek، تؤدي سلسلة V4 بشكل ممتاز في تقييمات متعددة:

3.1 اختبارات المعرفة والاستدلال

يحتل DeepSeek-V4-Pro-Max المرتبة الأولى في Apex Shortlist (90.2%) وCodeforces (التقييم 3206)، وهما مهمتان صعبتان في الاستدلال/البرمجة، مما يدل على قدرات منطقية وخوارزمية قوية للغاية
يتصدر Gemini-3.1-Pro-High في SimpleQA Verified (75.6%)
يتمتع Claude وGPT بنقاط قوة خاصة بهما عبر مشاريع مختلفة، مع فجوات عامة صغيرة

3.2 اختبارات قدرة الوكيل

يؤدي النماذج الأربعة بشكل متساوٍ في مهام SWE Verified (جميعها تصل إلى 80.6%)
يتفوق DeepSeek في Terminal Bench 2.0 (67.9%) وToolathlon (51.8%)، مما يدل على مزايا واضحة في سيناريوهات تنفيذ التعليمات المعقدة واستدعاء الأدوات

تشير المسؤولون إلى أن قدرات الوكيل لدى DeepSeek-V4-Pro قد تحسنت بشكل كبير مقارنة بالأجيال السابقة، “توفر تجربة مستخدم أفضل من Sonnet 4.5، مع جودة تسليم قريبة من وضع non-thinking الخاص بـ Opus 4.6، على الرغم من أنها لا تزال متأخرة إلى حد ما عن وضع thinking الخاص بـ Opus 4.6.”

3.3 المعرفة العالمية والقدرات العامة

يتفوق V4-Pro بشكل كبير على نماذج المصدر المفتوح الأخرى في تقييمات المعرفة العالمية، متأخراً فقط قليلاً عن نموذج المصدر المغلق الرائد Gemini-Pro-3.1
في الرياضيات وSTEM وتقييمات التعليمات البرمجية التنافسية، يتفوق V4-Pro على جميع نماذج المصدر المفتوح التي تم تقييمها علناً حالياً، ويصل إلى مستوى نماذج المصدر المغلق العالمية المتميزة
كنموذج اقتصادي، يحتوي V4-Flash على احتياطي معرفة أقل قليلاً من الإصدار Pro، ولكن قدرات استدلال مماثلة. مع معاملات وقيم تفعيل أصغر، يوفر خدمات واجهة برمجة تطبيقات أسرع وأكثر فعالية من حيث التكلفة
في تقييمات الوكيل، يؤدي V4-Flash بشكل مقارن مع الإصدار Pro في المهام البسيطة، ولكن لا تزال هناك فجوات في المهام ذات الصعوبة العالية

4. الابتكار التقني الأساسي: إعادة كتابة آلية الانتباه

أكثر تغيير تقني مركزي في V4 هو في طبقة الانتباه، وحل مشكلة كفاءة استدلال السياق الطويل بشكل أساسي.

في آليات انتباه Transformer التقليدية، يحتاج كل رمز إلى حساب التشابه مع جميع الرموز السابقة. عندما يتوسع السياق من 100K إلى 1M، تزداد التكلفة الحسابية 100 مرة، وهذا هو عنق الزجاجة الأساسي الذي يمنع تبني السياق الطويل على نطاق واسع.

يعتمد V4 آلية انتباه مزدوجة مبتكرة مع طبقات متناوبة:

CSA (Compressed Sparse Attention): يدمج أولاً ذاكرة التخزين المؤقت KV لكل 4 رموز في ملخص واحد، ثم يسمح لكل استعلام بتحديد أفضل k ملخصات ذات صلة فقط لحساب الانتباه، مما يضغط المحتوى المراد معالجته ويركز فقط على المعلومات ذات الصلة
HCA (Heavy Compressed Attention): يستخدم ضغطاً أكثر عدوانية، بدمج كل 128 رمزاً في ملخص واحد، ثم يطبق انتباهاً كثيفاً على الملخصات المتبقية دون اختيار متناثر

تتناوب آليتا الانتباه وتتراكب، مجتمعتان مع فرع النافذة المنزلقة الذي يتعامل مع تبعيات التفاصيل بين الرموز المجاورة، مكونة نهجاً مجتمعاً من “الحبيبات الخشنة + الحبيبات الدقيقة، المتناثرة + الكثيفة”.

من منظور تطور التكنولوجيا، تابعت DeepSeek V2 وV3 بشكل أساسي مسار التناثر المعامل (معاملات إجمالية كبيرة ولكن تنشيط خبراء جزئيين فقط لكل رمز). يفتح V4 مساراً جديداً من تناثر السياق (ضغط KV، اختيار top-k، معدلات الضغط الطبقية) على أساس ذلك. هذه هي المرة الأولى التي تطبق فيها DeepSeek مفهوم “التناثر” على الهيكل الأساسي لـ Transformer.

بالإضافة إلى طبقة الانتباه، هناك تحسينان معماريان مهم آخران في V4:

ترقية الاتصالات المتبقية التقليدية إلى mHC (Manifold Constrained Hyperconnection)، مما يجعل انتشار الشبكات العميقة للأمام والخلف أكثر استقراراً من خلال القيود الرياضية
استبدال AdamW بمحسن Muon لمعظم الوحدات، لتحقيق تقارب أسرع وتدريب أكثر استقراراً

هذه هي المرة الأولى التي تقوم فيها DeepSeek بتعديل ثلاثة مكونات Transformer الأساسية في وقت واحد: الانتباه، والاتصالات المتبقية، والمحسن.

5. الابتكار في نموذج ما بعد التدريب: تقطير نماذج الخبراء

بالمقارنة مع التغييرات المعمارية، فإن ابتكار V4 في أساليب ما بعد التدريب يستحق الاهتمام أكثر.

استخدم V3.2 نهج “RL المختلط”، مع تحسين أهداف متعددة في وقت واحد باستخدام التعلم المعزز. يتبنى V4 استراتيجية خطوتين “تمييز ثم توحيد”:

مرحلة التمييز: لمجالات مختلفة مثل الرياضيات والتعليمات البرمجية والوكيل واتباع التعليمات، قم بتدريب نموذج خبير منفصل لكل مجال. يخضع هؤلاء الخبراء أولاً للضبط الدقيق الخاضع للإشراف باستخدام بيانات مجال عالية الجودة، ثم التعلم المعزز باستخدام خوارزمية GRPO، كل خبير يحقق أداءً أمثل في مجال تخصصه
مرحلة التوحيد: تستخدم طريقة On-Policy Distillation (OPD) لـ “تخليق” أكثر من عشرة خبراء مجال مرة أخرى في نموذج طالب موحد. بعد أن يولد الطالب إجابة، تتطابق مع توزيع إخراج الخبير الذي “يفهم هذه المشكلة على أفضل وجه”، ممتصاً قدرات الخبراء من خلال المحاذاة على مستوى logits

يمكن فهم هذا النهج على أنه تقطير قدرات العديد من “أفضل الطلاب” في المجال في نموذج واحد. لحل التحدي الهندسي لتحميل أكثر من عشرة نماذج معلمين ذات معاملات تريليونية في وقت واحد، تقوم DeepSeek بتفريغ جميع أوزان المعلمين إلى التخزين الموزع، مع تخزين حالة الإخفاء لآخر طبقة من كل معلم فقط. أثناء التدريب، يتم فرز العينات حسب فهرس المعلم، مما يضمن وجود رأس معلم واحد فقط في ذاكرة GPU في أي وقت.

يتجنب هذا النهج مشكلة تداخل القدرات الشائعة في “RL المختلط” التقليدي، مما يسمح للنموذج بتحقيق أداء على مستوى الصدارة في مجالات متعددة.

6. التحسين الخاص لقدرات الوكيل

يتضمن DeepSeek V4 تكييفات وتحسينات متخصصة لمنتجات الوكيل الرئيسية، مع أداء محسّن في مهام التعليمات البرمجية وإنشاء المستندات وسيناريوهات أخرى.

تشمل التحسينات الخاصة لـ V4 لقدرات الوكيل ما يلي:

أثناء ما بعد التدريب، يتم التعامل مع الوكيل كاتجاه خبير مستقل إلى جانب الرياضيات والتعليمات البرمجية، مع تدريب منفصل
تغيير تنسيق استدعاء الأداة من JSON إلى هيكل XML مع رموز خاصة، مما يقلل من معدلات أخطاء الهروب
يتم الاحتفاظ بآثار الاستدلال عبر الأدوار بالكامل في سيناريوهات استدعاء الأدوات، ولم تعد يتم مسحها في كل دور كما في V3.2
منصة sandbox DSec ذاتية البناء، مع مجموعة واحدة قادرة على إدارة مئات الآلاف من حالات sandbox بشكل متزامن، داعمة تدريب وتقييم التعلم المعزز للوكيل

تشير المسؤولون إلى أن قدرات الوكيل لدى V4-Pro “أفضل من Sonnet 4.5، مع جودة تسليم قريبة من وضع non-thinking الخاص بـ Opus 4.5، على الرغم من أنها لا تزال متأخرة إلى حد ما عن وضع thinking الخاص بـ Opus 4.6.”

البنية التقنية لـ DeepSeek V4

ملخص

DeepSeek V4 Preview هو نموذج كبير مزود بابتكارات تقنية بارزة. من خلال إعادة بناء آلية الانتباه والابتكار في نموذج التدريب، يحافظ على قدرات استدلال قوية مع تقليل تكاليف استدلال السياق الطويل بشكل كبير، مما يمهد الطريق للتطبيقات العملية لسياق المستوى المليون.

سواء بالنسبة للسيناريوهات المهنية التي تتطلب قدرات استدلال قوية أو التطبيقات واسعة النطاق التي تسعى للفعالية من حيث التكلفة، توفر سلسلة V4 خيارات مناسبة. إذا كنت ترغب في تجربة القدرات القوية لـ DeepSeek V4، نرحب بك لاستخدامها مباشرة من خلال منصتنا.

ابدأ باستخدام DeepSeek