DeepSeek V4: 1 Milyon Token Bağlam, %73 Maliyet Düşüşü

Anahtar kelimeler: deepseek v4, deepseek resmi web sitesi, deepseek eğitim, deepseek v4 fiyat

Yayınlanma tarihi: 24 Nisan 2026

Yazar: DeepSeek HK

DeepSeek V4: 1 Milyon Token Bağlam, %73 Maliyet Düşüşü

Bugün DeepSeek, V3.2’den sonraki nesil amiral gemisi model sistemi olan DeepSeek-V4 serisinin önizleme sürümünün yayınlandığını ve açık kaynak yapıldığını resmen duyurdu. Bu sürüm iki model içerir: DeepSeek-V4-Pro ve DeepSeek-V4-Flash, her ikisi de MoE mimarisini benimser, toplam parametre ölçekleri sırasıyla 1,6T (49B etkinleştirilmiş) ve 284B (13B etkinleştirilmiştir) ve her ikisi de maksimum 1 milyon token bağlamını destekler.

DeepSeek yetkilileri ayrıca yüksek performanslı hesaplama gücünün sınırlamaları nedeniyle DeepSeek-V4-Pro’nun mevcut hizmet veriminin çok sınırlı olduğunu belirtti. Yılın ikinci yarısında Ascend 950 süper düğümlerinin toplu olarak piyasaya sürülmesinden sonra fiyatının önemli ölçüde düşmesi bekleniyor. Ek olarak, DeepSeek-V4 Cambricon’dan Gün 0 uyarlama desteği aldı ve ilgili uyarlama kodu GitHub topluluğuna açık kaynak olarak sunuldu.

Model Konumlandırma Farkları

DeepSeek-V4-Pro performans üst sınırına odaklanır, kapalı kaynak amiral gemisi modelleriyle kıyaslanır; DeepSeek-V4-Flash ise daha düşük gecikme ve daha düşük maliyet karşılığında parametre ölçeğini ve etkinleştirme ölçeğini önemli ölçüde azaltır. Önceki nesil modelle karşılaştırıldığında, ajan yetenekleri, dünya bilgisi ve karmaşık muhakeme görevlerinde daha da gelişmiştir ve ilk kez “1 milyon token bağlamı” varsayılan bir yetenek olarak açılmıştır.

Önemli ölçüde geliştirilmiş ajan yetenekleri

Ajan yetenekleri açısından, DeepSeek-V4-Pro’nun ajan yetenekleri önemli ölçüde geliştirilmiştir. Ajanik kodlama gibi değerlendirmelerde açık kaynağın ilk kademesine girmiştir. Dahili değerlendirmeler, teslimat kalitesinin Claude Opus 4.6’nın düşünmeyen moduna yakın olduğunu, ancak düşünme moduyla karşılaştırıldığında hala bir boşluk olduğunu gösteriyor.

DeepSeek-V4-Pro, matematik, STEM ve yarışma kodu gibi yüksek zorluklu görevlerde mevcut kamuoyu tarafından değerlendirilen açık kaynak modellerini geride bıraktı ve genel performansı GPT-5.4 ve Claude Opus 4.6-Max gibi en iyi kapalı kaynak modellerine yakın veya hatta karşılaştırılabilir düzeydedir.

Uzun bağlam maliyetinde önemli ölçüde azalma

Aynı zamanda DeepSeek-V4, uzun bağlam verimliliğinde daha radikal bir dizi optimizasyon sundu: 1 milyon token senaryolarında, token başına çıkarım hesaplaması yalnızca V3.2’nin %27’sidir ve KV önbelleği kullanımı yaklaşık %10’a düşürülerek uzun bağlantı görevlerinin hesaplama gücü ve video belleği maliyetlerini önemli ölçüde azaltır.

API Fiyat Planı

DeepSeek-V4 serisi için resmi olarak duyurulan API fiyatları:

DeepSeek-V4-Pro: önbelleğe alınmış giriş için 1 yuan / milyon token, önbelleğe alınmamış giriş için 12 yuan / milyon token, çıkış için 24 yuan / milyon token
DeepSeek-V4-Flash: önbelleğe alınmış giriş için yalnızca 0,2 yuan / milyon token, önbelleğe alınmamış giriş için 1 yuan / milyon token, çıkış için 2 yuan / milyon token

Şu anda DeepSeek-V4 serisi resmi web sitesinde ve uygulamada yayınlandı ve API’ler ile model ağırlıkları eş zamanlı olarak açılıyor.

Pratik Deneyim: Yeteneklerde Kapsamlı İyileştirme

DeepSeek-V4 değişikliklerini ilk deneyimledik, ağırlıklı olarak DeepSeek-V4-Pro modelini test ettik.

Ajanik programlama yeteneği önemli ölçüde gelişti

Ön uç web tek seferde geliştirme durumunda DeepSeek-V4-Pro yüksek yürütme verimliliği gösterdi. Gereksinimler karmaşık olmadığından, modelin düşünmesi için yalnızca 5 saniye harcadı, ardından hızlı bir şekilde geliştirdi, bu da çok sayıda tokeni düşünme konusunda boşa harcayan önceki DeepSeek modellerinin modelinden önemli ölçüde farklı. Gerçek üretim sürecine girdikten sonra DeepSeek-V4-Pro’nun çıktı uzunluğu diğer DeepSeek modellerinden önemli ölçüde daha uzundur, üretim hızı hızlıdır, temelde 5 kod satırı birimleri halinde çıktı verir ve web sayfasının tamamlama derecesi DeepSeek-V3.2’den daha yüksektir, daha zengin bir tasarıma sahiptir.

Ajan yetenekleri ve programlamayı birleştiren görev testinde DeepSeek-V4-Pro karmaşık çok tur araç çağrıları yapabilir ve önceki modellere kıyasla çevrimiçi arama giriş sayısı da artmıştır ve bilgi toplama daha kapsamlıdır. Son olarak üretilen seyahat planı makul bir şekilde planlanmıştır ve her turistik yerin konumu ile donatılmıştır, tıklandıktan sonra doğrudan navigasyon uygulamasında kullanılabilir, çok kullanışlıdır. Ajan görevlerinde, eylemlerinin çok kararlı olduğu, araç çağrıları ve düşünmenin birkaç saniye içinde çözüldüğü ve token verimliliğinin iyi olduğu görülebilir.

1 Milyon Token Bağlam Pratik Testi

DeepSeek-V4 serisi modelleri 1 milyon token bağlamını destekler. Test için “Üç Cisim” üçlemesinin tamamını (toplam yaklaşık 540.000 token) yükledik ve model belirtilen içeriği hızlı bir şekilde bulabilir ve çok uzun metinlerde bilgi alımını başarıyla gerçekleştirebilir.

Bilgi kesim tarihi testi, DeepSeek-V4-Pro’nun bilgi kesim tarihinin hala 2025 yılında olduğunu gösteriyor. Ayrıca bu model şu anda görsel yetenekleri desteklemiyor. Resimleri yükledikten sonra hala metin çıkarma yapacaktır ve metin içermeyen resimler işlenemeyeceğini gösterecektir.

Teknik Mimari Yeniliği

Bu V4 neslinin en doğrudan değişikliği, “uzun bağlamın” varsayılan bir yetenek haline gelmesidir. Pencereyi basitçe genişleten geleneksel yöntemden farklı olarak, DeepSeek-V4-Pro sıkıştırılmış seyrek dikkat ile yüksek sıkıştırma dikkatini (HCA) birleştiren yeni bir hibrit dikkat mimarisini sunar ve token boyutunda sıkıştırmak için DSA seyrek dikkat ile iş birliği yapar.

Ayrıca model, geleneksel artık bağlantıları geliştirmek için manifold kısıtlamalı hiperbağlantı (mHC) sunar ve yakınsama hızını ve eğitim istikrarını artırmak için Muon iyileştiricisini kullanır. Bu tasarım serisi, modelin “daha uzun süre hatırlarken” hesaplama maliyetini etkin bir şekilde kontrol etmesini sağlar.

Resmi verilere göre, 1 milyon token bağlamında, DeepSeek-V4-Pro’nun token başına çıkarım TFLOP’u DeepSeek-V3.2’ye kıyasla yaklaşık 3,7 ila 9,8 kat azaldı ve KV önbelleği kullanımı 9,5 ila 13,7 kat azaldı. Bu, geçmişte fiilen çalıştırılması zor olan çok uzun bağlantı görevlerinin (çok tur ajan planlama, uzun belge işleme gibi) yürütülebilir aralığa girmeye başladığı anlamına geliyor.

Performans: Açık Kaynak Modelleri İçin Yeni Tavan

Yetenek yapısı açısından, DeepSeek-V4-Pro’nun gelişimi, muhakeme yetenekleri, bilgi ve ajan yeteneklerinin eş zamanlı olarak geliştirilmesidir:

Bilgi ve Muhakeme Yetenekleri

Bilgi ve muhakeme görevlerinde SimpleQA, Apex ve Codeforces gibi değerlendirmelerde mevcut ana akım açık kaynak modellerini geride bırakır ve birçok görevde GPT-5.4 ve Gemini 3.1 Pro’ya yakındır. Örneğin, Apex kısa listesinde 90,2 puan aldı ve zaten en iyi kapalı kaynak modellerini geride bıraktı; Codeforces gibi yarışma görevlerinde de birinci kademe seviyesini koruyor.

Ajan Yetenekleri

Ajan yeteneği ile ilgili görevlerde DeepSeek-V4-Pro, SWE Doğrulanmış ve Terminal Bench gibi göstergelerde istikrarlı bir performans sergiliyor. SWE Doğrulanmış 80,6’ya ulaşır, Claude Opus 4.6’ya yakındır, çoğu açık kaynak modelinden önemli ölçüde yüksektir. Terminal Bench 2.0’da performansı GLM-5.1 Thinking ve Kimi K2.6 Thinking gibi modelleri de geride bırakıyor.

Genel olarak, DeepSeek-V4-Pro şu anda açık kaynak modellerinin “tavanıdır”.

Ajan Senaryoları İçin Özel Optimizasyon

DeepSeek-V4 nesli, ajan senaryolarına uyarlanmayı önemli ölçüde güçlendirir. Claude Code, OpenClaw ve CodeBuddy gibi ana akım ajan çerçeveleri için özel optimizasyonlar yapmıştır ve kod oluşturma, belge oluşturma gibi çok adımlı görevlerde daha kararlı çalışır.

Pratik konumlandırma açısından, DeepSeek-V4-Pro zaten DeepSeek içinde ajanik kodlama modeli olarak kullanılıyor ve “görevleri tamamlama”ya odaklanıyor. Basit görevler için V4-Flash zaten Pro sürümüne yakın, ancak karmaşık görevlerde hala önemli bir boşluk var, bu da esas olarak ajan uygulamaları için iki “hesaplama gücü vitesi” sunuyor.

Sonuç

DeepSeek-V4’ün piyasaya sürülmesi, yalnızca ekibin teknoloji ve mimari alanındaki birikimini göstermekle kalmaz, aynı zamanda ulusal hesaplama gücü ekosistemi altında büyük açık kaynak modellerinin fiili uygulama yeteneğini de işaret eder. Huawei Ascend ve Cambricon gibi ulusal çipler için uyarlama ve optimizasyondan sonra, DeepSeek-V4 serisi 1 milyon token bağlamı için istikrarlı destek ve verimli çıkarım elde etti ve bu da uzun bağlantı görevlerini ve çok adımlı ajan yürütmeyi mümkün kıldı.

Bu sürüm, Pro ve Flash’ın farklı konumlandırmasını uygular, performans açısından kapalı kaynak amiral gemisi modellerine yaklaşır ve maliyet açısından yüksek maliyet etkinliğini korur, bu da ulusal geliştiriciler için benzeri görülmemiş açık seçenekler sunar. Daha da önemlisi, bu sürüm, açık kaynak modellerinin yalnızca küresel rekabette sağlam bir yer edinmekle kalmayıp, aynı zamanda ulusal hesaplama gücü ve optimize edilmiş mimari yardımıyla teknik potansiyeli pratik üretkenliğe dönüştürebileceğini gösteriyor.

DeepSeek-V4, Çin’in açık kaynak gücünün yüksek performanslı AI alanında attığı önemli bir adım olabilir ve aynı zamanda ulusal AI ekosisteminin yeniliği ve uygulanması için net bir yol gösterir.

DeepSeek'i kullanmaya başlayın