Ayarlar

Dil

DeepSeek R1 Rehberi: 2026'da Mimari, Benchmarklar ve Pratik Kullanım

T
TokenLab
·26 Şubat 2026·1278 görüntüleme
DeepSeek R1 Rehberi: 2026'da Mimari, Benchmarklar ve Pratik Kullanım

DeepSeek R1, açık kaynaklı modellerin kapalı kaynaklı akıl yürütme (reasoning) yetenekleriyle eşleşebileceğini kanıtladı. Ocak 2025'te MIT lisansı altında yayınlanan model, AIME 2024'te %79,8 ve MATH-500'de %97,3 puan alarak OpenAI'ın o1 serisiyle aynı seviyeye yerleşti.

Bir yıl sonra, R1 hala mevcut olan en maliyet etkin akıl yürütme modellerinden biri olmaya devam ediyor. 1M token başına 0,55$/2,19$ fiyatıyla, benzer kapalı kaynaklı alternatiflerden 5-10 kat daha ucuzdur. İşte onu etkili bir şekilde kullanmak için bilmeniz gerekenler.

Eğer R1'i daha geniş kodlama ve amiral gemisi modelleriyle karşılaştırıyorsanız, bu sayfanın yanında kodlama modeli karşılaştırmasını ve fiyat karşılaştırmasını açık tutun. R1, her şeyi yapmasını istemek yerine onu karma bir model yığınına (mixed-model stack) yerleştirdiğinizde en çok parlar.


Mimari: Neden 671B Parametre 671B Maliyet Anlamına Gelmiyor

DeepSeek R1, bir Mixture of Experts (MoE) mimarisi kullanır:

  • 671 milyar toplam parametre
  • İleri geçiş (forward pass) başına 37 milyar aktif parametre
  • DeepSeek-V3-Base temeli üzerine inşa edildi
  • 128K token context window

MoE tasarımı, R1'in 671B'lik bir modelin bilgi kapasitesine sahip olduğu ancak ~37B'lik bir modelin çıkarım (inference) maliyetine sahip olduğu anlamına gelir. Her girdi token'ı, hesaplama gereksinimlerini yönetilebilir düzeyde tutarak yalnızca "uzman" (expert) ağların bir alt kümesini etkinleştirir.

Karşılaştırma için: yoğun (dense) bir 671B modelini çalıştırmak ~1,3TB bellek gerektirir. R1'in MoE mimarisi, bunu Q4 quantization ile ~336GB'a düşürerek üst düzey tüketici donanımlarında (512GB'lı Mac Studio M3/M5 Ultra) çalıştırılabilir hale getirir.


Benchmark Performansı

Matematik

Benchmark DeepSeek R1 OpenAI o1 Claude Opus 4.6
AIME 2024 79.8% 83.3% ~65%
MATH-500 97.3% 96.4% ~90%
Codeforces Elo 2,029 1,891 ~1,600

R1, çoğu matematiksel benchmark'ta o1 ile eşleşir veya onu geçer. 2,029'luk Codeforces reytingi, onu "Candidate Master" aralığına yerleştirerek güçlü insan programcılarla rekabet edebilir hale getirir.

Kodlama

R1, algoritmik kodlamada (rekabetçi programlama, matematiksel kanıtlar) güçlüdür ancak yazılım mühendisliği görevleri (çok dosyalı refactoring, API tasarımı) için daha az optimize edilmiştir. SWE-Bench Verified üzerinde Claude Sonnet 4.6 (%72,7), R1'den önemli ölçüde daha iyi performans gösterir.

Algoritma uygulamaları ve matematiksel kodlar için R1'i kullanın. Genel yazılım mühendisliği için Claude veya GPT-5 kullanın.

Akıl Yürütme (Reasoning)

R1'in chain-of-thought akıl yürütmesi şeffaf ve incelenebilirdir. Akıl yürütmenin gizli bir "düşünme" aşamasında gerçekleştiği kapalı kaynaklı modellerin aksine, R1'in akıl yürütme izleri (reasoning traces) çıktının bir parçasıdır. Bu, onu şunlar için değerli kılar:

  • Akıl yürütme hatalarını ayıklama (modelin nerede yanlış yaptığını görebilirsiniz)
  • Eğitim uygulamaları (öğrenciler akıl yürütme sürecini takip edebilir)
  • Araştırma (LLM'lerin problemlere nasıl yaklaştığını analiz etme)

Eğitim İnovasyonu: İnsan Etiketi Olmadan Saf RL

R1'in eğitim yaklaşımı, alana yaptığı en önemli katkıydı.

Geleneksel yaklaşım: insan tarafından etiketlenmiş akıl yürütme örnekleri toplanır, ardından model bunları taklit edecek şekilde ince ayar (fine-tune) yapılır.

DeepSeek'in yaklaşımı: herhangi bir denetimli akıl yürütme verisi olmadan büyük ölçekli pekiştirmeli öğrenme (reinforcement learning - RL) yoluyla eğitim. Model (DeepSeek-R1-Zero), yalnızca RL aracılığıyla öz-doğrulama, yansıma ve uzun chain-of-thought akıl yürütme yeteneklerini geliştirdi.

Pratik sonuç: R1, akıl yürütme yeteneklerinin pahalı insan açıklamaları olmadan RL eğitimiyle ortaya çıkabileceğini kanıtladı. Bu, diğer laboratuvarların akıl yürütme modellerini daha verimli bir şekilde eğitmesinin önünü açtı.

Nihai R1 modeli iki aşamalı bir işlem hattı kullanır:

  1. Akıl yürütme kalıplarını geliştirmek için RL aşamaları
  2. Çıktı kalitesini temizlemek ve tekrarlama ile dil karışıklığı gibi sorunları azaltmak için SFT (supervised fine-tuning) aşamaları

Pratik Kullanım

R1 Ne Zaman Kullanılmalı?

  • Matematiksel kanıtlar ve türetmeler
  • Rekabetçi programlama problemleri
  • Algoritma tasarımı ve optimizasyonu
  • Adım adım akıl yürütme gerektiren veri analizi
  • Şeffaf akıl yürütmenin önemli olduğu araştırma görevleri
  • Akıl yürütme yeteneğine ihtiyaç duyan bütçe odaklı uygulamalar

R1 Ne Zaman Kullanılmamalı?

  • Genel yazılım mühendisliği (Claude Sonnet 4.6 kullanın)
  • Yaratıcı yazarlık (Claude veya GPT-5 kullanın)
  • Akıl yürütme yükünün gereksiz olduğu hızlı Soru-Cevaplar (GPT-4.1-mini kullanın)
  • UI/frontend kod üretimi (R1 bu konuda daha zayıftır)
  • Güncel bilgi gerektiren görevler (R1'in eğitim verilerinin bir kesilme tarihi vardır)

R1 Kullanımını Optimize Etme

R1'in akıl yürütme izleri kelime kalabalığı yapabilir. Basit bir matematik problemi, nihai cevaptan önce 500'den fazla token'lık bir chain-of-thought oluşturabilir. Bunu yönetmek için ipuçları:

  1. max_tokens değerini uygun şekilde ayarlayın. R1 çıktıları, aynı görev için akıl yürütme yapmayan modellerden 3-5 kat daha uzun olabilir.
  2. Nihai cevabı ayrıştırın. R1 tipik olarak sonucunu akıl yürütme izinden sonra net bir formatta sunar.
  3. Daha basit görevler için distile (distilled) versiyonları kullanın. DeepSeek; 1.5B, 7B, 8B, 14B, 32B ve 70B parametreli R1 distile versiyonları sunar. 32B ve 70B versiyonları, çoğu akıl yürütme yeteneğini çok daha düşük maliyetle korur.

Fiyat Karşılaştırması

Model Girdi / 1M Çıktı / 1M Akıl Yürütme Yeteneği
DeepSeek R1 $0.55 $2.19 Güçlü (%79.8 AIME)
OpenAI o3 $2.00 $8.00 Güçlü (~%83 AIME)
Claude Opus 4.6 $5.00 $25.00 İyi (~%65 AIME)
OpenAI o4-mini $1.10 $4.40 İyi (hız için optimize edilmiş)

R1, girdide o3'ten 4 kat, çıktıda ise 4 kat daha ucuzdur. Akıl yürütme kalitesinin karşılaştırılabilir olduğu iş yükleri (matematik, algoritmalar) için R1 önemli maliyet tasarrufu sağlar.


Açık Kaynak Ekosistemi

R1, MIT lisanslıdır. Şunları yapabilirsiniz:

  • Kısıtlama olmaksızın ticari olarak kullanabilirsiniz
  • Kendi verilerinizle ince ayar (fine-tune) yapabilirsiniz
  • Daha küçük modelleri eğitmek için distile edebilirsiniz
  • Yerel olarak çalıştırabilirsiniz (tam model için Q4'te ~336GB RAM gerektirir)
  • Kendi altyapınıza dağıtabilirsiniz

Mevcut distile versiyonlar:

Versiyon Parametreler Kullanım Durumu
R1-Distill-Qwen-1.5B 1.5B Uç cihazlar, mobil
R1-Distill-Qwen-7B 7B Yerel geliştirme, test
R1-Distill-Llama-8B 8B Yerel geliştirme
R1-Distill-Qwen-14B 14B Prodüksiyon (hafif akıl yürütme)
R1-Distill-Qwen-32B 32B Prodüksiyon (güçlü akıl yürütme)
R1-Distill-Llama-70B 70B Prodüksiyon (tam kapasiteye yakın)

32B distile versiyon, çoğu prodüksiyon dağıtımı için ideal noktadır: tam modelin maliyetinin çok küçük bir kısmıyla güçlü akıl yürütme sağlar.

Bu aynı zamanda çoğu ekibin ilk olarak değerlendirmesi gereken versiyondur. Doğrudan 671B'lik tam modele yönelmek, modeli pratikte olduğundan daha operasyonel olarak pahalı gösterebilir.

Birçok ekip için distile yol, asıl ürün kararıdır. Tam model neyin mümkün olduğunu kanıtlar. Distile seri ise neyin pratik olduğuna karar verir.

Bu ayrımı gözden kaçırmak kolay ve görmezden gelmek pahalıdır.

R1 2026 Yığınında (Stack) Gerçekte Nereye Uyuyor?

Ekiplerin yaptığı hata, R1'i her kapalı modelin evrensel bir alternatifi olarak görmektir.

R1 şu durumlarda en güçlüdür:

  • iş algoritmik, matematiksel veya chain-of-thought ağırlıklıysa
  • maliyet çok önemliyse
  • daha uzun akıl yürütme izlerine tolerans gösterebiliyorsanız
  • gizli "düşünme" yerine şeffaf akıl yürütme istiyorsanız

R1 şu durumlarda daha zayıftır:

  • görev yüksek cilalı frontend üretimi ise
  • iş akışı akıl yürütmeden ziyade inceleme (review) ağırlıklıysa
  • en iyi çok dosyalı yazılım mühendisliği davranışına ihtiyacınız varsa

Bu nedenle birçok ekip artık DeepSeek R1'i yığındaki tek model olarak değil, daha geniş bir model havuzu içindeki akıl yürütme uzmanı olarak kullanıyor.


Başlarken

API Üzerinden

from openai import OpenAI

client = OpenAI(
    api_key="sk-lemon-xxx",
    base_url="https://api.tokenlab.sh/v1"
)

response = client.chat.completions.create(
    model="deepseek-r1",
    messages=[{
        "role": "user",
        "content": "İlk n tek sayının toplamının n²'ye eşit olduğunu kanıtlayın."
    }],
    max_tokens=4096  # R1 akıl yürütme izleri uzun olabilir
)

print(response.choices[0].message.content)

Yerel Olarak Çalıştırma

# Ollama aracılığıyla (tam model için ~336GB RAM gerektirir)
ollama pull deepseek-r1:671b-q4

# Veya 32B distile versiyonu kullanın (~20GB RAM gerektirir)
ollama pull deepseek-r1:32b

Sırada Ne Var: DeepSeek V3 ve Ötesi

DeepSeek V3 (akıl yürütme odaklı olmayan halefi), geliştirilmiş genel yeteneklerle zaten yayınlandı. DeepSeek ekibi, açık kaynaklı modellerin neler başarabileceğine dair sınırları zorlamaya devam ediyor.

Akıl yürütme görevleri için R1 en iyi açık kaynaklı seçenek olmaya devam ediyor. Genel görevler için, 1M token başına 0,28$/0,42$ fiyatıyla DeepSeek V3, mevcut en maliyet etkin modellerden biridir.

Her ikisine de tek bir API anahtarı ile TokenLab üzerinden erişilebilir. Kayıtta 1$ ücretsiz kredi verilmektedir.

R1'i yerel olarak çalıştırmayı planlıyorsanız, Mac Studio yerel AI rehberi okunması gereken bir sonraki sayfadır. Eğer ona bir gateway üzerinden yönlendirme yapmayı planlıyorsanız, birleşik AI gateway rehberi daha iyi bir sonraki adımdır.


Benchmarklar Şubat 2026 itibarıyladır. DeepSeek R1 ağırlıkları huggingface.co/deepseek-ai adresinde mevcuttur.

Paylaş: