Deepseek'in yeni sohbet botu etkileyici bir tanıtımla övünüyor: "Merhaba, yaratıldım, böylece bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz." Çin girişiminin bir ürünü olan bu AI, hızla önemli bir pazar oyuncusu haline geldi ve hatta Nvidia'nın hisse senedi fiyatında önemli bir düşüşe katkıda bulundu.

Resim: ensigame.com
Deepseek'in başarısı yenilikçi mimari ve eğitim yöntemlerinden kaynaklanmaktadır. Anahtar teknolojiler şunları içerir:
- Çoklu Tahmini Tahmin (MTP): Kelimeleri ayrı ayrı tahmin etmek yerine, MTP aynı anda birden fazla kelimeyi tahmin ederek doğruluğu ve verimliliği artırır.
- Uzmanların Karışımı (MOE): Bu mimari, Deepseek V3'te 256 sinir ağı kullanır, her jeton için sekiz'i aktive eder, eğitimi hızlandırır ve performansı artırır.
- Çok Baş Gizli Dikkat (MLA): MLA, metin parçalarından tekrar tekrar temel ayrıntıları çıkarır ve önemli bilgilerin kaçırılmamasını sağlar ve girdi verilerinin daha nüanslı bir şekilde anlaşılmasına yol açar.

Resim: ensigame.com
Deepseek başlangıçta 2048 GPU kullanan Deepseek V3 için 6 milyon dolarlık bir eğitim maliyeti iddia ederken, yarı. Çok daha önemli bir altyapı ortaya çıkardı: 10.000 H800, 10.000 H100 ve ek H20s dahil olmak üzere yaklaşık 50.000 NVIDIA Hopper GPU'lar, çoklu veri merkezlerine dağıtıldı. Bu, yaklaşık 1,6 milyar dolarlık toplam sunucu yatırımını temsil eder ve operasyonel giderlerin 944 milyon dolar olduğu tahmin edilmektedir.
Çin Hedge Fonu High-Flyer'in bir yan kuruluşu olan Deepseek, veri merkezlerinin sahibi, bulut tabanlı rakiplerden daha fazla kontrol ve daha hızlı inovasyon uygulaması sunuyor. Bu kendi kendine finanse edilen yaklaşım esnekliği ve karar verme hızını artırır. Ayrıca, şirket en iyi yetenekleri çekiyor ve bazı araştırmacılar yılda 1,3 milyon doların üzerinde, öncelikle önde gelen Çin üniversitelerinden kazanıyor.

Resim: ensigame.com
Deepseek'in ilk 6 milyon dolarlık rakamı, araştırma, arıtma, veri işleme ve altyapı hariç, yalnızca eğitim öncesi GPU kullanımını kapsamaktadır. Şirketin toplam AI geliştirme yatırımı 500 milyon doları aşıyor. Bununla birlikte, yalın yapısı daha büyük, daha bürokratik şirketlere kıyasla verimli yeniliği kolaylaştırır.

Resim: ensigame.com
Deepseek'in başarısı, iyi finanse edilmiş, bağımsız bir AI şirketinin endüstri devleriyle rekabet etme potansiyelini sergiliyor. "Devrimci bütçe" iddiası tartışmalı olarak abartılı olsa da, özellikle rakipler tarafından yapılan önemli ölçüde daha yüksek maliyetler göz önüne alındığında, başarıları yadsınamaz. Örneğin, Deepseek R1'e 5 milyon dolar harcarken, ChatGpt4 100 milyon dolara mal oldu. Bu, önemli genel yatırıma rağmen Deepseek'in maliyet verimliliğini vurgular.