Deepseeks neuer Chatbot bietet eine beeindruckende Einführung: "Hallo, ich wurde erstellt, damit Sie alles fragen und eine Antwort erhalten können, die Sie sogar überraschen könnte." Diese KI, ein Produkt des chinesischen Startups Deepseek, ist schnell zu einem wichtigen Marktspieler geworden und hat sogar zu einem erheblichen Rückgang des NVIDIA -Aktienkurses beigetragen.

Bild: Ensigame.com
Der Erfolg von Deepseek beruht auf seinen innovativen Architektur- und Trainingsmethoden. Schlüsseltechnologien umfassen:
- Multi-Token-Vorhersage (MTP): Anstatt Wörter einzeln vorherzusagen, prognostiziert MTP mehrere Wörter gleichzeitig, steigern Sie die Genauigkeit und Effizienz.
- Mischung von Experten (MOE): Diese Architektur verwendet 256 neuronale Netze in Deepseek V3, die acht für jedes Token aktiviert, das Training beschleunigt und die Leistung verbessert.
- Multi-Head Latent Achtung (MLA): MLA extrahiert wiederholt wichtige Details aus Textfragmenten und stellt sicher, dass wichtige Informationen nicht übersehen werden, was zu einem differenzierteren Verständnis der Eingabedaten führt.

Bild: Ensigame.com
Während Deepseek zunächst einen bemerkenswert niedrigen Schulungskosten von 6 Millionen US -Dollar für Deepseek V3 unter Verwendung von 2048 GPUs beanspruchte, ergab die semianalyse eine weitaus wesentlichere Infrastruktur: Rund 50.000 NVIDIA -Hopper -GPUs, einschließlich 10.000 H800, 10.000 H100s und zusätzliche H20S, verteilt über mehrere Datenzentren, die über mehrere Datenzentren verteilt wurden. Dies entspricht einer gesamten Serverinvestition von rund 1,6 Milliarden US -Dollar, wobei die Betriebskosten auf 944 Mio. USD geschätzt werden.
Deepseek, eine Tochtergesellschaft des chinesischen Hedgefonds-High-Flyer, besitzt seine Rechenzentren und bietet eine größere Kontrolle und eine schnellere Innovationsimplementierung als Cloud-basierte Wettbewerber. Dieser selbstfinanzierte Ansatz verbessert die Flexibilität und Entscheidungsgeschwindigkeit. Darüber hinaus zieht das Unternehmen Top -Talente an, wobei einige Forscher jährlich über 1,3 Millionen US -Dollar verdienen, hauptsächlich von führenden chinesischen Universitäten.

Bild: Ensigame.com
Deepseeks anfängliche Zahl von 6 Millionen US-Dollar deckt nur die Nutzung der GPU vor dem Training ab und ohne Forschung, Verfeinerung, Datenverarbeitung und Infrastruktur. Die gesamte KI -Entwicklungsinvestition des Unternehmens übersteigt 500 Millionen US -Dollar. Die magere Struktur erleichtert jedoch effiziente Innovationen im Vergleich zu größeren, bürokratischeren Unternehmen.

Bild: Ensigame.com
Der Erfolg von Deepseek zeigt das Potenzial eines gut finanzierten, unabhängigen KI-Unternehmens, mit Branchenriesen zu konkurrieren. Während die Behauptung des "revolutionären Haushalts" wohl übertrieben ist, sind seine Leistungen unbestreitbar, insbesondere angesichts der deutlich höheren Kosten, die von Wettbewerbern entstehen. Zum Beispiel gab Deepseek 5 Millionen US -Dollar für R1 aus, während Chatgpt4 100 Millionen US -Dollar kostete. Dies unterstreicht die Kosteneffizienz von Deepseek trotz der erheblichen Gesamtinvestition.