Chatbot ใหม่ของ Deepseek มีการแนะนำที่น่าประทับใจ: "สวัสดีฉันถูกสร้างขึ้นเพื่อให้คุณสามารถถามอะไรก็ได้และรับคำตอบที่อาจทำให้คุณประหลาดใจ" AI นี้ซึ่งเป็นผลิตภัณฑ์ของ Deepseek เริ่มต้นของจีนได้กลายเป็นผู้เล่นในตลาดรายใหญ่อย่างรวดเร็วแม้กระทั่งมีส่วนทำให้ราคาหุ้นของ Nvidia ลดลงอย่างมีนัยสำคัญ

รูปภาพ: Ensigame.com
ความสำเร็จของ Deepseek เกิดจากสถาปัตยกรรมที่เป็นนวัตกรรมและวิธีการฝึกอบรม เทคโนโลยีที่สำคัญ ได้แก่ :
- การทำนายแบบมัลติเทน (MTP): แทนที่จะทำนายคำแต่ละคำ MTP คาดการณ์หลายคำพร้อมกันเพิ่มความแม่นยำและประสิทธิภาพ
- ส่วนผสมของผู้เชี่ยวชาญ (MOE): สถาปัตยกรรมนี้ใช้เครือข่ายประสาท 256 แห่งใน Deepseek V3 โดยเปิดใช้งานแปดโทเค็นแต่ละโทเค็นเร่งการฝึกอบรมและปรับปรุงประสิทธิภาพ
- ความสนใจแฝงหลายหัว (MLA): MLA แยกรายละเอียดที่สำคัญซ้ำ ๆ จากชิ้นส่วนข้อความเพื่อให้แน่ใจว่าข้อมูลสำคัญไม่พลาดนำไปสู่ความเข้าใจที่เหมาะสมยิ่งขึ้นของข้อมูลอินพุต

รูปภาพ: Ensigame.com
ในขณะที่ Deepseek เริ่มแรกอ้างว่ามีค่าใช้จ่ายในการฝึกอบรมที่ต่ำอย่างน่าทึ่งที่ $ 6 ล้านสำหรับ Deepseek V3 โดยใช้ GPU ในปี 2048, Semianalysis เปิดเผยโครงสร้างพื้นฐานที่สำคัญยิ่งกว่า: GPU Nvidia Hopper ประมาณ 50,000 Nvidia รวมถึง 10,000 H800s, 10,000 H100s และ H20 เพิ่มเติม สิ่งนี้แสดงให้เห็นถึงการลงทุนเซิร์ฟเวอร์รวมประมาณ 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงานอยู่ที่ 944 ล้านดอลลาร์
Deepseek ซึ่งเป็น บริษัท ในเครือของกองทุนป้องกันความเสี่ยงของจีนที่มีการขับรถสูงเป็นเจ้าของศูนย์ข้อมูลนำเสนอการควบคุมที่มากขึ้นและการใช้นวัตกรรมที่เร็วกว่าคู่แข่งบนคลาวด์ วิธีการที่ได้รับทุนด้วยตนเองนี้ช่วยเพิ่มความยืดหยุ่นและความเร็วในการตัดสินใจ นอกจากนี้ บริษัท ยังดึงดูดความสามารถสูงสุดโดยนักวิจัยบางคนมีรายได้มากกว่า 1.3 ล้านเหรียญสหรัฐต่อปีส่วนใหญ่มาจากมหาวิทยาลัยชั้นนำของจีน

รูปภาพ: Ensigame.com
ตัวเลขเริ่มต้นของ Deepseek เพียง $ 6 ล้านครอบคลุมการใช้งาน GPU ก่อนการฝึกอบรมไม่รวมการวิจัยการปรับแต่งการประมวลผลข้อมูลและโครงสร้างพื้นฐาน การลงทุนการพัฒนา AI ทั้งหมดของ บริษัท เกิน $ 500 ล้าน อย่างไรก็ตามโครงสร้างแบบลีนช่วยอำนวยความสะดวกในการสร้างนวัตกรรมที่มีประสิทธิภาพเมื่อเทียบกับ บริษัท ที่มีขนาดใหญ่และมีระบบราชการมากขึ้น

รูปภาพ: Ensigame.com
ความสำเร็จของ Deepseek นำเสนอศักยภาพของ บริษัท AI ที่ได้รับการสนับสนุนและได้รับการสนับสนุนอย่างดีในการแข่งขันกับยักษ์ใหญ่ในอุตสาหกรรม ในขณะที่การเรียกร้อง "งบประมาณการปฏิวัติ" นั้นเกินจริงเนื้อหาความสำเร็จนั้นไม่อาจปฏิเสธได้โดยเฉพาะอย่างยิ่งเมื่อพิจารณาถึงค่าใช้จ่ายที่สูงขึ้นอย่างมีนัยสำคัญที่เกิดขึ้นจากคู่แข่ง ตัวอย่างเช่น Deepseek ใช้จ่าย $ 5 ล้านใน R1 ในขณะที่ CHATGPT4 มีราคา $ 100 ล้าน สิ่งนี้เน้นประสิทธิภาพต้นทุนของ Deepseek แม้จะมีการลงทุนโดยรวมอย่างมาก