DeepSeek
|
| |
| Turi | Xususiy |
|---|---|
| Tarmogʻi | Axborot texnologiyalari, Sun'iy intellekt |
| Egasi | High-Flyer |
| Qachon asos solingan | 2023-yil 17-iyul |
| Asoschi(lari) | Liang Wenfeng |
| Ishchilar soni | 160 (2025) |
| Vebsayti | https://www.deepseek.com/ |
DeepSeek (xitoycha: 深度求索) Xitoyda joylashgan, ochiq kodli yirik til modellari (LLM) ishlab chiqadigan sunʼiy intellekt kompaniyasidir. Kompaniya Zhejiang viloyatining Hangzhou shahrida joylashgan boʻlib, u faqatgina High-Flyer nomli xitoy xedj-fondi tomonidan moliyalashtiriladi. High-Flyer asoschilaridan biri Liang Venfeng 2023-yilda kompaniyani tashkil etgan va hozirda bosh direktor sifatida faoliyat yuritadi.
DeepSeek, ChatGPT bilan bir xil darajada mantiqiy vazifalarni bajara oladi[1], shunga qaramay, uni yaratishda ancha kam mablagʻ va resurslar sarflangan[2]. AI modeli DeepSeek tomonidan AQSHning Nvidia chiplari uchun Xitoyga nisbatan sanksiyalari fonida ishlab chiqilgan boʻlib, u mamlakatning ilgʻor AI tizimlarini ishlab chiqish qobiliyatini cheklashga qaratilgan edi[3]. 2025-yil 10-yanvarda kompaniya birinchi bepul chatbot ilovasini chiqardi, va 27-yanvarga kelib u AQShning iOS App Store’ida ChatGPTʼdan oʻtib, eng koʻp yuklab olingan bepul ilovaga aylandi[4]. Bu Nvidia kompaniyasining aksiyalar narxining 18% ga pasayishiga olib keldi[5]. DeepSeek’ning yirik va tajribali raqobatchilariga qarshi muvaffaqiyati „sunʼiy intellekt sohasida inqilob“ sifatida taʼriflanmoqda[4] va „global AI poygasining birinchi zarbasi“ sifatida baholanmoqda[6].
DeepSeek oʻzining generativ sunʼiy intellekt chatbotini ochiq manbaga aylantirdi, yaʼni uning kodi foydalanish, oʻzgartirish va koʻrish uchun bepul mavjud; Bunga qurilish maqsadlarida dastlabki kod va dizayn hujjatlariga kirish va foydalanish ruxsati kiradi[7]. Kompaniya Xitoyning yetakchi universitetlaridan yosh sunʼiy intellekt tadqiqotchilarini faol ravishda yollaydi[4] va modellarining bilim va qobiliyatlarini diversifikatsiya qilish maqsadida kompyuter fanidan tashqari sohalardan ham xodimlarni ishga oladi.
Tarixi
[tahrir | manbasini tahrirlash]2016-yil fevral oyida sunʼiy intellektga qiziqqan Liang Venfeng tomonidan High-Flyer kompaniyasiga asos solingan. U 2007–2008-yillardagi moliyaviy inqirozdan buyon Zhejiang Universitetida oʻqiyotgan paytda savdo faoliyati bilan shugʻullanib kelgan edi[8]. 2019-yilga kelib, u High-Flyer’ni sunʼiy intellekt savdo algoritmlarini ishlab chiqishga va ulardan foydalanishga ixtisoslashgan xedj-fond sifatida tashkil etdi. 2021-yilgacha High-Flyer savdo faoliyatida faqat sunʼiy intellektdan foydalana boshladi[9].
DeepSeek oʻzining generativ sunʼiy intellekt chatbotini ochiq kodli qilib taqdim etdi, yaʼni uning kodi foydalanish, oʻzgartirish va koʻrish uchun bepul mavjud. Bu shuningdek, manba kodi va dizayn hujjatlariga kirish va ulardan foydalanish ruxsatini ham oʻz ichiga oladi.
36Kr maʼlumotlariga koʻra, Liang AQSh hukumati Xitoyga nisbatan sunʼiy intellekt chiplariga cheklovlar kiritishidan oldin 10,000 ta Nvidia A100 GPU yigʻib olgan. Baʼzi taxminlarga koʻra, bu raqam 50,000 ga yetgan.
2023-yil aprel oyida High-Flyer moliyaviy biznesidan alohida boʻlgan sunʼiy umumiy intellekt asboblarini ishlab chiqishga qaratilgan tadqiqot laboratoriyasini ishga tushirdi.2023-yil may oyida, High-Flyer investorlaridan biri sifatida, ushbu laboratoriya alohida kompaniya – DeepSeek sifatida qayta tashkil etildi. Venchur kapital firmalari qisqa vaqt ichida daromad olish imkoniyati pastligi sababli moliyalashtirishga ikkilanib qarashgan.
2024-yil may oyida DeepSeek-V2 chiqarilgandan soʻng, arzon narxdagi kuchli ishlashi sababli DeepSeek Xitoyning sunʼiy intellekt modellarining narx urushi katalizatoriga aylandi. U tezda „AI Pinduoduo“ deb nomlandi va ByteDance, Tencent, Baidu va Alibaba kabi yirik texnologik gigantlar kompaniya bilan raqobatlashish uchun sunʼiy intellekt modellarining narxlarini pasaytira boshladilar. DeepSeek past narxlarda xizmat koʻrsatganiga qaramay, zarar koʻrgan raqiblariga nisbatan foyda olishga muvaffaq boʻldi.
DeepSeek faqat tadqiqotlarga eʼtibor qaratadi va tijoratlashtirish boʻyicha batafsil rejalariga ega emas. Bu esa uning texnologiyasini Xitoyning sunʼiy intellekt haqidagi eng qattiq qonunlaridan chetda qolishga imkon beradi, masalan, foydalanuvchilarga xizmat koʻrsatuvchi texnologiyalarning hukumatning axborot nazorati qoidalariga mos kelishi talab qilinmasligi.
DeepSeek yollash siyosatida texnik qobiliyatlarni ish tajribasidan ustun qoʻyadi. Natijada, yangi xodimlarning koʻpchiligi universitetni yaqinda tamomlaganlar yoki sunʼiy intellekt sohasidagi faoliyatini endi boshlayotgan ishlab chiquvchilar hisoblanadi. Shu bilan birga, kompaniya texnologiyasining boshqa mavzular va bilim sohalarini tushunishini oshirish uchun kompyuter faniga aloqador boʻlmagan mutaxassislarni ham ishga oladi.
Asosiy modellari
[tahrir | manbasini tahrirlash]DeepSeek-R1: 2025-yilda chiqarilgan, GPT-4 va o1 kabi modellarga teng darajadagi natijalar beradi. Ochiq vaznli (open-weight) model boʻlib, Hugging Face platformasida 10,9 million marta yuklab olingan. Oʻqitish narxi — 6 million dollar, bu raqobatchilardan ancha arzonga tushgan.
DeepSeek-V3: 671 milliard parametrga ega MoE modeli, har bir token uchun 37 milliard parametr faollashadi. 14,8 trillion token ustida oʻqitilgan. Multi-head Latent Attention (MLA) va DeepSeekMoE arxitekturalaridan foydalanadi. Oʻqitish xarajati — 2,664 million H800 GPU soati.
DeepSeek Coder V2: Dasturlashga ixtisoslashgan model.
DeepSeek Math: Matematik masalalarni hal qilish uchun.
DeepSeek VL: Koʻp modal (rasm va matn) tushunish modeli.
DeepSeek-V3.2-Exp: 2025-yilda yangilangan versiya, oʻqitish va ishlatish samaradorligi oshirilgan, API narxi pasaytirilgan.
DeepSeek modellari NVIDIA H800 GPU-larida oʻqitilgan, bu AQSh eksport nazorati ostidagi H100/A100 chip-laridan farqli oʻlaroq, arzonroq va mavjudroq. Kompaniya Multi-Token Prediction (MTP) va yukni muvozanatlash strategiyalarini qoʻllaydi.
DeepSeek-Math-V2
[tahrir | manbasini tahrirlash]DeepSeek-Math-V2 — 2025-yil 27-noyabrda chiqarilgan yangi avlod matematik fikrlash modeli bo'lib, asosan teorema isbotlash va o'z-o'zini tekshirish qobiliyatlariga e'tibor qaratgan. Bu model DeepSeek-V3.2-Exp-Base asosida qurilgan bo'lib, 685 milliard parametrga ega va ochiq og'irlikli (open-weight) holda Apache 2 litsenziyasi ostida taqdim etilgan, shuning uchun uni Hugging Face platformasida bepul yuklab olish mumkin. An'anaviy modellardan farqli o'laroq, u nafaqat javobning to'g'riligini, balki fikrlash jarayonining qat'iyligi va to'liqligini ta'minlaydi. "Verifier-generator" ikki tomonlama arxitekturadan foydalanib, AI inson matematikchilari kabi isbotlarni o'z-o'zidan tekshiradi. Modelni qattiq isbot tekshiruvchisi sifatida birinchi o'rgatib, keyin hal qiluvchi qismini shu tekshiruvchiga mos ravishda o'qitish orqali rivojlantirilgan. Bu real matematikada (masalan, invariantlar, tengsizliklar) samarali ishlaydi.
Natijalar va yutuqlar
- 2025 yilgi International Mathematical Olympiad (IMO) muammolaridan 6 ta masaladan 5 tasini muvaffaqiyatli yechib — ~83.3% to‘g‘ri javob ko‘rsatkichi bilan oltin medaldagi darajaga erishgan.
- China Mathematical Olympiad (CMO) 2024 va Putnam Competition 2024 kabi qiyin va nufuzli matematika tanlovlarida ham yuqori natijalar qayd etilgan (Putnam’dagi “118/120” ball — insonlar orasidagi yuqori natijalardan ham oshgan deb xabar qilingan).
- Bundan tashqari, rasmiy matematik “benchmark”lar (masalan, IMO‑ProofBench) bo‘yicha ham — oddiy darajadagi vazifalarda 99% yaqin to‘g‘ri natija va yuqori darajadagi muammolarda — ancha yaxshi ko‘rsatkich qayd etgan.
Bu model matematik AI tizimlarini rivojlantirishda muhim qadam bo'lib, inson nazoratisiz isbotlarni yaxshilash yo'lini ko'rsatmoqda.
Manbaalar
[tahrir | manbasini tahrirlash]- ↑ „Gibney, Elizabeth (23 January 2025). "China's cheap, open AI model DeepSeek thrills scientists"“.
- ↑ „Hoskins, Peter; Rahman-Jones, Imran (27 January 2025). "DeepSeek Chinese AI chatbot sparks market turmoil for rivals". BBC. Retrieved 27 January 2025.“.
- ↑ „Saran, Cliff (10 December 2024). "Nvidia investigation signals widening of US and China chip war | Computer Weekly". Computer Weekly. Retrieved 27 January 2025.“.
- ↑ 4,0 4,1 4,2 „"What is DeepSeek? And How Is It Upending A.I.?". The New York Times.“.
- ↑ „Field, Hayden (27 January 2025). "China's DeepSeek AI dethrones ChatGPT on App Store: Here's what you should know". CNBC.“.
- ↑ „"Nvidia, Microsoft shares tumble as China-based AI app DeepSeek hammers tech giants". ABC News. Retrieved 27 January 2025.“.
- ↑ „Romero, Luis E. "ChatGPT, DeepSeek, Or Llama? Meta's LeCun Says Open-Source Is The Key". Forbes.“.
- ↑ „https://www.technologyreview.com/2025/01/24/1110526/china-deepseek-top-ai-despite-sanctions/“.
- ↑ „https://www.chinatalk.media/p/deepseek-from-hedge-fund-to-frontier“.