Maʼlumotlar ombori

Vikipediya, ochiq ensiklopediya
(Ma'lumotlar omboridan yoʻnaltirildi)
NEOWISE kometasining mavjudligi (bu erda qizil nuqtalar qatori sifatida tasvirlangan) keng maydonli infraqizil tadqiqot tadqiqotchisi kosmik teleskopi tomonidan olingan astronomik tadqiqotlar maʼlumotlarini tahlil qilish orqali aniqlangan.

Maʼlumotlar ombori — tuzilgan va tuzilmagan ma’lumotlardan bilim va tushunchalarni ajratib olish yoki ekstrapolyatsiya qilish uchun ilmiyusullar, jarayonlar, algoritmlar va tizimlardan foydalanadigan fanlararo soha[1][2] va keng doiradagi dastur sohalarida maʼlumotlardan oʻrgangan bilim, malakalarni qoʻllash. U maʼlumotlarni izlab topish va katta hajimli maʼlumotlarni tahlil qilish bilan bogʻliqdir.

Maʼlumotlar ombori — haqiqiy hodisalarni maʼlumotlar bilan tushunish va tahlil qilish uchun statistika, maʼlumotlarni tahlil qilish, informatika va ularga tegishli usullarni birlashtirish tushunchasidir"[3].

Maʼlumotlar ombori matematika, statistika, informatika fani kotekstida koʻplab sohalardan olingan texnika va nazariy bilimlardan foydalanadi[4]. Lekin, maʼlumotlar ombori informatika va axborot texnalogiyalar fanidan farq qiladi. Turing mukofoti sovrindori Jim Grey maʼlumotlar fanning "toʻrtinchi paradigmasi " (nazariy, hisoblash va yangi maʼlumotlarga asoslangan) ilm-fanga oid hamma axborot texnologiyalari taʼsiri va maʼlumotlar toʻfoni tufayli oʻzgarib borayotganligini taʼkidladi[5][6].

Maʼlumot olimi — bu dasturlash kodini yaratadigan hamda maʼlumotlardan tushuncha yaratish uchun uning statistik bilimlar bilan birlashtiradigan inson.

Asoslar[tahrir | manbasini tahrirlash]

Maʼlumotlar ombori fani (data science) — fanlararo soha boʻlib[7], odatda katta maʼlumotlar toʻplamlaridan bilim olishga va ushbu maʼlumotlardan olingan bilim va tushunchalarni keng koʻlamli amaliy sohalardagi muammolarni hal qilish uchun qoʻllashga qaratilgan[8]. Bu sohani tahlil qilish uchun maʼlumotlarni tayyorlash va maʼlumotlar ombori faniga oid muammolarni shakllantirish, maʼlumotlarni tahlil qilish hamda maʼlumotlarga asoslangan yechimlarni ishlab chiqish va keng doiradagi dastur sohalarida yuqori darajadagi qarorlarni xabardor qilish uchun topilmalarni taqdim etishni oʻz ichiga oladi. U kompyuter fanlari, statistika, axborot fanlari, matematika, ma’lumotlarni vizualizatsiya qilish, maʼlumotlarni solishtirish, maʼlumotlar integratsiyasi, grafik dizayn,murakkab tizimlar, aloqa va biznes kabi koʻnikmalarni oʻz ichiga oladi[9][10]. Neytan Yau,Ben Frylarning statistikasiga tayangan holda. Bu maʼlumotlar fanini inson va kompyuterning oʻzaro taʼsiri bilan bogʻlaydi: foydalanuvchilar maʼlumotlarni xushyorlik bilan nazorat qilish va oʻrganish imkoniyatiga ega boʻlishi zarur deb takidlaganlar[11][12]. 2015-yilda Amerika Statistikaning Assotsiatsiyasi maʼlumotlar bazasini boshqarishi hamda statistikasini, zamonaviy texnikalarni oʻrganish va taqsimlangan va parallel tizimlarini uchta rivojlanayotgan asosiy professional jamoalar sifatida aniqladi[13].

Statistikaga munosabat[tahrir | manbasini tahrirlash]

Koʻpgina statistik olimlar, jumladan Neyt Silver, maʼlumotlar fani yangi soha emas, balki statistikaning boshqa nomi ekanligini taʼkidladilar[14]. Boshqalar esa, bu maʼlumotlar ombori fanni: „statistikadan farq qiladi, chunki u raqamli maʼlumotlarga xos boʻlgan muammolar va texnikalarga eʼtibor qaratadi[15]“, deya takidlashgan. Vasant Dharning yozishicha, statistika miqdoriy maʼlumotlar va tavsifga urgʻu beradi. Bundan farqli oʻlaroq, maʼlumotlar ombori fani miqdoriy va sifatli maʼlumotlar (masalan, tasvirlar, matn hamda sensorlar, tranzaktsiyalar yoki mijozlar maʼlumotlari va boshqalar) bilan shugʻullanadi va maʼlumotlar va harakatga urgʻu beradi[16]. Kolumbiya universitetidan Endryu Gelman statistikani maʼlumotlar ombori fanining muhim boʻlmagan qismi sifatida taʼrifladi[17].

Zamonaviy foydalanish[tahrir | manbasini tahrirlash]

2012-yilda texnologlar Tomas X. Davenport va DJ Patil „Maʼlumot olimi: XXI asrning eng muhum ishi“ deb eʼlon qilishdi bu iborani hatto Nyu-York Tayms[18], Boston Globe kabi yirik shahar gazetalari ham qabul qilindi[19]. Bundan oʻn yil oʻtgach, ular buni yana bir bor tasdiqladilar va ish beruvchilar uchun bu ish har qachongidan ham koʻproq talab qilinmoqda. Maʼlumotlar ombori fanining mustaqil fan sifatida zamonaviy kontseptsiyasi baʼzan Uilyam S. Klivlendga tegishli[20]. 2001-yildagi maqolasida u statistikani nazariyadan tashqari texnik sohalarga kengaytirish tarafdori edi: chunki bu maydonning sezilarli darajada oʻzgartiradi, u yangi nomni kafolatladi. Keyingi bir necha yillar ichida „maʼlumotlar ombori“ yanada koʻproq, kengroq qoʻllanila boshlandi: 2002-yilda Fan va texnologiya maʼlumotlari qoʻmitasi Data Science Journalni ishga tushirildi. 2003-yilda Kolumbiya universiteti The Journal of Data Science jurnalini ishga tushirildi[21]. 2014-yilda Amerika Statistik Assotsiatsiyasining Statistik oʻrganish va maʼlumotlarni izlab topish boʻlimi oʻz nomini Statistik oʻrganish va maʼlumotlar faniga oid boʻlimga oʻzgartirildi, bu maʼlumotlar fanining mashhurligini aks ettiradi[22].„Maʼlumotlar olimi“(data scientist) professional unvoni 2008-yilda DJ Patill va Jeff Xammerbaxerga berilgan[23]. U (National Science Board) Milliy Fan Kengashi tomonidan 2005-yilda "Uzoq umr koʻradigan raqamli maʼlumotlar toʻplami: XXI asrda tadqiqot va taʼlimni qoʻllab-quvvatlash“ hisobotida ishlatilgan boʻlsada, lekin u raqamli maʼlumotlar toʻplamini boshqarishdagi har qanday muhim omilga keng ishora qiladi[24]. Maʼlumotlar ombori (data science) taʼrifi boʻyicha haligacha konsensus yoʻq va baʼzilar buni mashhur soʻz deb hisoblashadi[25]. Katta hajimli maʼlumotlar — bu tegishli marketing atamasi[26]. Maʼlumotlar boʻyicha olimlar katta hajimli maʼlumotlarni foydali maʼlumotlarga tahlil qilish va kompaniyalar hamda tashkilotlarga optimal operatsiyalarni aniqlashga yordam beradigan dasturiy taʼminot va algoritmlarni yaratish uchun javobgardirlar[27].

Yana qarang[tahrir | manbasini tahrirlash]

Manbalar[tahrir | manbasini tahrirlash]

  1. Dhar, V. (2013). „Data science and prediction“. Communications of the ACM. 56-jild, № 12. 64–73-bet. doi:10.1145/2500499. 9 November 2014da asl nusxadan arxivlandi. Qaraldi: 2 September 2015.
  2. Jeff Leek. „The key word in "Data Science" is not Data, it is Science“. Simply Statistics (12-dekabr 2013-yil). 2014-yil 2-yanvarda asl nusxadan arxivlangan. Qaraldi: 1-yanvar 2014-yil.
  3. Hayashi, Chikio „What is Data Science? Fundamental Concepts and a Heuristic Example“,. Data Science, Classification, and Related Methods, Studies in Classification, Data Analysis, and Knowledge Organization (inglizcha) Hayashi: . Springer Japan, 1-yanvar 1998-yil — 40–51 bet. DOI:10.1007/978-4-431-65950-1_3. ISBN 9784431702085. 
  4. Cao, Longbing (29–iyun 2017–yil). „Data Science: A Comprehensive Overview“. ACM Computing Surveys. 50-jild, № 3. 43:1–43:42-bet. doi:10.1145/3076253. ISSN 0360-0300.{{cite magazine}}: CS1 maint: date format ()
  5. Tony Hey. The Fourth Paradigm: Data-intensive Scientific Discovery. Microsoft Research, 2009. ISBN 978-0-9825442-0-4. 
  6. Bell, G.; Hey, T.; Szalay, A. (2009). „Computer Science: Beyond the Data Deluge“. Science. 323-jild, № 5919. 1297–1298-bet. doi:10.1126/science.1170411. ISSN 0036-8075. PMID 19265007.
  7. Emmert-Streib, Frank; Dehmer, Matthias (2018). „Defining data science by a data-driven quantification of the community“. Machine Learning and Knowledge Extraction. 1-jild. 235–251-bet. doi:10.3390/make1010015.
  8. „About Data Science“. Data Science Association. 10-avgust 2020-yilda asl nusxadan arxivlangan. Qaraldi: 3-aprel 2020-yil.
  9. „1. Introduction: What Is Data Science?“ (inglizcha). Doing Data Science [Book]. O’Reilly. Qaraldi: 3-aprel 2020-yil.
  10. „the three sexy skills of data geeks“ (inglizcha). m.e.driscoll: data utopian (27-may 2009-yil). Qaraldi: 3-aprel 2020-yil.
  11. Yau. „Rise of the Data Scientist“ (inglizcha). FlowingData (4-iyun 2009-yil). Qaraldi: 3-aprel 2020-yil.
  12. „Basic Example“. benfry.com. Qaraldi: 3-aprel 2020-yil.
  13. „ASA Statement on the Role of Statistics in Data Science“. AMSTATNEWS. American Statistical Association (1-oktabr 2015-yil). 2019-yil 20-iyunda asl nusxadan arxivlangan. Qaraldi: 29-may 2019-yil.
  14. „Nate Silver: What I need from statisticians“. Statistics Views. Qaraldi: 3-aprel 2020-yil.
  15. „What's the Difference Between Data Science and Statistics?“ (inglizcha). Priceonomics (13-oktabr 2015-yil). Qaraldi: 3-aprel 2020-yil.
  16. Vasant Dhar (1–dekabr 2013–yil). „Data science and prediction“. Communications of the ACM (inglizcha). 56-jild, № 12. 64–73-bet. doi:10.1145/2500499.{{cite magazine}}: CS1 maint: date format ()
  17. „Statistics is the least important part of data science « Statistical Modeling, Causal Inference, and Social Science“. statmodeling.stat.columbia.edu. Qaraldi: 3-aprel 2020-yil.
  18. Miller, Claire. „Data Science: The Numbers of Our Lives“. New York Times (4-aprel 2013-yil). Qaraldi: 10-oktabr 2022-yil.
  19. Borchers, Callum. „Behind the scenes of the 'sexiest job of the 21st century'“. Boston Globe (11-noyabr 2015-yil). Qaraldi: 10-oktabr 2022-yil.
  20. Gupta. „William S. Cleveland“ (11-dekabr 2015-yil). Qaraldi: 2-aprel 2020-yil.
  21. Press. „A Very Short History of Data Science“ (inglizcha). Forbes. Qaraldi: 3-aprel 2020-yil.
  22. Talley, Jill. „ASA Expands Scope, Outreach to Foster Growth, Collaboration in Data Science“. Amstat News. American Statistical Association (1-iyun 2016-yil).
  23. Davenport, Thomas H.; Patil, D. J.. „Data Scientist: The Sexiest Job of the 21st Century“. Harvard Business Review (1-oktabr 2012-yil). Qaraldi: 3-aprel 2020-yil.
  24. „US NSF – NSB-05-40, Long-Lived Digital Data Collections Enabling Research and Education in the 21st Century“. www.nsf.gov. Qaraldi: 3-aprel 2020-yil.
  25. Press. „Data Science: What's The Half-Life of a Buzzword?“ (inglizcha). Forbes. Qaraldi: 3-aprel 2020-yil.
  26. Pham. „The Impacts of Big Data That You May Not Have Heard Of“ (inglizcha). Forbes. Qaraldi: 3-aprel 2020-yil.
  27. Martin. „How Data Science will Impact Future of Businesses?“ (inglizcha). Medium (20-sentabr 2019-yil). Qaraldi: 3-aprel 2020-yil.