CRISP-DM

Vikipediya, ochiq ensiklopediya

CRISP-DM (inglizcha: Cross-Industry Standard Process for Data Mining[1]) eng keng tarqalgan[2][3][4] maʼlumotlarni qazib olish metodologiyasidir.

Metodologiyada maʼlumotlarni oʻrganishning yashash davri modeli olti bosqichdan iborat boʻlib, oʻqlar bosqichlar orasidagi eng muhim va koʻp uchrovchi bogʻliqliklarni koʻrsatadi. Ushbu bosqichlarning ketma-ketligi aniq belgilanmagan. Qoidaga koʻra, koʻpgina loyihalarda avvalgi bosqichlarga qaytib, keyin yana oldinga siljishga toʻgʻri kelardi[5].

Ushbu metodologiyaning birinchi versiyasi 1999-yil mart oyida Bryusselda boʻlib oʻtgan toʻrtinchi CRISP-DM SIG Workshop tadbirida taqdim etilgan[6] va bosqichma-bosqich qoʻllanma bir yildan soʻng  nashr etilgan[7].

Maʼlumotlarni qazib olishning hayot aylanishi

Maʼlumotlarni oʻrganish davrining bosqichlari:

  1. Biznes maqsadlarini tushunish (Business Understanding);
  2. Dastlabki maʼlumotlarni oʻrganish (Data Understanding);
  3. Maʼlumotlarni tayyorlash (Data Preparation);
  4. Modellashtirish (Modeling);
  5. Baholash (Evaluation);
  6. Amalga oshirish (Deployment).

Bosqichlar ketma-ketligi qatʼiy emas va har doim talab qilinishiga qarab, turli bosqichlar oʻrtasida oldinga va orqaga siljishi mumkin. Jarayon diagrammasidagi oʻqlar bosqichlar orasidagi eng muhim va koʻp uchrovchi bogʻliqliklarni koʻrsatadi. Diagrammadagi tashqi doira maʼlumotlarning eng intellektual tahlilining davriy xususiyatini anglatadi. Maʼlumotlarni intellektual tahlil qilish jarayoni yechim shakllantirilgandan keyin davom etadi. Jarayon davomida olingan saboqlar yangi, koʻpincha maqsadli biznes savollarini keltirib chiqarishi mumkin va keyingi maʼlumotlarni intellektual tahlil qilish jarayonlari avvalgilarining tajribasidan foyda oladi.

Manbalar[tahrir | manbasini tahrirlash]

  1. Shearer C., The CRISP-DM model: the new blueprint for data mining, J Data Warehousing (2000); 5:13—22.
  2. „Poll: What main methodology are you using for data mining?“. www.kdnuggets.com. Qaraldi: 2016-yil 14-sentyabr.
  3. „Poll: Data Mining Methodology“. www.kdnuggets.com. Qaraldi: 2016-yil 14-sentyabr.
  4. „What main methodology are you using for your analytics, data mining, or data science projects? Poll“. www.kdnuggets.com. Qaraldi: 2016-yil 14-sentyabr.
  5. Óscar Marbán, Gonzalo Mariscal and Javier Segovia (2009); A Data Mining & Knowledge Discovery Process Model. In Data Mining and Knowledge Discovery in Real Life Applications, Book edited by: Julio Ponce and Adem Karahoca, ISBN 978-3-902613-53-0, pp. 438—453, February 2009, I-Tech, Vienna, Austria.
  6. Pete Chapman (1999); The CRISP-DM User Guide.
  7. Pete Chapman, Julian Clinton, Randy Kerber, Thomas Khabaza, Thomas Reinartz, Colin Shearer, and Rüdiger Wirth (2000); CRISP-DM 1.0 Step-by-step data mining guide[sayt ishlamaydi].

Havolalar[tahrir | manbasini tahrirlash]