Maʼlumotlarni tozalash

Vikipediya, ochiq ensiklopediya

Maʼlumotlarni tozalash (inglizcha: Data cleaning) — ularning sifatini yaxshilash maqsadida xatolarni, maʼlumotlar nomuvofiqliklarini aniqlash va tuzatish jarayoni, bazi maʼlumotlarni izlab olish ajralmas qismi sifatida tasniflanadi.

Maʼlumotlarni tozalash maʼlumotlar bazalari yoki fayllardagi maʼlumotlar toʻplamida amalga oshiriladi. Maʼlumotlarni tozalash zarurati koʻpincha turli xil axborot tizimlarini (maʼlumotlar omborlari, korporativ resurslarni boshqarish tizimlari, mijozlar bilan munosabatlarni boshqarish tizimlari) integratsiyalashganda[1] paydo boʻladi.

Turli xil tizimlardagi maʼlumotlar manbalari koʻpincha tarqoq va turli holatlarda boʻladi. Transformatsiyalar avtomatik (qoidalar toʻplamiga muvofiq) yoki qoʻlda (interaktiv) amalga oshiriladi.

Korporativ axborot tizimlarida tozalanishi va tuzatilishi kerak boʻlgan mavzular jismoniy va yuridik shaxslar toʻgʻrisidagi maʼlumotlar, manzil va aloqa maʼlumotlari boʻlib, matn shaklida qoʻlda kiritilgan har qanday maʼlumotnoma maʼlumotlari ham tozalanishi kerak.

Havolalar[tahrir | manbasini tahrirlash]

  • Jason W. Osborne. Best Practices in Data Cleaning: A Complete Guide to Everything You Need to Do Before and After Collecting Your Data. Sage, 2012. 
  1. integratsiyalash - lotincha «integer» - umumiylik, «integera» - umumiylikni to'ldirish, yaratish, tiklash demakdir.