Qidiruv tizimi

Vikipediya, ochiq ensiklopediya

Qidiruv Tizimi (inglizchada "search engine")- immmmmm reba bu komputerda, kompyuter tarmog´ida yoki butunjahon web tarmog´ida world wide web saqlanayotgan ma'lumotlarni qidirishga mo´ljallangan dasturdir. Internet qidiruv tizimi Information Retrieval systemdan kelib chiqqan. Bu sistema ma´lumotlar bazasi uchun kalit-so´zlar indeksini yaratib, natijada ushbu kalit-so´z qatnashgan qidiruv so´rovnomasiga javob sifatida natijalar ro´yxatini ko´rsatish imkoni paydo bo´ladi.Qidiriv tizimining afzalliklaridan biri bu kerakli ma'lumot yoki axborotni qisqa vaqt ichida komputer xotirasidan topib uni foydalanuvchiga yetkazishdir.Qidiruv tizimining asosiy vazifalari, hamda tarkibiy qismlari quyidagilardir:

  • Indeks yaratish va yangilab turish (hujjatlardagi ma´lumotlar strukturasi)
  • Qidiruv so´rovnomalarini bajarish
  • Qidiruv natijasini imkon qadar mazmunli, ya´ni tushunarli shaklda ko´rsatish

Odatda ma´lumotlar qidirish avtomatik ravishda amalga oshiriladi, masalan WWWda Webcrawler, alohida kompyuterda esa foydalanuvchi belgilagan Indexlar ro´yxatidan barcha ma´lumotlarni o´qish. Qidiruv tizimi turlari Qidiruv tizimlarini bir qancha belgilariga ko´ra turlarga ajratish mumkin. Quyidagi belgilar misol sifatida tanlangandir. Yangi qidiruv tizimini yaratishda ushbu belgilarning hammasini olish shart emas.

Axborotlar turi Turli xil qidiruv tizimlari turli xil axborot turlarini qidira oladi. Avvaliga umumiy qilib ma´lumotlar turini ko´rsatish mumkin, masalan, matn, tasvir, videotasvir, audiofayl va b. Natijalar ham ushbu turlarga bog´liq holda tartibga solinadi. Matn qidirilganda natija sifatida ushbu matndan kalit-so´z qatnashgan bir qism ko´rsatiladi. Axborotlar manba´i Klassifikasiyaning yana bir turi bu qidiruv tizimi topgan axborotning manba´i hisoblanadi. Ko´pincha qidiruv tizimining nomi axborotlani qaysi manba´dan qidirishini ko´rsatadi.

  • Web qidiruv tizimi - WWWdan ma´lumot qidiradi
  • Usenet qidiruv tizimi - butun dunyoga taqsimlangan munozaralar mediumi (vositasi) hisoblanadigan Usenetdan ma´lumot qidiradi
  • Intranet qidiruv tizimi - alohida tashkilotning ichki tarmog´idagi kompyuterlardan ma´lumot qidiradi
  • Desktop qidiruv tizimi - alohida kompyuterning ma´lumotlar bazasidan ma´lumot qidiradigan dastur.

Amalga oshirish usuli

  • Indeksga asoslangan qidiruv tizimi - hozirda eng muhim tizim.Bu tizim tegishli ma´lumotlarni topib, indeks yaratadi. Indeks shunday bir strukturaki, bunda saqlangan ma´lumotlar keyingi qidiruv vaqtida ham qo´llaniladi. Lekin bu tizimda indeksni yangilab turish va saqlash muammoli bo´lsa ham, qidiruv jarayoni tez ekanligi bu tizimning ustunligidir. Bu strukturani ko´pincha invers indeks deb ham atashadi.
  • Meta qidiruv tizimi - qidiruv so´rovnomasini bir vaqtning o´zida bir necha indeksga asoslangan qidiruv tizimlariga jo´natadi va natijani turli kombinasiyada ko´rsatadi.Ustunlik tomoni - ko´p miqdorda ma´lumotlar topishi va implementasiya jarayoni osonroqligidir.Ushbu qidiruv tizimi kam uchraydigan ma´lumotlarni qidirshda yaxshi hisoblanadi.
  • Gibrid formadagi qidiruv tizimi - odatda nisbatan kichik indeksga ega, lekin boshqa qidiruv tizimlariga ham so´rovnoma jo´natib, natijani kombinasiyalangan tarzda ko´rsatishi mumkin.Kam uchraydigan ma´lumotlarni qidirishda yaxshi emas.
  • Guruhlashtirilgan qidiruv tizimi - nisbatan yangi, bunda qidiruv so´rovnomasi o´z qidiruv tizimiga ega bir necha kompyuterlagra jo´natiladi va natija umumlashtiriladi. Markazlashtirilmagani uchun uzilib qolish xavfi yo´q, ishonchli, lekin markaziy tsenzura (cheklashlar) qoýishning iloji yo´q.

Interpretasiya Foydalanuvchining qidiruv so´rovnmasi qidirsh jarayoni boshlanishidan oldin kerakli qidiruv algoritmiga tushunarli qilib interpretasiya(tarjima) qilinadi.Bu esa o´z navbatida so´rov sintaksisini imkon qadar soddaroq qilish va murakkab so´rovlarni bajarish imkonini yaratishga xizmat qiladi. Ko´plab qidiruv tizimlari matematik mantiqdagi Bul operasiyalari yordamida turli kalit-so´zlarning mantiqiy birikmasini hosil qila oladi.Natijada esa ma´lum kalit-so´zga ega web-sahifani topish imkoni paydo bo´ladi. Eng yangi qidiruv tizimi tabiiy tilni tushunadigan qidiruv tizimini bo´lib, uni semantik qidiruv tizimi deb atashadi. Eng ko´p qo´llaniladigan qidiruv tizimlarining belgilari Eng ko´p qo´llaniladigan belgilar kombinasiyasi WWWdan axborot manba´i sifatida, matnli ma´lumotlar uchun esa HTML-format va qidiruvni amalga oshirishda esa indeks yaratishdan foydalanadi.So´rovnimani interpretasiya qilish ko´pincha sodda sintaksisga asoslanga holda amalga oshiriladi. Eng yirik qidiruv tizimi hosoblanmish Google, Yahoo Search va Microsoft Live Search mana shu uslubda ishlaydi. Natijani ko´rsatish Qidiruv natijasi ko´rsatadigan sahifa ko´pgina qidiruv tizimlari tomonidan ikkiga: tabiiy ro´yxat va homiylar linklariga ajratiladi. Homiylar linklari to´lov asosida qidiruv indeksiga kiritilgan bo´lsa, tabiiy ro´yxatda qidirilayotgan kalit-so´z qatnashgan bo´lsagina ko´rsatiladi.Foydalanuvshiga qidiruv tizimidan foydalanishni osonlashtirih maqsadida natijalar muvofiqlik boy´icha (Ranking) saralanadi, lekin har bir qidiruv tizimi saralash uchun o´z me´yorlariga egadir. Bu me´yorlarga quyidagilar kiradi:

  • ma´lumotning ahamiyati (Google uchun PageRank-ko´rsatkichi)
  • har bir topilgan malumotda qidirilayotgan kalit-so´zning qanchalik ko´p uchrashi va joylashgan o´rni
  • so´ralgan ma´lumotni baholash va soni
  • boshqa sahifalardan ushbu kalit-so´z qatnashgan sahifaga qanchalik ko´p linklar berilganligi
  • link beriladigan sahifalarning sifati.

Davomi bor...