Qidiruv tizimi

Vikipediya, ochiq ensiklopediya

Qidiruv tizimi (inglizcha: search engine) — kompyuterda, kompyuter tarmogʻida yoki butunjahon web tarmogʻida World Wide Web saqlanayotgan maʼlumotlarni qidirishga moʻljallangan dasturdir. Internet qidiruv tizimi Information Retrieval systemdan kelib chiqqan. Bu sistema maʼlumotlar bazasi uchun kalit-soʻzlar indeksini yaratib, natijada ushbu kalit-soʻz qatnashgan qidiruv soʻrovnomasiga javob sifatida natijalar roʻyxatini koʻrsatish imkoni paydo boʻladi. Qidiriv tizimining afzalliklaridan biri bu kerakli maʼlumot yoki axborotni qisqa vaqt ichida komputer xotirasidan topib uni foydalanuvchiga yetkazishdir. Qidiruv tizimining asosiy vazifalari hamda tarkibiy qismlari quyidagilardir:

  • Indeks yaratish va yangilab turish (hujjatlardagi maʼlumotlar strukturasi)
  • Qidiruv soʻrovnomalarini bajarish
  • Qidiruv natijasini imkon qadar mazmunli, yaʼni tushunarli shaklda koʻrsatish

Odatda maʼlumotlar qidirish avtomatik ravishda amalga oshiriladi, masalan WWWda Webcrawler, alohida kompyuterda esa foydalanuvchi belgilagan Indexlar roʻyxatidan barcha maʼlumotlarni oʻqish.

Qidiruv tizimi turlari Qidiruv tizimlarini bir qancha belgilariga koʻra turlarga ajratish mumkin. Quyidagi belgilar misol sifatida tanlangandir. Yangi qidiruv tizimini yaratishda ushbu belgilarning hammasini olish shart emas.

Axborotlar turi Turli xil qidiruv tizimlari turli xil axborot turlarini qidira oladi. Avvaliga umumiy qilib maʼlumotlar turini koʻrsatish mumkin, masalan, matn, tasvir, videotasvir, audiofayl va b. Natijalar ham ushbu turlarga bogʻliq holda tartibga solinadi. Matn qidirilganda natija sifatida ushbu matndan kalit-soʻz qatnashgan bir qism koʻrsatiladi.

Axborotlar manbaʼi Klassifikasiyaning yana bir turi bu qidiruv tizimi topgan axborotning manbaʼi hisoblanadi. Koʻpincha qidiruv tizimining nomi axborotlani qaysi manbaʼdan qidirishini koʻrsatadi.

  • Web qidiruv tizimi — WWWdan maʼlumot qidiradi
  • Usenet qidiruv tizimi — butun dunyoga taqsimlangan munozaralar mediumi (vositasi) hisoblanadigan Usenetdan maʼlumot qidiradi
  • Intranet qidiruv tizimi — alohida tashkilotning ichki tarmogʻidagi kompyuterlardan maʼlumot qidiradi
  • Desktop qidiruv tizimi — alohida kompyuterning maʼlumotlar bazasidan maʼlumot qidiradigan dastur.

Amalga oshirish usuli

  • Indeksga asoslangan qidiruv tizimi — hozirda eng muhim tizim.Bu tizim tegishli maʼlumotlarni topib, indeks yaratadi. Indeks shunday bir strukturaki, bunda saqlangan maʼlumotlar keyingi qidiruv vaqtida ham qoʻllaniladi. Lekin bu tizimda indeksni yangilab turish va saqlash muammoli boʻlsa ham, qidiruv jarayoni tez ekanligi bu tizimning ustunligidir. Bu strukturani koʻpincha invers indeks deb ham atashadi.
  • Meta qidiruv tizimi — qidiruv soʻrovnomasini bir vaqtning oʻzida bir necha indeksga asoslangan qidiruv tizimlariga joʻnatadi va natijani turli kombinasiyada koʻrsatadi.Ustunlik tomoni — koʻp miqdorda maʼlumotlar topishi va implementasiya jarayoni osonroqligidir.Ushbu qidiruv tizimi kam uchraydigan maʼlumotlarni qidirshda yaxshi hisoblanadi.
  • Gibrid formadagi qidiruv tizimi — odatda nisbatan kichik indeksga ega, lekin boshqa qidiruv tizimlariga ham soʻrovnoma joʻnatib, natijani kombinasiyalangan tarzda koʻrsatishi mumkin.Kam uchraydigan maʼlumotlarni qidirishda yaxshi emas.
  • Guruhlashtirilgan qidiruv tizimi — nisbatan yangi, bunda qidiruv soʻrovnomasi oʻz qidiruv tizimiga ega bir necha kompyuterlagra joʻnatiladi va natija umumlashtiriladi. Markazlashtirilmagani uchun uzilib qolish xavfi yoʻq, ishonchli, lekin markaziy tsenzura (cheklashlar) qoýishning iloji yoʻq.

Interpretasiya Foydalanuvchining qidiruv soʻrovnmasi qidirsh jarayoni boshlanishidan oldin kerakli qidiruv algoritmiga tushunarli qilib interpretasiya(tarjima) qilinadi.Bu esa oʻz navbatida soʻrov sintaksisini imkon qadar soddaroq qilish va murakkab soʻrovlarni bajarish imkonini yaratishga xizmat qiladi. Koʻplab qidiruv tizimlari matematik mantiqdagi Bul operasiyalari yordamida turli kalit-soʻzlarning mantiqiy birikmasini hosil qila oladi.Natijada esa maʼlum kalit-soʻzga ega web-sahifani topish imkoni paydo boʻladi. Eng yangi qidiruv tizimi tabiiy tilni tushunadigan qidiruv tizimini boʻlib, uni semantik qidiruv tizimi deb atashadi. Eng koʻp qoʻllaniladigan qidiruv tizimlarining belgilari Eng koʻp qoʻllaniladigan belgilar kombinasiyasi WWWdan axborot manbaʼi sifatida, matnli maʼlumotlar uchun esa HTML-format va qidiruvni amalga oshirishda esa indeks yaratishdan foydalanadi.Soʻrovnimani interpretasiya qilish koʻpincha sodda sintaksisga asoslanga holda amalga oshiriladi. Eng yirik qidiruv tizimi hosoblanmish Google, Yahoo Search va Microsoft Live Search mana shu uslubda ishlaydi. Natijani koʻrsatish Qidiruv natijasi koʻrsatadigan sahifa koʻpgina qidiruv tizimlari tomonidan ikkiga: tabiiy roʻyxat va homiylar linklariga ajratiladi. Homiylar linklari toʻlov asosida qidiruv indeksiga kiritilgan boʻlsa, tabiiy roʻyxatda qidirilayotgan kalit-soʻz qatnashgan boʻlsagina koʻrsatiladi.Foydalanuvshiga qidiruv tizimidan foydalanishni osonlashtirih maqsadida natijalar muvofiqlik boyʻicha (Ranking) saralanadi, lekin har bir qidiruv tizimi saralash uchun oʻz meʼyorlariga egadir. Bu meʼyorlarga quyidagilar kiradi:

  • maʼlumotning ahamiyati (Google uchun PageRank-koʻrsatkichi)
  • har bir topilgan malumotda qidirilayotgan kalit-soʻzning qanchalik koʻp uchrashi va joylashgan oʻrni
  • soʻralgan maʼlumotni baholash va soni
  • boshqa sahifalardan ushbu kalit-soʻz qatnashgan sahifaga qanchalik koʻp linklar berilganligi
  • link beriladigan sozlardir.