Qidiruv tizimi

Vikipediya, ochiq ensiklopediya
Jump to navigation Jump to search

Qidiruv Tizimi (inglizchada "search engine")- immmmmm reba bu komputerda, kompyuter tarmogʻida yoki butunjahon web tarmogʻida world wide web saqlanayotgan ma'lumotlarni qidirishga moʻljallangan dasturdir. Internet qidiruv tizimi Information Retrieval systemdan kelib chiqqan. Bu sistema maʻlumotlar bazasi uchun kalit-soʻzlar indeksini yaratib, natijada ushbu kalit-soʻz qatnashgan qidiruv soʻrovnomasiga javob sifatida natijalar roʻyxatini koʻrsatish imkoni paydo boʻladi.Qidiriv tizimining afzalliklaridan biri bu kerakli ma'lumot yoki axborotni qisqa vaqt ichida komputer xotirasidan topib uni foydalanuvchiga yetkazishdir.Qidiruv tizimining asosiy vazifalari, hamda tarkibiy qismlari quyidagilardir:

  • Indeks yaratish va yangilab turish (hujjatlardagi maʻlumotlar strukturasi)
  • Qidiruv soʻrovnomalarini bajarish
  • Qidiruv natijasini imkon qadar mazmunli, yaʻni tushunarli shaklda koʻrsatish

Odatda maʻlumotlar qidirish avtomatik ravishda amalga oshiriladi, masalan WWWda Webcrawler, alohida kompyuterda esa foydalanuvchi belgilagan Indexlar roʻyxatidan barcha maʻlumotlarni oʻqish.

Qidiruv tizimi turlari Qidiruv tizimlarini bir qancha belgilariga koʻra turlarga ajratish mumkin. Quyidagi belgilar misol sifatida tanlangandir. Yangi qidiruv tizimini yaratishda ushbu belgilarning hammasini olish shart emas.

Axborotlar turi Turli xil qidiruv tizimlari turli xil axborot turlarini qidira oladi. Avvaliga umumiy qilib maʻlumotlar turini koʻrsatish mumkin, masalan, matn, tasvir, videotasvir, audiofayl va b. Natijalar ham ushbu turlarga bogʻliq holda tartibga solinadi. Matn qidirilganda natija sifatida ushbu matndan kalit-soʻz qatnashgan bir qism koʻrsatiladi.

Axborotlar manbaʻi Klassifikasiyaning yana bir turi bu qidiruv tizimi topgan axborotning manbaʻi hisoblanadi. Koʻpincha qidiruv tizimining nomi axborotlani qaysi manbaʻdan qidirishini koʻrsatadi.

  • Web qidiruv tizimi - WWWdan maʻlumot qidiradi
  • Usenet qidiruv tizimi - butun dunyoga taqsimlangan munozaralar mediumi (vositasi) hisoblanadigan Usenetdan maʻlumot qidiradi
  • Intranet qidiruv tizimi - alohida tashkilotning ichki tarmogʻidagi kompyuterlardan maʻlumot qidiradi
  • Desktop qidiruv tizimi - alohida kompyuterning maʻlumotlar bazasidan maʻlumot qidiradigan dastur.

Amalga oshirish usuli

  • Indeksga asoslangan qidiruv tizimi - hozirda eng muhim tizim.Bu tizim tegishli maʻlumotlarni topib, indeks yaratadi. Indeks shunday bir strukturaki, bunda saqlangan maʻlumotlar keyingi qidiruv vaqtida ham qoʻllaniladi. Lekin bu tizimda indeksni yangilab turish va saqlash muammoli boʻlsa ham, qidiruv jarayoni tez ekanligi bu tizimning ustunligidir. Bu strukturani koʻpincha invers indeks deb ham atashadi.
  • Meta qidiruv tizimi - qidiruv soʻrovnomasini bir vaqtning oʻzida bir necha indeksga asoslangan qidiruv tizimlariga joʻnatadi va natijani turli kombinasiyada koʻrsatadi.Ustunlik tomoni - koʻp miqdorda maʻlumotlar topishi va implementasiya jarayoni osonroqligidir.Ushbu qidiruv tizimi kam uchraydigan maʻlumotlarni qidirshda yaxshi hisoblanadi.
  • Gibrid formadagi qidiruv tizimi - odatda nisbatan kichik indeksga ega, lekin boshqa qidiruv tizimlariga ham soʻrovnoma joʻnatib, natijani kombinasiyalangan tarzda koʻrsatishi mumkin.Kam uchraydigan maʻlumotlarni qidirishda yaxshi emas.
  • Guruhlashtirilgan qidiruv tizimi - nisbatan yangi, bunda qidiruv soʻrovnomasi oʻz qidiruv tizimiga ega bir necha kompyuterlagra joʻnatiladi va natija umumlashtiriladi. Markazlashtirilmagani uchun uzilib qolish xavfi yoʻq, ishonchli, lekin markaziy tsenzura (cheklashlar) qoýishning iloji yoʻq.

Interpretasiya Foydalanuvchining qidiruv soʻrovnmasi qidirsh jarayoni boshlanishidan oldin kerakli qidiruv algoritmiga tushunarli qilib interpretasiya(tarjima) qilinadi.Bu esa oʻz navbatida soʻrov sintaksisini imkon qadar soddaroq qilish va murakkab soʻrovlarni bajarish imkonini yaratishga xizmat qiladi. Koʻplab qidiruv tizimlari matematik mantiqdagi Bul operasiyalari yordamida turli kalit-soʻzlarning mantiqiy birikmasini hosil qila oladi.Natijada esa maʻlum kalit-soʻzga ega web-sahifani topish imkoni paydo boʻladi. Eng yangi qidiruv tizimi tabiiy tilni tushunadigan qidiruv tizimini boʻlib, uni semantik qidiruv tizimi deb atashadi. Eng koʻp qoʻllaniladigan qidiruv tizimlarining belgilari Eng koʻp qoʻllaniladigan belgilar kombinasiyasi WWWdan axborot manbaʻi sifatida, matnli maʻlumotlar uchun esa HTML-format va qidiruvni amalga oshirishda esa indeks yaratishdan foydalanadi.Soʻrovnimani interpretasiya qilish koʻpincha sodda sintaksisga asoslanga holda amalga oshiriladi. Eng yirik qidiruv tizimi hosoblanmish Google, Yahoo Search va Microsoft Live Search mana shu uslubda ishlaydi. Natijani koʻrsatish Qidiruv natijasi koʻrsatadigan sahifa koʻpgina qidiruv tizimlari tomonidan ikkiga: tabiiy roʻyxat va homiylar linklariga ajratiladi. Homiylar linklari toʻlov asosida qidiruv indeksiga kiritilgan boʻlsa, tabiiy roʻyxatda qidirilayotgan kalit-soʻz qatnashgan boʻlsagina koʻrsatiladi.Foydalanuvshiga qidiruv tizimidan foydalanishni osonlashtirih maqsadida natijalar muvofiqlik boyʻicha (Ranking) saralanadi, lekin har bir qidiruv tizimi saralash uchun oʻz meʻyorlariga egadir. Bu meʻyorlarga quyidagilar kiradi:

  • maʻlumotning ahamiyati (Google uchun PageRank-koʻrsatkichi)
  • har bir topilgan malumotda qidirilayotgan kalit-soʻzning qanchalik koʻp uchrashi va joylashgan oʻrni
  • soʻralgan maʻlumotni baholash va soni
  • boshqa sahifalardan ushbu kalit-soʻz qatnashgan sahifaga qanchalik koʻp linklar berilganligi
  • link beriladigan sahifalarning sifati.

Davomi bor...