Kontent qismiga oʻtish

Foydalanuvchi:Gulshoda Safarova/Tabiiy tilni tushunish

Vikipediya, ochiq ensiklopediya

Tabiiy tilni tushunish ( NLU ) yoki tabiiy tilni talqin qilish ( NLI )[1] - bu sun'iy intellektdagi tabiiy tilga ishlov berishning kichik to'plami hisoblanib, sun'iy intellektning vazifasi esa bu yerda mashinada o'qishni tushunish. Tabiiy tilni tushunish AI uchun yechish zarur bo'lgan qiyin muammo hisoblanadi[2].

Ushbu sohaning bir necha qo'llanilish holatlari mavjud bo'lib, ular jamoat orasida moliyaviy qiziqish uyg'otmoqda. Quyidagilar NLU ning asosiy faoliyat turlari hisoblanadi:

  • Avtomatlashtirilgan fikrlash[3]
  • Savollarga javob berish[5]
  • Yangiliklarni yig'ish
  • Matnlarni turkumlashtirish
  • Ovozni faollashtirish
  • Arxivlash
  • Kontent tahlili

STUDENT dasturi 1964-yilda Daniel Bobrou tomonidan MITda doktorlik dissertatsiyasi uchun yozilgan bo'lib, kompyuter orqali tabiiy tilni tushunishga qaratilgan dastlabki urinishlardan biri edi[6][7][8][9][10]. Oradan sakkiz yil o'tgach Jon Makkarti sun'iy intellekt atamasini ishlab chiqdi, Bobrouning dissertatsiyasida (Kompyuter muammolarini hal qilish tizimi uchun tabiiy tilni kiritish) algebrik so'z muammolarini yechish uchun kompyuter qanday qilib oddiy tabiiy tilni tushunishi mumkinligini ko'rsatadi.

Bir yil o'tgach, 1965-yilda MITda Joseph Weizenbaum "ELIZA" interaktiv dasturini yozdi, u ingliz tilidagi istalgan mavzuda suhbat olib bora olardi, ulardan eng ommabopi psixoterapiya hisoblanadi. ELIZA sintaktik tahlil qilish va kalit so'zlarni tayyor iboralarga almashtirish orqali ishlardi. Weizenbaum ELIZA ni keng qamrovli bilim bazasi yoki keng lug'at bilan ta'minlash muammosidan qochdi. Shunga qaramay, ELIZA oddiy loyiha sifatida kutilmaganda mashhur bo'ldi hamda uni Ask.com kabi zamonaviy tijorat tizimlarining dastlabki versiyasi sifatida ko'rish mumkin[11].

1969-yilda Stanford universitetida Roger Schank tabiiy tilni tushunish uchun kontseptual tegishlilik nazariyasini yaratdi[12].Sydney Lamb ta'sirida bo'lgan ushbu model Schankning Yale universiteti talabalari, jumladan Robert Wilensky, Wendy Lehnert va Janet Kolodner tomonidan qo'llanilgan.

1970-yilda William A. Woods kompyuterlarga tabiiy tilni tushunishga yordam berish uchun augmented transition network (kengaytirilgan o'tish tarmog'i)ni (ATN) yaratdi[13]. ATNlar birgalikda ishlaydigan oddiy qoidalar to'plamidan foydalangan holda oldingi yondashuvlarga (phrase structure rules) qaraganda boshqacha (finite state automata) usuldan foydalanganlar. Ushbu ATN va ularning "umumiylashtirilgan ATN" deb nomlangan takomillashtirilgan versiyasi ko'p yillar davomida mashhur edi.

Stenfordda Winograd keyinchalik Google asoschilaridan biri bo'lgan Larri Peyjga maslahat beradi.1971-yilda Terry Winograd MITda PhD uchun SHRDLU dasturini tamomladi. Bu dastur bolalar bloklari dunyosi haqidagi oddiy inglizcha jumlalarni tushunishi mumkin va bu tushunchadan foydalanib, narsalarni harakatga keltirish uchun robot qo'lini yo'naltiradi. SHRDLU ning muvaffaqiyati ushbu sohadagi tadqiqotlarni kuchaytirdi[14][15]. Winograd Language as a Cognitive Process (Til kognitiv jarayon sifatida) kitobini nashr etishi bilan bu sohada o'z hissasini qo'shishda davom etdi[16] va keyinchalik Stenfordda Google asoschisi Larri Peyjga maslahat berdi.

1970-1980-yillarda SRI Internationaldagi tabiiy tillarni qayta ishlash guruhi ushbu sohada tadqiqot qilish va ishlanmalar yaratishni davom ettirdi. Ushbu tadqiqotlar asosida bir qator tijoriy harakatlar amalga oshirildi, jumladan, 1982-yilda Gary Hendrix tomonidan shakllantirilgan Symantec Corporation dastlab shaxsiy kompyuterlarda ma'lumotlar bazasi so'rovlari uchun tabiiy til interfeysini ishlab chiqish maqsadida kompaniya sifatida tuzildi. Ammo, sichqoncha bilan boshqariladigan grafik foydalanuvchi interfeyslari paydo bo'lishi bilan Symantec o'z yo'nalishini o'zgartirdi. Bir vaqtning o'zida bir qator boshqa tijorat harakatlari yuzaga kela boshladi, masalan, Sun'iy intellekt korporatsiyasida Larry R. Harris va Cognitive Systems korporatsiyasida Roger Schank va uning shogirdlari[17][18] 1983-yilda Michael Dyer Roger Schank va W.G Lehnertning Yeldagi ishiga o'xshash bo'lgan BORIS tizimini ishlab chiqdi[19].

Uchinchi ming yillikda IBM Watson kabi matnlarni tasniflash uchun mashinali o'qitishdan foydalanadigan tizimlar joriy etildi. Biroq, mutaxassislar ushbu tizimlar matnlarni qay darajada "tushuna olish" darajasini muhokama qilmoqdalar. Misol uchun, Jon Searl, Watsonning ma'lumot berishiga qaraganda ushbu tizim hattoki savollarni ham tushunmagan[20].

Imkoniyat va kontekst

[tahrir | manbasini tahrirlash]

"Tabiiy tilni tushunish" atamasi kompyuter ilovalarining keng doirasini qamrab oladi. Bularga robotlarga qisqa buyruqlar berish kabi oddiy vazifalardan tortib gazeta maqolalari yoki she'rlarni to'liq tushunish kabi murakkab vazifalar ham kiradi. Ko'pgina amaliy ilovalar ikki qarama-qarshi tomonga ajraldi, masalan, elektron pochta xabarlarini avtomatik ravishda tasniflash va ularni kompaniyaga yo'naltirish. Ular matnni chuqur tushunishni talab qilmasalar-da, sxemali ma'lumotlar bazalariga asosiy so'rovlarni boshqarish bilan solishtirganda kattaroq lug'at va turli jumla tuzilmalarini boshqaradi.

Yillar davomida kompyuterlarga taqdim etilgan tabiiy til yoki ingliz tili tabiatiga mos jumlalarni qayta ishlashga turli xil urinishlar turli darajadagi murakkabliklarda amalga oshirildi.Tabiiy tilni qayta ishlash bo'yicha ba'zi urinishlar tizimni chuqur tushunishga olib kelishi shart emas edi, lekin ular umumiy foydalanish qulayligini oshirdi. Masalan, Wayne Ratliff Vulcan dasturini Star Trek dagi kompyuterdan ilhomlangan inglizcha sintaksis asosida yaratdi. Vulcan dBase tizimiga aylandi, uning foydalanuvchilarga qulay sintaksisi shaxsiy kompyuterlar ma'lumotlar bazasi sanoatini ishga tushirishda muhim rol o'ynadi[21] [22]. Foydalanish oson yoki ingliz tiliga o'xshash sintaksisga ega tizimlar boy leksikadan foydalanadigan tizimlardan ancha farq qiladi va tabiiy til jumlalari semantikasining ichki tasvirini (ko'pincha birinchi tartibli mantiq sifatida) o'z ichiga oladi.

Tarkibiy qismi va qurilishi

[tahrir | manbasini tahrirlash]

Qabul qilingan yondashuvdan qat'i nazar, ko'pchilik tabiiy tilni tushunadigan tizimlar umumiy tarkibiy qismlarga ega. Bular jumlalarni ichki tasvirga aylantirish uchun til leksikasi, tahlil qilish va grammatik qoidalarni o'z ichiga oladi. Tegishli ontologiyaga ega bo'lgan keng qamrovli leksikani yaratish katta kuch talab qiladi; Masalan, WordNet leksikonini yaratish ko'p yillik mehnatni talab qildi[23].

  • Hisoblash semantikasi
  • Kompyuter lingvistikasi
  • Diskursni ifodalash nazariyasi
  • Chuqur lingvistik ishlov berish
  • Tabiiy tilni qayta ishlash tarixi
  • Ma'lumotlarni ajratib olish
  • Matematika [24] [25] [26]
  • Tabiiy tilga ishlov berish
  • Tabiiy tilda dasturlash
  • Tabiiy tildagi foydalanuvchi interfeysi
  • Ochiq ma'lumot olish
  • Nutqning bir qismini teglash
  • Nutqni tanish
  1. Semaan, P. (2012). Natural Language Generation: An Overview. Journal of Computer Science & Research (JCSCR)-ISSN, 50-57
  2. Roman V. Yampolskiy. Turing Test as a Defining Feature of AI-Completeness . In Artificial Intelligence, Evolutionary Computation and Metaheuristics (AIECM) --In the footsteps of Alan Turing. Xin-She Yang (Ed.). pp. 3-17. (Chapter 1). Springer, London. 2013. http://cecs.louisville.edu/ry/TuringTestasaDefiningFeature04270003.pdf
  3. Van Harmelen, Frank, Vladimir Lifschitz, and Bruce Porter, eds. Handbook of knowledge representation. Vol. 1. Elsevier, 2008.
  4. Macherey, Klaus, Franz Josef Och, and Hermann Ney. "Natural language understanding using statistical machine translation." Seventh European Conference on Speech Communication and Technology. 2001.
  5. Hirschman, Lynette, and Robert Gaizauskas. "Natural language question answering: the view from here." natural language engineering 7.4 (2001): 275-300.
  6. American Association for Artificial Intelligence Brief History of AI
  7. Daniel Bobrow's PhD Thesis Natural Language Input for a Computer Problem Solving System.
  8. Machines who think by Pamela McCorduck 2004 ISBN 1-56881-205-1 page 286
  9. Russell, Stuart J.; Norvig, Peter (2003), Artificial Intelligence: A Modern Approach Prentice Hall, ISBN 0-13-790395-2, http://aima.cs.berkeley.edu/, p. 19
  10. Computer Science Logo Style: Beyond programming by Brian Harvey 1997 ISBN 0-262-58150-7 page 278
  11. Weizenbaum, Joseph (1976). Computer power and human reason: from judgment to calculation W. H. Freeman and Company. ISBN 0-7167-0463-3 pages 188-189
  12. Roger Schank, 1969, A conceptual dependency parser for natural language Proceedings of the 1969 conference on Computational linguistics, Sång-Säby, Sweden, pages 1-3
  13. Woods, William A (1970). "Transition Network Grammars for Natural Language Analysis". Communications of the ACM 13 (10): 591–606
  14. Artificial intelligence: critical concepts, Volume 1 by Ronald Chrisley, Sander Begeer 2000 ISBN 0-415-19332-X page 89
  15. Terry Winograd's SHRDLU page at Stanford SHRDLU
  16. Winograd, Terry (1983), Language as a Cognitive Process, Addison–Wesley, Reading, MA.
  17. Larry R. Harris, Research at the Artificial Intelligence corp. ACM SIGART Bulletin, issue 79, January 1982
  18. Inside case-based reasoning by Christopher K. Riesbeck, Roger C. Schank 1989 ISBN 0-89859-767-6 page xiii
  19. In Depth Understanding: A Model of Integrated Process for Narrative Comprehension.. Michael G. Dyer. MIT Press. ISBN 0-262-04073-5
  20. Searle, John. „Watson Doesn't Know It Won on 'Jeopardy!'“. Wall Street Journal (2011-yil 23-fevral).
  21. InfoWorld, Nov 13, 1989, page 144
  22. InfoWorld, April 19, 1984, page 71
  23. G. A. Miller, R. Beckwith, C. D. Fellbaum, D. Gross, K. Miller. 1990. WordNet: An online lexical database. Int. J. Lexicograph. 3, 4, pp. 235-244.
  24. Programming with Natural Language Is Actually Going to Work—Wolfram Blog
  25. Van Valin, Jr. „From NLP to NLU“.
  26. Ball. „multi-lingual NLU by Pat Inc“. Pat.ai.