Elementlarning javob nazariyasi

Zamonaviy ( nazariyasi Berilgan javob nazariyasi ) - (ba'zan rus tilida - zamonaviy test nazariyasi, topshiriqlarga javoblar nazariyasi, pedagogik testlarni modellashtirish va parametrlashtirish nazariyasi) turli xil vazifalarga mavzularning to'g'ri javob berish ehtimolini baholashga imkon beruvchi usullar to'plami. qiyinchilik. U so'rovnomadagi yomon (axborot bo'lmagan) savollardan xalos bo'lish, yashirin konstruktsiyalarning bir-biri bilan va kuzatilgan o'zgaruvchilar bilan aloqasini baholash, respondentlarga topshiriqlarni taqdim etishni optimallashtirish va boshqalar uchun ishlatiladi. Rus tilida "Item Response Theory" nomi tarjima qilingan. turli yo'llar bilan. YU. Neumann va V. Xlebnikov uni "Pedagogik testlarni modellashtirish va parametrlashtirish nazariyasi" (TMPT) deb nomlashni taklif qiladi ^{[Neyman Yu. M., Xlebnikov V. A. Vedenie v teoriyu modellashtirish va parametrizatsii pedagogik testov. -M.: Prometey, −169 s. “Arxivirovannaya nusxa”. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun. 1]} . V. Avanesov - “Test topshiriqlarining yashirin parametrlarini va test topshiruvchilarning tayyorgarlik darajasini baholashning matematik-statistik nazariyasi” ^[1] . Biroq, tarjimaning eng muvaffaqiyatli usullaridan biri bu "zamonaviy test nazariyasi" dir, chunki uning modellari test topshiriqlarini yoki testning o'zini emas, balki respondentlar va topshiriqlarning o'zaro ta'siri natijasini (va ko'plab zamonaviy modellar ham jarayonni tasvirlaydi) tasvirladi.

Psixometriyada zamonaviy test nazariyasi (IRT) testlar, anketalar va shunga o'xshash o'lchov vositalarini loyihalash, tahlil qilish va baholash uchun paradigma hisoblanadi. Ushbu test nazariyasi element javoblarining taxminiyligi va umumiy bilim sifati o'rtasida bog'liqlik mavjudligini ko'rsatadi. Vazifalar va respondentlarning maqsadli parametrlarini baholash uchun turli statistik modellar qo'llaniladi . Tarozilarni tuzish va anketa javoblarini baholashning oddiy muqobillaridan farqli o'laroq, zamonaviy test nazariyasi har bir savol bir xil darajada qiyin deb hisoblamaydi. Bu IRTni, masalan, Likertning masshtablashdagi “barcha ob'ektlar bir-birining replikatsiyasi sifatida qabul qilinadi yoki boshqacha qilib aytganda: ob'ektlar bir-birini almashtiruvchi hisoblanadi” ^[2] farazidan farq qiladi. Bundan farqli o'laroq, zamonaviy sinov nazariyasi har bir elementning parametrlarini (bu elementning ICC (buyumning xarakteristikasi egri chizig'ini) belgilaydi) modelni kalibrlashda kiritilishi kerak bo'lgan ma'lumot sifatida ko'rib chiqadi.

Shunday qilib, IRT har bir respondentning har bir test topshirig'iga javob berish ehtimolini modellashtiradi. Zamonaviy test nazariyasining asosiy xususiyati va uning asosiy ta'rifi respondentlar va vazifalar parametrlarini ajratish g'oyasidir. Ya'ni, topshiriqga to'g'ri javob berish ehtimoli respondent va topshiriqning yashirin parametrlarining o'zaro ta'siri natijasidir. Ularning o'zaro ta'sirining o'ziga xos usuli tadqiqotchining taxminlari bilan belgilanadi va ma'lum bir matematik funktsiya tenglamasiga - zamonaviy test nazariyasi modeliga tarjima qilinadi.

Zamonaviy test nazariyasi modellari tasdiqlovchi omillar tahlili, umumlashtirilgan chiziqli aralash effektlar modellari, statistik fizikadan tarmoq modellari (Markov maydonlari va Ising modeli) va tanlangan ma'lumotlar fanining usullari (modelga asoslangan hamkorlikda filtrlash usullari va cheklangan Boltzmann mashinalari) bilan chambarchas bog'liq. Zamonaviy IRT modellari yangi axborot manbalarini modellashtirish imkonini beradi (masalan, javob vaqtlari, elementlarni echishga urinishlar); turli yashirin o'zgaruvchilar o'rtasidagi murakkab chiziqli bo'lmagan (masalan, shift) munosabatlar; ochiq javoblar uchun ball beruvchi model baholovchi effektlari (va yakuniy qobiliyat ballarining baholovchiga nisbatan o'zgarmasligiga imkon beradi); kompozit va ko'p o'lchovli konstruktsiyalarni modellashtirish; vaqt o'tishi bilan yashirin o'zgaruvchi darajasidagi model o'zgarishi; reyting modelini klassifikatorga aylantiradigan diskret qobiliyat ballaridan foydalaning va hokazo. Bugungi kunda IRT hisoblash xulq-atvori fanining eng ilg'or va nazariy asoslangan yo'nalishlaridan biridir.

Hikoya[tahrir | manbasini tahrirlash]

IRTni yaratish uchun umumiy manba shaklning logistik funktsiyasi deb ataladigan narsa edi $y={\frac {e^{x}}{1+e^{x}}}$ , biologiya fanida 1844 yildan beri ma'lum. O'shandan beri u biologiyada o'simlik massasining o'sishini yoki organizmlarning o'sishini modellashtirish uchun keng qo'llanila boshlandi. Psixologik va pedagogik o'lchov modeli sifatida u 20-asrning 50-yillaridan boshlab qo'llanila boshlandi. IRT modellarini ishlab chiqishning kelib chiqishi test topshiriqlarining rasmiy xususiyatlarini vizualizatsiya qilish istagi, klassik test nazariyasining ko'plab kamchiliklarini bartaraf etishga urinishlar, o'lchovlarning aniqligini oshirish va nihoyat, moslashtirish orqali boshqarish jarayonini optimallashtirish istagida yotadi. kompyuter yordamida talabaning tayyorgarligi darajasini aniqlash uchun test ^[1] .

IRTning nazariya sifatidagi dastlabki ishi 1950-1960-yillarda paydo bo'lgan. Bular Educational Testing Service^[en] a'zolari edi: Фредерик Лорд^[en] daniyalik matematik Георг Раш^[en] va avstriyalik sotsiolog Pol Lazarsfeld . IRT taraqqiyotiga yordam bergan asosiy shaxslar Бенджамин Дрейк^[en] va Дэвид Андрич^[en] dir.

IRTni yaratishning dastlabki shartlaridan biri Alfred Binet va Teodor Saymonning tadqiqot ishlarining natijalari edi ^[3], bu mualliflarning turli yoshdagi bolalarga qanday qilib, majoziy ma'noda, qanday qilib topshirganligini aniqlash istagini aks ettirdi. ish." Keyin koordinata tekisligiga nuqtalarni qo'yib, yoshi (yillarda) x o'qi bo'ylab va har bir yosh guruhidagi sub'ektlarning to'g'ri javoblar nisbati ordinata o'qi bo'ylab chizilgan, natijada olingan nuqtalar Har bir guruh uchun o'rtacha, keyinchalik xarakterli deb ataladigan egri chiziqqa o'xshardi.

1936 yilda M. V. Richardson keng ko'lamli empirik tadqiqot o'tkazdi, 803 ta topshiriq bo'yicha 1200 talabadan so'rov o'tkazdi, uning davomida talabalar test natijalariga qarab har biri yuz kishidan iborat 12 guruhga bo'lingan. U birinchi bo'lib test topshiriqlarining egri chizig'ining o'zgaruvchanligiga e'tibor qaratdi va tiklik o'lchovini vazifaning farqlash qobiliyatini taxminiy baholash sifatida ko'rib chiqishni taklif qildi ^[4] . MVt Richardson, ko'rinishidan, birinchi bo'lib ishlab chiqilgan test topshiriqlarining rasmiy xususiyatlarini grafik ko'rsatish uchun o'rtacha balldan foydalanish samaradorligini tushundi ^[5] .

Xususan, IRTning maqsadi baholashlar qanchalik yaxshi bajarilishini va individual baholash elementlari qanchalik yaxshi ishlashini tahlil qilish uchun asos yaratishdir. Zamonaviy test nazariyasining eng keng tarqalgan qo'llanilishi ta'limda bo'lib, psixometrlar undan imtihonlarni ishlab chiqish va loyihalash, imtihonlar uchun savollar banklarini yuritish va imtihonlarning keyingi versiyalari uchun savollarni solishtirish uchun foydalanadilar ^[6] . Ushbu sohada, sinov natijalari bo'yicha qabul qilingan qarorlarning yuqori ulushi tufayli, o'lchov vositalarining sifatini argumentatsiya qilish ishlab chiquvchi mas'uliyatining o'ta muhim elementi va uning asbobining raqobatdosh ustunligi bo'lib, zamonaviy sinov nazariyasi modellari egallaydi. bu bahsning asosiy joylaridan biri.

Elementga javob berish funktsiyasi IRF[tahrir | manbasini tahrirlash]

IRF ma'lum bir qobiliyat darajasiga ega bo'lgan odamning biror narsaga to'g'ri javob berish ehtimolini beradi.

Uch parametrli logistika modeli[tahrir | manbasini tahrirlash]

Zamonaviy test nazariyasining uch parametrli logistik modeli (3PL) dixotomiyali i topshirig'iga (odatda bir nechta taklif qilinganlardan bitta javobni tanlagan savol) to'g'ri javob berish ehtimolini belgilaydi:

p_{i}({\theta })=c_{i}+{\frac {1-c_{i}}{1+e^{-a_{i}({\theta }-b_{i})}}}

Qayerda ${\theta }$ odatda normal taqsimotga amal qiladi (marginallashtirilgan modellarda). Model kalibrlangandan so'ng, har bir respondentning natijalarni foydalanuvchilarga etkazish qobiliyati baholanadi. $a_{i}$ , $b_{i}$ Va $c_{i}$ — bu vazifa parametrlari. Vazifa parametrlari vazifaga javob berish funksiyasi shaklini belgilaydi. 1-rasmda 3PL modelidan model ishining xarakteristikasi egri chizig'i ko'rsatilgan.

Vazifa parametrlarini standart logistika funktsiyasi shaklini o'zgartirish sifatida talqin qilish mumkin:

P(t)={\frac {1}{1+e^{-t}}}.

Test topshiriqlarini tavsiflovchi parametrlar:

b - qiyinchilik. Bu qiymat savolning qanchalik oson yoki qiyinligini ko'rsatadi. $p(b)=(1+c)/2$ - funksiyaning burilish nuqtasida masalani yechish ehtimoli.
a - diskriminativlik. Bu qiymat ushbu savolning o'quvchilarni qobiliyat darajasi bo'yicha qanchalik samarali ajratishi mumkinligini ko'rsatadi (qoida tariqasida, vazifalarning yuqori diskriminativligi maqsadga muvofiqdir - bu zaif respondentlar vazifani hal qilmasligini ko'rsatadi, lekin kuchlilar bajaradi).
c - psevdo-tasodifiy taxmin qilish ehtimoli. Bu qiymat sub'ektlarning berilgan variantlardan tasodifiy tanlab to'g'ri javob olishlari ehtimolini ko'rsatadi. $p(-\infty )=c$ - asimptotik minimum. Biroq, 3PL modeli 3PL modeli parametrlarining klassik fkventist bahosi yoki boshqa vazifa parametrlari bo'yicha cheklovlar yo'qligi bilan noma'lum.

IRT modellari[tahrir | manbasini tahrirlash]

IRT modellarini ikkita oilaga bo'lish mumkin: bir o'lchovli va ko'p o'lchovli. Bir o'lchovli modellar o'lchovning yagona qiymatini (imkoniyatini) talab qiladi ${\theta }$ . Ko'p o'zgaruvchan IRT modellaridagi javoblar respondentlarni tavsiflovchi bir nechta yashirin o'zgaruvchilarga bog'liq deb taxmin qilinadi.

IRT modellarini element ballari bo'yicha ham tasniflash mumkin. Ko'pincha, vazifalar dixotomiyadir (mumkin ballar 0 (hamma narsa noto'g'ri) yoki 1 (hamma narsa to'g'ri)). Modellarning boshqa klassi politomli topshiriqlarga nisbatan qo'llaniladi, bunda har bir javob topshiriqning qisman to'g'riligini aks ettiradi ^[7] . Buning keng tarqalgan misoli Likert shkalasi javoblari bo'lgan elementlardir, masalan, "0 dan 4" gacha.

Funktsiyalarning analitik spetsifikatsiyasiga kiritilgan parametrlar soni mantiqiy funktsiyalar oilalarini sinflarga bo'lish uchun asosdir.

Logistika funktsiyalari orasida ^[8] :

1) G. Rashning bir parametrli modeli (Georg Rash)— $P_{i}(\theta )={\frac {e^{(\theta -b_{i})}}{1+e^{(\theta -b_{i})}}}$ , Qayerda $\theta$ Va $b_{i}$ — mos ravishda respondentlarning parametrlari va i vazifa;

Ba'zan ko'rsatkich belgisi ostida 1,702 koeffitsienti kiritiladi, bu Rasch modelini A modeliga moslashtirish uchun ishlatiladi. Fergusson, bu erda topshiriqga to'g'ri javob berish ehtimoli normal taqsimotning integrali (normal taqsimotning yig'ilgan ehtimollik zichligi formulasi) bilan ifodalanadi, bu sizga standart normalning yaxshi o'rganilgan integral funktsiyasidan foydalanishga imkon beradi. logistik egri chiziqlar o'rniga taqsimlash.

2-rasm: Modeldagi (1PL) element xarakteristikasi egri chiziqlari (ICC)

Rasch modeli "1 parametrik logistik latent xususiyat modeli" (1PL) deb ataladi va A. Fergusson - "1 Parametrik Normal Ogive Modeli" (1PNO). Rasch modeli respondentning vazifani bitta parametr funktsiyasi sifatida hal qilish ehtimolini tavsiflaganligi sababli (farq $\theta _{j}-b_{i}$ ; ba'zi talqinlarda - vazifa faqat bitta parametrga ega bo'lganligi sababli $b_{i}$ ), u zamonaviy test nazariyasining bir parametrli modeli deb ataladi.

Ikki to'plamning o'zaro ta'siri ${\theta _{j}}$ Va $b_{i}$ "birlashgan qo'shilish" xususiyatiga ega bo'lgan ma'lumotlarni shakllantiradi. Rasch modelidan to'g'ri foydalanish respondentlar qaysi vazifalarga javob berishlari va respondentlar ularga javob beradigan vazifalar parametrlarining to'liq mustaqilligiga erishishga imkon beradi. Rasch modeli yordamida o'lchovlarning bu xususiyati maxsus ob'ektivlik deb ataladi.

Shaklda. 2-rasmda vazifalarning qiyinchiliklari -2, 0 va +2 logitlar bo'lgan uchta xarakterli egri chiziq ko'rsatilgan (birinchisi eng oson, ikkinchisi o'rtacha, uchinchisi eng qiyin). Berilgan bog'liqliklardan ko'rinib turibdiki, sub'ektning th tayyorgarlik darajasi qanchalik yuqori bo'lsa, muayyan vazifani bajarishda muvaffaqiyatga erishish ehtimoli shunchalik yuqori bo'ladi. Masalan, bilan mavzu uchun ${\theta _{j}}=0$ birinchi vazifaga to'g'ri javob berish ehtimoli birga yaqin, ikkinchisi 0,5, uchinchisi esa deyarli nolga teng. E'tibor bering, qaerda nuqtalarda ${\theta _{j}}=b$ to'g'ri javob ehtimoli 0,5 ga teng. Ya'ni, agar topshiriqning qiyinligi sub'ektning tayyorgarlik darajasiga teng bo'lsa, u bu vazifani teng ehtimollik bilan engishi yoki muvaffaqiyatsiz bo'lishi mumkin.

Shaklda. 3-rasmda sub'ektlarning uchta xarakterli egri chizig'i ko'rsatilgan - "Shaxsning xarakteristikasi egri chizig'i" (PCC). Tayyorlik darajasi -2 logit (eng zaif), 0 logit (o'rtacha) va +2 logit (eng kuchli mavzu) bo'lgan uchta fan uchun grafiklar ko'rsatilgan.

Yuqoridagi bog'liqliklardan ko'rinib turibdiki, tayyorgarlik darajasi qanchalik yuqori bo'lsa, topshiriqga to'g'ri javob berish ehtimoli shunchalik yuqori bo'ladi. Masalan, qiyinligi b = 0 bo'lgan vazifa birinchi mavzu uchun (q=-2) amalda mumkin emas, ikkinchisi (q = 0) 0,5 ga teng, uchinchisi (q=+2) uchun vazifani bajarish ehtimoli bor. vazifani osongina engishi mumkin, chunki u uchun muvaffaqiyat ehtimoli deyarli birga teng.

2) А. Бирнбаума^[en] ikki parametrli modeli : $P_{i}(\theta )={\frac {e^{a_{i}(\theta -b_{i})}}{1+e^{a_{i}(\theta -b_{i})}}}$

Agar test turli xil farqlash qobiliyatiga ega bo'lgan vazifalarni o'z ichiga olgan bo'lsa ( $a_{i}$ ), keyin bir parametrli 1PL modeli bunday ma'lumotlarni tasvirlay olmaydi. Ushbu qiyinchilikni bartaraf etish uchun A.Birnbaum yana bir parametrni kiritdi - $a_{i}$ (moddani diskriminatsiya parametri), diskriminativlik parametri.

Parametr $a_{i}$ i-vazifaning xarakterli egri chizig'ining qiyaligini (tikligini) aniqlaydi. Xarakterli egri chiziqlarga misollar shaklda ko'rsatilgan. 4. Ko'proq ekanligi aniq $a_{i}$ egri chiziq qanchalik tik bo'lsa va vazifani farqlash qobiliyati shunchalik yuqori bo'ladi.

3) A.Birnbaumning uch parametrli modeli: $P_{i}(\theta )=c_{i}+(1-c_{i}){\frac {e^{a_{i}(\theta -b_{i})}}{1+e^{a_{i}(\theta -b_{i})}}}$

Qayerda $c_{i}$ i-topshiriqga to'g'ri javob berish ehtimolini tavsiflovchi topshiriqning uchinchi parametridir.

Empirik ma'lumotlarga yanada yaxshiroq moslashish uchun A. Birnbaum uchinchi parametrni kiritdi $c_{i}$ - taxminiy parametr. Shaklda. 5-rasmda qiyinchilik bilan uchta vazifa uchun xarakterli egri chiziqlar misollari ko'rsatilgan $b_{i}$ = 1, diskriminatsion parametr $a_{i}$ = 1 va turli taxmin parametrlari $c_{i}$ = 0, $c_{i}$ = 0,25, $c_{i}$ = 0,5. Yuqoridagi grafiklardan ko'rinib turibdiki, taxminiy parametrning mavjudligi ICC ning proportsional siqilishiga olib keladi. $c_{i}$ 1 ga.

4) A.Birnbaumning to‘rt parametrli modeli: $P_{i}(\theta )=c_{i}+(d_{i}-c_{i}){\frac {e^{a_{i}(\theta -b_{i})}}{1+e^{a_{i}(\theta -b_{i})}}}$

Qayerda $d_{i}$ i-topshiriqga javob berishda xatolik ehtimolini tavsiflovchi vazifaning to'rtinchi parametridir. Ushbu modelda xarakterli egri chiziq 3PL modeliga o'xshash siqiladi, lekin undan emas $c_{i}$ 1 ga va dan $c_{i}$ oldin $d_{i}$ .

Shunday qilib, 2PL modeli 1PL modelining turli xil diskriminativ parametrlarga ega bo'lgan vazifalarga umumlashtirilishi va 3PL modeli 2PL modelining turli taxmin parametrlariga ega bo'lgan vazifalar holatiga umumlashtirishdir va shu bilan birga, u, o'z navbatida, 4PL modelining alohida holati.

Monotonik bo'lmagan xarakterli egri chiziqli vazifalarni tavsiflovchi "5PL" modellari ham mavjud - bu ma'lum bir qobiliyat darajasiga qadar vazifani hal qilish ehtimolining oshishini, keyin esa uning pasayishini aks ettiradi.

Rasch modeli[tahrir | manbasini tahrirlash]

Rasch oilasi modellarining o'ziga xos xususiyati (shu jumladan politom modellar) vazifalarning xarakterli egri chiziqlarining parallelligidir (ular kesishmaydi), 2-rasmga qarang. 3. Bu shuni anglatadiki, osonroq vazifani hal qilish ehtimoli har doim qiyinroq bo'lganidan past bo'ladi - bu qobiliyatning butun uzluksizligi bo'yicha vazifalar ierarxiyasini yaratadi va uni sifat jihatidan talqin qilishga imkon beradi.

Ikki va uch parametrli modellar uchun butunlay boshqacha rasm kuzatiladi. Bu 4-rasmda aniq ko'rinadi. Bilan topshiriq $a_{i}$ th ning ijobiy qiymatlari mintaqasida = 0,5 taqdim etilgan uchta vazifaning eng qiyini, ya'ni bu vazifaga to'g'ri javob berish ehtimoli eng past. q ning manfiy qiymatlari mintaqasida xuddi shu vazifa endi eng oson - unga to'g'ri javob berish ehtimoli eng katta. Ma’lum bo‘lishicha, zaif o‘quvchilar uchun bu eng oson, kuchli talabalar uchun esa eng qiyin. Shunday qilib, Rasch modellaridan farqli o'laroq, 2PL-dagi vazifalar ierarxiyasi qobiliyatning butun uzluksizligi bo'yicha emas, balki xarakterli egri chiziqlarning bir kesishmasidan (har qanday) ikkinchisiga o'tadi, shundan so'ng vazifalarning yangi ierarxiyasi boshlanadi, bu esa ularni tahlil qilishdan mahrum qiladi. barcha amaliy mulohazalar ierarxiyasi.

Xuddi shunday rasm uch parametrli model uchun ham kuzatiladi. 5-rasmda kesishmaydigan xarakterli egri chiziqlarning kamdan-kam holatlari ko'rsatilgan, chunki ular uchun bir xil parametrlar tanlangan. $b_{i}$ =1 va $a_{i}$ =1, ya'ni uchta vazifa ham bir xil qiyinchilik va bir xil diskriminativlik parametriga ega.

6-rasmda yana bir misol ko'rsatilgan. Bu erda parametr bilan vazifa $c_{i}$ =0 qiyinchilik o'zgartirildi $b_{i}$ = -1, bu darhol xarakterli egri chiziqlarning kesishishiga sabab bo'ldi. Bilan topshiriq $c_{i}$ =0 mintaqada th < -2 eng qiyin. Mintaqada -1,5 < th < -1 bu vazifa topshiriqdan ko'ra osonroqdir $c_{i}$ =0,25 va undan ortiq qiyin vazifalar bilan $c_{i}$ =0,5. Mintaqada th > -1 vazifa bilan $c_{i}$ =0 eng oson. Amalda ICC ning bunday kesishishi har doim 2PL va 3PL modellarida sodir bo'ladi.

Biroq, faqat xarakterli egri chiziqlarning parallelligi o'ziga xos ob'ektivlik xususiyatiga olib kelishi mumkin, ya'ni. , faqat Rasch modellari respondentlar parametrlari va vazifalarning bir-biridan mustaqilligini ta'minlashga qodir. Biroq, bu 2PL va undan yuqori modellarda o'ziga xos psixometrik muammolarni hal qilish mumkin emas degani emas.

Zamonaviy test nazariyasining asosiy taxminlari[tahrir | manbasini tahrirlash]

1) Respondentlar va vazifalarning yashirin/yashirin parametrlari mavjud (ular bevosita kuzatilmaydi). Masalan, razvedka testida bu test topshiruvchining aql darajasi va topshiriqning qiyinchilik darajasi (Rasch modellarida).

2) ko'rsatkichlar mavjud bo'lib, ularning namoyon bo'lish ehtimoli yashirin parametrlar bilan belgilanadi. Biroq, parametrlardan farqli o'laroq, ko'rsatkichlar kuzatish uchun mavjud. Ko'rsatkich qiymatlariga asoslanib, yashirin parametrlarning qiymatlarini baholash mumkin.

3) Eskirgan formula: baholanayotgan yashirin o'zgaruvchi bir o'lchovli bo'lishi kerak (shkala faqat bitta o'zgaruvchini o'lchashi kerak). Agar bir o'lchovlilik sharti bajarilmasa, u holda testni qayta ishlash kerak. Bir o'lchovlilikni buzadigan barcha elementlar o'lchovdan olib tashlanishi yoki ishga tushirish uchun o'zgartirilishi kerak, chunki u model taxminlarini buzadi va parametr baholarining talqinini ifloslantiradi.

Zamonaviy shakllanish: Vazifalar respondentlarning parametrlaridan mahalliy darajada mustaqil bo'lishi kerak. Bu shuni anglatadiki, respondentlar parametrlarini nazorat qilishda elementlarga javoblar o'rtasida kovariatsiya yo'q. Boshqacha qilib aytganda, agar siz ma'lum bir qobiliyat darajasiga ega bo'lgan barcha respondentlarni tanlasangiz (masalan, 1 logitga teng va buni qobiliyatning har bir mumkin bo'lgan qiymati uchun qilsangiz), unda ularning topshiriqlarga javoblari mutlaqo tasodifiydir. Bunday holda, vazifalarni bog'laydigan barcha ma'lumotlar respondentlarning qobiliyat darajasi bo'lib, u model tomonidan chiqariladi va qoldiqlar o'rtasida kovariatsiya yo'q (topshiriqlarning mahalliy miqyosda respondentlar parametrlariga bog'liqligi). Ushbu formula topshiriqlarning mahalliy bog'liqligini (testning bir o'lchovsizligi) bartaraf etish usullarining ko'proq umumiyligini ta'minlaydi, chunki u modelga respondentlarning qo'shimcha parametrlarini kiritishga imkon beradi (modelni bifaktor yoki testlet modeliga aylantirish), respondentlar va testletlarning o'zaro ta'siri (mahalliy qaramlikni ko'rsatadigan vazifalar guruhlari). Bunday holda, respondentlarning qo'shimcha parametrlari bifaktorli modellardan o'ziga xos omillar sifatida ishlaydi va mahalliy qaramlikni "singdiradi". Ularning nazorati bilan ushbu parametrlar sonini ko'paytirish orqali respondentlarning parametrlari bo'yicha mahalliy mustaqillikka erishish mumkin. Shu bilan birga, bu taxmin zamonaviy test nazariyasini atalmish nazariyaga integratsiya qilish imkonini beradi. shartli kovariatsiya nazariyasi, uning barcha sinflari ushbu taxmin bilan tavsiflanadi: $Cov(Y_{i},Y_{j}|\theta )=0$ har qanday uchun $i\neq j$ , Qayerda $Y$ - topshiriqlarga javoblar. Shartli kovariatsiya nazariyasi yashirin sinf tahlili, kognitiv diagnostika modellari, tasdiqlovchi omillar tahlili, Bayes tarmoqlari va yashirin o'zgaruvchilarni modellashtirishning boshqa usullarini o'z ichiga oladi.

Zamonaviy va klassik test nazariyalarini solishtirish ^[9][tahrir | manbasini tahrirlash]

	Klassik test nazariyasi (CTT)	IRT (Rasch modellari)
1	Test topshiriqlarining qiyinligini baholash test topshiruvchilarning ma'lum bir namunasining tayyorgarlik darajasiga bog'liq	Test topshiriqlarining qiyinligini baholash test natijalari olingan sub'ektlar kontingentiga nisbatan o'zgarmasdir.
2	Test topshiruvchilarning tayyorgarlik darajasini baholash (birlamchi ballar) ma'lum bir testning qiyinchilik darajasiga bog'liq.	Sinov sub'ektlarining tayyorgarlik darajasini baholash ular olingan natijalar bo'yicha test topshiriqlariga nisbatan o'zgarmasdir.
3	O'lchov xatosi barcha sub'ektlar uchun doimiy qiymatdir. Ishni o'lchash xatosi baholanmaydi	O'lchov xatosi har bir mavzu va har bir vazifa uchun alohida baholanadi. Bundan tashqari, xato bilvosita emas, balki to'g'ridan-to'g'ri hisoblanadi
4	Ishonchlilikni baholash usullari sezilarli cheklovlarni talab qiladi va buzilgan natijalarni keltirib chiqaradi.	Sinov ob'ektlarini o'lchashning ishonchliligini va test topshiriqlarini baholashning ishonchliligini alohida baholash mumkin.
5	Asosiy ball shkalasi tartibli. Xom ballarni CTT ga o'tkazmaslik shkala darajasini oshiradi	Logit shkalasi intervalli bo'lib, bu mavzular va vazifalarni tartiblashdan mos ravishda tayyorgarlik darajasi va qiyinchilik darajasini o'lchashga o'tishga imkon beradi.
6	Sinov ob'ektlarining ballari va test topshirig'idagi qiyinchiliklarning normal taqsimlanishi muhim rol o'ynaydi	Parametrlarni normal taqsimlash talab qilinmaydi
7	Turli xil o'zgarishlarni amalga oshiradigan sub'ektlarning ballari o'rtasidagi yozishmalarni o'rnatish usullari qiyin taxminlarni talab qiladi.	Turli xil variantlarning ko'rsatkichlarini tekislash tartibini bajarish va bitta metrik shkalada masshtablashni amalga oshirish mumkin. Vazifa banklarini yaratish mumkin
8	Kompyuterga moslashtirilgan test uchun mos emas	Kompyuterga moslashtirilgan testning butun nazariyasi IRTga asoslangan
9	Tahlil faqat ob'ektlarning qiyinligini va sub'ektlarning o'lchovlarini baholashga qaratilgan	Qo'shimcha omillarning sub'ektlarning vazifalari va chora-tadbirlari parametrlarini baholashga ta'sirini tahlil qilish mumkin.
10	Vazifalarga og'irliklarni sun'iy ravishda belgilash sub'ektlarning tayyorgarlik darajasi to'g'risidagi ma'lumotlarning buzilishiga olib kelishi mumkin.	Sinov ob'ektining og'irligi (axborot hissasi) boshqa elementlarning xususiyatlaridan qat'i nazar, alohida hisoblanishi mumkin.

Yana qarang[tahrir | manbasini tahrirlash]

Psixologik testning ishonchliligi
Psixologik test
yangi ixtirolar^[en]
turli xil texnikalar^[en]
Inson salomatligi texnikasi^[en]
Psixometriya
Ijtimoiy qurulma^[en]
Standartlashtirilgan test

Eslatmalar[tahrir | manbasini tahrirlash]

↑ ^1,0 ^1,1 Аванесов В. С. Применение тестовых форм в Rasch Measurement // Педагогические измерения, 2005, № 4. -С.3-20. „Архивированная копия“. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun.
↑ A. van Alphen, R. Halfens, A. Hasman and T. Imbos. (1994). Likert or Rasch? Nothing is more applicable than good theory. Journal of Advanced Nursing. 20, 196—201
↑ Binet A., Simon T.H. The Development of Intelligence in Young Children. Vineland, NJ: The Training School, 1916.
↑ Richardson Marion W. The Relation Between the Difficulty and the Difference Validity of a Test / Psychometrika, 1936, 1: 2, 33-49.
↑ Richardson M.W. Notes on the Rationale of Item Analysis./Psychometrika, 1936,1: 169-76.
↑ Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of Item Response Theory. Newbury Park, CA: Sage Press.
↑ Ostini, Remo; Nering, Michael L. (2005). Polytomous Item Response Theory Models. Quantitative Applications in the Social Sciences. 144. SAGE. ISBN 978-0-7619-3068-6.
↑ „Архивированная копия“. 2017-yil 16-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun.
↑ Карданова Е.Ю. Преимущества современной теории тестирования по сравнению с классической теорией тестирования. Вопросы тестирования в образовании. 2004, № 10

Manbala[tahrir | manbasini tahrirlash]

- Embretson, Susan E.; Reise, Steven P.. Item Response Theory for Psychologists. Psychology Press, 2000. ISBN 978-0-8058-2819-1.
- Baker, Frank (2001). The Basics of Item Response Theory. ERIC Clearinghouse on Assessment and Evaluation, University of Maryland, College Park, MD.
- Baker, Frank B.; Kim, Seock-Ho. Item Response Theory: Parameter Estimation Techniques, 2nd, Andoza:Нп3, 2004. ISBN 978-0-8247-5825-7.
- Handbook of Modern Item Response Theory. Springer, 1996. ISBN 978-0-387-94661-0.
- de Boeck, Paul; Wilson, Mark. Explanatory Item Response Models: A Generalized Linear and Nonlinear Approach. Springer, 2004. ISBN 978-0-387-40275-8.
- Fox, Jean-Paul. Bayesian Item Response Modeling: Theory and Applications. Springer, 2010. ISBN 978-1-4419-0741-7.
- Крокер, Линда; Джеймс, Алгина. Введение в классическую и современную теорию тестов. ВЫСШЕЕ ОБРАЗОВАНИЕ СЕГОДНЯ, 2010. ISBN 978-5-98704-437-5.

Manba xatosi: <ref> tags exist for a group named "Neyman Yu. M., Xlebnikov V. A. Vedenie v teoriyu modellashtirish va parametrizatsii pedagogik testov. -M.: Prometey, −169 s. “Arxivirovannaya nusxa”. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun.", but no corresponding <references group="Neyman Yu. M., Xlebnikov V. A. Vedenie v teoriyu modellashtirish va parametrizatsii pedagogik testov. -M.: Prometey, −169 s. “Arxivirovannaya nusxa”. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun."/> tag was found

[uss.dvfu.ru-2] 1,0 ^1,1 Аванесов В. С. Применение тестовых форм в Rasch Measurement // Педагогические измерения, 2005, № 4. -С.3-20. „Архивированная копия“. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun.

[3] A. van Alphen, R. Halfens, A. Hasman and T. Imbos. (1994). Likert or Rasch? Nothing is more applicable than good theory. Journal of Advanced Nursing. 20, 196—201

[4] Binet A., Simon T.H. The Development of Intelligence in Young Children. Vineland, NJ: The Training School, 1916.

[5] Richardson Marion W. The Relation Between the Difficulty and the Difference Validity of a Test / Psychometrika, 1936, 1: 2, 33-49.

[6] Richardson M.W. Notes on the Rationale of Item Analysis./Psychometrika, 1936,1: 169-76.

[7] Hambleton, R. K., Swaminathan, H., & Rogers, H. J. (1991). Fundamentals of Item Response Theory. Newbury Park, CA: Sage Press.

[8] Ostini, Remo; Nering, Michael L. (2005). Polytomous Item Response Theory Models. Quantitative Applications in the Social Sciences. 144. SAGE. ISBN 978-0-7619-3068-6.

[9] „Архивированная копия“. 2017-yil 16-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun.

[10] Карданова Е.Ю. Преимущества современной теории тестирования по сравнению с классической теорией тестирования. Вопросы тестирования в образовании. 2004, № 10

[Neyman Yu. M., Xlebnikov V. A. Vedenie v teoriyu modellashtirish va parametrizatsii pedagogik testov. -M.: Prometey, −169 s. “Arxivirovannaya nusxa”. 2017-yil 4-iyunda asl nusxadan arxivlangan. Qaraldi: 2017-yil 3-iyun. 1]

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]