Teori tindak balas kepada item - Aplikasi dan Ujian

Dalam bidang Teori Ujian Psikometrik Denominasi yang berbeza telah muncul yang kini mengambil nama "Teori Maklumbalas Perkara" (F.M. Lord, 1980). Denominasi ini membentangkan beberapa perbezaan berkenaan dengan model klasik: 1.- hubungan antara nilai yang diharapkan dari skor subjek dan sifat (ciri yang bertanggungjawab untuk nilai-nilai), biasanya tidak linear. 2.- bertujuan untuk membuat ramalan individu tanpa perlu merujuk kepada ciri-ciri kumpulan normatif.

Anda juga mungkin tertarik dalam: Indeks Teori Ujian Klasik

Teori tindak balas kepada item atau model sifat laten dalam teori ujian
Model teori tindak balas item (tri)
Anggaran parameter
Pembinaan ujian
Penggunaan teori tindak balas item
Tafsiran skor

Teori tindak balas kepada item atau model sifat laten dalam teori ujian

Oleh itu, kita lihat bahawa Teori Respon ini kepada item ini memberi kemungkinan untuk menggambarkan item dan individu secara berasingan; Ia juga menganggap bahawa tindak balas yang diberikan oleh subjek bergantung kepada tahap kemahiran yang ada dalam julat yang dipertimbangkan. Asal-usul model ini adalah disebabkan oleh Lazarsfeld, 1950, yang memperkenalkan istilah "sifat laten" .

Dari sini ia dianggap bahawa setiap individu mempunyai parameter individu yang bertanggungjawab untuk ciri-ciri subjek, yang juga dikenali sebagai "sifat". Ciri ini tidak dapat diukur secara langsung, oleh itu parameter individu dipanggil pemboleh ubah laten. Apabila menggunakan ujian, anda boleh mendapatkan dua perkara yang berbeza, skor sebenar dan skala kecergasan; Ini dicapai jika kita lulus dua ujian dengan kecergasan yang sama kepada kumpulan yang sama.

Dalam teori sifat laten atau teori tindak balas terhadap item tersebut Nilai sebenar adalah nilai yang dijangkakan daripada skor yang diperhatikan. Menurut Tuhan, skor dan kebugaran sejati adalah hal yang sama tetapi dinyatakan dalam skala ukuran yang berlainan.

Model teori tindak balas item (tri)

Model Binomial: telah diperkenalkan oleh Lord (1965), yang menganggap bahawa skor yang diperhatikan sepadan dengan bilangan jawapan yang betul diperolehi dalam ujian (yang barang-barang semua mempunyai masalah yang sama dan mempunyai kebebasan tempatan, iaitu, kebarangkalian untuk bertindak balas dengan betul kepada item tidak dipengaruhi oleh jawapan yang diberikan kepada item lain).

Model Poisson: model-model ini sesuai untuk ujian-ujian yang mempunyai banyak item dan di mana kebarangkalian jawapan yang betul atau salah adalah kecil. Di dalam kumpulan ini pula, kami mempunyai model yang berbeza:

Model Poissonian Rasch, hipotesisnya ialah: setiap ujian mempunyai sejumlah besar item binari yang bebas di dalam negara. kebarangkalian kesilapan dalam setiap item adalah kecil. Kebarangkalian bahawa subjek membuat kesalahan bergantung kepada dua perkara: kesukaran ujian dan kebolehan subjek. tambahnya kesukaran, difahami sebagai hasil pencampuran dua ujian setara dalam satu ujian yang kesulitan adalah jumlah kesukaran dari dua ujian awal.
Model Poisson untuk menilai kelajuan: Model ini juga dicadangkan oleh Rasch dan dicirikan kerana kelajuan dalam pelaksanaan ujian diambil kira. Model ini boleh dicadangkan dalam dua cara: mengira bilangan kesilapan yang dilakukan dan bilangan kata yang dibaca dalam satu unit masa. mengira bilangan kesilapan yang dilakukan dan masa yang dibelanjakan untuk menyelesaikan bacaan teks. Kebarangkalian realisasi sebilangan kata dalam ujian (i) oleh subjek (j), untuk suatu masa (t)
Model Biasa Ojiva: adalah model yang dicadangkan oleh Tuhan (1968), yang digunakan dalam ujian dengan item dikotom dan dengan hanya satu pembolehubah yang sama. Grafiknya adalah seperti berikut: Andaian asas yang mencirikan model ini ialah:

ruang varian laten adalah satu dimensi (k = 1).
kemerdekaan tempatan antara inten.
metrik untuk pemboleh ubah pendam boleh dipilih supaya lengkung setiap item adalah kepala kepala biasa.

Model Logistik; Ia adalah model yang sangat mirip dengan yang sebelumnya tetapi ia juga mempunyai lebih banyak kelebihan berbanding dengan rawatan matematiknya. Fungsi logistik mengambil bentuk berikut: Terdapat model logistik yang berbeza bergantung kepada bilangan parameter yang mempunyai:

2 parameter model logistik, Birnbaum 1968, di antara ciri-cirinya kita menyebutkan bahawa ia adalah satu dimensi, terdapat kemerdekaan tempatan, unsur-unsur adalah dikotom, dan lain-lain.
3 parameter model logistik, Tuhan, dicirikan kerana kebarangkalian memukul dengan ramalan adalah faktor yang akan mempengaruhi prestasi ujian. 4.3. Model logistik 4-parameter: model yang dicadangkan oleh McDonald 1967 dan Barton-Lord pada tahun 1981, yang tujuannya adalah untuk menerangkan kes-kes di mana subjek yang mempunyai tahap kecergasan yang tinggi tidak bertindak balas dengan betul kepada item.
Model logistik Rasch: Model ini adalah yang telah menghasilkan jumlah pekerjaan yang paling besar walaupun mempunyai kelemahan, ini adalah bahawa penyesuaiannya terhadap data nyata lebih sukar. Tetapi sebaliknya dengan kelebihan yang menjadikannya begitu digunakan adalah ia tidak memerlukan besar Saiz sampel untuk pelarasan anda.

Anggaran parameter

Kaedah yang paling banyak digunakan ialah Kemungkinan Maksimum, bersebelahan kaedah ini kaedah pengiraan berangka seperti Newton-Raphson dan Scoring (Rao) digunakan. Kaedah Maksimum Kemungkinan adalah berdasarkan prinsip mendapatkan penganggar parameter tidak diketahui yang memaksimumkan kebarangkalian mendapatkan sampel tersebut. Sebagai tambahan kepada Kemungkinan Maksimum, Pengiraan Bayesian juga digunakan, berdasarkan Teorema Bayes, yang terdiri daripada memasukkan semua maklumat yang diketahui, suatu priori, yang relevan dengan proses membuat kesimpulan. Kajian yang lebih mendalam mengenai kaedah Bayesian untuk menganggar parameter kebugaran ialah Birnbaum (1996) dan Owen (1975). .

FUNGSI MAKLUMAT

Ujian terbaik yang boleh dibina adalah yang memberikan maklumat paling banyak mengenai ciri laten. Kuantifikasi maklumat ini dilakukan melalui "fungsi maklumat". Maklumat fungsi formula, Birnbaum 1968, adalah seperti berikut: Perlu diingat bahawa maklumat yang diperoleh dalam ujian adalah jumlah maklumat setiap item, ditambah dengan sumbangan setiap item tidak bergantung kepada perkara-perkara lain yang membentuk ujian. Secara umum kita boleh mengatakan bahawa maklumat, dalam semua model:

berbeza dengan tahap kecergasan.
Lebih besar cerun lengkung, lebih banyak maklumat.
bergantung kepada varians skor, semakin tinggi ini, kurang maklumat.

Pembinaan ujian

Tugas pertama dan salah satu yang paling penting pada masa membina ujian adalah pilihan item, kord sebelumnya dari asumsi-asumsi teori yang mesti menentukan ciri yang ujian itu hendak diukur. Konsep "analisis item" merujuk kepada satu set prosedur formal yang dijalankan untuk memilih item-item yang akhirnya akan membentuk ujian. Maklumat yang dianggap paling berkaitan dengan item adalah:

Kesukaran item, peratusan individu yang menjawabnya.
Diskriminasi, korelasi setiap item dengan skor total pada ujian.
Pengkhotbah atau analisis kesilapan, pengaruhnya adalah relevan, memberi kesan kepada kesulitan item dan menyebabkan nilai diskriminasi dapat dipandang rendah.

Pada masa menunjuk indikator indeks, statistik atau indeks yang berbeza biasanya digunakan, berikut adalah yang paling banyak digunakan:

Indeks kesukaran Indeks diskriminasi Indeks kebolehpercayaan Indeks kesahihan Indeks yang diketahui harus dipertimbangkan untuk pemilihan item yang akan membentuk ujian, kami akan melihat langkah-langkah apa yang diperlukan untuk pembinaan ujian:

Spesifikasi masalah.
Mengunci set item yang luas dan debug mereka.
Pilihan model.
Uji item yang telah dipilih.
Pilih barang yang terbaik.
Kaji kualiti ujian
Menetapkan norma tafsiran ujian akhir yang diperolehi.

Dari sudut sebelumnya, perlu diingatkan bahawa pilihan model, titik 3, akan bergantung kepada objektif yang diikuti oleh ujian, ciri-ciri dan kualiti data, dan sumber-sumber yang ada. Apabila model dipilih, memandangkan keadaan teoritis di mana ia boleh digunakan, tidak walaupun kebaikannya mereka mesti dianalisis dalam setiap kes dan dalam keadaan tertentu. Ciri-ciri yang dikaitkan dengan model-model yang membentuk Teori Respon ke Item (TRI), Mereka boleh dipengaruhi oleh:

kematraan ujian menunjukkan ketersediaan terhad kekurangan sumber pengkomputeran Terdapat beberapa pilihan apabila menggunakan salah satu atau model lain, mari kita lihat: model kepala peledak normal biasanya tidak digunakan dalam aplikasi, nilai mereka adalah teori.
Rasch: sesuai untuk perbandingan mendatar (ujian sebanding pada tahap kesukaran dengan pengagihan kecergasan yang sama). untuk mempunyai bentuk ujian yang sama. * 2 dan 3 parameter: adalah yang paling sesuai dengan pelbagai masalah.
untuk mengesan corak tindak balas yang salah. untuk penyamaan menegak ujian (membandingkan ujian dengan tahap kesukaran yang berbeza dan pengagihan yang berbeza untuk kecergasan).

1 dan 2 parameter:

sesuai untuk membina skala tunggal, supaya anda dapat membandingkan kemahiran di peringkat yang berbeza.

Pilihan model, sebagai tambahan kepada tujuan yang diusahakan, boleh dipengaruhi oleh saiz sampel; Sekiranya sampel itu besar dan mewakili, tidak akan ada masalah sama ada model klasik atau ciri laten. Tetapi dalam TRI ( teori tindak balas item ) daya sampel kecil untuk memilih model dengan sebilangan kecil parameter, walaupun model uniparameter.

Penggunaan teori tindak balas item

Mari kita lihat apakah aplikasi yang paling biasa: a) Penyamaan ujian, kadang-kadang perlu untuk menghubungkan skor yang diperolehi dalam ujian yang berbeza, dengan dua tujuan yang mungkin:

Persamaan mendatar: ia dicari untuk mendapatkan bentuk ujian yang sama.
Penyamaan Menegak: matlamatnya adalah untuk membina satu skala kebolehan dengan tahap kesukaran yang berbeza. Mengenai persamaan ujian, Tuhan (1980) memperkenalkan konsep "ekuiti", yang menunjukkan bahawa bagi setiap subjek dua ujian boleh ditukar kerana digunakan bahawa satu atau yang lain tidak akan mengubah tahap kebolehan yang telah dianggarkan. untuk subjek.

Kajian bias item, item adalah condong apabila, secara purata, ia memberikan skor yang berbeza secara signifikan dalam kumpulan tertentu yang dianggap sebagai sebahagian daripada penduduk yang sama.

Ujian disesuaikan atau purata , Melalui TRI, ujian individu boleh dibina yang membolehkan untuk menyimpulkan dengan cara yang lebih tepat nilai sebenar sifat yang dipersoalkan. Item akan diberikan secara berturut-turut, presetasi satu item atau yang lain akan bergantung kepada jawapan yang diberikan di atas. Terdapat pelbagai jenis ujian yang disesuaikan, kami menunjukkan perkara berikut:

prosedur dua peringkat, Tuhan 1971; Bertz dan Weiss 1973 - 1974. Satu ujian diluluskan dahulu dan bergantung pada hasil ujian kedua diberikan.
Prosedur dalam beberapa peringkat, adalah sama seperti sebelumnya, hanya proses yang melibatkan lebih banyak peringkat.
Model cawangan tetap, Tuhan 1970, 1971, 1974; Mussoo 1973. Semua subjek menyelesaikan item yang sama, bergantung kepada tindak balas, satu set item diselesaikan.
Model bercabang boleh ubah, berdasarkan kebebasan antara item dan sifat-sifat penganggar kemungkinan maksimum.

Bank barangan, Mempunyai set besar item adalah sesuatu yang akan meningkatkan kualiti ujian tetapi untuk item ini mesti melalui proses debugging terlebih dahulu. Untuk mengklasifikasikan item, perlu mengambil kira ciri yang dimaksudkan untuk mengukur uji bahwa item ini akan menjadi bagian dari.

Tafsiran skor

Skala: tujuannya adalah untuk menawarkan suatu kontinum untuk memerintahkan, mengelaskan atau mengetahui apa yang magnitud relatif dari ciri yang dinilai; ini akan membolehkan kita menubuhkan perbezaan dan persamaan dengan orang yang berkenaan dengan sifat itu. Skala yang digunakan dalam Psikologi adalah: nominal, ordinal, selang dan alasan; skala ini dibina dari hasil ujian, hasil yang dipanggil "skor langsung" .

Penipuan : untuk menaipkan ujian adalah untuk mengubah skor langsung kepada orang lain yang mudah difahami kerana skor bertanda akan mendedahkan kedudukan subjek berkenaan dengan kumpulan, dan akan membolehkan kita membuat perbandingan intra dan intersubject. Terdapat dua jenis menaip:

Linear, mengekalkan bentuk pengedaran dan tidak mengubah saiz korelasi.
Bukan linear, mereka tidak mengekalkan pengedaran atau saiz korelasi .

APTITUDE SCALE Dalam TRI, skala yang dibina adalah skala yang sepadan dengan tahap kecergasan; Skala ini dicirikan kerana perkiraan dan rujukan dibuat secara langsung berkenaan bakat dan skalanya. Di samping itu, bakat yang dianggarkan hanya bergantung pada bentuk lengkung ciri item. Dalam skala yang mungkin, kami menunjukkan dua:

Skala, dicadangkan oleh Woodcock (1978) dan ditakrifkan oleh formula berikut:
Skala WITS, yang dicadangkan oleh Wright (1977), skala ini adalah pengubahsuaian yang terdahulu dan diberikan oleh hubungan berikut:

Artikel ini semata-mata bermaklumat, dalam Psikologi Dalam Talian kita tidak mempunyai fakulti untuk membuat diagnosis atau mencadangkan rawatan. Kami menjemput anda pergi ke psikologi untuk merawat kes anda khususnya.

Jika anda ingin membaca lebih banyak artikel yang serupa dengan Teori tindak balas kepada item - Aplikasi dan Ujian, Kami mengesyorkan anda memasukkan kategori Psikologi Eksperimen kami.

« Teori sistem terbuka - Definisi dan ciri-ciri Teori Michael Tomasello, apa yang membuat kita manusia? »