Kabuuang puntos. Magtatag ng mga pamantayan sa pagganap ng pagsubok


Mga Resulta ng Pagsusukat sa Pagsusukat

Tinukoy ni Stevens (1946) ang 4 na antas ng mga sukat ng pagsukat, na naiiba sa antas kung saan ang mga pagtatantya na kabilang sa kanila ay nagpapanatili ng mga katangian ng hanay ng mga tunay na numero. Ito ang mga timbangan:

Nominal (o nominatibo, sukat ng pagbibigay ng pangalan)

ordinal

Pagitan

Iskala ng relasyon.

Interpretasyon ng mga resulta ng pagsusulit

Sa mga pagsubok na may interpretasyong nakatuon sa pamantayan ang pangunahing gawain ay upang matukoy ang paghahambing na lugar ng bawat isa sa mga nasubok sa pangkalahatang pangkat ng mga paksa. Malinaw, ang lugar ng bawat paksa ay depende sa background ng kung aling grupo siya sinusuri. Ang parehong resulta ay maaaring mauri bilang medyo mataas kung ang grupo ay mahina, at sa halip ay mababa kung ang grupo ay malakas. Iyon ang dahilan kung bakit kinakailangan, kung maaari, na gumamit ng mga pamantayan na sumasalamin sa mga resulta ng pagsusulit ng isang malaking kinatawan na sample ng mga paksa.

Sa mga pagsubok na may interpretasyong nakatuon sa pamantayan ang gawain ay ihambing ang mga nakamit na pang-edukasyon ng bawat mag-aaral sa dami ng kaalaman, kasanayan at kakayahan na binalak para sa asimilasyon. Sa kasong ito, ang isang tiyak na lugar ng nilalaman ay ginagamit bilang isang interpretive frame ng sanggunian, at hindi isa o isa pang sample ng mga paksa. Ang pangunahing problema ay ang pagtatatag ng passing score na naghihiwalay sa mga nakabisado ang materyal na sinusuri sa mga hindi nakabisado nito.

Magtatag ng mga pamantayan sa pagganap ng pagsubok

Upang alisin ang pag-asa ng interpretasyon sa mga resulta ng iba pang mga kalahok sa pagsusulit, ginagamit ang mga espesyal na pamantayan sa pagganap ng pagsusulit, at sa gayon, ang pangunahing marka ng isang indibidwal na paksa ng pagsusulit ay inihambing sa mga pamantayan sa pagganap ng pagsusulit. Mga pamantayan - ito ay isang hanay ng mga indicator na empirically itinatag batay sa mga resulta ng isang pagsubok sa pamamagitan ng isang mahusay na tinukoy na sample ng mga paksa. Ang pagbuo at mga pamamaraan para sa pagkuha ng mga tagapagpahiwatig na ito ay proseso ng normalisasyon(o estandardisasyon) pagsusulit. Ang pinakakaraniwang pamantayan ay ang mean at standard deviation ng isang set ng mga indibidwal na marka. Ang ugnayan ng pangunahing marka ng paksa sa mga pamantayan ng pagganap ay nagbibigay-daan sa iyo upang maitatag ang lugar ng paksa sa sample na ginamit upang gawing pamantayan ang pagsusulit.

Mga uri ng timbangan na ginagamit upang i-convert ang mga pangunahing marka

Ang pinakasikat na mga conversion ng mga pangunahing marka ay:

Percentile rank, na sumasalamin sa porsyento ng mga paksa sa normative group, na ang mga resulta ay mas mababa o katumbas ng isang naibigay na halaga ng pangunahing marka;

Linear Z-pagtatasa, na tinukoy bilang ang ratio ng indibidwal na paglihis ng marka ng pagsusulit sa karaniwang paglihis para sa pangkat ng mga paksa;

Mga pagtatantya na isang linear na pagbabago z-mga pagtatasa (T-scale, karaniwang mga marka ng IQ, atbp.);

Stanine at mga kaliskis sa dingding, na nakukuha sa pamamagitan ng paghahati ng sukat ng mga pangunahing punto sa iba't ibang mga agwat.

Percentile rank scale

Pinapayagan ka ng mga porsyento na itakda ang ranggo ng pangunahing tagapagpahiwatig ng paksa sa pangkat ng normatibo. Ang percentile rank na tumutugma sa isang ibinigay na pangunahing marka ay nagpapakita ng porsyento ng mga paksa sa normative sample na ang mga resulta ay hindi mas mataas kaysa sa ibinigay na pangunahing marka.

Ang mga porsyento ay hindi dapat malito sa mga porsyento na kumakatawan sa porsyento ng mga gawain na tama na natapos ng mga paksa ng pangkat. Hindi tulad ng huli - pangunahin - ang percentile ay isang nagmula na tagapagpahiwatig na nagsasaad ng bahagi ng kabuuang bilang ng mga paksa sa pangkat.

Bilang karagdagan sa kaginhawaan na nauugnay sa kadalian ng interpretasyon, ang mga ranggo ng percentile ay may mga makabuluhang disbentaha. Ang sukat ng percentile ranks ay non-linear, i.e. sa iba't ibang bahagi ng sukat ng pangunahing marka, ang pagtaas ng 1 puntos ay maaaring tumugma sa iba't ibang pagtaas sa sukat ng percentile. Samakatuwid, ang mga porsyento ay hindi lamang sumasalamin, ngunit kahit na papangitin ang mga tunay na pagkakaiba sa resulta ng pagsusulit.

Samakatuwid, ang paggamit ng mga percentile ay medyo limitado. Dahil sa kanilang kaginhawahan at pagiging simple, pangunahing ginagamit ang mga ito sa mga pagsusulit na nakatuon sa pamantayan para sa sariling pagtatasa ng kaalaman ng mga mag-aaral, na nag-uulat ng mga resulta sa mga mag-aaral mismo at sa kanilang mga magulang.

Z-scale

Kino-convert ang mga indibidwal na resulta sa isang karaniwang sukat na may pangkalahatang average na marka at isang karaniwang sukat ng pagkakaiba. Z- pagsusuri i-th ang mag-aaral ay matatagpuan sa pamamagitan ng formula:

saan pangunahing marka i-th ang paksa; - average ng mga indibidwal na marka N pangkat ng pagsubok ( i=1,2,…,N); ay ang karaniwang paglihis para sa hanay ng mga pangunahing marka.

Z-Scale ay standard na may zero mean at unit standard deviation. Sa tulong nito, maaari mong dalhin ang mga marka ng mga mag-aaral na nakuha sa iba't ibang mga pagsusulit sa isang form na maginhawa para sa paghahambing.

Halaga Z-ang pagtatantya ay katumbas ng distansya sa pagitan ng itinuturing na pangunahing marka at ang average na halaga ng mga pagtatantya para sa pangkat, na ipinahayag sa mga yunit ng karaniwang paglihis: sa loob kung gaano karaming mga karaniwang paglihis ang pangunahing marka ng paksa sa ibaba o sa itaas ng ibig sabihin ng pangkat.

Ang mga Z-scores, na may mga bihirang pagbubukod, ay kumukuha ng mga halaga mula sa pagitan (-3, +3). Ang pagiging maginhawa para sa siyentipikong pagsusuri sa proseso ng pagbuo ng mga bagong pagsubok, ang Z-scale ay hindi maginhawa para sa praktikal na paggamit sa pagtatasa ng kaalaman ng mga paksa ng grupo. Ang mga Z-scores ay maaaring kumuha ng mga fractional at negatibong halaga, na mahirap gamitin sa mga kalkulasyon at mahirap bigyang-kahulugan para sa mga pagsubok na user. Ang pag-round ng Z-scores sa mga integer na halaga ay hindi palaging katanggap-tanggap, dahil ang pangunahing layunin ng paglikha ng mga pagsusulit ay upang matukoy ang mga pagkakaiba sa paghahanda ng mga paksa. Ang mga negatibong halaga ng Z-score, na nagsasaad ng mga resultang mas mababa sa average para sa pangkat ng mga nasubok na mag-aaral, ay nagdudulot din ng ilang partikular na abala - magdudulot sila ng halatang pagtanggi sa mga mag-aaral na tumatanggap sa kanila. Sa pangkalahatan, ginagawa ng lahat ng ito na hindi maginhawa ang Z-score para sa pag-uulat ng mga resulta sa mga paksa at pinipilit ang paggamit ng mga espesyal na paraan ng conversion para sa pag-iskor ng mga mag-aaral.

Mga pagbabago sa Z-score

Ang mga pagbabago sa Z-score ay naglalayong isalin ang mga ito sa mga halaga na mas madaling isulat at ipaliwanag. Sa kasong ito, ang pagbabagong ginamit ay dapat na linear upang mapanatili ang hugis ng distribusyon ng mga Z-scores. Ang pangkalahatang pormula para sa naturang pagbabago ay

Z1 = M+ ? Z ,

Kung saan ang Z 1 ay ang na-convert na pagtatantya, M ay ang bagong mean na halaga (ang ibig sabihin ng halaga ng mga marka pagkatapos ng pagbabago), - bagong standard deviation. Ang iba't ibang pagbabago ay may iba't ibang kahulugan M at . Narito ang ilan sa mga pinakakilalang pagbabago ng Z-scores.

T-scale(McCall, 1939, para sa pag-uulat ng pagganap ng mga bata sa mga pagsusulit sa kakayahan sa pag-iisip). Ang average na halaga ay pinili M = 50 at karaniwang paglihis? = 10. Nakukuha namin ang: Z 1 \u003d 50 + 10 Z

Skala ng CEEV(ETS, upang ipaalam sa mga prospective na mag-aaral ng mga marka ng pagsusulit sa pasukan sa kolehiyo). Ang average na halaga ay pinili M = 500 at karaniwang paglihis? = 100. Nakukuha namin ang: Z 1 \u003d 500 + 100 Z

IQ scale(Weshler, 1939, para sa pagbibigay-kahulugan sa mga marka ng katalinuhan ng nasa hustong gulang). Ang average na halaga ay pinili M = 100 at standard deviation? = 15. Nakukuha namin ang: Z 1 \u003d 100 + 15 Z

Mga kaliskis ng mga staline at dingding

Minsan kapag nag-uulat ng mga resulta, ginagamit ang mga kaliskis na binubuo ng mga solong integer, halimbawa, mula 1 hanggang 9 o mula 1 hanggang 10. Maginhawa ito para sa pag-uulat ng mga resulta ng pagsubok, dahil. ang gayong mga kaliskis ay malinaw na simple.

Ang paghahati sa normal na distribusyon sa 9 na pagitan ay nagreresulta sa isang Stanine scale na may 9 na karaniwang unit. Sa sukat na ito, ang mean ay 5 at ang karaniwang paglihis ay humigit-kumulang 2. Kapag sinusuri ang mga paksa sa anumang pagsusulit na may anumang bilang ng mga aytem, ​​ang pinakamasamang 4% na mga marka ay binibigyan ng stanine na 1 at ang pinakamahusay na mga marka ay isang stanine na 9. Ang susunod pinakamasama at pinakamahusay na mga marka ay 7% italaga stanine 2 at 8, ayon sa pagkakabanggit. Ang susunod na 12% ng mga resulta ay mga stannin 3 at 7. Ang susunod na 17% ay itinalagang mga stannin 4 at 6, at sa wakas, 20% ng mga average na resulta ay tumutugma sa stannin 5.

Sa sukat ng dingding, madalas na tinatawag na sukat ng Cattell, ang buong hanay ng mga resulta ay nahahati sa 10 bahagi na may pagitan na 0.5 na karaniwang paglihis. Sa wall scale, ang arithmetic mean ay kinukuha na 5.5, at ang distansya sa pagitan ng dalawang katabing standard na unit ay 0.5.

Minsan ang isang eleven-point scale ay nakuha mula sa Stanine scale sa pamamagitan ng pagtukoy ng isang porsyento ng pinakamalakas at pinakamahina na paksa at pagtatalaga sa kanila ng maximum at minimum na mga marka, ayon sa pagkakabanggit.

Pagtatakda ng passing score

Mayroong maraming mga pamamaraan para sa pagtatatag ng passing score sa criterion-oriented na pagsubok. Ang lahat ng mga pamamaraan ay nahahati sa ganap at kamag-anak. Halos lahat ng mga pamamaraan ay nagsasangkot ng mga eksperto sa pamamaraan para sa pagtukoy ng pumasa na marka. Tingnan natin ang ilan sa mga kilalang pamamaraan.

Mga Paraang Nakasentro sa Trabaho

Pamamaraan ng Nedelsky(1954) - para sa mga saradong gawain.

Dapat suriin ng bawat eksperto ang lahat ng mga gawain at i-cross out para sa bawat gawain ang mga bilang ng mga sagot na maaaring tanggihan ng minimally competent subject. Para sa bawat gawain, ipinapahiwatig ng eksperto ang kapalit ng bilang ng natitirang mga sagot. Halimbawa, kung sa isang gawain na may limang sagot ang eksperto ay nag-cross out ng dalawa, pagkatapos ay ipahiwatig niya ang numero 1/3 para sa gawaing ito. Pagkatapos ang lahat ng mga katumbas na ito ay summed up. Ang resultang numero ay maaaring ituring bilang isang posibleng pagtatasa ng pinakamababang karampatang paksa ng ekspertong ito. Pagkatapos ang mga marka ng lahat ng mga eksperto ay na-average.

Paraan ng Angoff(1971). Ang mga eksperto ay hinihiling na mag-isip ng isang pangkat ng mga minimally competent na mga paksa at, para sa bawat aytem, ​​tantiyahin ang proporsyon ng mga paksa sa pangkat na ito na sumagot ng tama sa item. (Ito ay kapareho ng pagtatantya ng posibilidad na ang isang minimally competent na paksa ay sasagot sa gawain nang tama.) Ang mga probabilidad na ito ay idinagdag para sa bawat eksperto at na-average sa lahat ng mga eksperto.

Paraan ng Ebel(1972). Gumagamit ang paraang ito ng 2D grid upang ikategorya ang bawat gawain. Hinihiling sa mga eksperto na hatiin ang lahat ng mga gawain ayon sa kahirapan (tatlong antas ng kahirapan ang inaalok - ang gawain ay madali, katamtamang kahirapan, mahirap) at ayon sa kaugnayan ng nilalaman nito (4 na antas ng kaugnayan ang inaalok - mahalaga, mahalaga, katanggap-tanggap, kontrobersyal ). Kaya, ang lahat ng mga gawain ay inilatag sa mga cell ng grid na ito. Pagkatapos ay dapat suriin ng mga eksperto kung paano gagawin ng minimally competent subject ang mga gawain sa bawat cell, i.e. ipahiwatig ang porsyento ng bilang ng mga gawain sa cell na dapat niyang sagutin ng tama.

Mga Pamamaraang Nakasentro sa Paksa(Nedelsky, 1954; Zieky at Livingston, 1977)

Paghahambing ng pamamaraan ng pangkat

Sumasang-ayon ang mga eksperto sa kung ano ang resulta ng pagsasagawa ng pagsusulit sa antas ng pinakamababang kakayahan. Pagkatapos ay hinati ng mga eksperto ang lahat ng mga paksa sa dalawang grupo - may kakayahan at walang kakayahan (hindi kasama ang mga, sa kanilang opinyon, ay nasa hangganan). Susunod, ang mga graph ng pamamahagi ng mga puntos para sa bawat isa sa mga pangkat ay naka-plot sa isang guhit. Ang punto ng intersection ng mga graph ay kinuha bilang isang passing score.

Pamamaraan ng boundary group

Sa kaibahan sa nakaraang pamamaraan, ang mga eksperto ay hinihiling na kilalanin ang mga paksa na, sa kanilang opinyon, ay nasa hangganan sa pagitan ng dalawang magkakaibang grupo na naiiba sa kakayahan. Ang median ng distribusyon ng mga marka ng napiling pangkat ay kinukuha bilang passing score.

Itinuturo ng mga kritiko ng pamamaraang ito na ang pagtatatag ng isang nakapasa na marka batay sa pagganap ng pagsusulit ng mga paksa ay hindi tumutugma sa esensya sa pangunahing layunin ng pagsubok na nakatuon sa pamantayan, dahil ang pamamaraang ito ay hindi nauugnay sa nilalaman ng pagsusulit.

Standardisasyon

- pag-iisa, pagdadala sa parehong mga pamantayan ng pamamaraan at mga marka ng pagsusulit. Salamat sa standardisasyon ng pamamaraan, ang paghahambing ng mga resulta na nakuha para sa iba't ibang mga paksa ay nakakamit at nagiging posible na ipahayag ang mga marka ng pagsusulit sa mga tagapagpahiwatig na nauugnay sa sample ng standardisasyon.

1) Standardisasyon - pagproseso at regulasyon ng pamamaraan para sa pagsasagawa, pag-iisa ng mga tagubilin, mga form ng survey, mga pamamaraan para sa pagtatala ng mga resulta, mga kondisyon para sa pagsasagawa ng survey, mga katangian ng mga contingent ng mga paksa. Ang mahigpit na periodicity ng pamamaraan ng pagsusuri ay isang paunang kinakailangan para sa pagtiyak ng pagiging maaasahan ng pagsusulit at pagtukoy ng mga pamantayan ng pagsusulit para sa pagsusuri ng mga resulta sa pagsusuri.

2) Standardisasyon - pagbabago ng normal na sukat ng rating sa isang bagong sukat batay hindi sa dami ng mga halaga ng pinag-aralan na tagapagpahiwatig, ngunit sa kamag-anak na lugar nito sa pamamahagi ng mga resulta sa sample ng mga paksa.

Mga yugto ng standardisasyon

Stage 1. Paglikha ng isang pare-parehong pamamaraan ng pagsubok.

Binubuo ito ng pagtukoy sa mga sandali ng diagnostic na sitwasyon.

· Mga kondisyon sa pagsubok (kuwarto, ilaw, at iba pang panlabas na salik).

· Ang nilalaman ng pagtuturo at ang mga tampok ng pagtatanghal nito (tono ng boses, paghinto, bilis ng pagsasalita, atbp.).

· Ang pagkakaroon ng karaniwang materyal na pampasigla (halimbawa, mga Rorschach card).

· Mga limitasyon sa oras para sa pagsusulit na ito.

· Standard form para sa pagsasagawa ng pagsusulit na ito.

· Pagtutuos para sa impluwensya ng mga salik sa sitwasyon sa proseso at mga resulta ng pagsubok.

· Accounting para sa impluwensya ng pag-uugali ng diagnostician sa proseso at resulta ng pagsubok

· Accounting para sa impluwensya ng karanasan ng paksa sa pagsubok.

Stage 2. Paglikha ng isang pare-parehong pagsusuri ng pagganap ng pagsubok. MULA SA karaniwang interpretasyon ng mga nakuhang resulta at paunang pamantayang pagproseso. Sa yugtong ito, ang nakuha na tagapagpahiwatig ay inihambing sa pamantayan para sa pagsasagawa ng pagsusulit na ito para sa isang naibigay na edad.

Stage 3. Pagpapasiya ng mga pamantayan sa pagganap ng pagsubok. Ang mga pamantayan ay binuo para sa iba't ibang edad, propesyon, kasarian, atbp.

z-score

Ang pinakakaraniwang pagbabago ng mga pangunahing pagtatantya ay ang pagsentro at normalisasyon sa pamamagitan ng mga karaniwang paglihis. Ang pamamaraan ng normalisasyon ay binubuo sa paglipat sa iba pang mga yunit ng pagsukat. Ang normalization function ay karaniwang Z-score (standard indicator), na nagpapahayag ng paglihis ng isang indibidwal na resulta X sa mga yunit na proporsyonal sa karaniwang paglihis.

Ang mas laganap sa psychodiagnostics ay ang mga karaniwang indicator na kinakalkula batay sa isang linear at non-linear na pagbabago ng mga pangunahing indicator na ibinahagi ayon sa isang normal o malapit sa normal na batas. Sa naturang pagkalkula, ang isang z-transform ng mga pagtatantya ay ginaganap. Upang matukoy ang z-standard na marka, tukuyin ang pagkakaiba sa pagitan ng indibidwal na pangunahing resulta at ang mean para sa normal na grupo, at pagkatapos ay hatiin ang pagkakaibang ito sa δ ng normal na sample.

X - raw na marka (bilang ng mga gawaing natapos)

Mx - ang average na halaga ng mga natapos na gawain para sa buong sample

δ - karaniwang paglihis (sa dayuhang sikolohiya SD)

Ang matematiko na si Carl Gauss ay nagmungkahi ng isang function na naglalarawan sa normal na distribusyon. Normal distribution equation plot - simetriko unimodal bell curve (o BELL curve ).

Tawagin natin ang arithmetic mean na Mx, at ang standard deviation δ (sigma small). Sa normal na distribusyon, lahat ng pinag-aralan na dami ay nasa loob ng Mx ± 5 δ.

Sa loob ng Mx ± δ ay 68.26%, ang natitirang 31.74% ay matatagpuan sa simetriko sa 15.87

Sa loob ng Mx ± 2 δ ay 95.44%

At sa loob ng Mx ± 3 δ ay 99.72%

PERCENTILES

Percentile ay ang porsyento ng mga indibidwal mula sa sample ng standardisasyon na mas mababa sa ibinigay na pangunahing tagapagpahiwatig. Ang percentile scale ay maaaring ituring bilang isang set ng rank gradations na may bilang ng rank 100 at nagbibilang mula sa 1st rank, na tumutugma sa pinakamababang resulta;

50th percentile ( R 50 )ay tumutugon sa median ng pamamahagi ng mga resulta

Ang mga porsyento ay hindi dapat malito sa mga regular na porsyento. Ang huli ay kumakatawan sa proporsyon ng mga tamang solusyon mula sa kabuuang bilang ng mga test item sa isang indibidwal na resulta. Mga ranggo R 1 at R 100 makatanggap, ayon sa pagkakabanggit, ang pinakamababa at pinakamataas na resulta mula sa mga naobserbahan sa sample, gayunpaman, ang mga ranggo na ito ay maaaring tumutugma sa malayo sa zero (walang tamang solusyon) o ganap (lahat ng solusyon ay tama) na mga tagapagpahiwatig. Halimbawa, na may kabuuang 120 gawain, ang pinakamababang resulta na naaayon sa unang ranggo ay maaaring 6 na tamang solusyon, habang ang pinakamataas na resulta na naaayon sa ranggo R 100 , ay magiging 95 wastong nalutas na mga gawain. Ang sitwasyong ito ay sinusunod, halimbawa, kapag sinusuri ang mga pagsubok sa bilis.

Ang pangunahing kawalan ng percentile scale ay ang hindi pantay na mga yunit ng pagsukat. Sa isang normal na distribusyon, ang mga indibidwal na variable ay malapit na nakagrupo sa gitna ng distribusyon at nagkakalat habang lumalayo sila sa mga gilid. Samakatuwid, ang mga pantay na dalas ng mga kaso na malapit sa gitna ay tumutugma sa mas maiikling mga agwat sa kahabaan ng x-axis, na matatagpuan sa mga gilid ng pamamahagi ng mga pagtatantya. Ipinapakita ng mga porsyento ang relatibong posisyon ng bawat paksa sa isang normal na sample, ngunit hindi ang laki ng pagkakaiba sa pagitan ng mga resulta. Lumilikha ito ng ilang abala sa interpretasyon ng mga indibidwal na resulta. Kaya, ang pagkakaiba sa mga pangunahing tagapagpahiwatig na naaayon sa pagitan R 70 R 80, ay maaaring 10 puntos, at ang pagkakaiba sa bilang ng mga tamang solusyon sa hanay ng mga ranggo R 50R 60, - 1 - 3 puntos lamang.

Gayunpaman, ang mga pagtatantya ng porsyento ay mayroon ding ilang mga pakinabang. Ang mga ito ay madaling ma-access sa pag-unawa ng mga gumagamit ng psychodiagnostic na impormasyon, ay unibersal na may kaugnayan sa iba't ibang uri ng mga pamamaraan at madaling kalkulahin.

Mga pamantayan sa istatistika

PERO. Mga pamantayan sa istatistika. Ang mga halaga ng hangganan sa sukat ng mga marka ng pagsusulit, na nabuo batay sa dalas ng pamamahagi ng mga marka ng pagsusulit sa sample ng standardisasyon. Bilang isang patakaran, ang mga halaga ng hangganan na ito ay naghihiwalay ng isang nakapirming porsyento ng mga paksa mula sa sample: (decile), 25 (quartile), 50 (median). Sa isang normal na distribusyon, ang istatistikal na pamantayan ay inilalarawan gamit ang mga parameter (mean plus/minus sigma, o standard deviation). Ang mga istatistikal na pamantayan ay nagsisilbing gumawa ng "paghahambing na desisyon" at hindi nagbibigay ng impormasyon para sa paggawa ng "mga pagpapasya sa pamantayan"

B. Mga pamantayan sa edad - mga pribadong bersyon ng psychodiagnostic norms na nakolekta para sa mga bata na may iba't ibang edad.

AT. Mga pamantayan sa pamantayan - mga pamantayan ng diagnostic, kung saan ang mga sulat sa pagitan ng mga marka ng pagsusulit sa sukat ng sinusukat na ari-arian at ang antas ng tagapagpahiwatig ng pamantayan ay tinukoy. Sa kaso ng pag-uugali ng pamantayan, ang mga pamantayan ng pamantayan ay nagpapahiwatig ng posibilidad ng paglitaw ng pag-uugali ng pamantayan para sa isang naibigay na halaga ng marka ng pagsusulit.

G. pamantayan ng paaralan ay binuo batay sa mga pagsubok ng mga nagawa ng paaralan o mga pagsubok ng mga kakayahan sa paaralan.

D. propesyonal na pamantayan. Itinatag batay sa mga pagsubok para sa iba't ibang mga propesyonal na grupo.

E. Mga lokal na kaugalian . Itinatag ang mga ito para sa mga makitid na kategorya ng mga tao na naiiba sa pagkakaroon ng isang karaniwang tampok - edad, kasarian, heograpikal na lugar, socioeconomic status.

AT. pambansang pamantayan. Binuo para sa mga kinatawan ng isang partikular na bansa o bansa sa kabuuan.

STANAINS

Ang isang halimbawa ng isang non-linear na na-convert sa isang karaniwang sukat ay ang Stanine scale (English standard nine - standard nine), kung saan ang mga score ay kumukuha ng mga halaga mula 1 hanggang 9, M = 5, δ = 2

Ang Stanine scale ay nagiging mas at mas malawak, pinagsasama ang mga bentahe ng karaniwang mga tagapagpahiwatig ng sukat at ang pagiging simple ng mga percentile. Ang mga pangunahing tagapagpahiwatig ay madaling ma-convert sa mga staline. Upang gawin ito, ang mga paksa ay niraranggo sa pataas na pagkakasunud-sunod ng mga resulta at mula sa kanila ay bumubuo sila ng mga grupo na may bilang ng mga tao na proporsyonal sa ilang mga frequency ng mga pagtatasa sa normal na pamamahagi ng mga resulta ng pagsubok.

MGA PADER

Kapag binabago ang mga grado sa isang sukat mga stans (mula sa English standsrt ten - standard ten) ang isang katulad na pamamaraan ay isinasagawa na may pagkakaiba lamang na ang sampung karaniwang pagitan ay nasa base ng iskala na ito.

Mga Resulta ng Pagsusukat sa Pagsusukat

Tinukoy ni Stevens (1946) ang 4 na antas ng mga sukat ng pagsukat, na naiiba sa antas kung saan ang mga pagtatantya na kabilang sa kanila ay nagpapanatili ng mga katangian ng hanay ng mga tunay na numero. Ito ang mga timbangan:

Nominal (o nominatibo, sukat ng pagbibigay ng pangalan)

ordinal

Pagitan

Iskala ng relasyon.

Interpretasyon ng mga resulta ng pagsusulit

Sa mga pagsubok na may interpretasyong nakatuon sa pamantayan ang pangunahing gawain ay upang matukoy ang paghahambing na lugar ng bawat isa sa mga nasubok sa pangkalahatang pangkat ng mga paksa. Malinaw, ang lugar ng bawat paksa ay depende sa background ng kung aling grupo siya sinusuri. Ang parehong resulta ay maaaring mauri bilang medyo mataas kung ang grupo ay mahina, at sa halip ay mababa kung ang grupo ay malakas. Iyon ang dahilan kung bakit kinakailangan, kung maaari, na gumamit ng mga pamantayan na sumasalamin sa mga resulta ng pagsusulit ng isang malaking kinatawan (mula sa French sample ng mga paksa.

Sa mga pagsubok na may interpretasyong nakatuon sa pamantayan ang gawain ay ihambing ang mga nakamit na pang-edukasyon ng bawat mag-aaral sa dami ng kaalaman, kasanayan at kakayahan na binalak para sa asimilasyon. Sa kasong ito, ang isang tiyak na lugar ng nilalaman ay ginagamit bilang isang interpretive frame ng sanggunian, at hindi isa o isa pang sample ng mga paksa. Ang pangunahing problema ay ang pagtatatag ng passing score na naghihiwalay sa mga nakabisado ang materyal na sinusuri sa mga hindi nakabisado nito.

Magtatag ng mga pamantayan sa pagganap ng pagsubok

Upang alisin ang pag-asa ng interpretasyon sa mga resulta ng iba pang mga kalahok sa pagsusulit, ginagamit ang mga espesyal na pamantayan sa pagganap ng pagsusulit, at sa gayon, ang pangunahing marka ng isang indibidwal na paksa ng pagsusulit ay inihambing sa mga pamantayan sa pagganap ng pagsusulit. Mga pamantayan - ito ay isang hanay ng mga indicator na empirically itinatag batay sa mga resulta ng isang pagsubok sa pamamagitan ng isang mahusay na tinukoy na sample ng mga paksa. Ang pagbuo at mga pamamaraan para sa pagkuha ng mga tagapagpahiwatig na ito ay proseso ng normalisasyon(o estandardisasyon) pagsusulit. Ang pinakakaraniwang pamantayan ay ang mean at standard deviation ng isang set ng mga indibidwal na marka. Ang pag-uugnay ng pangunahing marka ng paksa sa mga pamantayan ng pagganap ay nagbibigay-daan sa iyo upang maitatag ang lugar ng paksa sa sample na ginamit upang gawing pamantayan ang pagsusulit.

Mga uri ng timbangan na ginagamit upang i-convert ang mga pangunahing marka

Ang pinakasikat na mga conversion ng mga pangunahing marka ay:

Percentile rank, na sumasalamin sa porsyento ng mga paksa sa normative group, na ang mga resulta ay mas mababa o katumbas ng isang naibigay na halaga ng pangunahing marka;

Linear Z-pagtatasa, na tinukoy bilang ang ratio ng indibidwal na paglihis ng marka ng pagsusulit sa karaniwang paglihis para sa pangkat ng mga paksa;

Mga pagtatantya na isang linear na pagbabago z-mga pagtatasa (T-scale, karaniwang mga marka ng IQ, atbp.);

Stanine at mga kaliskis sa dingding, na nakukuha sa pamamagitan ng paghahati ng sukat ng mga pangunahing punto sa iba't ibang mga agwat.

Percentile rank scale

Pinapayagan ka ng mga porsyento na itakda ang ranggo ng pangunahing tagapagpahiwatig ng paksa sa pangkat ng normatibo. Ang percentile rank na tumutugma sa isang ibinigay na pangunahing marka ay nagpapakita ng porsyento ng mga paksa sa normative sample na ang mga resulta ay hindi mas mataas kaysa sa ibinigay na pangunahing marka.

Ang mga porsyento ay hindi dapat malito sa mga porsyento na kumakatawan sa porsyento ng mga gawain na tama na natapos ng mga paksa ng pangkat. Hindi tulad ng huli - pangunahin - ang percentile ay isang nagmula na tagapagpahiwatig na nagsasaad ng bahagi ng kabuuang bilang ng mga paksa sa pangkat.

Bilang karagdagan sa kaginhawaan na nauugnay sa kadalian ng interpretasyon, ang mga ranggo ng percentile ay may mga makabuluhang disbentaha. Hindi linear ang percentile rank scale, ibig sabihin, sa iba't ibang bahagi ng primary score scale, ang pagtaas ng 1 point ay maaaring tumugma sa iba't ibang pagtaas sa percentile scale. Samakatuwid, ang mga porsyento ay hindi lamang sumasalamin, ngunit kahit na papangitin ang mga tunay na pagkakaiba sa resulta ng pagsusulit.

Samakatuwid, ang paggamit ng mga percentile ay medyo limitado. Dahil sa kanilang kaginhawahan at pagiging simple, pangunahing ginagamit ang mga ito sa mga pagsusulit na nakatuon sa pamantayan para sa sariling pagtatasa ng kaalaman ng mga mag-aaral, na nag-uulat ng mga resulta sa mga mag-aaral mismo at sa kanilang mga magulang.

Z- sukat

Kino-convert ang mga indibidwal na resulta sa isang karaniwang sukat na may pangkalahatang average na marka at isang karaniwang sukat ng pagkakaiba. Z- pagsusuri i- ika ang mag-aaral ay matatagpuan sa pamamagitan ng formula:

saan pangunahing marka i- ika ang paksa; Ang OCRUncertain203"> ay ang karaniwang paglihis ng hanay ng mga pangunahing marka.

Z-Scale ay standard na may zero mean at unit standard deviation. Sa tulong nito, maaari mong dalhin ang mga marka ng mga mag-aaral na nakuha sa iba't ibang mga pagsusulit sa isang form na maginhawa para sa paghahambing.

Halaga Z-ang pagtatantya ay katumbas ng distansya sa pagitan ng itinuturing na pangunahing marka at ang average na halaga ng mga pagtatantya para sa pangkat, na ipinahayag sa mga yunit ng karaniwang paglihis: sa loob kung gaano karaming mga karaniwang paglihis ang pangunahing marka ng paksa sa ibaba o sa itaas ng ibig sabihin ng pangkat.

Ang mga Z-scores, na may mga bihirang pagbubukod, ay kumukuha ng mga halaga mula sa pagitan (-3, +3). Ang pagiging maginhawa para sa siyentipikong pagsusuri sa proseso ng pagbuo ng mga bagong pagsubok, ang Z-scale ay hindi maginhawa para sa praktikal na paggamit sa pagtatasa ng kaalaman ng mga paksa ng grupo. Ang mga Z-scores ay maaaring kumuha ng mga fractional at negatibong halaga, na mahirap gamitin sa mga kalkulasyon at mahirap bigyang-kahulugan para sa mga pagsubok na user. Ang pag-round sa mga Z-scores sa mga halaga ng integer ay hindi palaging katanggap-tanggap, dahil ang pangunahing layunin ng paglikha ng mga pagsubok ay upang makilala ang mga pagkakaiba sa paghahanda ng mga paksa. Ang mga negatibong halaga ng Z-score, na nagsasaad ng mga resultang mas mababa sa average para sa pangkat ng mga nasubok na mag-aaral, ay nagdudulot din ng ilang partikular na abala - magdudulot sila ng halatang pagtanggi sa mga mag-aaral na tumatanggap sa kanila. Sa pangkalahatan, ginagawa ng lahat ng ito na hindi maginhawa ang Z-score para sa pag-uulat ng mga resulta sa mga paksa at pinipilit ang paggamit ng mga espesyal na paraan ng conversion para sa pag-iskor ng mga mag-aaral.

Mga pagbabagoZ-mga pagtatantya

Ang mga pagbabago sa Z-score ay naglalayong isalin ang mga ito sa mga halaga na mas madaling isulat at ipaliwanag. Sa kasong ito, ang pagbabagong ginamit ay dapat na linear upang mapanatili ang hugis ng distribusyon ng mga Z-scores. Ang pangkalahatang pormula para sa naturang pagbabago ay

Z1= M+ σ Z,

kung saan ang Z1 ay ang na-convert na pagtatantya, M ay ang bagong mean na halaga (ang ibig sabihin ng halaga ng mga marka pagkatapos ng pagbabago), - bagong standard deviation. Ang iba't ibang pagbabago ay may iba't ibang kahulugan M at . Narito ang ilan sa mga pinakakilalang pagbabago ng Z-scores.

T-scale(McCall, 1939, para sa pag-uulat ng pagganap ng mga bata sa mga pagsusulit sa kakayahan sa pag-iisip). Ang average na halaga ay pinili M = 50 at karaniwang paglihis σ = 10. Nakukuha namin ang: Z1=50 + 10 Z

Skala ng CEEV(ETS, upang ipaalam sa mga prospective na mag-aaral ng mga marka ng pagsusulit sa pasukan sa kolehiyo). Ang average na halaga ay pinili M = 500 at karaniwang paglihis σ = 100. Nakukuha namin ang: Z1=500 + 100 Z

Scale IQ(Weshler, 1939, para sa pagbibigay-kahulugan sa mga marka ng katalinuhan ng nasa hustong gulang). Ang average na halaga ay pinili M = 100 at karaniwang paglihis σ = 15. Nakukuha namin ang: Z1=100 + 15 Z

Mga kaliskis ng mga staline at dingding

Minsan kapag nag-uulat ng mga resulta, ginagamit ang mga kaliskis na binubuo ng mga solong integer, halimbawa, mula 1 hanggang 9 o mula 1 hanggang 10. Ito ay maginhawa para sa pag-uulat ng mga resulta ng pagsubok, dahil ang gayong mga kaliskis ay may malinaw na pagiging simple.

Ang paghahati sa normal na distribusyon sa 9 na pagitan ay nagreresulta sa isang Stanine scale na may 9 na karaniwang unit. Sa sukat na ito, ang mean ay 5 at ang karaniwang paglihis ay humigit-kumulang 2. Kapag sinusuri ang mga paksa sa anumang pagsusulit na may anumang bilang ng mga aytem, ​​ang pinakamasamang 4% na mga marka ay binibigyan ng stanine na 1 at ang pinakamahusay na mga marka ay isang stanine na 9. Ang susunod pinakamasama at pinakamahusay na mga marka ay 7% italaga stanine 2 at 8, ayon sa pagkakabanggit. Ang susunod na 12% ng mga resulta ay mga stannin 3 at 7. Ang susunod na 17% ay itinalagang mga stannin 4 at 6, at sa wakas, 20% ng mga average na resulta ay tumutugma sa stannin 5.

Sa sukat ng dingding, madalas na tinatawag na sukat ng Cattell, ang buong hanay ng mga resulta ay nahahati sa 10 bahagi na may pagitan na 0.5 na karaniwang paglihis. Sa sukat ng pader, ang arithmetic mean ay ipinapalagay na 5.5, at ang distansya sa pagitan ng dalawang katabing standard na unit ay 0.5. mula sa mga kilalang pamamaraan.

Mga Paraang Nakasentro sa Trabaho

PamamaraanNedelsky(1954) - para sa mga saradong gawain.

Dapat suriin ng bawat eksperto ang lahat ng mga gawain at i-cross out para sa bawat gawain ang mga bilang ng mga sagot na maaaring tanggihan ng minimally competent subject. Para sa bawat gawain, ipinapahiwatig ng eksperto ang kapalit ng bilang ng natitirang mga sagot. Halimbawa, kung sa isang gawain na may limang sagot ang eksperto ay nag-cross out ng dalawa, pagkatapos ay ipahiwatig niya ang numero 1/3 para sa gawaing ito. Pagkatapos ang lahat ng mga katumbas na ito ay summed up. Ang resultang numero ay maaaring ituring bilang isang posibleng pagtatasa ng pinakamababang karampatang paksa ng ekspertong ito. Pagkatapos ang mga marka ng lahat ng mga eksperto ay na-average.

PamamaraanAngoff(1971). Ang mga eksperto ay hinihiling na mag-isip ng isang pangkat ng mga minimally competent na mga paksa at, para sa bawat aytem, ​​tantiyahin ang proporsyon ng mga paksa sa pangkat na ito na sumagot ng tama sa item. (Ito ay kapareho ng pagtatantya ng posibilidad na ang isang minimally competent na paksa ay sasagot sa gawain nang tama.) Ang mga probabilidad na ito ay idinagdag para sa bawat eksperto at na-average sa lahat ng mga eksperto.

Pamamaraanebel(1972). Gumagamit ang paraang ito ng 2D grid upang ikategorya ang bawat gawain. Hinihiling sa mga eksperto na hatiin ang lahat ng mga gawain ayon sa kahirapan (tatlong antas ng kahirapan ang inaalok - ang gawain ay madali, katamtamang kahirapan, mahirap) at ayon sa kaugnayan ng nilalaman nito (4 na antas ng kaugnayan ang inaalok - mahalaga, mahalaga, katanggap-tanggap, kontrobersyal ). Kaya, ang lahat ng mga gawain ay inilatag sa mga cell ng grid na ito. Pagkatapos ay dapat suriin ng mga eksperto kung paano makukumpleto ng pinakamababang karampatang paksa ang mga gawain sa bawat cell, ibig sabihin, ipahiwatig ang porsyento ng bilang ng mga gawain sa cell na dapat niyang sagutin nang tama.

Mga Pamamaraang Nakasentro sa Paksa(Nedelsky, 1954; Zieky at Livingston, 1977)

Paghahambing ng pamamaraan ng pangkat

Sumasang-ayon ang mga eksperto sa kung ano ang resulta ng pagsasagawa ng pagsusulit sa antas ng pinakamababang kakayahan. Pagkatapos ay hinati ng mga eksperto ang lahat ng mga paksa sa dalawang grupo - may kakayahan at walang kakayahan (hindi kasama ang mga, sa kanilang opinyon, ay nasa hangganan). Susunod, ang mga graph ng pamamahagi ng mga puntos para sa bawat isa sa mga pangkat ay naka-plot sa isang guhit. Ang punto ng intersection ng mga graph ay kinuha bilang isang passing score.

Pamamaraan ng boundary group

Sa kaibahan sa nakaraang pamamaraan, ang mga eksperto ay hinihiling na kilalanin ang mga paksa na, sa kanilang opinyon, ay nasa hangganan sa pagitan ng dalawang magkakaibang grupo na naiiba sa kakayahan. Ang median ng distribusyon ng mga marka ng napiling pangkat ay kinukuha bilang passing score.

Itinuturo ng mga kritiko ng diskarteng ito na ang pagtatatag ng isang nakapasa na marka batay sa pagganap ng pagsusulit ng mga paksa ay hindi tumutugma sa esensya sa pangunahing layunin ng pagsubok na nakatuon sa pamantayan, dahil ang diskarte na ito ay hindi nauugnay sa nilalaman ng pagsusulit. .

Pagtatasa ng pisikal na pag-unlad ng mga bata sa isang sukat Z - marka

Isang mahalagang bahagi ng anumang programa para sa pag-aaral ng kalusugan at nutrisyon ng mga bata, kapwa sa antas ng populasyon at sa pagtatasa ng nutrisyon at kalusugan ng indibidwal, ay ang pagsubaybay sa mga anthropometric na parameter ng mga bata kumpara sa mga karaniwang kurba ng paglaki. Inirerekomenda ng World Health Organization ang isang paraan para sa pagtatasa ng nutritional status ng mga bata batay sa paggamit ng mga indicator ng kabuuang sukat ng katawan (haba at timbang ng katawan). Ang pagsusuri ng anthropometric data ay binubuo sa pagkalkula ng bilang ng mga standard deviations (Co o s) kung saan ang pinag-aralan na indicator ng timbang o haba ng katawan ay naiiba sa median ng karaniwang populasyon (WHO international standards ay kinakalkula sa data mula sa isang pag-aaral ng anthropometric parameters ng mga bata sa USA at Great Britain). Ang kinakalkula na standard deviation ay tinatawag Z - score o Z-score.

Ang anthropometric data ng bawat bata ay nailalarawan sa pamamagitan ng kanilang Z - score. Kung ang anthropometric data ng bata ay mas mababa sa median ng pamantayan, ang Z - score ay magkakaroon ng negatibong halaga, kung ang mga indicator ay nasa itaas ng median, ang Z - score ay magiging positibo.

ang halaga Z-score kinakalkula para sa tatlong tagapagpahiwatig:

1. Timbang ng katawan para sa edad - Mt / V,

2. Haba ng katawan para sa edad - Dt / V,

3. Timbang ng katawan para sa haba ng katawan - Mt / Dt.

Ang indicator na Mt / Dt ay ginagamit lamang sa edad na hanggang 10 taon para sa mga babae at hanggang 11.5 taon para sa mga lalaki.

Para sa mga diagnostic, tinutukoy ang mga halaga ng hangganan ng SD, na nagpapahintulot sa amin na makilala ang mga sumusunod na opsyon para sa mga tinantyang tagapagpahiwatig:

- mababa (n), pagkilala sa hindi sapat na DT at MT - ay nakatakda sa mga halaga ng CO na mas mababa sa -2;

- mataas sa), na nagpapakilala sa labis na DT at MT - ay nakatakda sa mga halaga ng CO higit sa +2;

— normal (nm)- ay nakatakda sa mga halaga ng CO sa hanay mula -2 hanggang +2;

Ang index ng haba-para sa edad ay nagpapakilala sa linear na paglago at tinatasa ang pangmatagalang pagpapahinto ng paglago, i.e. Z-score mas mababa sa -2 ay maaaring magpahiwatig ng talamak na malnutrisyon na nagreresulta sa pagbaril sa paglaki.

Z-score Ang timbang ng katawan para sa haba ng katawan ay sumasalamin sa mga proporsyon ng katawan o maayos na pag-unlad, at ito ay napaka-sensitibo sa talamak na malnutrisyon.

Z-score ang timbang ng katawan para sa edad ay sensitibo sa talamak na malnutrisyon at sumasalamin sa kasalukuyan o kamakailang malnutrisyon ng bata.

Upang iproseso ang anthropometric data at kalkulahin ang mga indeks ng WHO, isang espesyal na programa sa computer na ANTHRO v.1.01, 1990 ay binuo at ipinamahagi nang walang bayad. Awtomatikong isinasaalang-alang ng programa ang edad ng bata sa mga buwan. Sa pagsasagawa, kapag ginagamit ang programa, kinakailangang irehistro ang petsa ng kapanganakan at ang petsa ng pagsusuri ng bata.

Para sa isang grupo o populasyon ng mga bata, ang halaga ng pangkat Z - puntos ay maaaring kalkulahin at istatistikal na tinatantya. Ang halaga ng Z - score sa karaniwang populasyon ay katumbas ng zero. Kung mas ang Z-score sa populasyon ng pag-aaral ay naiiba mula sa zero, mas malaki ang pagkakaiba sa pagitan ng pangkat ng pag-aaral ng mga bata at ng sangguniang populasyon. Ang halaga ng pangkat Z - marka ay maaaring gamitin para sa isang paghahambing na pagsusuri ng mga contingent ng mga bata at sa sistema ng pagsubaybay sa kalusugan.

Ang mga derived indicator ay maaaring hatiin ayon sa kanilang layunin. Ang ilan sa kanila ay nagsisilbi upang matukoy ang antas ng pagsasanay na nakamit sa isang tiyak na sukat, habang ang iba ay nagsisilbi upang maitaguyod ang kamag-anak na posisyon ng paksa sa isang tiyak na pangkat ng normatibo. Sa partikular, ang mga porsyento ay nagsisilbi upang malutas ang pangalawang problema, na nagbibigay-daan sa iyo upang maitaguyod ang ranggo ng pangunahing tagapagpahiwatig ng paksa sa normatibong pangkat. Ang ranggo ng indicator sa percentiles ay tinutukoy ng porsyento ng mga paksa mula sa standardization sample na ang mga resulta ay hindi mas mataas kaysa sa pangunahing indicator na ito. Ang proseso ng pagbuo ng isang percentile scale ay binubuo sa pagtukoy ng percentile ranks ng mga pangunahing indicator ng normative group.

Ang paraan ng pagbuo ng percentile scale ay makikita sa isang maliit na halimbawa ng mga resulta ng isang pagsubok na isinagawa ng isang pangkat ng 25 na paksa, bagaman, siyempre, malamang na hindi matugunan ang gayong sample sa pagsasanay. Karaniwan ang pagtatayo ng mga kaliskis na ito ay ginagawa sa malalaking array. Hayaan, halimbawa, 25 mag-aaral na nasubok sa isa sa mga paksa ang nakatanggap ng mga pangunahing resulta na ipinakita sa Talahanayan. 7.2:

Talahanayan 7.2. Mga resulta ng pagsubok

Ang unang hilera sa Talahanayan 7.2 ay naglalaman ng mga naobserbahang marka ng mga paksa sa sample, na inayos mula sa pinakamababa hanggang sa pinakamataas (kaliwa hanggang kanan). Karaniwan, para sa malalaking grupo, ang simpleng pag-order ay hindi epektibo at mas maginhawang gumamit ng pinagsama-samang data, na kinabibilangan ng pagpapakilala ng mga marka para sa mga indibidwal na grupo (tingnan ang Seksyon 5.2 para sa mga detalye).

Ang pangalawang linya ay nagpapakita ng mga resulta ng pagbibilang ng bilang ng mga paksa na may parehong marka ng pagsusulit. Ang bawat elemento ng ikalawang hanay ay nagpapakita ng bilang ng mga pag-uulit ng marka at samakatuwid ay tinatawag na dalas ng mga naobserbahang hilaw na marka ng mga paksa. Kung ang mga frequency ay summed mula kaliwa hanggang kanan, ang mga halaga ng naipon (cumulated) frequency ay makukuha. Ang pinagsama-samang mga frequency ay ang kabuuan ng mga frequency na naobserbahan sa o mas mababa sa markang iyon. Halimbawa, mayroong 9 na subject na nakakuha ng 7 o mas mababa dahil ang Cumulative Frequencies para sa score na 7 ay ang bilang 9.



Ang pagkalkula ng mga percentile rank upang punan ang ikaapat na row ng talahanayan ay kumplikado sa pamamagitan ng pangangailangan upang matukoy ang aktwal na mga hangganan ng agwat ng kumpiyansa (tingnan ang Seksyon 5.5) na naglalaman ng tunay na marka ng bawat paksa sa sample. Ang aktwal na haba ng agwat ay nakasalalay sa halaga ng karaniwang error ng pagsukat. Gayunpaman, karaniwang ginagamit ang 0.5 na unit ng raw score upang tukuyin ang mga hangganan ng agwat. Sa kasong ito, kung ang paksa ay nakatanggap ng marka na 5, ang tunay na halaga ng kanyang marka ay nasa saklaw mula 4.5 hanggang 5.5, i.e. (4.5; 5), at ang mga numerong 4.5 at 5.5 ay tinatawag na lower at upper bounds ng unit interval ng mga pagtatantya, ayon sa pagkakabanggit.

Ang mga konsepto ng "itaas" at "ibaba" na mga hangganan ay ginagamit upang bumuo ng isang sukat ng mga ranggo ng percentile, kung ipagpalagay na magkatulad na pamamahagi ng mga resulta ng mga paksa sa loob ng agwat ng kumpiyansa. Halimbawa, kapag kinakalkula ang porsyento

Talahanayan 7.3. Pagbuo ng Percentile Rank Scale

ranggo para sa isang marka ng pagsusulit na 5, ipinapalagay na ang mga resulta ng dalawang paksa ay matatagpuan sa pagitan (4.5; 5.5) nang pantay (Talahanayan 7.3).

Malamang, ang isang resulta ay mas mababa sa puntong katumbas ng 5, at ang isa ay nasa itaas ng puntong ito. Kaya, kabilang sa mga paksa na ang tunay na marka ay mas mababa sa 5, maaari naming isama ang tatlong mag-aaral, kung saan ang isa ay may marka na 3, ang pangalawa - isang marka ng 4 at ang pangatlo - isa sa dalawa na nakatanggap ng marka ng 5, na sa mga tuntunin ng porsyento ay magiging (3/25) 100% \u003d 12%. Ito ang percentile rank na tumutugma sa 5, na nagbibigay ng isang maginhawang interpretasyon ng mga resulta ng mag-aaral: 12% ng mga mag-aaral mula sa normative sample ang nakakumpleto ng 5 o mas kaunting mga item sa pagsusulit. Alinsunod sa depinisyon na ipinakilala kanina, ang ika-12 percentile sa isang pangkat ng 25 na paksa ay 5. Tumutukoy sa datos na nakuha sa ikatlong hanay ng Talahanayan. 7.2, tiyak na masasabi natin na ang pangunahing resulta ng 5 puntos ay mahirap, dahil lumampas ito sa mga resulta ng 12% lamang ng mga paksa ng sample ng standardisasyon. Ito ay isang kongkreto at madaling makitang resulta, na kung saan ay maginhawa, una sa lahat, para sa mga mag-aaral kapag inihahambing ang mga nakamit sa isang bilang ng mga pagsubok. Ang pangunahing kinalabasan na mas mababa sa alinman sa mga marka ng sample ng standardisasyon ay may zero percentile na ranggo. Ang isang resulta na mas mataas kaysa sa iba sa sample ay makakatanggap ng isang percentile na ranggo na 100. Siyempre, alinman sa isang zero na ranggo o isang 100% na ranggo ay nagpapahiwatig ng zero o ganap na kaalaman sa kinokontrol na paksa.

Posible upang malutas ang kabaligtaran na problema kapag kinakailangan upang matukoy r-th percentile, o sa halip, ang punto sa ibaba kung saan kasinungalingan R % mga resulta. Para sa pagtukoy p-ika percentile, kailangan mong kumpletuhin ang 5 hakbang, na nakuha gamit ang talahanayan. 7.4 at ibinibigay sa talahanayan. 7.5.

Talahanayan 7.4. Relasyon sa pagitan ng mga raw score at frequency

Talahanayan 7.5.Pagpapasiya ng mga percentile

Hakbang Hakbang sa pagkalkula Halimbawa ng pagkalkula
Pagkalkula (rl)/100%, kung saan P- pinagsama-samang dalas sa pangkat ng pagtatasa
Pagpapasiya ng aktwal na lower bound L kategorya ng mga pagtatantya na naglalaman ng resulta ng 1st step
Pagbawas ng naipon na k L mga frequency (cum.f) mula sa resulta ng 1st step (pagtukoy ng mga frequency na nasa ibaba (rp)/100%)
Pagpapasiya ng bahagi ng pagitan ng mga discharge na nasa ilalim ng dalas (rp)/100%
Pagdaragdag ng mga resulta ng ika-4 na hakbang sa mga resulta ng ika-2 hakbang. Pangwakas na Pormula

Ang mga porsyento ay hindi dapat malito sa mga porsyento na kumakatawan sa porsyento ng mga gawain na tama na natapos ng mga paksa ng pangkat. Hindi tulad ng huli, ang pangunahing percentile ay isang nagmula na tagapagpahiwatig na nagsasaad ng bahagi ng kabuuang bilang ng mga paksa sa pangkat.

Bilang karagdagan sa kaginhawahan ng kadalian ng interpretasyon, ang mga ranggo ng percentile ay may dalawang makabuluhang disbentaha. Ang una ay ang porsyento ng mga ranggo ay mga halaga ng isang ordinal na sukat, dahil ipinapakita nila ang kamag-anak na posisyon ng bawat indibidwal sa normative sample, at hindi ibinubunyag ang pagkakaiba sa pagitan ng mga resulta ng mga indibidwal na paksa ng grupo. Ang pangalawang disbentaha ay nagpapalubha sa una sa isang tiyak na lawak - ang mga porsyento ay hindi lamang sumasalamin, ngunit kahit na papangitin ang mga tunay na pagkakaiba sa resulta ng pagsubok. Ito ay dahil sa mga kakaiba ng pamamahagi ng mga percentile, na may isang hugis-parihaba na karakter. Malaki ang pagkakaiba ng distribusyon ng mga pangunahing tagapagpahiwatig mula sa isang hugis-parihaba at lumalapit sa isang normal na kurba para sa mahusay na mga pagsusulit na nakatuon sa pamantayan. Sa pagsasaalang-alang na ito, ang mga maliliit na paglihis mula sa mean sa gitna ng distribusyon ng mga naobserbahang kinalabasan ay lubhang nadaragdagan ng mga porsyento, habang ang medyo malalaking paglihis sa mga gilid ng bell curve ay i-compress.

Ang mga disadvantages na nabanggit ay ang pangunahing dahilan kung bakit ang paggamit ng mga percentile ay medyo limitado. Dahil sa kanilang kaginhawahan at pagiging simple, ang mga ito ay pangunahing ginagamit sa mga pagsusulit para sa sariling pagtatasa ng kaalaman ng mga mag-aaral.

Z-SCALE

Ang pinakasimpleng pamamaraan para sa pagtukoy sa lugar ng resulta ng i-th na mag-aaral (X) sa paghahambing sa mga resulta ng iba ay batay sa pagkalkula ng paglihis ng Xi score mula sa average na halaga ng X score para sa isang pangkat ng mga nasubok na mag-aaral. Ang paglihis ay matatagpuan sa pamamagitan ng pagkalkula ng pagkakaiba X-X f Kung ang pagkakaiba X-Xt> Oh, pagkatapos ay ang resulta 1st mag-aaral na higit sa average ng grupo. Ang isang negatibong halaga ng pagkakaiba ay nagpapahiwatig ng isang resulta sa ibaba ng average. x.

Dahil ang mga average na arithmetic na nakuha para sa iba't ibang mga pagsubok at sa iba't ibang mga grupo ay naiiba nang malaki, ang problema sa pagiging maihahambing ng mga deviations ay lumitaw. Parehong score X t sa isang mahinang grupo ito ay maaaring higit sa karaniwan, sa isang malakas na grupo ito ay maaaring mas mababa. Bilang karagdagan, ang sukat ng paglihis ay lumalabas na nakaunat nang iba depende sa haba ng pagsubok.

Ang isang maginhawang paraan ng pagtagumpayan sa mga nabanggit na kahirapan ay ang pag-convert ng mga indibidwal na resulta sa isang karaniwang Z-scale na may pangkalahatang average na marka at isang karaniwang sukatan ng pagkakaiba-iba ng marka. Sa pangkalahatan, ang pagtatayo ng mga karaniwang kaliskis ay isinasagawa sa pamamagitan ng mga linear o non-linear na pagbabago ng mga hilaw na marka. Sa isang linear na pagbabago, ang mga karaniwang marka ay nagpapahayag ng paglihis ng mga indibidwal na marka mula sa mean raw na marka sa mga yunit na proporsyonal sa karaniwang paglihis ng distribusyon. Sa huling kaso, ang naka-scale na resulta ng i-th na mag-aaral ay matatagpuan sa pamamagitan ng formula

saan X.- raw na marka ng i-th subject; X- ang average na halaga ng mga indibidwal na marka ng mga paksa ng pagsusulit ng pangkat (i= 1,2,..., N); Sx- ang karaniwang paglihis sa hanay ng mga hilaw na marka na kinakalkula gamit ang formula (tingnan ang Seksyon 5.2).

Dahil sa ang katunayan na mula sa bawat paunang halaga X ( ibinawas x, ang parehong ^ ay ibinabawas sa average ng orihinal na mga marka. Samakatuwid, ang arithmetic mean ng pagkakaiba X-X i(/ = 1,2,..., N), na nakuha para sa pangkat ng mga mag-aaral na sinusuri ay katumbas ng zero. Ang pahayag na ito ay lubos na nakakumbinsi na inilalarawan ng halimbawa ng pagkalkula ng average na halaga ng mga pagkakaiba X- X i para sa isang matrix ng mga resulta ng pagsusulit ng 10 paksa (seksyon 5.2). Ang kabuuan ng mga pagkakaiba ay katumbas ng zero:

Katulad nito, madaling ipakita na ang standard deviation sa hanay ng mga value ay 1. Kaya, ang Z-score ay standard na may zero mean at isang standard deviation. Sa tulong nito, posible na dalhin ang mga marka ng mga mag-aaral na nakuha sa iba't ibang mga pagsusulit sa isang form na maginhawa para sa paghahambing sa pamamagitan ng pag-normalize ng mga indibidwal na resulta.

Para sa halimbawa sa itaas, ang mga marka ng 10 paksa sa Z-scale ay nakuha sa pamamagitan ng paghahati ng mga kinakalkula na pagkakaiba sa karaniwang paglihis ng 2.6:

Ito ay kagiliw-giliw na ihambing ang nakuha na mga resulta ng scale sa mga hilaw na marka ng 10 mga paksa (Talahanayan 7.6).

Talahanayan 7.6. Mga resulta ng paghahambing

Bilang ng paksa i Numero ng trabaho X i Xi-X Z i
0,38
-0 -1,14
-4" -1,52
-1,52
-1 -0,38
-1 -0,38
-1 -0,38
-1,52
0,38
X=5 Sx=2.6 Halaga = 0 Z=0 S z =\

Kapag gumagamit ng mga pagsubok na nakapasa sa pangmatagalang yugto ng standardisasyon at may matatag na pagtatantya ng mga pangkalahatang parameter, ang conversion ng mga hilaw na marka sa Z-scale ay isinasagawa ayon sa formula

saan M at isang x - pangkalahatang arithmetic mean at pangkalahatang pagkakaiba, ayon sa pagkakabanggit.

Malinaw, para sa isang raw na marka na eksaktong katumbas ng mean, ang Z-score ay napupunta sa zero. Ang mga negatibong halaga ng Z ay nagpapahiwatig ng mas mababa sa average na pagganap, habang ang mga positibong Z-values ​​ay nagpapahiwatig ng mahusay na pagganap, sa itaas ng average ng pangkat ng mga hilaw na marka.

Ang mga Z-scores ay lalong kapaki-pakinabang sa kaso ng isang normal na pamamahagi ng mga pangunahing marka, kapag ang lahat ng mga halaga ng Z ay karaniwang nag-iiba sa pagitan ng -3 at +3. Minsan sinusubukan nilang palawakin ang agwat ng pagkakaiba-iba at isinasaalang-alang ang lahat ng mga marka mula -5 hanggang +5, na, walang alinlangan, ay walang kabuluhan, dahil ang mga halaga sa mga dulo ng agwat ay tinutukoy na may napakalaking error sa pagsukat.

Ang walang alinlangan na bentahe ng Z-scale ay ang karaniwang arithmetic mean at ang pangkalahatang sukatan ng pagkakaiba-iba ng data, na ginagawang posible upang makamit ang pagiging maihahambing ng mga resulta sa iba't ibang pagsubok. Gayunpaman, bilang karagdagan sa mga halatang pakinabang, mayroon ding mga disadvantages. Ang pagiging maginhawa para sa siyentipikong pagsusuri sa proseso ng pagbuo ng mga bagong pagsubok, ang Z-scale ay hindi maginhawa para sa praktikal na paggamit sa pagtatasa ng kaalaman ng mga paksa ng grupo. Pangunahing ito ay dahil sa ang katunayan na ang mga halaga ng Z ay kadalasang kailangang kalkulahin sa maraming decimal na lugar, dahil ang average ng mga indibidwal na marka ay bihirang isang integer. Dahil ang pagkakakilanlan ng mga pagkakaiba sa paghahanda ng pagsusulit ay ang pangunahing layunin ng disenyo ng pagsubok, madaling maunawaan na ang pag-ikot ng mga Z-scores ay hindi palaging katanggap-tanggap, dahil maaari nitong mapawalang-bisa ang mga unang pagkakaiba sa mga indibidwal na marka at sa gayon ay mabawasan ang pagkakaiba-iba ng epekto ng pagsusulit.

Ang epekto ng pagbabawas ng kakayahan sa pagkakaiba-iba ng pagsusulit bilang resulta ng pag-ikot ng mga Z-scores ay maaaring ilarawan sa pamamagitan ng isang halimbawa ng data sa Talahanayan. 7.6. Ang mga resulta ng pangalawa at pangatlong paksa na magkaiba bago i-round ang Z 2 = -1.14 at Z 3 = -1.52 pagkatapos nito sa parehong mga marka Z 2 = Z 3 = - 1.

Ang ilang partikular na abala ay sanhi ng mga negatibong halaga ng Z-score, na nagpapahiwatig ng mga resultang mas mababa sa average para sa pangkat ng mga nasubok na mag-aaral. Malinaw na sa pagsasagawa ng kontrol, ang mga negatibong halaga ng Z-scores ay magdudulot ng halatang pagtanggi sa mga mag-aaral na tumanggap sa kanila. Sa pangkalahatan, ginagawa ng lahat ng ito na hindi maginhawa ang Z-score para sa pag-uulat ng mga resulta sa mga paksa ng grupo at pinipilit ang paggamit ng mga espesyal na paraan ng conversion para sa pagbibigay ng marka sa mga mag-aaral.