Metode statistik parametrik dan non-parametrik. Prosedur parametrik dan non-parametrik untuk analisis data statistik

Strategi umum untuk mengevaluasi hipotesis statistik yang dibahas di atas terutama menentukan penggunaan apa yang disebut metode parametrik statistik matematika.

Metode parametrik didasarkan pada beberapa, sebagai suatu peraturan, asumsi yang cukup mungkin tentang sifat distribusi variabel acak. Biasanya, metode parametrik yang digunakan dalam analisis data eksperimen didasarkan pada asumsi bahwa distribusi data tersebut normal. Konsekuensi dari asumsi ini adalah kebutuhan untuk memperkirakan parameter distribusi yang diteliti. Jadi, dalam kasus berikut t -Tes siswa parameter estimasi tersebut adalah ekspektasi matematis dan varians. Dalam beberapa kasus, asumsi tambahan dibuat tentang bagaimana parameter yang mencirikan distribusi variabel acak dalam sampel yang berbeda berkorelasi satu sama lain. Jadi, dalam tes Student, yang sering digunakan untuk membandingkan nilai rata-rata (harapan) dari dua deret data untuk homogenitas atau heterogenitasnya, asumsi tambahan dibuat tentang homogenitas varians dari distribusi variabel acak dalam dua populasi umum dari mana data ini diekstraksi.

Kelebihan metode analisis data parametrik adalah memiliki daya yang cukup tinggi. Dibawah menguji kekuatan mempertimbangkan kemampuannya untuk menghindari kesalahan jenis kedua, atau kesalahan-. Semakin kecil -error, semakin tinggi kekuatan tes. Dengan kata lain, daya uji = 1 - .

Tingginya kekuatan tes parametrik, atau kriteria, disebabkan oleh fakta bahwa metode ini mengharuskan data yang tersedia dijelaskan dalam skala metrik. Seperti yang Anda ketahui, skala metrik meliputi skala interval dan skala rasio, yang terkadang juga disebut skala absolut. Skala interval memungkinkan peneliti untuk mengetahui tidak hanya hubungan kesetaraan atau ketidaksetaraan elemen sampel (seperti yang memungkinkan untuk dilakukan) skala nama ) dan tidak hanya memesan hubungan (seperti yang memungkinkan untuk dilakukan skala pesanan ), tetapi juga mengevaluasi kesetaraan interval. Skala mutlak selain itu, ini memungkinkan Anda untuk mengevaluasi kesetaraan hubungan antara elemen-elemen himpunan yang diperoleh selama pengukuran. Itulah sebabnya timbangan metrik disebut sebagai timbangan pengukur kuat. Karena kekuatan ini, metode parametrik memungkinkan ekspresi perbedaan yang lebih akurat dalam distribusi variabel acak di bawah kondisi peluru atau hipotesis alternatif benar.

Perlu juga dicatat bahwa, secara umum, metode statistik parametrik lebih dikembangkan dalam teori statistik matematika dan oleh karena itu digunakan jauh lebih luas. Hampir semua hasil eksperimen dapat dievaluasi menggunakan salah satu metode ini. Metode inilah yang terutama dipertimbangkan dalam buku teks dan manual tentang analisis data statistik.

Pada saat yang sama, kesulitan yang terkait dengan penggunaan metode analisis parametrik dalam statistik adalah bahwa dalam beberapa kasus asumsi apriori tentang sifat distribusi variabel acak yang diteliti mungkin salah. Dan kasus-kasus ini sangat khas untuk penelitian psikologis dalam situasi tertentu.

Jadi, jika kita membandingkan dua sampel menggunakan t -Tes siswa, Anda dapat menemukan bahwa distribusi data kami berbeda dari normal, dan varians dalam dua sampel berbeda secara signifikan. Dalam hal ini, penggunaan tes siswa parametrik mungkin, sampai batas tertentu, mendistorsi kesimpulan yang ingin ditarik oleh peneliti. Bahaya ini meningkat jika nilai statistik yang dihitung ternyata mendekati nilai batas kuantil yang digunakan untuk menerima atau menolak hipotesis. Namun, dalam kebanyakan kasus, seperti, misalnya, dalam kasus penggunaan t -test, beberapa penyimpangan dari asumsi yang diberikan secara teoritis tidak penting untuk inferensi statistik yang andal. Dalam kasus lain, penyimpangan tersebut dapat menimbulkan ancaman serius terhadap kesimpulan tersebut. Kemudian peneliti dapat mengembangkan prosedur khusus yang dapat menyesuaikan prosedur pengambilan keputusan tentang kebenaran hipotesis statistik. Tujuan dari prosedur ini adalah untuk menghindari atau melonggarkan persyaratan yang terlalu ketat dari model parametrik dari statistik yang digunakan.

Salah satu opsi untuk tindakan peneliti tersebut, ketika ia menemukan bahwa data yang diterimanya berbeda dalam parameternya dari apa yang ditentukan dalam model struktural uji parametrik yang digunakan, mungkin mencoba mengubah data ini ke bentuk yang diinginkan. Misalnya, seperti disebutkan dalam Bab. 1, ketika mengukur waktu reaksi, adalah mungkin untuk menghindari nilai asimetri distribusi yang tinggi jika logaritma dari nilai yang diperoleh digunakan untuk analisis, dan bukan nilai waktu reaksi itu sendiri.

Pilihan lain adalah menolak untuk menggunakan asumsi apriori tentang sifat distribusi variabel acak dalam populasi umum. Dan ini berarti penolakan metode parametrik statistik matematika yang mendukung metode non-parametrik.

Nonparametrik disebut metode statistik matematika, di mana tidak ada asumsi apriori yang dibuat tentang sifat distribusi data yang diteliti dan tidak ada asumsi yang dibuat tentang rasio parameter distribusi dari nilai yang dianalisis. Ini adalah keuntungan utama dari metode ini.

Keuntungan statistik nonparametrik terungkap sepenuhnya ketika hasil yang diperoleh dalam percobaan disajikan dalam bentuk yang lebih lemah. skala non-metrik, mewakili hasil peringkat. Skala seperti ini disebut skala pesanan. Tentu saja, dalam beberapa kasus, peneliti dapat mengubah data ini menjadi skala interval yang lebih kuat menggunakan prosedur normalisasi data, tetapi, sebagai aturan, pilihan terbaik dalam situasi ini adalah menggunakan tes nonparametrik yang dirancang khusus untuk analisis statistik.

Sebagai aturan, tes statistik non-parametrik melibatkan memperkirakan rasio jumlah peringkat yang tersedia dalam dua atau lebih sampel, dan atas dasar ini, kesimpulan dirumuskan tentang rasio sampel ini. Contoh tes tersebut adalah tes tanda, tes peringkat bertanda Wilcoxon, sebaik Tes U Mann putih, yang digunakan sebagai analog dari parametrik t -Tes siswa.

Pada saat yang sama, jika hasil pengukuran disajikan pada skala yang lebih kuat, penggunaan statistik non-parametrik berarti penolakan terhadap beberapa informasi yang terkandung dalam data. Konsekuensi dari ini adalah bahaya peningkatan kesalahan jenis kedua yang melekat dalam metode ini.

Dengan demikian, metode statistik nonparametrik lebih konservatif daripada metode statistik parametrik. Penggunaannya mengancam tingkat yang lebih besar dengan kesalahan jenis kedua, yaitu. situasi di mana peneliti, misalnya, tidak dapat mendeteksi perbedaan antara dua sampel, ketika perbedaan tersebut benar-benar terjadi. Dengan kata lain, metode tersebut ternyata kurang kuat dibandingkan metode parametrik. Oleh karena itu, penggunaan statistik parametrik dalam analisis data eksperimen selain peringkat sederhana umumnya lebih disukai.

Saat memecahkan masalah membangun model sistem, tugas menghasilkan informasi awal tentang parameter elemen yang membentuk sistem memiliki relevansi khusus. Keakuratan dan keandalan informasi awal menentukan keakuratan perkiraan karakteristik sistem yang dianalisis, keakuratan perhitungan untuk mengoptimalkan strategi fungsi dan aturan pemeliharaannya, memecahkan masalah yang terkait dengan memprediksi perilaku sistem di masa depan , dan masalah lainnya. Saat membentuk informasi awal tentang parameter elemen, sebagai aturan, informasi yang diperoleh selama pemeriksaan sistem dan studi tentang pengalaman operasinya diambil sebagai dasar. Dengan kata lain, informasi tentang perilaku komponen sistem dalam proses operasinya diambil sebagai dasar.

Analisis indikator awal elemen, rakitan, komponen, yang dilakukan pada tahap operasi, pengujian, pengembangan desain, dilakukan untuk menyelesaikan masalah berikut:

    penentuan nilai aktual dari karakteristik komponen yang dipelajari dalam kondisi operasi aktualnya;

    mengidentifikasi hubungan antara karakteristik elemen yang dipelajari dan kondisi operasinya, menganalisis dampak pada indikator pengaruh eksternal yang dipelajari;

    memprediksi perilaku peralatan yang baru dibuat.

Oleh karena itu, untuk mengatasi masalah-masalah tersebut, pertama-tama,

perlu untuk mengatur kontrol atas perilaku peralatan dalam kondisi nyata operasinya. Di masa depan, informasi yang diperoleh selama pengoperasian objek digunakan untuk membangun model sistem yang analisisnya dilakukan.

Saat melakukan studi eksperimental, peran penting dimainkan oleh informasi yang diperoleh sebagai hasil pengamatan objek yang perilakunya bersifat probabilistik. Studi sistem tersebut dilakukan sesuai dengan hasil implementasi parameter output, yang merupakan variabel acak. Karakteristik paling umum yang menggambarkan perilaku variabel acak satu dimensi adalah kepadatan distribusinya / (0- Mengetahui kepadatan distribusi variabel acak, seseorang dapat secara unik menentukan karakteristik seperti probabilitas realisasi beberapa peristiwa, intensitas terjadinya peristiwa, waktu rata-rata antara realisasi peristiwa, dll. Kami menyajikan formula , memungkinkan untuk mengevaluasi indikator yang sesuai.

Probabilitas suatu peristiwa yang terjadi dari waktu ke waktu t ditentukan oleh rumus

Q(t) = F(t)=\f(t)dt.

Dalam praktiknya, besaran yang didefinisikan melalui fungsi distribusi sering digunakan sebagai berikut:

Misalnya, dalam teori keandalan, probabilitas operasi bebas kegagalan didefinisikan dengan cara ini.

Waktu rata-rata antara realisasi peristiwa ditentukan dari relasi

T a =]tf(f)dt=]p(t)dt.

Intensitas terjadinya suatu peristiwa dapat ditentukan dengan rumus

"_/(f)_ClFjt) Saya _ dP(t) 1 P(t)dt P(t)dt Lubang)"

Dengan demikian, mengetahui densitas atau fungsi distribusi variabel acak, kita dapat melanjutkan untuk menentukan karakteristik sistem yang kompleks. Dalam prakteknya, fungsi distribusi sering tidak diketahui. Itu harus dikembalikan sesuai dengan data statistik implementasi variabel acak. Karena statistik hasil pengamatan selalu hadir dalam bentuk terbatas, pemulihan fungsi distribusi dimungkinkan dengan tingkat keandalan tertentu. Oleh karena itu, jika fungsi distribusi diestimasi dengan kesalahan tertentu,

urya

f (X - t ) 2^2a 2

" (x-t ) 2 ^ 2 sebuah 2

Mari kita hitung turunan parsialnya:

dPN(t, m,Hai) _ 1

dm

d P N (t, t, HAI) _ dsebuah 2

r r \t

2 tentang 2

\ /-J

maka perhitungan karakteristik sistem juga akan dilakukan dengan error.

Keakuratan memperkirakan indikator sistem yang kompleks ditandai dengan besarnya dispersi. Biarkan perlu untuk memperkirakan beberapa indikator R(t). Mari kita tunjukkan bagaimana varians ditentukan dalam estimasinya. Kami akan mengasumsikan bahwa indikator R(t ) ditentukan melalui fungsi distribusi. Biarkan fungsi distribusi tergantung pada dua parameter udara. Contoh fungsi dua parameter adalah distribusi normal, normal terpotong, log-normal, distribusi gamma, distribusi Weibull, dan sejumlah lainnya. Jadi mari F(t) = F(t, a, r). Dengan demikian, indikator estimasi dari sistem yang kompleks dapat direpresentasikan sebagai fungsi dari F(t) = F(t, a, r):

K(r) = K = K(f,a,p).

Mari kita urai perkiraannya R ( t) ke dalam deret Taylor pada titik a, p dan kami membatasi diri pada tiga suku:

i(0 = K(0+^®(a-a)+^®(p-p).

Untuk kedua bagian dari ekspresi ini, kami menerapkan operasi penghitungan varians

(t-m) 2

-t exp

Distribusi normal

Massa jenis hukum distribusi normal memiliki bentuk

Pn(t, m, tentang)= 1 -7=- J exp

Fn(t, kemudian)= -y=- J exp

(t-m)

2o 2

Waktu rata-rata antara realisasi acara ditentukan oleh bentuk

(t- m) 2 2 sebuah 2

di mana cov(a, P) adalah kovarians antara parameter udara. Jadi, untuk mengestimasi varians suatu indikator tertentu, perlu ditentukan turunan parsial dari indikator ini dengan memperhatikan parameter hukum distribusi dan varians dalam mengestimasi parameter hukum distribusi.

Mari kita pertimbangkan masalah penentuan turunan parsial untuk indikator yang diperkenalkan di atas untuk hukum distribusi tertentu.Menentukan varians estimasi parameter hukum distribusi akan dijelaskan di bawah ini.

Sebagai contoh, mari kita pertimbangkan definisi turunan parsial dari indikator yang diestimasi sehubungan dengan parameter hukum distribusi untuk hukum normal.

Ґ ( t-m) 2 ^

2 sejak 2

Dengan demikian, turunan parsial didefinisikan sebagai

dTN(m,sebuah) 1 7

-- - = - f=~ exp

d m V2nab

dTN(m, Hai) Saya

sayat= F

f 2 ~\ m

2 0

\ /

Dan, akhirnya, untuk intensitas acara, kami memiliki

X(t, t, o) = -

Distribusi normal terpotong satu arah

Kerapatan distribusi dari hukum normal terpotong dengan pemotongan satu sisi di sebelah kiri pada titik 0 memiliki bentuk

/ (t-m ) 2 ^ 2 sebuah 2

\ 2pada

(X - t) 2 2a 2

\І2po(

Ekspresi untuk turunan parsial memiliki bentuk

dX N (t, m, a ) _ f N (t, m, a )" m (l -F N (t, m,o))-f N (t, m,o )[ l-F N (t, m,o )]" m m

2

dm

Dengan = -

(*-YU 2 2 Kommersant

tentangyj2nb

, ., t-m SAYA ( t-m ) 2

f H (fW O ra =Ir=-T ex PV

Ґ , h2 4 V

( t-m) 2

( 2M t

2 sebuah 2

\

2 detik 7

\ /J

" a2

da 2

2

[( t-m ) 2 - sebuah 2 ] 2l/2l 3

(t-m)

dx

P(SCH,b) = \-{

(t -m) 2a 2

m2O 2

\ =

(t-m)exp

m exp

2 2 pada 3

Mari kita perkenalkan notasi:

R = J exp

J

Dengan demikian, rumus disajikan untuk menentukan indikator turunan yang sesuai untuk parameter hukum distribusi untuk hukum normal. Generalisasi dari distribusi normal adalah distribusi normal terpotong. Mari kita pertimbangkan penggunaan distribusi normal terpotong satu sisi dalam masalah memperkirakan indikator sistem yang kompleks. Dalam sejumlah masalah analisis sistem, parameter acak didefinisikan secara positif. Contohnya adalah masalah teori keandalan, di mana parameter acak memiliki domain definisi dari 0 hingga, misalnya, waktu operasi hingga kegagalan adalah nilai pasti positif. Dalam hal ini, adalah ilegal untuk menerapkan hukum distribusi normal untuk menggambarkan variabel acak ini. Dalam situasi seperti itu, distribusi normal terpotong kiri digunakan. Mari kita pertimbangkan kasus ini dalam kaitannya dengan estimasi indikator reliabilitas.

(x-c) 2 2 b

( X - U-U

dx; Q= jexp

Turunan yang bersesuaian memiliki bentuk

Ґ 2\ .hl

2 Kommersant

r,"H

db(Q-Rf

di mana komponen yang sesuai ditentukan oleh rumus

Waktu rata-rata antara realisasi acara ditentukan oleh rumus

2 b 2

/ . .і \ (*-YU

S / jam’ ^

l/ts l/ts fG G-M-

(QW b =^exp

saya^lbSAYA-Jakub Jb

Mari kita tunjukkan pembilangnya melalui L

Turunan yang sesuai dihitung dengan rumus

distribusi log-normal

Hukum distribusi normal secara logaritmik mematuhi variabel acak t, yang logaritmanya didistribusikan menurut hukum normal. Kerapatan distribusi dari hukum log-normal memiliki bentuk

KMY) _ saya;q-%aku Jf_urz _______

"-! Li S)

/ 2 N .th! 2fc

PALSUKQ Ul.

-^ , A, -ex R

Fungsi distribusi memiliki bentuk

2 b 2

Akhirnya, intensitas terjadinya peristiwa sama dengan

(*-10 2 PADA

2 b

di manaPADA= Kommersant 1 .

Mari kita menulis rumus untuk menentukan indikator keandalan

(X -M-) 2 2 Kommersant

(x -\saya .? 2 Kommersant

dx-jexptentang

Saya (*, saya, D) \u003d Saya - Jexp

Kami memperkenalkan notasi

Turunan yang bersesuaian memiliki bentuk

(*-YU

M= exp

2 \

( (Sayanf-H) 2 PADA

Rln(; , N.D) _ 1 En - JakunB

P Jt,\i,B) 1pg-n

Mari kita tentukan turunan dari intensitas sehubungan dengan parameter

dkyM(t, ) _ M^jQ-R)- (Q-RY 11 M EC(Q-R) 2 :

uhdi


( (Pak) m 2 b

Untuk menentukan waktu rata-rata untuk kegagalan, gunakan rumus

(Nyonya. 2

M 11 =-m^exp

; (b-l)"= exp

dan ekspresi terakhir

Derivatifnya sama

dtlaC, R, PADA) 1 (di ,

Mari kita menulis ekspresi untuk probabilitas operasi tanpa kegagalan

Ekspresi untuk menentukan tingkat kegagalan memiliki bentuk \Jt,\saya, b) = -

P B (t, a, b) = exp\

KsebuahJ

Mari kita hitung turunan dari ekspresi ini sehubungan dengan parameter distribusi:

<У2дВ I 2 PADA

E P^(t,a,b) _ b ya a

dPB(t,sebuah, b) _

Turunan parsial ditentukan dari ekspresi

E CL^V) _

^ 2

L tjbw di exp|

(lnf- |X) 2 2 PADA

dimana (/ln(0)

7 B(a ^) = J ex P

(Inf-(X) 2 2 PADA

E T B (a, b)_~ r b(t

* (t"Di

\df, E7v(a ^ e b

dK»ShV) (0 ) " th (Saya - (0 )- / l. (Saya- F n J t))"

EV 2

* P

Tingkat kegagalannya adalah

(^ b-" , sebuah

Turunan terhadap parameter memiliki bentuk

dia,sebuah,b)

(1 - F) = - I n Vii exp

_ (SAYAnf- (X) 2 PADA

E ^a,b) b 2

E Xdiaku, b)_Ґ" b

ya~a 2

dbsebuahbsebuah

sebuah ,

Distribusi Weibull

Densitas distribusi Weibull memiliki bentuk

f B (t,a,b) = -(-

Distribusi gamma

Kepadatan distribusi gamma ditulis sebagai berikut:

F B (t, a, b) = 1-exp

Dengan demikian, fungsi distribusi memiliki bentuk

x, a *

Fr(t,X,a) = fXsebuah~ " exn(-Xx) dx.

Probabilitas operasi bebas kegagalan dihitung dengan rumus

P v (t , X , a) = Saya fexp(-Xx)dx.

Derivatif sehubungan dengan parameter adalah

і і OcX a4 Jx a4 exp (-Xx) Jx-X a J x sebuah exp ( -Xx)dx

EXG(g,a,X) _ (f r ( 'Xa)) K - / r(f,X,sebuah); Ea 2

J exp(-Xx)(a - Xx)dx \

[!-,F r (ZAa)];=-

DR G (t, X , sebuah) _ X 1

pa) saya

DR ^ya sebuah) = ~ G^a) aku * sebuah ~" ex P(-^t r (a)(ta ^ - 111 0 - "(а)]Жс, di mana (а) = J X sebuah t sebuah ~ " exp (- Xt)dt \u003d J Z a " 1 exp (-r)<&; Г(а) = J г“"’ exp(-z) In z 4 z

Waktu rata-rata untuk kegagalan ditentukan oleh rumus

G r (o, X) \u003d J ^ - exp(-Xt)dsaya =~.

og(a) X

Turunan yang sesuai adalah

dt G (Oh ) sebuahdG G ( sebuah ,X) _ 1 EH.X 2 Ya~X"

Tingkat kegagalan dicatat

X sebuah t sebuah -" exp (- xt )

Xr(t,sebuah,X) =

(f r (t , X ,sebuah )) sebuah = ^-y-^-[(X a InXf a "exp (- Xt)+X sebuah t sebuah 1 Infexp(-Xt))-

X 1 V a " 1 exp(-Xf)r„ (a)];

G a ((X)X a Jjr a "1 exp (-Xx) Jx-

t tX sebuah Dalam Xj X a ' 1 exp (-Xx)dx +X a Jx a 1 Injfexp (-Xx)dx

Dengan demikian, ekspresi diperoleh yang memungkinkan pemecahan masalah penilaian akurasi dalam menentukan indikator sistem yang kompleks. Hukum distribusi yang paling sering digunakan dalam analisis sistem dipertimbangkan. Rumus untuk menentukan indikator utama sistem diperoleh dan turunan parsial pertama dari indikator dihitung sehubungan dengan parameter hukum distribusi yang sesuai. Masalah selanjutnya yang perlu ditangani adalah masalah estimasi parameter hukum distribusi yang dipilih. Mari kita lihat bagaimana masalah ini diselesaikan.

Derivatif sehubungan dengan parameter didefinisikan sebagai

d X r ( t, a , x) _ (fr(tX sebuah) ) \ -/ r(t, X,a) 2

di mana sebuah^ g" 1 "pW-X-r-exp(-Xr)

Skala statistik

Pengolahan statistik data penelitian

Data statistik digunakan dalam pengolahan bahan penelitian psikologis untuk mengekstrak informasi yang berguna sebanyak mungkin dari data kuantitatif yang diperoleh dalam percobaan.

Penggunaan metode statistik tertentu ditentukan oleh skala statistik mana dari materi yang diterima.

skala nama. Skala ini mencakup bahan-bahan di mana objek yang dipelajari berbeda satu sama lain dalam kualitasnya, dan urutannya tidak penting. Misalnya, distribusi peserta konferensi. Dalam pemrosesan statistik bahan-bahan tersebut, seseorang harus memperhitungkan jumlah unit setiap objek yang diwakili.

skala pesanan. Urutan objek adalah fokusnya. Skala dalam statistik ini mencakup bahan penelitian seperti itu di mana objek yang termasuk dalam satu atau beberapa kelas tunduk pada pertimbangan, tetapi berbeda ketika membandingkan satu sama lain: lebih - lebih sedikit, lebih tinggi - lebih rendah, dll.

Cara termudah untuk menunjukkan ciri khas skala pesanan adalah dengan melihat hasil dari setiap kompetisi olahraga. Mereka secara berurutan mendaftar peserta yang masing-masing menempati posisi pertama, kedua, ketiga dan lainnya.

dalam urutan tempat, dan informasi tentang prestasi atlet yang sebenarnya memudar ke latar belakang, atau tidak ada.

Skala interval. Ini termasuk bahan-bahan di mana penilaian kuantitatif dari objek yang diteliti diberikan dalam unit tetap. Bahan yang sesuai dengan skala interval harus memiliki unit pengukuran yang identik dengan dirinya sendiri untuk semua pengukuran berulang.

Skala hubungan. Skala ini mencakup bahan yang memperhitungkan tidak hanya jumlah unit tetap , seperti dalam skala interval, tetapi juga rasio dari hasil total yang diperoleh di antara mereka sendiri. Untuk bekerja dengan hubungan seperti itu, Anda harus memiliki beberapa poin absolut, dari mana hitungan mundur dilakukan.

Jika data yang tersedia bagi peneliti, setelah diperiksa lebih dekat, hanya sedikit menyimpang dari kurva distribusi normal Gaussian, maka ini memberi peneliti hak untuk menggunakan metode parametrik dalam pemrosesan statistik, yang ketentuan awalnya didasarkan pada kurva distribusi normal Gaussian. . Distribusi normal disebut parametrik karena untuk membangun dan menganalisis kurva Gaussian, cukup hanya memiliki dua parameter: mean aritmatika, yang nilainya harus sesuai dengan ketinggian tegak lurus yang dipulihkan di pusat kurva, dan apa yang disebut akar rata-rata kuadrat, atau standar deviasi, nilai yang mencirikan kisaran fluktuasi kurva ini.

Jika tidak mungkin menerapkan metode parametrik, maka perlu beralih ke metode non-parametrik.

Salah satu faktor yang membatasi penerapan uji statistik berdasarkan asumsi normalitas adalah ukuran sampel. Selama sampel cukup besar (misalnya 100 pengamatan atau lebih), distribusi sampel dapat dianggap normal, meskipun tidak pasti bahwa distribusi variabel dalam populasi adalah normal. Namun, jika sampelnya kecil, maka uji parametrik hanya boleh digunakan jika ada keyakinan bahwa variabel memang terdistribusi normal. Namun, bahkan untuk variabel seperti itu, tidak ada cara untuk menguji asumsi ini pada sampel kecil (pengujian statistik untuk normalitas secara efektif mulai bekerja pada sampel yang berisi setidaknya 51 pengamatan).

Metode nonparametrik paling tepat ketika ukuran sampel kecil dan data dalam skala ordinal atau nominal. Jika ada banyak data empiris (misalnya, n>100), maka sering kali tidak masuk akal dan bahkan tampaknya salah untuk menggunakan statistik nonparametrik. Jika ukuran sampel sangat kecil (misalnya, n=10 atau kurang), maka tingkat signifikansi p untuk pengujian non-parametrik yang menggunakan pendekatan normal hanya dapat dianggap sebagai perkiraan kasar.



Penerapan kriteria berdasarkan asumsi normalitas juga dibatasi oleh fakta bahwa karakteristik yang diteliti termasuk dalam skala pengukuran tertentu. Metode statistik seperti, misalnya, uji-t Student (untuk sampel dependen dan independen), korelasi linier Pearson, serta analisis regresi, klaster, dan faktor mengasumsikan bahwa sumber data adalah kontinu (nilai-nilai variabel yang diteliti terkait dengan skala interval atau rasio). Namun, ada kasus di mana data hanya diberi peringkat (diukur pada skala ordinal) daripada diukur secara akurat. Maka tampaknya tepat untuk menggunakan kriteria statistik seperti, misalnya, uji-T Wilcoxon, uji-G tanda, uji-U Mann-Whitney, uji-Z Wald-Wolfowitz, korelasi peringkat Spearman, dll. Metode statistik mereka sendiri akan bekerja pada data nominal , misalnya, korelasi fitur kualitatif, uji chi-kuadrat, uji Q Cochran, dll. Pilihan kriteria tertentu dikaitkan dengan hipotesis yang diajukan peneliti selama penelitian ilmiah , dan kemudian mencoba membuktikannya pada tingkat empiris.

Jadi, untuk setiap kriteria parametrik, setidaknya ada satu alternatif nonparametrik. Secara umum, prosedur ini termasuk dalam salah satu kategori berikut: (1) menilai tingkat ketergantungan antar variabel; (2) kriteria perbedaan untuk sampel independen; (3) kriteria perbedaan untuk sampel dependen.

Untuk menilai ketergantungan (hubungan), atau tingkat kekencangan (kepadatan, kekuatan) sambungan, hitung koefisien korelasi Pearson (r). Sebenarnya, penggunaannya juga memiliki keterbatasan yang terkait, misalnya, dengan jenis skala di mana data diukur dan ketergantungan non-linier. Oleh karena itu, non-parametrik atau yang disebut koefisien korelasi peringkat (misalnya, koefisien korelasi peringkat Spearman (ρ), statistik tau Kendall (τ), Gamma (Gamma)), digunakan untuk data ordinal (peringkat), digunakan sebagai alternatif. Jika ada lebih dari dua variabel, maka digunakan Kendall Coeff.of Concordance. Ini digunakan, misalnya, untuk menilai konsistensi pendapat para ahli independen (misalnya, poin yang diberikan untuk subjek yang sama, peserta dalam kompetisi).

Jika data diukur pada skala nominal, maka wajar untuk menyajikannya dalam tabel kontingensi yang menggunakan uji chi-kuadrat Pearson dengan berbagai variasi dan penyesuaian untuk akurasi.

Perbedaan antara kelompok independen. Jika ada dua sampel (misalnya, anak laki-laki dan perempuan) yang perlu dibandingkan sehubungan dengan beberapa nilai rata-rata, misalnya, berpikir kreatif, maka Anda dapat menggunakan uji-t untuk sampel independen (uji-t untuk sampel independen) . Alternatif nonparametrik untuk pengujian ini adalah uji berjalan Wald-Wolfowitz, uji Mann-Whitney U, dan uji dua sampel Kolmogorov-Smirnov. Harus diingat bahwa uji Kolmogorov-Smirnov dua sampel sensitif tidak hanya terhadap perbedaan posisi kedua distribusi, tetapi juga terhadap bentuk distribusi. Faktanya, ini sensitif terhadap setiap penyimpangan dari hipotesis homogenitas, tetapi tidak menunjukkan penyimpangan mana yang dihadapi peneliti.

Perbedaan antara kelompok dependen. Jika perlu membandingkan dua variabel yang terkait dengan sampel yang sama, misalnya indikator agresivitas subjek yang sama sebelum dan sesudah pekerjaan pemasyarakatan, maka uji-t untuk sampel dependen biasanya digunakan. Tes nonparametrik alternatif adalah Uji Tanda dan uji pasangan cocok Wilcoxon. Tes Wilcoxon menunjukkan bahwa adalah mungkin untuk membuat peringkat perbedaan antara pengamatan yang dibandingkan. Jika hal ini tidak dapat dilakukan, maka digunakan kriteria tanda, yang hanya memperhitungkan tanda-tanda perbedaan antara nilai-nilai yang dibandingkan.

Jika variabel yang dipertimbangkan adalah kategoris (nominal), maka Chi-square McNemar adalah tepat. Jika ada dua variabel kategori, maka statistik standar dan kriteria yang sesuai untuk tabel kontingensi digunakan untuk menilai tingkat ketergantungan: Chi-kuadrat, Phi-kuadrat, uji eksak Fisher.

Tabel di bawah ini menyajikan pengujian parametrik dan alternatif non-parametriknya, dengan mempertimbangkan kategori berikut: 1) penilaian tingkat ketergantungan antar variabel; 2) kriteria perbedaan.

Tabel 4.1 - Kriteria parametrik dan non-parametrik

Kriteria parametrik Tes nonparametrik
penilaian ketergantungan (hubungan)
Koefisien korelasi Pearson (r) koefisien korelasi peringkat (koefisien korelasi peringkat Spearman ), statistik tau Kendall (τ), Gamma (Gamma)); Chi-kuadrat Pearson (untuk data nominal)
perbedaan antara kelompok independen
Uji-t siswa untuk sampel independen (uji-t untuk sampel independen) Wald-Wolfowitz menjalankan uji, uji Mann-Whitney U, uji dua sampel Kolmogorov-Smirnov
perbedaan antara kelompok dependen
Uji-t siswa untuk sampel dependen (uji-t untuk sampel dependen) Uji-G tanda (Sign Test), uji-T perbandingan berpasangan Wilcoxon (uji pasangan cocok Wilcoxon); McNemar Chi-kuadrat, Chi-kuadrat, Phi-kuadrat, Fisher tepat (untuk data nominal)

Jika lebih dari dua variabel dari sampel yang sama dipertimbangkan (misalnya, pra-penyesuaian, pasca-penyesuaian-1, dan pasca-penyesuaian-2), maka analisis varians ukuran berulang biasanya digunakan, yang dapat dianggap sebagai generalisasi uji-t untuk sampel dependen, untuk meningkatkan sensitivitas analisis. Singkatan bahasa Inggris untuk analysis of variance adalah ANOVA (Analysis of Variation). Analisis varians memungkinkan Anda untuk secara bersamaan mengontrol tidak hanya tingkat dasar variabel dependen, tetapi juga faktor lain, serta menyertakan lebih dari satu variabel dependen dalam rencana eksperimen. Metode alternatif non-parametrik adalah analisis varians Kruskal-Wallis dan uji median (ANOVA Kruskal-Wallis, uji median), analisis varians peringkat Friedman (ANOVA Friedman berdasarkan Peringkat).

Pertanyaan tentang kriteria nonparametrik.

Kriteria statistik - aturan keputusan yang memastikan penerimaan yang benar dan penolakan hipotesis yang salah dengan probabilitas tinggi.Pada saat yang sama, kriteria statistik adalah metode untuk menghitung angka tertentu dan angka ini sendiri.

Kriteria parametrik digunakan bila sampelnya normal, sedangkan perhitungan dalam kriteria ini mencakup fitur distribusi probabilitas fitur, yaitu mean dan varians. Ini mengasumsikan bahwa data tersebut kontinu. Tes parametrik meliputi: Uji-t siswa, uji chi-kuadrat. Cocok untuk skala rasio interval.

Tes non-parametrik digunakan ketika tidak mungkin untuk berbicara tentang distribusi normal, tes didasarkan pada operasi dengan peringkat atau frekuensi. Yang non parametrik meliputi uji tanda, uji Wilcoxon, uji Mann-Whitney, dan Jonkheer. Cocok untuk tangga nada yang lebih lemah dari tangga nada interval.

Sebelum memilih kriteria, kita harus memeriksa sampel untuk normalitas.

Saya tidak tahu harus menulis apa dalam hal ukuran rata-rata dan pencar, karena ternyata ada semua konsep dispersi dan bla bla hal-hal lain yang sama *_*

2. Metode pengujian hipotesis statistik: uji-t, uji Wilcoxon, uji Mann-Whitney, uji Kruskal-Wallace (syarat penerapan, rumusan hipotesis, distribusi statistik, ide perhitungan)

t-test (Student) - digunakan jika sampelnya normal. Hipotesis dirumuskan sebagai berikut:

1. H0 dirumuskan

2. H1 dirumuskan, alternatif H0 (biasanya menunjukkan interaksi fitur).

3. Sebuah statistik dipilih untuk memilih antara dua hipotesis

4. Untuk setiap tingkat signifikansi , daerah kritis ditetapkan, di mana a) hasil yang jatuh ke daerah ini menunjukkan H1 daripada H0 b) probabilitas hasil yang jatuh ke daerah ini pada H0 benar sama dengan .

Probabilitas kesalahan yang dapat diterima dari jenis pertama = 0,05, jika nilai kriteria dalam sampel kami lebih besar dari t 0,05, maka kami menerima hipotesis H0, menolak hipotesis H1.

Untuk satu sampel

Untuk sampel independen.

Tes peringkat bertanda Wilcoxon tidak mempertimbangkan nilai angka dalam sampel, tetapi hanya tanda-tandanya. Kriteria memperhitungkan nilai absolut dari anggota sampel. Ini digunakan ketika sampel mungkin tidak normal dan ketika diperlukan untuk memutuskan apakah sampel memiliki rata-rata yang tidak nol secara signifikan. Aplikasi membutuhkan:

1) Tetapkan tingkat signifikansi dan temukan kuantil Wilcoxon bawah yang sesuai.


2) Atur semua anggota sampel dalam urutan menaik dari nilai absolut, tanda tangani peringkat di bawahnya.

3) Hitung statistik Wilcoxon, yang untuknya kami menghitung jumlah peringkat yang diberikan kepada anggota sampel yang negatif.

4) Bandingkan statistik yang diperoleh dengan kuantil yang ditemukan sebelumnya. Jika jumlah peringkat ini lebih kecil dari kuantil bawah, kami menolak hipotesis H0 dan menerima hipotesis H1. Demikian pula, jika jumlah pangkat semua anggota sampel positif lebih besar dari kuantil atas, kami menerima H1 dan menolak H0.

Tes Mann-Whitney (U) adalah tes untuk sampel independen, analog dari uji-t Student. Nilai empirisnya menunjukkan bagaimana dua baris nilai atribut bertepatan. Ini digunakan ketika sampel mungkin tidak normal, hanya persyaratan kesamaan distribusi yang dipertahankan, tetapi mereka tidak harus normal + ketika diperlukan untuk menyelesaikan masalah, apakah mungkin untuk menyatakan itu. Bahwa nilai rata-rata sampel eksperimen secara signifikan lebih tinggi daripada nilai rata-rata kelompok kontrol.

1) Kami menuliskan anggota kedua sampel dalam urutan menaik, menyoroti anggota sampel yang berbeda dengan cara yang berbeda.

2) Untuk setiap jumlah sampel pertama (kontrol), kami menghitung berapa banyak jumlah sampel kedua (percobaan) yang terletak di sebelah kirinya. Jika jumlah sampel pertama sama dengan jumlah sampel kedua, maka tambahkan 0,5. Kami mendapatkan hasil yang konsisten dan menambahkannya.

3) Kami melihat tingkat signifikansi yang telah kami pilih untuk kuantil bawah menurut Mann-Whitney. Jika jumlah yang kami terima lebih kecil dari kuantil bawah, maka kami menolak hipotesis H0, kami menerima hipotesis H1.

Distribusi Mann-Whitney adalah simetris (yaitu, Anda dapat menghitung mundur dan menggunakan kuantil atas).

Uji Kruskal-Wallace adalah analog non-parametrik dari analisis varians satu arah untuk sampel independen. Mirip dengan tes Mann-Whitney. Menilai tingkat kebetulan dari beberapa rangkaian nilai dari karakteristik yang berubah. Ide utamanya adalah untuk menyajikan semua nilai sampel yang dibandingkan sebagai urutan umum nilai peringkat dengan perhitungan selanjutnya dari peringkat rata-rata untuk masing-masing sampel.

Dihitung setelah peringkat.

N adalah jumlah total semua sampel.

k adalah jumlah sampel yang dibandingkan.

R i adalah jumlah peringkat untuk sampel tertentu.

n i – ukuran sampel i.

Semakin banyak sampel yang berbeda, semakin besar nilai komputasi H, semakin rendah tingkat signifikansi p. Ketika hipotesis statistik nol ditolak, hipotesis alternatif tentang perbedaan signifikan secara statistik dalam sifat ini diterima tanpa menentukan arah perbedaan. (untuk arah, diperlukan uji Mann-Whitney, karena untuk dua sampel, dan yang ini untuk lebih dari dua).