Analisis perhitungan varians urutan subjek periode obat. Pembengkokan benang mewah dengan efek keliling

Analisis varians adalah metode statistik yang dirancang untuk menilai pengaruh berbagai faktor pada hasil percobaan, serta untuk perencanaan selanjutnya dari percobaan serupa.

Awalnya (1918), analisis varians dikembangkan oleh matematikawan dan ahli statistik Inggris R.A. Fisher mengolah hasil percobaan agronomi untuk mengidentifikasi kondisi untuk memperoleh hasil yang maksimal dari berbagai varietas tanaman.

Saat menyiapkan eksperimen, kondisi berikut harus dipenuhi:

    Setiap varian percobaan harus dilakukan pada beberapa unit pengamatan (kelompok hewan, bagian lapangan, dll.)

    Distribusi unit observasi antara varian pengalaman harus acak, tidak disengaja.

Analisis varians menggunakan F-kriteria(Kriteria R.A. Fisher), mewakili rasio dua varians:

di mana d adalah fakta, d adalah dispersi faktorial (antargrup) dan residual (intragrup) per satu derajat kebebasan.

Varians faktorial dan residual adalah perkiraan varians populasi, dihitung dari data sampel, dengan mempertimbangkan jumlah derajat kebebasan variasi.

Varians faktor (antarkelompok) menjelaskan variasi sifat yang dihasilkan di bawah pengaruh faktor yang dipelajari.

Varians residual (intragroup) menjelaskan variasi atribut efektif karena pengaruh faktor lain (dengan pengecualian pengaruh faktor yang dipelajari).

Singkatnya, varians faktor dan residual memberikan varians total, yang menyatakan pengaruh semua karakteristik faktor pada yang efektif.

Prosedur untuk melakukan analisis varians:

1. Data eksperimen dimasukkan ke dalam tabel perhitungan dan ditentukan jumlah dan nilai rata-rata pada setiap kelompok populasi yang diteliti, serta jumlah total dan nilai rata-rata untuk seluruh populasi (Tabel 1).

Tabel 1

Nilai atribut yang dihasilkan untuk unit ke-i

di grup ke-j, x ij

Jumlah pengamatan, f j

Rata-rata (kelompok dan total), x j

x 11, x 12, ..., x 1 n

x 21, x 22, ..., x 2 n

x m 1 , x m 2 , …, x mn

Jumlah total pengamatan n dihitung sebagai jumlah dari jumlah pengamatan f j di setiap kelompok:

Jika jumlah anggota dalam semua golongan sama, maka rata-rata totalnya ditemukan dari grup mean sebagai mean aritmatika sederhana:

Jika jumlah elemen dalam kelompok berbeda, maka total rata-rata dihitung dengan rumus rata-rata tertimbang aritmatika:

2. Total varians ditentukan D umum sebagai jumlah deviasi kuadrat dari nilai individu dari atribut yang dihasilkan dari total rata-rata :

3. Varians faktorial (antar-grup) dihitung D fakta sebagai jumlah dari deviasi kuadrat dari grup berarti dari total rata-rata dikalikan dengan jumlah pengamatan:

4. Nilai dispersi residual (intragroup) ditentukan D ost sebagai selisih antara jumlah D umum dan faktorial D fakta dispersi:

5. Banyaknya derajat kebebasan faktorial
varians sebagai perbedaan antara jumlah kelompok m dan satuan:

6. Jumlah derajat kebebasan untuk dispersi residual ditentukan
sebagai perbedaan antara jumlah nilai fitur individual n dan jumlah kelompok m:

7. Nilai dispersi faktor per satu derajat kebebasan dihitung d fakta sebagai rasio varians faktor D fakta dengan jumlah derajat kebebasan varians faktorial
:

8. Nilai dispersi residual per satu derajat kebebasan ditentukan d ost sebagai rasio varians residual D ost dengan jumlah derajat kebebasan dispersi residual
:

9. Nilai yang dihitung dari kriteria-F ditentukan F-kal sebagai rasio varians faktorial per derajat kebebasan d fakta untuk dispersi residual per satu derajat kebebasan d ost :

10. Menurut tabel Fisher's F-kriteria, dengan mempertimbangkan tingkat signifikansi yang diadopsi dalam penelitian, serta dengan mempertimbangkan derajat kebebasan untuk varians faktorial dan residual, nilai teoritis ditemukan F meja .

Tingkat signifikansi 5% sesuai dengan tingkat probabilitas 95%, tingkat probabilitas 1% - hingga 99%. Dalam kebanyakan kasus, tingkat signifikansi 5% digunakan.

nilai teoritis F meja pada tingkat signifikansi tertentu, mereka ditentukan dari tabel di persimpangan baris dan kolom yang sesuai dengan dua derajat kebebasan varians:

di telepon - sisa;

menurut kolom - faktorial.

11. Hasil perhitungan tersebut disusun dalam sebuah tabel (Tabel 2).

Analisis varians

Kursus dalam disiplin: "Analisis Sistem"

Mahasiswa berprestasi gr. 99 ISE-2 Zhbanov V.V.

Universitas Negeri Orenburg

Fakultas Teknologi Informasi

Departemen Informatika Terapan

Orenburg-2003

pengantar

Tujuan pekerjaan: untuk berkenalan dengan metode statistik seperti analisis varians.

Analisis varians (dari bahasa Latin Dispersio - dispersi) adalah metode statistik yang memungkinkan Anda menganalisis pengaruh berbagai faktor terhadap variabel yang diteliti. Metode ini dikembangkan oleh ahli biologi R. Fisher pada tahun 1925 dan pada awalnya digunakan untuk mengevaluasi eksperimen dalam produksi tanaman. Kemudian, signifikansi ilmiah umum dari analisis dispersi untuk eksperimen dalam psikologi, pedagogi, kedokteran, dll., Menjadi jelas.

Tujuan dari analisis varians adalah untuk menguji signifikansi perbedaan antara rata-rata dengan membandingkan varians. Varians dari atribut yang diukur didekomposisi menjadi istilah independen, yang masing-masing mencirikan pengaruh faktor tertentu atau interaksinya. Perbandingan selanjutnya dari istilah-istilah tersebut memungkinkan kita untuk mengevaluasi signifikansi setiap faktor yang diteliti, serta kombinasinya /1/.

Jika hipotesis nol benar (tentang persamaan rata-rata dalam beberapa kelompok pengamatan yang dipilih dari populasi umum), estimasi varians yang terkait dengan variabilitas intragrup harus mendekati estimasi varians antargrup.

Saat melakukan riset pasar, pertanyaan tentang komparabilitas hasil sering muncul. Misalnya, ketika melakukan survei tentang konsumsi produk tertentu di berbagai wilayah negara, perlu untuk menarik kesimpulan tentang bagaimana data survei berbeda atau tidak berbeda satu sama lain. Tidak masuk akal untuk membandingkan indikator individu, dan oleh karena itu prosedur untuk perbandingan dan penilaian selanjutnya dilakukan sesuai dengan beberapa nilai rata-rata dan penyimpangan dari penilaian rata-rata ini. Variasi sifat sedang dipelajari. Varians dapat diambil sebagai ukuran variasi. Dispersi 2 adalah ukuran variasi, yang didefinisikan sebagai rata-rata deviasi kuadrat fitur.

Dalam praktiknya, tugas yang lebih umum sering muncul - tugas memeriksa signifikansi perbedaan rata-rata beberapa sampel sampel. Misalnya, diperlukan untuk mengevaluasi pengaruh berbagai bahan baku terhadap kualitas produk, untuk memecahkan masalah pengaruh jumlah pupuk terhadap hasil produk pertanian.

Terkadang analisis varians digunakan untuk menetapkan homogenitas beberapa populasi (varians dari populasi ini sama dengan asumsi; jika analisis varians menunjukkan bahwa ekspektasi matematisnya sama, maka populasinya homogen dalam pengertian ini). Populasi homogen dapat digabungkan menjadi satu dan dengan demikian memperoleh informasi yang lebih lengkap tentangnya, dan oleh karena itu kesimpulan yang lebih andal /2/.

1 Analisis varians

1.1 Konsep dasar analisis varians

Dalam proses mengamati objek yang diteliti, faktor kualitatif berubah secara sewenang-wenang atau dengan cara yang telah ditentukan sebelumnya. Implementasi spesifik suatu faktor (misalnya, rezim suhu tertentu, peralatan atau bahan yang dipilih) disebut tingkat faktor atau metode pemrosesan. Model ANOVA dengan tingkat faktor tetap disebut model I, model dengan faktor acak disebut model II. Dengan memvariasikan faktor, seseorang dapat menyelidiki pengaruhnya terhadap besarnya respon. Saat ini, teori umum analisis varians telah dikembangkan untuk model I.

Tergantung pada jumlah faktor yang menentukan variasi fitur yang dihasilkan, analisis varians dibagi menjadi faktor tunggal dan multifaktor.

Skema utama untuk mengatur data awal dengan dua atau lebih faktor adalah:

Klasifikasi silang, karakteristik model I, di mana setiap tingkat satu faktor digabungkan dengan setiap gradasi faktor lain ketika merencanakan percobaan;

Klasifikasi hierarkis (bersarang), karakteristik model II, di mana setiap nilai yang dipilih secara acak dari satu faktor sesuai dengan subsetnya sendiri dari nilai faktor kedua.

Jika ketergantungan respons pada faktor kualitatif dan kuantitatif diselidiki secara bersamaan, mis. faktor alam campuran, maka digunakan analisis kovarians /3/.

Dengan demikian, model-model ini berbeda satu sama lain dalam cara memilih tingkat faktor, yang, jelas, terutama mempengaruhi kemungkinan generalisasi hasil eksperimen yang diperoleh. Untuk analisis varians dalam eksperimen faktor tunggal, perbedaan antara kedua model ini tidak begitu signifikan, tetapi dalam analisis varians multivariat bisa menjadi sangat penting.

Saat melakukan analisis varians, asumsi statistik berikut harus dipenuhi: terlepas dari tingkat faktornya, nilai respons memiliki hukum distribusi normal (Gaussian) dan varians yang sama. Persamaan dispersi ini disebut homogenitas. Dengan demikian, mengubah metode pemrosesan hanya memengaruhi posisi variabel acak respons, yang dicirikan oleh nilai rata-rata atau median. Oleh karena itu, semua pengamatan respons termasuk dalam keluarga shift dari distribusi normal.

Teknik ANOVA dikatakan "kuat". Istilah ini, yang digunakan oleh ahli statistik, berarti bahwa asumsi ini dapat dilanggar sampai batas tertentu, tetapi meskipun demikian, teknik ini dapat digunakan.

Ketika hukum distribusi nilai respons tidak diketahui, metode analisis nonparametrik (paling sering peringkat) digunakan.

Analisis varians didasarkan pada pembagian varians menjadi bagian-bagian atau komponen. Variasi karena pengaruh faktor yang mendasari pengelompokan ditandai dengan dispersi antarkelompok 2 . Ini adalah ukuran variasi rata-rata parsial untuk kelompok di sekitar rata-rata umum dan ditentukan oleh rumus:

,

di mana k adalah jumlah grup;

n j adalah jumlah unit dalam kelompok ke-j;

Rata-rata pribadi untuk kelompok ke-j;

Rata-rata keseluruhan atas populasi unit.

Variasi akibat pengaruh faktor lain dicirikan pada masing-masing kelompok dengan dispersi intragrup j 2 .

.

Terdapat hubungan antara varians total 0 2 , varians intragrup 2 dan varians antargrup:

0 2 = + 2 .

Varians intragrup menjelaskan pengaruh faktor-faktor yang tidak diperhitungkan saat pengelompokan, dan varians antargrup menjelaskan pengaruh faktor pengelompokan terhadap rata-rata grup /2/.

1.2 Analisis varians satu arah

Model dispersi satu faktor memiliki bentuk:

x ij = + F j + ij , (1)

dimana ij adalah nilai variabel yang diteliti yang diperoleh pada faktor tingkat ke-i (i=1,2,...,т) dengan nomor urut ke-j (j=1,2,... ,n);

F i adalah efek akibat pengaruh tingkat faktor ke-i;

ij adalah komponen acak, atau gangguan yang disebabkan oleh pengaruh faktor yang tidak dapat dikendalikan, yaitu. variasi dalam satu tingkat.

Prasyarat dasar untuk analisis varians:

Ekspektasi matematis dari gangguan ij sama dengan nol untuk setiap i, mis.

M(ε ij) = 0; (2)

Gangguan ij saling bebas;

Varians variabel x ij (atau gangguan ij) konstan untuk

setiap i, j, yaitu

D(ε ij) = 2 ; (3)

Variabel x ij (atau gangguan ε ij) memiliki hukum normal

distribusi N(0;σ 2).

Pengaruh tingkat faktor dapat berupa tetap atau sistematis (Model I) atau acak (Model II).

Mari, misalnya, perlu untuk mengetahui apakah ada perbedaan yang signifikan antara batch produk dalam hal beberapa indikator kualitas, yaitu. periksa dampaknya terhadap kualitas satu faktor - sekumpulan produk. Jika semua batch bahan baku dimasukkan dalam penelitian, maka pengaruh tingkat faktor tersebut adalah sistematis (model I), dan temuan hanya berlaku untuk batch individu yang terlibat dalam penelitian. Jika kita memasukkan hanya sebagian dari pihak yang dipilih secara acak, maka pengaruh faktor tersebut adalah acak (model II). Dalam kompleks multifaktorial, model campuran III dimungkinkan, di mana beberapa faktor memiliki tingkat acak, sementara yang lain tetap.

Biarkan ada m batch produk. Dari setiap batch, masing-masing, n 1 , n 2 , ..., n m produk dipilih (untuk kesederhanaan, diasumsikan bahwa n 1 =n 2 =...=n m =n). Nilai-nilai indikator kualitas produk ini disajikan dalam matriks pengamatan:

x 11 x 12 … x 1n

x 21 x 22 … x 2n

………………… = (x ij), (i = 1.2, …, m; j = 1.2, …, n).

x m 1 x m 2 … x mn

Penting untuk memeriksa signifikansi pengaruh batch produk pada kualitasnya.

Jika kita berasumsi bahwa elemen-elemen dari baris-baris matriks observasi adalah nilai numerik dari variabel acak X 1 ,X 2 ,...,X m , yang menyatakan kualitas produk dan memiliki hukum distribusi normal dengan ekspektasi matematis, berturut-turut a 1 ,a 2 ,...,a m dan varians identik 2 , maka masalah ini direduksi menjadi pengujian hipotesis nol H 0: a 1 =a 2 =...= a m , dilakukan dalam analisis perbedaan.

Rata-rata pada beberapa indeks ditunjukkan dengan tanda bintang (atau titik) alih-alih indeks, maka indikator kualitas rata-rata produk batch ke-i, atau rata-rata grup untuk tingkat faktor ke-i, akan mengambil membentuk:

di mana i * adalah nilai rata-rata di atas kolom;

Ij adalah elemen dari matriks observasi;

n adalah ukuran sampel.

Dan rata-rata keseluruhan:

. (5)

Jumlah deviasi kuadrat dari pengamatan x ij dari rata-rata total ** terlihat seperti ini:

2 = 2 + 2 +

2 2 . (6)

Q \u003d Q 1 + Q 2 + Q 3.

Suku terakhir adalah nol

karena jumlah penyimpangan nilai variabel dari meannya sama dengan nol, mis.

2 =0.

Suku pertama dapat ditulis sebagai:

Hasilnya adalah identitas:

Q = Q1 + Q2 , (8)

di mana - total, atau total, jumlah deviasi kuadrat;

- jumlah deviasi kuadrat dari rata-rata grup dari rata-rata total, atau jumlah intergroup (faktorial) dari deviasi kuadrat;

- jumlah deviasi kuadrat dari pengamatan dari rata-rata grup, atau jumlah deviasi kuadrat intragrup (sisa).

Ekspansi (8) berisi gagasan utama analisis varians. Sehubungan dengan masalah yang sedang dipertimbangkan, kesetaraan (8) menunjukkan bahwa keseluruhan variasi indikator kualitas, diukur dengan jumlah Q, terdiri dari dua komponen - Q 1 dan Q 2, yang mencirikan variabilitas indikator ini antar batch (Q 1 ) dan variabilitas dalam batch (Q 2), yang mencirikan variasi yang sama untuk semua batch di bawah pengaruh faktor yang tidak terhitung.

Dalam analisis varians, bukan jumlah deviasi kuadrat itu sendiri yang dianalisis, tetapi apa yang disebut kuadrat rata-rata, yang merupakan estimasi tak bias dari varians yang sesuai, yang diperoleh dengan membagi jumlah deviasi kuadrat dengan jumlah derajat yang sesuai. kebebasan.

Jumlah derajat kebebasan didefinisikan sebagai jumlah total pengamatan dikurangi jumlah persamaan yang menghubungkannya. Oleh karena itu, untuk kuadrat rata-rata s 1 2 , yang merupakan penduga tak bias dari varians antargrup, jumlah derajat kebebasan k 1 =m-1, karena mean grup m saling berhubungan dengan satu persamaan (5) digunakan dalam perhitungannya. Dan untuk kuadrat rata-rata s22, yang merupakan penduga tak bias dari varians intragrup, jumlah derajat kebebasannya adalah k2=mn-m, karena itu dihitung dengan menggunakan semua mn pengamatan yang saling berhubungan dengan m persamaan (4).

Dengan demikian:

Jika kita menemukan ekspektasi matematis dari kuadrat rata-rata dan , substitusikan ekspresi xij (1) ke dalam rumusnya melalui parameter model, kita dapatkan:

(9)

karena dengan mempertimbangkan sifat-sifat ekspektasi matematis

sebuah

(10)

Untuk model I dengan tingkat faktor F i yang tetap (i=1,2,...,m) adalah nilai non-acak, oleh karena itu

M(S) = 2 /(m-1) +σ 2 .

Hipotesis H 0 berbentuk F i = F * (i = 1,2,...,m), yaitu. pengaruh semua tingkat faktor adalah sama. Jika hipotesis ini benar

M(S)= M(S)= 2 .

Untuk model acak II, istilah F i dalam ekspresi (1) adalah nilai acak. Menunjukkannya dengan varians

kita peroleh dari (9)

(11)

dan, seperti pada model I

Tabel 1.1 menyajikan gambaran umum perhitungan nilai menggunakan analisis varians.

Tabel 1.1 - Tabel dasar analisis varians

komponen varians

Jumlah kuadrat

Jumlah derajat kebebasan

Persegi sedang

Harapan kuadrat rata-rata

antarkelompok

intragrup

Hipotesis H 0 akan berbentuk F 2 =0. Jika hipotesis ini benar

M(S)= M(S)= 2 .

Dalam kasus kompleks satu faktor untuk model I dan model II, kuadrat rata-rata S 2 dan S 2 adalah estimasi tak bias dan independen dari varians yang sama 2 .

Akibatnya, pengujian hipotesis nol H 0 dikurangi untuk menguji signifikansi perbedaan antara estimasi sampel yang tidak bias S dan S dari varians 2 .

Hipotesis H 0 ditolak jika nilai statistik yang sebenarnya dihitung F = S/S lebih besar dari nilai kritis F : K 1: K 2 , ditentukan pada taraf signifikansi dengan jumlah derajat kebebasan k 1 = m-1 dan k 2 =mn-m, dan diterima jika F< F α: K 1: K 2 .

Distribusi Fisher F (untuk x > 0) memiliki fungsi kerapatan berikut (untuk = 1, 2, ...; = 1, 2, ...):

di mana - derajat kebebasan;

G - fungsi gamma.

Sehubungan dengan masalah ini, sanggahan hipotesis H 0 berarti adanya perbedaan yang signifikan dalam kualitas produk dari batch yang berbeda pada tingkat signifikansi yang dipertimbangkan.

Untuk menghitung jumlah kuadrat Q 1 , Q 2 , Q sering kali lebih mudah menggunakan rumus berikut:

(12)

(13)

(14)

itu. umumnya tidak perlu mencari rata-ratanya sendiri.

Dengan demikian, prosedur analisis varians satu arah terdiri dari pengujian hipotesis H 0 bahwa ada satu kelompok data eksperimen homogen terhadap alternatif yang ada lebih dari satu kelompok tersebut. Homogenitas mengacu pada kesamaan sarana dan varians dalam setiap subset data. Dalam hal ini, varians dapat diketahui dan tidak diketahui sebelumnya. Jika ada alasan untuk percaya bahwa varians pengukuran yang diketahui atau tidak diketahui adalah sama di seluruh kumpulan data, maka tugas analisis varians satu arah direduksi menjadi mempelajari signifikansi perbedaan rata-rata dalam kelompok data / 1/.

1.3 Dispersi multivariat analisis

Harus segera dicatat bahwa tidak ada perbedaan mendasar antara analisis varians multivariat dan faktor tunggal. Analisis multivariat tidak mengubah logika umum analisis varians, tetapi hanya sedikit memperumitnya, karena, selain memperhitungkan pengaruh masing-masing faktor terhadap variabel terikat secara terpisah, efek gabungannya juga harus dinilai. Dengan demikian, hal baru yang dibawa oleh analisis varians multivariat ke dalam analisis data terutama menyangkut kemampuan untuk menilai interaksi antarfaktorial. Namun, masih mungkin untuk mengevaluasi pengaruh masing-masing faktor secara terpisah. Dalam pengertian ini, prosedur analisis varians multivariat (dalam varian penggunaan komputernya) tidak diragukan lagi lebih ekonomis, karena hanya dalam satu kali menyelesaikan dua masalah sekaligus: pengaruh masing-masing faktor dan interaksinya diperkirakan / 3/.

Skema umum percobaan dua faktor yang datanya diolah dengan analisis varians adalah sebagai berikut:



Gambar 1.1 - Skema percobaan dua faktor

Data yang menjadi sasaran analisis varians multivariat sering diberi label menurut jumlah faktor dan levelnya.

Dengan asumsi bahwa dalam pertimbangan masalah kualitas m batch yang berbeda, produk diproduksi pada t mesin yang berbeda dan diperlukan untuk mengetahui apakah ada perbedaan yang signifikan dalam kualitas produk untuk setiap faktor:

A - sekumpulan produk;

B - mesin.

Hasilnya adalah transisi ke masalah analisis varians dua faktor.

Semua data disajikan dalam tabel 1.2, di mana baris - tingkat A i faktor A, kolom - tingkat B j faktor B, dan di sel tabel yang sesuai adalah nilai indikator kualitas produk x ijk (i = 1.2, ... ,m; j=1,2,...,l; k=1,2,...,n).

Tabel 1.2 - Indikator kualitas produk

x 11l ,…,x 11k

x 12l ,…,x 12k

x 1jl ,…,x 1jk

x 1ll ,…,x1lk

x 2 1l ,…,x 2 1k

x 22l ,…,x 22k

x 2jl ,…,x 2jk

x 2ll ,…,x 2lk

x i1l ,…,x i1k

x i2l ,…,x i2k

xijl ,…,xijk

xjll ,…,xjlk

x m1l ,…,x m1k

x m2l ,…,x m2k

xmjl ,…,xmjk

x ml ,…, x mlk

Model dispersi dua faktor memiliki bentuk:

x ijk =μ+F i +G j +I ij +ε ijk , (15)

dimana x ijk adalah nilai pengamatan pada sel ij dengan angka k;

- rata-rata umum;

F i - efek karena pengaruh tingkat ke-i dari faktor A;

G j - efek karena pengaruh tingkat ke-j faktor B;

I ij - efek karena interaksi dua faktor, yaitu. penyimpangan dari rata-rata untuk pengamatan di sel ij dari jumlah tiga suku pertama dalam model (15);

ijk - gangguan karena variasi variabel dalam satu sel.

Diasumsikan bahwa ijk memiliki distribusi normal N(0; 2), dan semua ekspektasi matematis F * , G * , I i * , I * j sama dengan nol.

Rata-rata grup ditemukan dengan rumus:

Dalam sel:

per baris:

menurut kolom:

rata-rata keseluruhan:

Tabel 1.3 menyajikan gambaran umum perhitungan nilai menggunakan analisis varians.

Tabel 1.3 - Tabel dasar analisis varians

komponen varians

Jumlah kuadrat

Jumlah derajat kebebasan

Kotak tengah

Antarkelompok (faktor A)

Antarkelompok (faktor B)

Interaksi

Sisa

Memeriksa hipotesis nol HA, HB, HAB tentang tidak adanya pengaruh pada variabel yang dipertimbangkan faktor A, B dan interaksinya AB dilakukan dengan membandingkan rasio , , (untuk model I dengan tingkat faktor tetap) atau rasio , , (untuk model acak II) dengan nilai tabular yang sesuai kriteria F - Fisher-Snedecor. Untuk model campuran III, pengujian hipotesis mengenai faktor-faktor dengan level tetap dilakukan dengan cara yang sama seperti pada model II, dan untuk faktor-faktor dengan level acak, seperti pada model I.

Jika n=1, mis. dengan satu pengamatan dalam sel, maka tidak semua hipotesis nol dapat diuji, karena komponen Q3 jatuh dari jumlah total deviasi kuadrat, dan dengan itu kuadrat rata-rata, karena dalam hal ini tidak ada pertanyaan tentang interaksi faktor.

Dari sudut pandang teknik komputasi, untuk mencari jumlah kuadrat Q 1, Q 2, Q 3, Q 4, Q, lebih baik menggunakan rumus:

Q 3 \u003d Q - Q 1 - Q 2 - Q 4.

Penyimpangan dari prasyarat dasar analisis varians - normalitas distribusi variabel yang diteliti dan kesetaraan varians dalam sel (jika tidak berlebihan) - tidak berpengaruh secara signifikan terhadap hasil analisis varians dengan jumlah pengamatan yang sama dalam sel, tetapi bisa sangat sensitif jika jumlahnya tidak sama. Selain itu, dengan jumlah pengamatan yang tidak sama dalam sel, kompleksitas peralatan untuk analisis varians meningkat tajam. Oleh karena itu, direkomendasikan untuk merancang skema dengan jumlah pengamatan yang sama dalam sel, dan jika ada data yang hilang, maka kompensasikan dengan nilai rata-rata pengamatan lain dalam sel. Namun, dalam kasus ini, data hilang yang diperkenalkan secara artifisial tidak boleh diperhitungkan saat menghitung jumlah derajat kebebasan /1/.

2 Penerapan ANOVA dalam berbagai proses dan studi

2.1 Menggunakan analisis varians dalam studi proses migrasi

Migrasi merupakan fenomena sosial yang kompleks yang sangat menentukan aspek ekonomi dan politik masyarakat. Studi tentang proses migrasi dikaitkan dengan identifikasi faktor-faktor yang menarik, kepuasan dengan kondisi kerja, dan penilaian pengaruh faktor-faktor yang diperoleh pada pergerakan populasi antarkelompok.

ij = c i q ij a j ,

di mana ij adalah intensitas transisi dari grup asli i (output) ke grup baru j (input);

c i – kemungkinan dan kemampuan untuk meninggalkan grup i (c i 0);

q ij – daya tarik kelompok baru dibandingkan dengan yang asli (0≤q ij 1);

a j – ketersediaan grup j (a j 0).

ij n i ij =n i c i q ij a j . (enambelas)

Dalam prakteknya, untuk seorang individu, probabilitas p untuk pindah ke kelompok lain kecil, dan ukuran kelompok n yang dipertimbangkan besar. Dalam hal ini berlaku hukum kejadian langka, yaitu limit ij adalah distribusi Poisson dengan parameter =np:

.

Ketika meningkat, distribusi mendekati normal. Nilai transformasi ij dapat dianggap terdistribusi normal.

Jika kita mengambil logaritma dari ekspresi (16) dan membuat perubahan variabel yang diperlukan, maka kita dapat memperoleh model analisis varians:

ln√ν ij =½lnν ij =½(lnn i +lnc i +lnq ij +lna j)+ε ij ,

X i,j =2ln√ν ij -lnn i -lnq ij ,

Xi,j =Ci +Aj +ε.

Nilai C i dan A j memungkinkan untuk mendapatkan model ANOVA dua arah dengan satu pengamatan per sel. Transformasi terbalik dari C i dan A j menghitung koefisien c i dan a j .

Saat melakukan analisis varians, nilai berikut harus diambil sebagai nilai fitur efektif Y:

X \u003d (X 1.1 + X 1.2 +: + X mi, mj) / mimj,

dimana mimj adalah estimasi dari ekspektasi matematis X i,j ;

X mi dan X mj - masing-masing, jumlah grup keluar dan masuk.

Level faktor I akan menjadi grup keluar mi, level faktor J akan menjadi grup entri mj. Mi=mj=m diasumsikan. Masalah muncul dalam pengujian hipotesis H I dan H J tentang persamaan harapan matematis nilai Y pada level I i dan pada level J j , i,j=1,…,m. Pengujian hipotesis H I didasarkan pada perbandingan nilai taksiran tak bias dari varians s I 2 dan s o 2 . Jika hipotesis H I benar, maka nilai F(I) = s I 2 /s o 2 berdistribusi Fisher dengan jumlah derajat kebebasan k 1 =m-1 dan k 2 =(m-1)(m- 1). Untuk tingkat signifikansi tertentu , titik kritis tangan kanan x pr, cr ditemukan. Jika nilai numerik F (I) dari kuantitas berada dalam interval (x pr, kr, +∞), maka hipotesis H I ditolak dan diyakini bahwa faktor I mempengaruhi fitur efektif. Tingkat pengaruh ini, berdasarkan hasil pengamatan, diukur dengan koefisien determinasi sampling, yang menunjukkan berapa proporsi varians fitur yang dihasilkan dalam sampel yang disebabkan oleh pengaruh faktor I di atasnya.Jika F ( saya) nomor

2.2 Prinsip analisis matematis dan statistik data penelitian biomedis

Tergantung pada tugas, volume dan sifat materi, jenis data dan hubungannya, ada pilihan metode pemrosesan matematis pada tahap baik pendahuluan (untuk menilai sifat distribusi dalam sampel penelitian) dan analisis akhir sesuai dengan tujuan penelitian. Aspek yang sangat penting adalah verifikasi homogenitas kelompok pengamatan yang dipilih, termasuk kelompok kontrol, yang dapat dilakukan baik oleh seorang ahli, atau dengan metode statistik multivariat (misalnya, menggunakan analisis klaster). Tetapi langkah pertama adalah menyusun kuesioner yang memberikan deskripsi standar tentang karakteristik. Apalagi dalam melakukan studi epidemiologi, dimana diperlukan kesatuan dalam memahami dan mendeskripsikan gejala yang sama oleh dokter yang berbeda, termasuk dengan mempertimbangkan rentang perubahannya (severity). Jika ada perbedaan signifikan dalam pendaftaran data awal (penilaian subjektif dari sifat manifestasi patologis oleh berbagai spesialis) dan ketidakmungkinan membawanya ke satu bentuk pada tahap pengumpulan informasi, maka apa yang disebut koreksi kovarian dapat dilakukan, yang melibatkan normalisasi variabel, yaitu penghapusan kelainan indikator dalam matriks data. "Koordinasi pendapat" dilakukan dengan mempertimbangkan spesialisasi dan pengalaman dokter, yang kemudian memungkinkan untuk membandingkan hasil pemeriksaan yang diperoleh mereka satu sama lain. Untuk ini, analisis multivariat varians dan analisis regresi dapat digunakan.

Tanda dapat berupa jenis yang sama, yang jarang, atau jenis yang berbeda. Istilah ini mengacu pada evaluasi metrologi yang berbeda. Tanda-tanda kuantitatif atau numerik adalah yang diukur pada skala tertentu dan pada skala interval dan rasio (kelompok I tanda). Kualitatif, peringkat atau penilaian digunakan untuk mengekspresikan istilah dan konsep medis yang tidak memiliki nilai numerik (misalnya, tingkat keparahan kondisi) dan diukur pada skala urutan (kelompok II tanda). Klasifikasi atau nominal (misalnya, profesi, golongan darah) - ini diukur dalam skala nama (kelompok III tanda).

Dalam banyak kasus, upaya dilakukan untuk menganalisis sejumlah besar fitur, yang akan membantu meningkatkan konten informasi dari sampel yang disajikan. Namun, pemilihan informasi yang berguna, yaitu implementasi seleksi fitur, adalah operasi yang mutlak diperlukan, karena untuk memecahkan masalah klasifikasi, informasi yang membawa informasi yang berguna untuk tugas ini harus dipilih. Jika untuk beberapa alasan ini tidak dilakukan oleh peneliti sendiri atau tidak ada kriteria yang cukup kuat untuk mengurangi dimensi ruang fitur untuk alasan yang berarti, perang melawan redundansi informasi sudah dilakukan dengan metode formal oleh menilai isi informasi.

Analisis varians memungkinkan Anda untuk menentukan pengaruh berbagai faktor (kondisi) pada sifat (fenomena) yang diteliti, yang dicapai dengan menguraikan variabilitas total (dispersi yang dinyatakan sebagai jumlah deviasi kuadrat dari rata-rata umum) menjadi komponen individual yang disebabkan oleh pengaruh berbagai sumber variabilitas.

Dengan bantuan analisis varians, ancaman penyakit diperiksa dengan adanya faktor risiko. Konsep risiko relatif mempertimbangkan hubungan antara pasien dengan penyakit tertentu dan mereka yang tidak mengidapnya. Nilai risiko relatif memungkinkan untuk menentukan berapa kali kemungkinan sakit meningkat di hadapannya, yang dapat diperkirakan dengan menggunakan rumus sederhana berikut:

di mana a adalah kehadiran suatu sifat dalam kelompok studi;

b - tidak adanya suatu sifat dalam kelompok studi;

c - adanya tanda pada kelompok pembanding (kontrol);

d - tidak adanya tanda pada kelompok pembanding (kontrol).

Skor risiko atribut (rA) digunakan untuk menilai proporsi morbiditas yang terkait dengan faktor risiko tertentu:

,

di mana Q adalah frekuensi sifat penanda risiko dalam populasi;

r" - risiko relatif.

Identifikasi faktor-faktor yang berkontribusi terhadap terjadinya (manifestasi) penyakit, yaitu faktor risiko dapat dilakukan dengan berbagai cara, misalnya, dengan menilai konten informasi dengan peringkat tanda berikutnya, yang, bagaimanapun, tidak menunjukkan efek kumulatif dari parameter yang dipilih, berbeda dengan penggunaan regresi, analisis faktor, metode teori pengenalan pola, yang memungkinkan untuk memperoleh "kompleks gejala" faktor risiko. Selain itu, metode yang lebih canggih memungkinkan untuk menganalisis hubungan tidak langsung antara faktor risiko dan penyakit /5/.

2.3 Bioassay tanah

Polutan yang beragam, masuk ke agrocenosis, dapat mengalami berbagai transformasi di dalamnya, sambil meningkatkan efek toksiknya. Untuk alasan ini, metode penilaian integral kualitas komponen agrocenosis ternyata diperlukan. Studi dilakukan atas dasar analisis varians multivariat dalam rotasi tanaman baris 11-bidang biji-rumput-rumput. Dalam percobaan, pengaruh faktor-faktor berikut dipelajari: kesuburan tanah (A), sistem pemupukan (B), sistem perlindungan tanaman (C). Kesuburan tanah, sistem pemupukan dan sistem perlindungan tanaman dipelajari pada dosis 0, 1, 2 dan 3. Pilihan dasar diwakili oleh kombinasi berikut:

000 - tingkat kesuburan awal, tanpa menggunakan pupuk dan produk perlindungan tanaman dari hama, penyakit dan gulma;

111 - tingkat kesuburan tanah rata-rata, dosis pupuk minimum, perlindungan biologis tanaman dari hama dan penyakit;

222 - tingkat awal kesuburan tanah, dosis rata-rata pupuk, perlindungan kimia tanaman dari gulma;

333 - tingkat kesuburan tanah yang tinggi, dosis pupuk yang tinggi, perlindungan kimia tanaman dari hama dan penyakit.

Kami mempelajari opsi di mana hanya ada satu faktor:

200 - kesuburan:

020 - pupuk;

002 - produk perlindungan tanaman.

Serta opsi dengan kombinasi faktor yang berbeda - 111, 131, 133, 022, 220, 202, 331, 313, 311.

Penelitian ini bertujuan untuk mempelajari daya hambat kloroplas dan koefisien pertumbuhan sesaat sebagai indikator pencemaran tanah pada berbagai varian percobaan multifaktorial.

Penghambatan fototaksis kloroplas duckweed dipelajari di cakrawala tanah yang berbeda: 0-20, 20-40 cm. Bagian dalam total dispersi kesuburan tanah adalah 39,7%, sistem pemupukan - 30,7%, sistem perlindungan tanaman - 30,7%.

Untuk mempelajari efek gabungan faktor-faktor pada penghambatan fototaksis kloroplas, berbagai kombinasi varian eksperimental digunakan: dalam kasus pertama - 000, 002, 022, 222, 220, 200, 202, 020, dalam kasus kedua - 111, 333, 331, 313, 133, 311, 131.

Hasil analisis varians dua arah menunjukkan pengaruh yang signifikan dari interaksi pupuk dan sistem perlindungan tanaman terhadap perbedaan fototaksis untuk kasus pertama (bagian dalam varians total adalah 10,3%). Untuk kasus kedua, ditemukan pengaruh yang signifikan dari interaksi kesuburan tanah dan sistem pemupukan (53,2%).

Analisis varians tiga arah menunjukkan dalam kasus pertama pengaruh yang signifikan dari interaksi ketiga faktor. Bagian dalam total dispersi adalah 47,9%.

Koefisien pertumbuhan sesaat dipelajari dalam berbagai varian percobaan 000, 111, 222, 333, 002, 200, 220. Tahap pertama pengujian adalah sebelum penerapan herbisida pada tanaman gandum musim dingin (April), tahap kedua - setelah aplikasi herbisida (Mei) dan terakhir - pada waktu panen (Juli). Pelopor - bunga matahari dan jagung untuk biji-bijian.

Munculnya pelepah baru diamati setelah fase lag singkat dengan periode penggandaan total bobot segar 2-4 hari.

Pada kontrol dan setiap varian, berdasarkan hasil yang diperoleh, dihitung koefisien pertumbuhan populasi sesaat r, dan kemudian dihitung waktu penggandaan jumlah pelepah (t penggandaan).

t ganda \u003d ln2 / r.

Perhitungan indikator-indikator tersebut dilakukan secara dinamis dengan analisis sampel tanah. Analisis data menunjukkan bahwa waktu penggandaan populasi duckweed sebelum pengolahan tanah paling singkat dibandingkan dengan data setelah pengolahan tanah dan pada saat panen. Dalam dinamika pengamatan, respon tanah setelah aplikasi herbisida dan pada saat panen lebih menarik. Pertama-tama, interaksi dengan pupuk dan tingkat kesuburan.

Terkadang mendapatkan respons langsung terhadap aplikasi sediaan kimia dapat menjadi rumit karena interaksi sediaan dengan pupuk, baik organik maupun mineral. Data yang diperoleh memungkinkan untuk melacak dinamika respons sediaan yang diterapkan, dalam semua varian dengan perlindungan kimia, di mana pertumbuhan indikator dihentikan.

Data analisis varians satu arah menunjukkan pengaruh yang signifikan dari masing-masing indikator terhadap laju pertumbuhan duckweed tahap I. Pada tahap kedua, pengaruh perbedaan kesuburan tanah sebesar 65,0%, pada sistem pemupukan dan sistem perlindungan tanaman masing-masing 65,0%. Faktor-faktor tersebut menunjukkan perbedaan yang signifikan antara varian 222 dan varian 000, 111.333, rata-rata dalam hal koefisien pertumbuhan sesaat.Pada tahap ketiga, pangsa penyebaran total kesuburan tanah adalah 42,9%, sistem pemupukan dan perlindungan tanaman sistem - masing-masing 42,9%. Perbedaan signifikan dicatat dalam nilai rata-rata opsi 000 dan 111, opsi 333 dan 222.

Sampel tanah yang dipelajari dari opsi pemantauan lapangan berbeda satu sama lain dalam hal penghambatan fototaksis. Pengaruh faktor kesuburan dicatat, sistem pemupukan dan produk perlindungan tanaman dengan pangsa 30,7 dan 39,7% dalam analisis faktor tunggal, dalam analisis dua faktor dan tiga faktor, pengaruh gabungan faktor dicatat.

Analisis hasil eksperimen menunjukkan perbedaan yang tidak signifikan antara cakrawala tanah dalam hal indikator penghambatan fototaksis. Perbedaan ditandai dengan nilai rata-rata.

Di semua varian di mana terdapat produk perlindungan tanaman, perubahan posisi kloroplas dan penghambatan pertumbuhan duckweed lebih sedikit diamati /6/.

2.4 Influenza menyebabkan peningkatan produksi histamin

Para peneliti di Rumah Sakit Anak di Pittsburgh (AS) telah menerima bukti pertama bahwa kadar histamin meningkat dengan infeksi virus pernapasan akut. Terlepas dari kenyataan bahwa histamin sebelumnya telah disarankan untuk berperan dalam timbulnya gejala infeksi saluran pernapasan akut pada saluran pernapasan bagian atas.

Para ilmuwan tertarik pada mengapa banyak orang menggunakan antihistamin, yang di banyak negara termasuk dalam kategori OTC, untuk pengobatan sendiri "pilek" dan flu biasa. tersedia tanpa resep dokter.

Tujuan dari penelitian ini adalah untuk mengetahui apakah produksi histamin meningkat selama percobaan infeksi virus influenza A.

15 sukarelawan sehat disuntik secara intranasal dengan virus influenza A dan kemudian diamati perkembangan infeksinya. Setiap hari selama perjalanan penyakit, porsi urin pagi dikumpulkan dari sukarelawan, dan kemudian histamin dan metabolitnya ditentukan, dan jumlah total histamin dan metabolitnya yang diekskresikan per hari dihitung.

Penyakit ini berkembang di semua 15 sukarelawan. Analisis varians mengkonfirmasi tingkat histamin yang secara signifikan lebih tinggi dalam urin pada hari ke-2-5 infeksi virus (p<0,02) - период, когда симптомы «простуды» наиболее выражены. Парный анализ показал, что наиболее значительно уровень гистамина повышается на 2 день заболевания. Кроме этого, оказалось, что суточное количество гистамина и его метаболитов в моче при гриппе примерно такое же, как и при обострении аллергического заболевания.

Hasil penelitian ini memberikan bukti langsung pertama bahwa kadar histamin meningkat pada infeksi saluran pernapasan akut /7/.

Analisis varians dalam kimia

Analisis dispersi adalah seperangkat metode untuk menentukan dispersi, yaitu karakteristik ukuran partikel dalam sistem dispersi. Analisis dispersi mencakup berbagai metode untuk menentukan ukuran partikel bebas dalam media cair dan gas, ukuran saluran pori dalam benda berpori halus (dalam hal ini, konsep ekivalen porositas digunakan sebagai pengganti konsep dispersi), serta luas permukaan spesifik. Beberapa metode analisis dispersi memungkinkan untuk memperoleh gambaran lengkap tentang distribusi partikel berdasarkan ukuran (volume), sementara yang lain hanya memberikan karakteristik rata-rata dispersi (porositas).

Kelompok pertama mencakup, misalnya, metode untuk menentukan ukuran partikel individu dengan pengukuran langsung (analisis saringan, mikroskop optik dan elektron) atau dengan data tidak langsung: laju pengendapan partikel dalam media kental (analisis sedimentasi dalam medan gravitasi dan dalam sentrifugal), besarnya pulsa arus listrik, yang timbul dari lewatnya partikel melalui lubang di partisi non-konduktif (metode konduktometri).

Kelompok metode kedua menggabungkan estimasi ukuran rata-rata partikel bebas dan penentuan luas permukaan spesifik bubuk dan benda berpori. Ukuran partikel rata-rata ditemukan oleh intensitas cahaya yang tersebar (nefelometri), menggunakan ultramikroskop, metode difusi, dll., Permukaan spesifik ditemukan dengan adsorpsi gas (uap) atau zat terlarut, dengan permeabilitas gas, laju disolusi, dan metode lainnya. Di bawah ini adalah batas penerapan berbagai metode analisis varians (ukuran partikel dalam meter):

Analisis saringan - 10 -2 -10 -4

Analisis Sedimentasi di Medan Gravitasi - 10 -4 -10 -6

Metode konduktometri - 10 -4 -10 -6

Mikroskop - 10 -4 -10 -7

Metode filtrasi - 10 -5 -10 -7

Sentrifugasi - 10 -6 -10 -8

Ultrasentrifugasi - 10 -7 -10 -9

Ultramikroskopi - 10 -7 -10 -9

Nefelometri - 10 -7 -10 -9

Mikroskop elektron - 10 -7 -10 -9

Metode difusi - 10 -7 -10 -10

Analisis dispersi banyak digunakan dalam berbagai bidang ilmu pengetahuan dan produksi industri untuk menilai dispersi sistem (suspensi, emulsi, sol, serbuk, adsorben, dll) dengan ukuran partikel dari beberapa milimeter (10 -3 m) hingga beberapa nanometer (10 -9 m) /8/.

2.6 Penggunaan sugesti langsung yang disengaja dalam keadaan terjaga dalam metode pendidikan kualitas fisik

Pelatihan fisik adalah sisi dasar dari pelatihan olahraga, karena, pada tingkat yang lebih besar daripada aspek pelatihan lainnya, ini ditandai dengan beban fisik yang memengaruhi sifat morfologis dan fungsional tubuh. Keberhasilan latihan teknis, isi taktik seorang atlet, terwujudnya sifat-sifat pribadi dalam proses latihan dan kompetisi tergantung pada tingkat kebugaran jasmani.

Salah satu tugas utama pelatihan fisik adalah pendidikan kualitas fisik. Dalam hal ini, ada kebutuhan untuk mengembangkan alat dan metode pedagogis yang memungkinkan dengan mempertimbangkan karakteristik usia atlet muda yang menjaga kesehatan mereka, tidak memerlukan waktu tambahan dan pada saat yang sama merangsang pertumbuhan kualitas fisik dan, sebagai hasil, sportivitas. Penggunaan heteroinfluence verbal dalam proses pelatihan dalam kelompok pelatihan utama adalah salah satu bidang penelitian yang menjanjikan tentang masalah ini.

Analisis teori dan praktik penerapan hetero-influence verbal yang menginspirasi mengungkapkan kontradiksi utama:

Bukti penggunaan yang efektif dari metode-metode khusus dari heteroinfluence verbal dalam proses pelatihan dan ketidakmungkinan praktis penggunaannya oleh seorang pelatih;

Pengakuan sugesti langsung yang disengaja (selanjutnya disebut sebagai DSP) dalam keadaan terjaga sebagai salah satu metode utama heteroinfluence verbal dalam aktivitas pedagogis pelatih dan kurangnya pembenaran teoretis untuk fitur metodologis penggunaannya dalam pelatihan olahraga, dan khususnya dalam proses mendidik kualitas fisik.

Sehubungan dengan kontradiksi yang diidentifikasi dan perkembangan yang tidak memadai, masalah penggunaan sistem metode heteroinfluence verbal dalam proses mendidik kualitas fisik atlet telah menentukan tujuan penelitian - untuk mengembangkan metode PPV yang ditargetkan secara rasional dalam keadaan terjaga, berkontribusi pada peningkatan proses pendidikan kualitas fisik berdasarkan penilaian keadaan mental, manifestasi dan dinamika kualitas fisik judoist dari kelompok pelatihan dasar.

Untuk menguji dan menentukan efektivitas metode eksperimental PPV dalam pengembangan kualitas fisik pegulat judo, percobaan pedagogis komparatif dilakukan, di mana empat kelompok mengambil bagian - tiga eksperimental dan satu kontrol. Pada kelompok eksperimen pertama (EG) digunakan teknik PPV M1, pada kelompok kedua - teknik PPV M2, pada kelompok ketiga - teknik PPV M3. Pada kelompok kontrol (CG), metode PPV tidak digunakan.

Untuk menentukan efektivitas dampak pedagogis metode PPV dalam proses pendidikan kualitas fisik di antara judoka, analisis varians satu faktor dilakukan.

Tingkat pengaruh metodologi PPV M1 dalam proses pendidikan:

Daya tahan:

a) setelah bulan ketiga adalah 11,1%;

Kemampuan kecepatan:

a) setelah bulan pertama - 16,4%;

b) setelah yang kedua - 26,5%;

c) setelah yang ketiga - 34,8%;

a) setelah bulan kedua - 26,7%;

b) setelah yang ketiga - 35,3%;

Fleksibilitas:

a) setelah bulan ketiga - 20,8%;

a) setelah bulan kedua eksperimen pedagogis utama, tingkat pengaruh metodologi adalah 6,4%;

b) setelah yang ketiga - 10,2%.

Akibatnya, perubahan signifikan dalam indikator tingkat perkembangan kualitas fisik menggunakan metode PPV M1 ditemukan dalam kemampuan kecepatan dan kekuatan, tingkat pengaruh metode dalam hal ini adalah yang terbesar. Tingkat pengaruh metodologi yang paling kecil ditemukan dalam proses mendidik daya tahan, fleksibilitas, dan kemampuan koordinasi, yang memberikan alasan untuk berbicara tentang ketidakefektifan yang tidak memadai dari penggunaan metode PPV M1 dalam mendidik kualitas-kualitas ini.

Tingkat pengaruh metodologi PPV M2 dalam proses pendidikan:

Daya tahan

a) setelah bulan pertama percobaan - 12,6%;

b) setelah yang kedua - 17,8%;

c) setelah yang ketiga - 20,3%.

Kemampuan kecepatan:

a) setelah bulan ketiga sesi pelatihan - 28%.

a) setelah bulan kedua - 27,9%;

b) setelah yang ketiga - 35,9%.

Fleksibilitas:

a) setelah bulan ketiga sesi pelatihan - 14,9%;

Kemampuan koordinasi - 13,1%.

Hasil yang diperoleh dari analisis varians faktor tunggal dari EG ini memungkinkan kita untuk menyimpulkan bahwa metode PPV M2 adalah yang paling efektif dalam pengembangan daya tahan dan kekuatan. Kurang efektif dalam proses pengembangan kelenturan, kecepatan dan kemampuan koordinasi.

Tingkat pengaruh metodologi PPV M3 dalam proses pendidikan:

Daya tahan:

a) setelah bulan pertama percobaan 16,8%;

b) setelah yang kedua - 29,5%;

c) setelah yang ketiga - 37,6%.

Kemampuan kecepatan:

a) setelah bulan pertama - 26,3%;

b) setelah yang kedua - 31,3%;

c) setelah yang ketiga - 40,9%.

a) setelah bulan pertama - 18,7%;

b) setelah yang kedua - 26,7%;

c) setelah yang ketiga - 32,3%.

Fleksibilitas:

a) setelah yang pertama - tidak ada perubahan;

b) setelah yang kedua - 16,9%;

c) setelah yang ketiga - 23,5%.

Kemampuan koordinasi:

a) tidak ada perubahan setelah bulan pertama;

b) setelah yang kedua - 23,8%;

c) setelah yang ketiga - 91%.

Dengan demikian, analisis varians satu faktor menunjukkan bahwa penggunaan teknik PPV M3 pada periode persiapan paling efektif dalam proses pendidikan kualitas fisik, karena ada peningkatan tingkat pengaruhnya setelah setiap bulan eksperimen pedagogis. /9/.

2.7 Meredakan gejala psikotik akut pada pasien dengan skizofrenia dengan antipsikotik atipikal

Tujuan dari penelitian ini adalah untuk mempelajari kemungkinan penggunaan rispolet untuk menghilangkan psikosis akut pada pasien yang didiagnosis dengan skizofrenia (tipe paranoid menurut ICD-10) dan gangguan skizoafektif. Pada saat yang sama, indikator durasi persistensi gejala psikotik di bawah farmakoterapi dengan rispolet (kelompok utama) dan antipsikotik klasik digunakan sebagai kriteria utama yang diteliti.

Tujuan utama dari penelitian ini adalah untuk menentukan indikator durasi psikosis (yang disebut psikosis bersih), yang dipahami sebagai pelestarian gejala psikotik produktif dari awal penggunaan antipsikotik, dinyatakan dalam hari. Indikator ini dihitung secara terpisah untuk kelompok risperidone dan secara terpisah untuk kelompok antipsikotik klasik.

Bersamaan dengan ini, tugas ditetapkan untuk menentukan proporsi pengurangan gejala produktif di bawah pengaruh risperidon dibandingkan dengan antipsikotik klasik pada periode terapi yang berbeda.

Sebanyak 89 pasien (42 pria dan 47 wanita) dengan gejala psikotik akut dalam bentuk paranoid skizofrenia (49 pasien) dan gangguan skizoafektif (40 pasien) dipelajari.

Episode pertama dan durasi penyakit hingga 1 tahun tercatat pada 43 pasien, sedangkan pada kasus lain pada saat penelitian, episode skizofrenia berikutnya tercatat dengan durasi penyakit lebih dari 1 tahun.

Terapi Rispoleptom diterima oleh 29 orang, di antaranya ada 15 pasien yang disebut episode pertama. Terapi dengan neuroleptik klasik diterima oleh 60 orang, di antaranya 28 orang dengan episode pertama. Dosis rispolept bervariasi antara 1 sampai 6 mg per hari dan rata-rata 4±0,4 mg/hari. Risperidone diminum secara eksklusif setelah makan sekali sehari di malam hari.

Terapi dengan antipsikotik klasik termasuk penggunaan trifluoperazine (triftazine) dengan dosis harian hingga 30 mg secara intramuskular, haloperidol dengan dosis harian hingga 20 mg secara intramuskular, triperidol dengan dosis harian hingga 10 mg secara oral. Sebagian besar pasien menggunakan antipsikotik klasik sebagai monoterapi selama dua minggu pertama, setelah itu mereka beralih, jika perlu (sambil mempertahankan gejala delusi, halusinasi atau produktif lainnya), ke kombinasi beberapa antipsikotik klasik. Pada saat yang sama, neuroleptik dengan efek anti-delusi dan anti-halusinasi elektif yang diucapkan (misalnya, haloperidol atau triftazin) tetap sebagai obat utama, obat dengan efek hipnosedatif yang berbeda (klorpromazin, tizersin, klorprotixena dalam dosis hingga 50-100 mg / hari) ditambahkan di malam hari.

Pada kelompok yang menggunakan antipsikotik klasik, direncanakan untuk menggunakan korektor antikolinergik (Parkopan, Cyclodol) dengan dosis hingga 10-12 mg/hari. Korektor diresepkan jika muncul efek samping ekstrapiramidal yang berbeda dalam bentuk distonia akut, parkinsonisme yang diinduksi obat, dan akatisia.

Tabel 2.1 menyajikan data tentang durasi psikosis dalam pengobatan rispolept dan antipsikotik klasik.

Tabel 2.1 - Durasi psikosis ("psikosis bersih") dalam pengobatan rispolept dan antipsikotik klasik

Sebagai berikut dari data dalam tabel, ketika membandingkan durasi psikosis selama terapi dengan antipsikotik klasik dan risperidone, ada pengurangan hampir dua kali lipat dalam durasi gejala psikotik di bawah pengaruh rispolet. Adalah penting bahwa baik faktor nomor seri kejang maupun sifat gambaran sindrom utama tidak mempengaruhi nilai durasi psikosis ini. Dengan kata lain, durasi psikosis ditentukan semata-mata oleh faktor terapi, yaitu tergantung pada jenis obat yang digunakan, terlepas dari nomor seri serangan, durasi penyakit dan sifat sindrom psikopatologis terkemuka.

Untuk mengkonfirmasi keteraturan yang diperoleh, analisis varians dua faktor dilakukan. Pada saat yang sama, interaksi faktor terapi dan nomor seri serangan (tahap 1) dan interaksi faktor terapi dan sifat sindrom utama (tahap 2) diperhitungkan secara bergantian. Hasil analisis varians menegaskan pengaruh faktor terapi terhadap durasi psikosis (F=18,8) tanpa adanya pengaruh faktor angka serangan (F=2,5) dan faktor jenis sindrom psikopatologis (F=1,7 ). Penting bahwa pengaruh bersama dari faktor terapi dan jumlah serangan pada durasi psikosis juga tidak ada, serta pengaruh bersama dari faktor terapi dan faktor sindrom psikopatologis.

Dengan demikian, hasil analisis varians mengkonfirmasi pengaruh hanya faktor antipsikotik yang diterapkan. Rispolept dengan tegas menyebabkan pengurangan durasi gejala psikotik dibandingkan dengan antipsikotik tradisional sekitar 2 kali. Penting bahwa efek ini dicapai meskipun pemberian rispolet secara oral, sedangkan antipsikotik klasik digunakan secara parenteral pada kebanyakan pasien /10/.

2.8 Pembengkokan benang hias dengan efek keliling

Universitas Teknologi Negeri Kostroma telah mengembangkan struktur ulir berbentuk baru dengan parameter geometris variabel. Dalam hal ini, ada masalah dalam pemrosesan benang hias dalam produksi persiapan. Studi ini dikhususkan untuk proses pelengkungan pada masalah: pilihan jenis tensioner yang memberikan penyebaran minimum ketegangan dan keselarasan ketegangan, benang kepadatan linier yang berbeda sepanjang lebar poros warping.

Objek penelitian adalah benang berbentuk linen empat varian kerapatan linier dari 140 hingga 205 tex. Pekerjaan perangkat tegangan dipelajari dari tiga jenis: pencuci porselen, NS-1P dua zona dan NS-1P zona tunggal. Studi eksperimental tentang ketegangan benang lengkung dilakukan pada mesin lengkung SP-140-3L. Kecepatan lengkungan, berat cakram rem sesuai dengan parameter teknologi lengkungan benang.

Untuk mempelajari ketergantungan tegangan ulir berbentuk pada parameter geometris selama pelengkungan, analisis dilakukan untuk dua faktor: X 1 - diameter efek, X 2 - panjang efek. Parameter keluaran adalah tegangan Y 1 dan fluktuasi tegangan Y 2 .

Persamaan regresi yang dihasilkan cukup untuk data eksperimen pada tingkat signifikansi 0,95, karena kriteria Fisher yang dihitung untuk semua persamaan lebih kecil daripada kriteria tabel.

Untuk mengetahui besarnya pengaruh faktor X 1 dan X 2 terhadap parameter Y 1 dan Y 2 dilakukan analisis varians yang menunjukkan bahwa diameter pengaruh lebih besar pengaruhnya terhadap tingkat dan fluktuasi tegangan. .

Analisis komparatif dari tensogram yang diperoleh menunjukkan bahwa penyebaran minimum tegangan selama pelengkungan benang ini disediakan oleh perangkat tegangan dua zona NS-1P.

Telah ditetapkan bahwa dengan peningkatan kepadatan linier dari 105 menjadi 205 tex, perangkat NS-1P memberikan peningkatan tingkat tegangan hanya 23%, sedangkan mesin cuci porselen - sebesar 37%, NS-1P zona tunggal - sebesar 53%.

Saat membentuk poros bengkok, termasuk ulir berbentuk dan "halus", perlu untuk menyesuaikan tensioner secara individual menggunakan metode tradisional /11/.

2.9 Patologi bersamaan dengan kehilangan gigi total pada orang tua dan pikun

Kehilangan gigi secara epidemiologis lengkap dan patologi bersamaan dari populasi lansia yang tinggal di panti jompo di wilayah Chuvashia telah dipelajari. Pemeriksaan dilakukan dengan cara pemeriksaan gigi dan pengisian kartu statistik sebanyak 784 orang. Hasil analisis menunjukkan persentase tinggi kehilangan gigi lengkap, diperburuk oleh patologi umum tubuh. Ini mencirikan kategori populasi yang diperiksa sebagai kelompok dengan risiko gigi yang meningkat dan memerlukan revisi terhadap seluruh sistem perawatan gigi mereka.

Pada usia lanjut, angka kejadiannya dua kali lipat, dan pada usia tua enam kali lipat lebih tinggi dibandingkan angka kejadian pada orang yang lebih muda.

Penyakit utama orang tua dan pikun adalah penyakit pada sistem peredaran darah, sistem saraf dan organ sensorik, organ pernapasan, organ pencernaan, tulang dan organ gerak, neoplasma dan cedera.

Tujuan dari penelitian ini adalah untuk mengembangkan dan memperoleh informasi tentang penyakit penyerta, efektivitas prostetik dan kebutuhan perawatan ortopedi pada lansia dan pikun dengan kehilangan gigi lengkap.

Sebanyak 784 orang berusia 45 hingga 90 tahun diperiksa. Rasio wanita dan pria adalah 2,8:1.

Evaluasi hubungan statistik menggunakan koefisien korelasi Pearson's rank memungkinkan untuk menetapkan pengaruh timbal balik dari tidak adanya gigi pada morbiditas penyerta dengan tingkat reliabilitas p=0,0005. Pasien lanjut usia dengan kehilangan gigi lengkap menderita penyakit karakteristik usia tua, yaitu aterosklerosis serebral dan hipertensi.

Analisis varians menunjukkan bahwa spesifisitas penyakit memainkan peran yang menentukan di bawah kondisi yang diteliti. Peranan bentuk nosologis pada periode usia yang berbeda berkisar antara 52-60%. Dampak signifikan secara statistik terbesar pada tidak adanya gigi disebabkan oleh penyakit pada sistem pencernaan dan diabetes mellitus.

Secara umum, kelompok pasien berusia 75-89 tahun ditandai dengan sejumlah besar penyakit patologis.

Pada penelitian ini dilakukan studi banding insiden komorbiditas pada pasien dengan kehilangan gigi lengkap pada lansia dan pikun yang tinggal di panti jompo. Persentase yang tinggi dari gigi yang hilang di antara orang-orang dari kelompok usia ini terungkap. Pada pasien dengan dentia lengkap, karakteristik komorbiditas pada usia ini diamati. Aterosklerosis dan hipertensi adalah yang paling umum di antara orang-orang yang diperiksa. Dampak pada keadaan rongga mulut penyakit seperti penyakit pada saluran pencernaan dan diabetes mellitus secara statistik signifikan, pangsa bentuk nozoologi lainnya berada di kisaran 52-60%. Penggunaan analisis varians tidak mengkonfirmasi peran signifikan jenis kelamin dan tempat tinggal pada indikator keadaan rongga mulut.

Jadi, sebagai kesimpulan, perlu dicatat bahwa analisis distribusi penyakit penyerta pada orang yang tidak memiliki gigi lengkap pada usia lanjut dan pikun menunjukkan bahwa kategori warga negara ini termasuk dalam kelompok khusus populasi yang harus menerima perawatan gigi yang memadai. perawatan dalam kerangka sistem gigi yang ada /12/ .

3 Analisis varians dalam konteks metode statistik

Metode analisis statistik adalah metodologi untuk mengukur hasil aktivitas manusia, yaitu mengubah karakteristik kualitatif menjadi kuantitatif.

Langkah-langkah utama dalam analisis statistik:

Menyusun rencana pengumpulan data awal - nilai-nilai variabel input (X 1 ,...,X p), jumlah observasi n. Langkah ini dilakukan ketika eksperimen direncanakan secara aktif.

Memperoleh data awal dan memasukkannya ke dalam komputer. Pada tahap ini, array bilangan terbentuk (x 1i ,..., x pi ; y 1i ,..., y qi), i=1,..., n, di mana n adalah ukuran sampel.

Pengolahan data statistik primer. Pada tahap ini, deskripsi statistik dari parameter yang dipertimbangkan terbentuk:

a) konstruksi dan analisis ketergantungan statistik;

b) analisis korelasi dirancang untuk mengevaluasi signifikansi pengaruh faktor (X 1 ,...,X p) terhadap respon Y;

c) analisis varians digunakan untuk mengevaluasi pengaruh faktor non-kuantitatif (X 1 ,...,X p) terhadap respons Y untuk memilih yang paling penting di antara faktor-faktor tersebut;

d) analisis regresi dirancang untuk menentukan ketergantungan analitis dari respon Y terhadap faktor kuantitatif X;

Interpretasi hasil dalam hal set tugas /13/.

Tabel 3.1 menunjukkan metode statistik yang digunakan untuk memecahkan masalah analitis. Sel-sel tabel yang sesuai berisi frekuensi penerapan metode statistik:

Label "-" - metode ini tidak diterapkan;

Label "+" - metode diterapkan;

Label "++" - metode ini banyak digunakan;

Label "+++" - penerapan metode ini menarik /14/.

Analisis varians, seperti uji-t Student, memungkinkan Anda untuk mengevaluasi perbedaan antara mean sampel; namun, tidak seperti uji-t, uji ini tidak memiliki batasan jumlah rata-rata yang dibandingkan. Jadi, alih-alih menanyakan apakah dua mean sampel berbeda, seseorang dapat menilai apakah dua, tiga, empat, lima, atau k mean berbeda.

ANOVA memungkinkan berurusan dengan dua atau lebih variabel independen (fitur, faktor) secara bersamaan, mengevaluasi tidak hanya efek masing-masing secara terpisah, tetapi juga efek interaksi antara mereka /15/.


Tabel 3.1 - Penerapan metode statistik dalam memecahkan masalah analitik

Tugas analitis yang timbul di bidang bisnis, keuangan, dan manajemen

Metode statistik deskriptif

Metode untuk memverifikasi hipotesis statistik

Metode analisis regresi

Metode analisis dispersi

Metode analisis multivariat

Metode Analisis Diskriminan

cluster-nogo

Metode Analisis

kemampuan bertahan hidup

Metode Analisis

dan ramalan

rangkaian waktu

Tugas analisis horizontal (temporal)

Tugas analisis vertikal (struktural)

Tugas analisis dan perkiraan tren

Tugas analisis indikator relatif

Tugas analisis komparatif (spasial)

Tugas analisis faktor

Untuk sebagian besar sistem yang kompleks, prinsip Pareto berlaku, yang menurutnya 20% faktor menentukan sifat sistem sebesar 80%. Oleh karena itu, tugas utama peneliti model simulasi adalah menghilangkan faktor-faktor yang tidak signifikan, yang memungkinkan pengurangan dimensi masalah optimasi model.

Analisis varians mengevaluasi penyimpangan pengamatan dari rata-rata keseluruhan. Kemudian variasi tersebut dipecah menjadi bagian-bagian yang masing-masing memiliki penyebabnya sendiri-sendiri. Bagian residual dari variasi, yang tidak dapat dikaitkan dengan kondisi percobaan, dianggap sebagai kesalahan acaknya. Untuk mengkonfirmasi signifikansi, tes khusus digunakan - F-statistik.

Analisis varians menentukan apakah ada efek. Analisis regresi memungkinkan Anda untuk memprediksi respons (nilai fungsi tujuan) di beberapa titik dalam ruang parameter. Tugas langsung dari analisis regresi adalah memperkirakan koefisien regresi /16/.

Ukuran sampel yang terlalu besar membuat analisis statistik menjadi sulit, jadi masuk akal untuk mengurangi ukuran sampel.

Dengan menerapkan analisis varians, dimungkinkan untuk mengidentifikasi signifikansi pengaruh berbagai faktor terhadap variabel yang diteliti. Jika pengaruh suatu faktor ternyata tidak signifikan, maka faktor tersebut dapat dikeluarkan dari pemrosesan lebih lanjut.

Ahli makroekonometrika harus mampu memecahkan empat masalah yang berbeda secara logis:

Deskripsi data;

Prakiraan ekonomi makro;

Inferensi struktural;

Analisis kebijakan.

Mendeskripsikan data berarti mendeskripsikan properti dari satu atau lebih deret waktu dan mengomunikasikan properti ini ke berbagai ekonom. Peramalan ekonomi makro berarti meramalkan jalannya perekonomian, biasanya dua sampai tiga tahun atau kurang (terutama karena terlalu sulit untuk meramalkan dalam jangka waktu yang lebih panjang). Inferensi struktural berarti memeriksa apakah data makroekonomi konsisten dengan teori ekonomi tertentu. Analisis kebijakan makroekonometrika berlangsung dalam beberapa arah: di satu sisi, dampak terhadap ekonomi dari perubahan hipotetis dalam instrumen kebijakan (misalnya, tingkat pajak atau tingkat bunga jangka pendek) dinilai, di sisi lain, dampak dari perubahan aturan kebijakan (misalnya, transisi ke rezim kebijakan moneter baru) dinilai. Sebuah proyek penelitian ekonomi makro empiris dapat mencakup satu atau lebih dari empat tugas ini. Setiap masalah harus diselesaikan sedemikian rupa sehingga korelasi antara deret waktu diperhitungkan.

Pada tahun 1970-an, masalah ini diselesaikan dengan menggunakan berbagai metode, yang jika dinilai dari posisi modern, tidak memadai karena beberapa alasan. Untuk menggambarkan dinamika suatu deret individu cukup menggunakan model deret waktu satu dimensi, dan untuk menggambarkan dinamika gabungan dua deret cukup menggunakan analisis spektral. Namun, tidak ada bahasa umum yang cocok untuk deskripsi sistematis sifat dinamis gabungan dari beberapa deret waktu. Prakiraan ekonomi dibuat baik menggunakan model rata-rata bergerak autoregresif (ARMA) yang disederhanakan atau menggunakan model ekonometrik struktural besar yang populer pada saat itu. Inferensi struktural didasarkan baik pada model persamaan tunggal kecil atau pada model besar yang identifikasinya dicapai melalui kendala eksklusi yang tidak berdasar dan yang biasanya tidak mencakup harapan. Analisis kebijakan model struktural bergantung pada asumsi-asumsi pengidentifikasi ini.

Akhirnya, kenaikan harga pada tahun 1970-an dilihat oleh banyak orang sebagai kegagalan besar model besar yang kemudian digunakan untuk membuat rekomendasi kebijakan. Artinya, ini adalah waktu yang tepat untuk munculnya konstruksi makroekonometrik baru yang dapat memecahkan banyak masalah ini.

Pada tahun 1980, konstruksi seperti itu dibuat - vektor autoregressions (VAR). Sepintas, VAR tidak lebih dari generalisasi autoregresi univariat untuk kasus multivariat, dan setiap persamaan dalam VAR tidak lebih dari regresi kuadrat terkecil sederhana dari satu variabel pada nilai lag itu sendiri dan variabel lain dalam VAR. Tetapi alat yang tampaknya sederhana ini memungkinkan untuk secara sistematis dan internal secara konsisten menangkap dinamika yang kaya dari rangkaian waktu multivarian, dan alat statistik yang menyertai VAR terbukti nyaman dan, yang sangat penting, mudah untuk ditafsirkan.

Ada tiga model VAR yang berbeda:

Bentuk VAR yang dikurangi;

VAR rekursif;

VAR struktural.

Ketiganya adalah model linier dinamis yang menghubungkan nilai saat ini dan masa lalu dari vektor Y t dari deret waktu n-dimensi. Bentuk tereduksi dan VAR rekursif adalah model statistik yang tidak menggunakan pertimbangan ekonomi apa pun selain pilihan variabel. VAR ini digunakan untuk menggambarkan data dan perkiraan. VAR struktural mencakup kendala yang berasal dari teori ekonomi makro dan VAR ini digunakan untuk inferensi struktural dan analisis kebijakan.

Bentuk VAR di atas menyatakan Y t sebagai lag masa lalu yang terdistribusi ditambah istilah kesalahan yang tidak berkorelasi serial, yaitu, menggeneralisasi autoregresi univariat ke kasus vektor. Bentuk reduksi matematis dari model VAR adalah sistem n persamaan yang dapat dituliskan dalam bentuk matriks sebagai berikut:

di mana adalah n l vektor konstanta;

A 1 , A 2 , ..., A p adalah matriks koefisien n n;

t , adalah vektor nl dari kesalahan tak berkorelasi serial, yang diasumsikan memiliki rata-rata nol dan matriks kovarians .

Kesalahan t , dalam (17) adalah dinamika tak terduga dalam Y t , yang tersisa setelah memperhitungkan lag terdistribusi linier dari nilai masa lalu.

Memperkirakan parameter bentuk VAR tereduksi itu mudah. Masing-masing persamaan berisi regresi yang sama (Y t-1 ,...,Y t–p), dan tidak ada batasan timbal balik antara persamaan. Dengan demikian, estimasi efektif (metode kemungkinan maksimum dengan informasi lengkap) disederhanakan menjadi kuadrat terkecil yang biasa diterapkan pada masing-masing persamaan. Matriks kovarians kesalahan dapat diperkirakan secara wajar dengan matriks kovarians sampel yang diperoleh dari residual LSM.

Satu-satunya kehalusan adalah menentukan panjang lag p, tetapi ini dapat dilakukan dengan menggunakan kriteria informasi seperti AIC atau BIC.

Pada level persamaan matriks, VAR rekursif dan struktural terlihat sama. Kedua model VAR ini secara eksplisit memperhitungkan interaksi simultan antara elemen Y t , yang berarti menambahkan suku simultan ke ruas kanan persamaan (17). Dengan demikian, VAR rekursif dan struktural keduanya diwakili dalam bentuk umum berikut:

di mana - vektor konstanta;

B 0 ,..., B p - matriks;

t - kesalahan.

Kehadiran matriks B 0 dalam persamaan berarti kemungkinan interaksi simultan antara n variabel; yaitu, B 0 memungkinkan Anda untuk membuat variabel-variabel yang terkait dengan titik waktu yang sama, didefinisikan bersama.

VAR rekursif dapat diperkirakan dengan dua cara. Struktur rekursif memberikan satu set persamaan rekursif yang dapat diperkirakan menggunakan metode kuadrat terkecil. Metode estimasi ekuivalen adalah bahwa persamaan bentuk tereduksi (17), dianggap sebagai sistem, dikalikan dari kiri dengan matriks segitiga bawah.

Metode memperkirakan VAR struktural tergantung pada bagaimana tepatnya B 0 diidentifikasi. Pendekatan informasi parsial memerlukan penggunaan metode estimasi persamaan tunggal seperti kuadrat terkecil dua langkah. Pendekatan informasi lengkap memerlukan penggunaan metode estimasi multi-persamaan seperti kuadrat terkecil tiga langkah.

Waspadai berbagai jenis VAR. Bentuk pengurangan VAR itu unik. Urutan variabel dalam Y t ini sesuai dengan VAR rekursif tunggal, tetapi ada n! perintah seperti itu, yaitu n! berbagai VAR rekursif. Jumlah VAR struktural - yaitu, kumpulan asumsi yang mengidentifikasi hubungan simultan antara variabel - hanya dibatasi oleh kecerdikan peneliti.

Karena matriks estimasi koefisien VAR sulit untuk diinterpretasikan secara langsung, hasil estimasi VAR biasanya diwakili oleh beberapa fungsi dari matriks tersebut. Untuk dekomposisi statistik seperti kesalahan perkiraan.

Ekspansi varians kesalahan perkiraan dihitung terutama untuk sistem rekursif atau struktural. Dekomposisi varians ini menunjukkan betapa pentingnya kesalahan dalam persamaan ke-j untuk menjelaskan perubahan tak terduga pada variabel ke-i. Ketika kesalahan VAR tidak berkorelasi secara persamaan, varians kesalahan perkiraan untuk h periode ke depan dapat ditulis sebagai jumlah komponen yang dihasilkan dari masing-masing kesalahan ini /17/.

3.2 Analisis faktor

Dalam statistik modern, analisis faktor dipahami sebagai seperangkat metode yang, berdasarkan hubungan nyata dari fitur (atau objek), memungkinkan untuk mengidentifikasi karakteristik generalisasi laten dari struktur organisasi dan mekanisme pengembangan fenomena dan proses. sedang dipelajari.

Konsep latency dalam definisi adalah kuncinya. Artinya implisititas karakteristik diungkapkan dengan menggunakan metode analisis faktor. Pertama, kita berurusan dengan satu set fitur dasar X j , interaksi mereka mengandaikan adanya penyebab tertentu, kondisi khusus, yaitu. adanya beberapa faktor tersembunyi. Yang terakhir ditetapkan sebagai hasil dari generalisasi fitur dasar dan bertindak sebagai karakteristik atau fitur terintegrasi, tetapi pada tingkat yang lebih tinggi. Secara alami, tidak hanya fitur-fitur sepele X j yang dapat berkorelasi, tetapi juga objek-objek yang diamati N i itu sendiri, sehingga pencarian faktor-faktor laten secara teoritis dimungkinkan baik oleh fitur maupun data objek.

Jika objek dicirikan oleh sejumlah besar fitur dasar (m > 3), maka asumsi lain juga logis - keberadaan kelompok titik (fitur) yang padat dalam ruang n objek. Pada saat yang sama, sumbu baru tidak menggeneralisasi fitur X j , tetapi objek n i , masing-masing, dan faktor laten F r akan dikenali oleh komposisi objek yang diamati:

F r = c 1 n 1 + c 2 n 2 + ... + c N n N ,

di mana c i adalah berat benda n i dalam faktor F r .

Bergantung pada jenis korelasi mana yang dipertimbangkan di atas - fitur dasar atau objek yang diamati - dipelajari dalam analisis faktor, R dan Q dibedakan - metode teknis pemrosesan data.

Nama teknik-R adalah analisis data volumetrik dengan m fitur, sehingga diperoleh r kombinasi linear (grup) fitur: F r =f(X j), (r=1..m). Analisis menurut kedekatan (koneksi) dari n objek yang diamati disebut teknik-Q dan memungkinkan Anda untuk menentukan r kombinasi linear (kelompok) objek: F=f(n i), (i = l .. N).

Saat ini, dalam praktiknya, lebih dari 90% masalah diselesaikan menggunakan teknik-R.

Himpunan metode analisis faktor saat ini cukup besar, mencakup puluhan pendekatan dan teknik pengolahan data yang berbeda. Untuk fokus pada pilihan metode yang tepat dalam penelitian, perlu untuk menyajikan fitur-fiturnya. Kami membagi semua metode analisis faktor menjadi beberapa kelompok klasifikasi:

Metode komponen utama. Sebenarnya, itu tidak diklasifikasikan sebagai analisis faktor, meskipun memiliki banyak kesamaan dengannya. Spesifiknya adalah, pertama, bahwa selama prosedur komputasi semua komponen utama diperoleh secara bersamaan dan jumlahnya awalnya sama dengan jumlah fitur dasar. Kedua, kemungkinan dekomposisi lengkap dari dispersi fitur dasar didalilkan, dengan kata lain, penjelasan lengkapnya melalui faktor laten (fitur umum).

Metode analisis faktor. Varians fitur dasar tidak sepenuhnya dijelaskan di sini, diakui bahwa bagian dari varians tetap tidak dikenali sebagai karakteristik. Faktor-faktor biasanya dipilih secara berurutan: yang pertama, menjelaskan bagian terbesar dari variasi dalam fitur dasar, kemudian yang kedua, menjelaskan bagian varian yang lebih kecil, yang kedua setelah faktor laten pertama, yang ketiga, dll. Proses ekstraksi faktor dapat terganggu pada setiap langkah jika keputusan dibuat pada kecukupan proporsi varians yang dijelaskan dari fitur dasar atau dengan mempertimbangkan interpretasi faktor laten.

Disarankan untuk membagi lebih lanjut metode analisis faktor menjadi dua kelas: metode aproksimasi yang disederhanakan dan modern.

Metode analisis faktor sederhana terutama terkait dengan perkembangan teoritis awal. Mereka memiliki kemampuan terbatas dalam mengidentifikasi faktor laten dan mendekati solusi faktorial. Ini termasuk:

Model satu faktor. Ini memungkinkan Anda untuk memilih hanya satu faktor laten umum dan satu karakteristik. Untuk faktor-faktor laten lain yang mungkin ada, sebuah asumsi dibuat tentang ketidakpentingannya;

model bifaktorial. Memungkinkan pengaruh pada variasi fitur dasar bukan hanya satu, tetapi beberapa faktor laten (biasanya dua) dan satu faktor karakteristik;

metode pusat. Di dalamnya, korelasi antara variabel dianggap sebagai sekelompok vektor, dan faktor laten secara geometris direpresentasikan sebagai vektor penyeimbang yang melewati pusat kelompok ini. : Metode ini memungkinkan Anda untuk mengidentifikasi beberapa faktor laten dan karakteristik, untuk pertama kalinya dimungkinkan untuk mengkorelasikan solusi faktorial dengan data asli, mis. menyelesaikan masalah aproksimasi dalam bentuk paling sederhana.

Metode aproksimasi modern sering mengasumsikan bahwa solusi aproksimasi pertama telah ditemukan oleh beberapa metode, dan solusi ini dioptimalkan dengan langkah-langkah berikutnya. Metode berbeda dalam kompleksitas perhitungan. Metode ini meliputi:

metode kelompok. Solusinya didasarkan pada kelompok fitur dasar yang telah dipilih sebelumnya dalam beberapa cara;

Metode faktor utama. Paling dekat dengan metode komponen utama, perbedaannya terletak pada asumsi keberadaan fitur;

Kemungkinan maksimum, residu minimum, analisis faktor-a, analisis faktor kanonik, semua pengoptimalan.

Metode ini memungkinkan untuk secara konsisten meningkatkan solusi yang ditemukan sebelumnya berdasarkan penggunaan teknik statistik untuk memperkirakan variabel acak atau kriteria statistik, dan memerlukan sejumlah besar perhitungan yang memakan waktu. Yang paling menjanjikan dan nyaman untuk bekerja dalam kelompok ini adalah metode kemungkinan maksimum.

Tugas utama, yang diselesaikan dengan berbagai metode analisis faktor, termasuk metode komponen utama, adalah kompresi informasi, transisi dari himpunan nilai menurut m fitur dasar dengan jumlah informasi n x m ke batas yang terbatas. himpunan elemen matriks pemetaan faktor (m x r) atau matriks faktor nilai laten untuk setiap objek yang diamati berdimensi n x r, dan biasanya r< m.

Metode analisis faktor juga memungkinkan untuk memvisualisasikan struktur fenomena dan proses yang diteliti, yang berarti menentukan keadaannya dan memprediksi perkembangannya. Akhirnya, data analisis faktor memberikan dasar untuk mengidentifikasi objek, yaitu. memecahkan masalah pengenalan citra.

Metode analisis faktor memiliki sifat yang sangat menarik untuk digunakan sebagai bagian dari metode statistik lainnya, paling sering dalam analisis korelasi-regresi, analisis cluster, penskalaan multivariat, dll. /18/.

3.3 Regresi berpasangan. Sifat probabilistik model regresi.

Jika kita mempertimbangkan masalah menganalisis pengeluaran makanan dalam kelompok dengan pendapatan yang sama, misalnya $10.000(x), maka ini adalah nilai deterministik. Tetapi Y - bagian dari uang yang dihabiskan untuk makanan ini - bersifat acak dan dapat berubah dari tahun ke tahun. Oleh karena itu, untuk setiap individu ke-i:

di mana i - kesalahan acak;

dan adalah konstanta (secara teoritis), meskipun mereka dapat bervariasi dari model ke model.

Prasyarat untuk regresi berpasangan:

X dan Y berhubungan linier;

X adalah variabel non-acak dengan nilai tetap;

- - kesalahan terdistribusi normal N(0,σ 2);

- .

Gambar 3.1 menunjukkan model regresi berpasangan.

Gambar 3.1 - Model regresi berpasangan

Asumsi tersebut menggambarkan model regresi linier klasik.

Jika kesalahan memiliki rata-rata bukan nol, model asli akan setara dengan model baru dan intersep lainnya, tetapi dengan rata-rata nol untuk kesalahan.

Jika prasyarat terpenuhi, maka penduga kuadrat terkecil dan penduga tak bias linier yang efisien

Jika kita menunjuk:

fakta bahwa ekspektasi matematis dan dispersi koefisien adalah sebagai berikut:

Kovarians koefisien:

Jika sebuah maka mereka juga terdistribusi normal:

Dari sini berikut bahwa:

Variasi sepenuhnya ditentukan oleh variasi ;

Semakin tinggi varians X, semakin baik estimasi .

Dispersi total ditentukan dengan rumus:

Varians dari deviasi dalam bentuk ini adalah estimasi yang tidak bias dan disebut standar error dari regresi. N-2 - dapat diartikan sebagai jumlah derajat kebebasan.

Analisis penyimpangan dari garis regresi dapat memberikan ukuran yang berguna tentang seberapa baik perkiraan regresi mencerminkan data sebenarnya. Regresi yang baik adalah yang menjelaskan proporsi varians yang signifikan dalam Y, dan sebaliknya, regresi yang buruk tidak melacak sebagian besar fluktuasi dalam data asli. Secara intuitif jelas bahwa setiap informasi tambahan akan meningkatkan model, yaitu, mengurangi bagian variasi Y yang tidak dapat dijelaskan. Untuk menganalisis model regresi, varians didekomposisi menjadi komponen-komponen, dan koefisien determinasi R 2 ditentukan.

Rasio dua varians didistribusikan menurut distribusi-F, yaitu jika kita memeriksa signifikansi statistik dari perbedaan antara varians model dan varians dari residual, kita dapat menyimpulkan bahwa R 2 signifikan.

Pengujian hipotesis tentang kesetaraan varians dari dua sampel ini:

Jika hipotesis H 0 (kesamaan varians beberapa sampel) benar, t memiliki distribusi-F dengan (m 1 ,m 2)=(n 1 -1,n 2 -1) derajat kebebasan.

Setelah menghitung F-ratio sebagai rasio dua dispersi dan membandingkannya dengan nilai tabel, kita dapat menyimpulkan bahwa R 2 /2/, /19/ signifikan secara statistik.

Kesimpulan

Aplikasi modern dari analisis varians mencakup berbagai masalah di bidang ekonomi, biologi, dan teknologi dan biasanya ditafsirkan dalam istilah teori statistik yang mengungkapkan perbedaan sistematis antara hasil pengukuran langsung yang dilakukan dalam kondisi tertentu yang berubah.

Berkat otomatisasi analisis varians, peneliti dapat melakukan berbagai studi statistik menggunakan komputer, sambil menghabiskan lebih sedikit waktu dan tenaga untuk perhitungan data. Saat ini, ada banyak paket perangkat lunak yang mengimplementasikan peralatan analisis dispersi. Produk perangkat lunak yang paling umum adalah:

Sebagian besar metode statistik diimplementasikan dalam produk perangkat lunak statistik modern. Dengan perkembangan bahasa pemrograman algoritmik, menjadi mungkin untuk membuat blok tambahan untuk memproses data statistik.

ANOVA adalah metode statistik modern yang kuat untuk memproses dan menganalisis data eksperimental dalam psikologi, biologi, kedokteran, dan ilmu lainnya. Hal ini sangat erat kaitannya dengan metodologi khusus untuk perencanaan dan pelaksanaan studi eksperimental.

Analisis varians digunakan di semua bidang penelitian ilmiah, di mana perlu untuk menganalisis pengaruh berbagai faktor terhadap variabel yang diteliti.

Bibliografi

1 Kremer N.Sh. Teori probabilitas dan statistik matematika. M.: Unity - Dana, 2002.-343s.

2 Gmurman V.E. Teori Probabilitas dan Statistik Matematika. - M.: Sekolah Tinggi, 2003.-523s.

4 www.conf.mitme.ru

5 www.pedklin.ru

6 www.webcenter.ru

7 www.infeksi.ru

8 www.encycl.yandex.ru

9 www.infosport.ru

10 www.medtrust.ru

11 www.flax.net.ru

12 www.jdc.org.il

13 www.big.spb.ru

14 www.bizcom.ru

15 Gusev A.N. Analisis dispersi dalam psikologi eksperimental. - M .: Kolektor pendidikan dan metodologi "Psikologi", 2000.-136s.

17 www.econometrics.exponenta.ru

18 www.optimizer.by.ru

Dalam praktik dokter ketika melakukan penelitian biomedis, sosiologis dan eksperimental, menjadi perlu untuk menetapkan pengaruh faktor-faktor pada hasil mempelajari keadaan kesehatan populasi, ketika menilai aktivitas profesional, dan efektivitas inovasi.

Ada sejumlah metode statistik yang memungkinkan Anda untuk menentukan kekuatan, arah, pola pengaruh faktor pada hasil dalam populasi umum atau sampel (perhitungan kriteria I, analisis korelasi, regresi, 2 - (kriteria kesepakatan Pearson, dll.). Analisis varians dikembangkan dan diusulkan oleh ilmuwan Inggris, matematikawan dan ahli genetika Ronald Fisher pada tahun 1920-an.

Analisis varians lebih sering digunakan dalam studi ilmiah dan praktis kesehatan masyarakat dan perawatan kesehatan untuk mempelajari pengaruh satu atau lebih faktor pada sifat yang dihasilkan. Ini didasarkan pada prinsip "mencerminkan keragaman nilai faktor pada keragaman nilai atribut yang dihasilkan" dan menetapkan kekuatan pengaruh faktor dalam populasi sampel .

Inti dari metode analisis varians adalah mengukur varians individual (total, faktorial, residual), dan selanjutnya menentukan kekuatan (share) pengaruh faktor-faktor yang dipelajari (penilaian peran masing-masing faktor, atau pengaruh gabungannya). ) pada atribut yang dihasilkan.

Analisis varians- ini adalah metode statistik untuk menilai hubungan antara faktor dan karakteristik kinerja dalam kelompok yang berbeda, dipilih secara acak, berdasarkan penentuan perbedaan (keanekaragaman) nilai karakteristik. Analisis varians didasarkan pada analisis penyimpangan semua unit populasi yang diteliti dari mean aritmatika. Sebagai ukuran deviasi, dispersi (B) diambil - kuadrat deviasi rata-rata. Penyimpangan yang disebabkan oleh pengaruh suatu faktor atribut (faktor) dibandingkan dengan besarnya penyimpangan yang disebabkan oleh keadaan acak. Jika penyimpangan yang disebabkan oleh atribut faktor lebih signifikan daripada penyimpangan acak, maka faktor tersebut dianggap memiliki pengaruh yang signifikan terhadap atribut yang dihasilkan.

Untuk menghitung varians dari nilai deviasi setiap opsi (setiap nilai numerik terdaftar dari atribut) dari rata-rata aritmatika, dikuadratkan. Ini akan menghilangkan tanda-tanda negatif. Kemudian penyimpangan (selisih) ini dijumlahkan dan dibagi dengan jumlah pengamatan, yaitu. penyimpangan rata-rata. Dengan demikian, nilai dispersi diperoleh.

Nilai metodologis yang penting untuk penerapan analisis varians adalah pembentukan sampel yang benar. Tergantung pada tujuan dan sasaran, kelompok selektif dapat dibentuk secara acak secara independen satu sama lain (kelompok kontrol dan eksperimen untuk mempelajari beberapa indikator, misalnya, efek tekanan darah tinggi pada perkembangan stroke). Sampel seperti itu disebut independen.

Seringkali, hasil paparan faktor dipelajari dalam kelompok sampel yang sama (misalnya, pada pasien yang sama) sebelum dan sesudah paparan (pengobatan, pencegahan, tindakan rehabilitasi), sampel semacam itu disebut dependen.

Analisis varians, di mana pengaruh satu faktor diperiksa, disebut analisis satu faktor (analisis univariat). Ketika mempelajari pengaruh lebih dari satu faktor, digunakan analisis varians multivariat (analisis multivariat).

Tanda-tanda faktor adalah tanda-tanda yang mempengaruhi fenomena yang diteliti.
Tanda-tanda efektif adalah tanda-tanda yang berubah di bawah pengaruh tanda-tanda faktor.

Karakteristik kualitatif (jenis kelamin, profesi) dan kuantitatif (jumlah suntikan, pasien di bangsal, jumlah hari tidur) dapat digunakan untuk melakukan analisis varians.

Metode analisis dispersi:

  1. Metode menurut Fisher (Fisher) - kriteria F (nilai F, lihat Lampiran No. 1);
    Metode yang digunakan dalam analisis varians satu arah, ketika varians total dari semua nilai yang diamati didekomposisi menjadi varians dalam kelompok individu dan varians antar kelompok.
  2. Metode "model linier umum".
    Hal ini didasarkan pada analisis korelasi atau regresi yang digunakan dalam analisis multivariat.

Biasanya, hanya satu faktor, kompleks dispersi dua faktor maksimum yang digunakan dalam penelitian biomedis. Kompleks multifaktorial dapat diselidiki dengan menganalisis secara berurutan kompleks satu atau dua faktor yang diisolasi dari seluruh populasi yang diamati.

Syarat penggunaan analisis varians:

  1. Tugas penelitian ini adalah untuk menentukan kekuatan pengaruh satu (hingga 3) faktor pada hasil atau untuk menentukan kekuatan pengaruh gabungan berbagai faktor (jenis kelamin dan usia, aktivitas fisik dan nutrisi, dll.).
  2. Faktor-faktor yang dipelajari harus independen (tidak berhubungan) satu sama lain. Misalnya, seseorang tidak dapat mempelajari efek gabungan dari pengalaman kerja dan usia, tinggi dan berat anak, dll. pada kejadian populasi.
  3. Pemilihan kelompok untuk penelitian dilakukan secara acak (random selection). Organisasi kompleks dispersi dengan penerapan prinsip pemilihan opsi secara acak disebut pengacakan (diterjemahkan dari bahasa Inggris - acak), mis. dipilih secara acak.
  4. Baik fitur kuantitatif maupun kualitatif (atributif) dapat digunakan.

Saat melakukan analisis varians satu arah, disarankan (kondisi yang diperlukan untuk aplikasi):

  1. Normalitas distribusi kelompok yang dianalisis atau korespondensi kelompok sampel dengan populasi umum yang berdistribusi normal.
  2. Kemandirian (non-connectedness) distribusi pengamatan dalam kelompok.
  3. Adanya frekuensi (pengulangan) pengamatan.

Normalitas distribusi ditentukan oleh kurva Gauss (De Mavour), yang dapat dijelaskan oleh fungsi y \u003d f (x), karena itu adalah salah satu hukum distribusi yang digunakan untuk mendekati deskripsi fenomena yang acak, bersifat probabilistik. Subyek penelitian biomedis adalah fenomena yang bersifat probabilistik, distribusi normal dalam penelitian semacam itu sangat umum terjadi.

Prinsip penerapan metode analisis varians

Pertama, hipotesis nol dirumuskan, yaitu diasumsikan bahwa faktor-faktor yang diteliti tidak berpengaruh pada nilai atribut yang dihasilkan dan perbedaan yang dihasilkan adalah acak.

Kemudian kami menentukan berapa probabilitas untuk memperoleh perbedaan yang diamati (atau lebih kuat), asalkan hipotesis nol benar.

Jika probabilitas ini kecil*, maka kami menolak hipotesis nol dan menyimpulkan bahwa hasil penelitian signifikan secara statistik. Ini belum berarti bahwa pengaruh dari faktor-faktor yang dipelajari telah terbukti (ini terutama merupakan masalah perencanaan penelitian), tetapi masih kecil kemungkinannya bahwa hasilnya adalah kebetulan.
__________________________________
* Probabilitas maksimum yang dapat diterima untuk menolak hipotesis nol yang benar disebut tingkat signifikansi dan dilambangkan dengan = 0,05.

Ketika semua kondisi untuk menerapkan analisis varians terpenuhi, dekomposisi varians total secara matematis terlihat seperti ini:

D gen. = D fakta + D istirahat. ,

D gen. - varian total dari nilai yang diamati (varian), ditandai dengan penyebaran varian dari total rata-rata. Mengukur variasi suatu sifat di seluruh populasi di bawah pengaruh semua faktor yang menyebabkan variasi ini. Keanekaragaman secara keseluruhan terdiri dari intergroup dan intragroup;

D fakta - varians faktorial (antarkelompok), dicirikan oleh perbedaan rata-rata di setiap kelompok dan tergantung pada pengaruh faktor yang dipelajari, yang membedakan setiap kelompok. Misalnya, dalam kelompok faktor etiologi yang berbeda dari perjalanan klinis pneumonia, tingkat rata-rata hari tidur yang dihabiskan tidak sama - keragaman antarkelompok diamati.

D istirahat. - varians residual (intragroup), yang mencirikan dispersi varian dalam grup. Mencerminkan variasi acak, mis. bagian dari variasi yang terjadi di bawah pengaruh faktor yang tidak ditentukan dan tidak tergantung pada sifat – faktor yang mendasari pengelompokan tersebut. Variasi sifat yang diteliti tergantung pada kekuatan pengaruh beberapa faktor acak yang tidak terhitung, baik pada faktor terorganisir (diberikan oleh peneliti) dan acak (tidak diketahui).

Oleh karena itu, variasi total (dispersi) terdiri dari variasi yang disebabkan oleh faktor-faktor terorganisir (diberikan), yang disebut variasi faktorial dan faktor-faktor yang tidak terorganisir, yaitu. variasi residual (acak, tidak diketahui).

Analisis varians klasik dilakukan dengan langkah-langkah berikut:

  1. Konstruksi kompleks dispersi.
  2. Perhitungan kuadrat rata-rata deviasi.
  3. Perhitungan varians.
  4. Perbandingan varians faktor dan residual.
  5. Evaluasi hasil menggunakan nilai teoritis dari distribusi Fisher-Snedekor (Lampiran N 1).

ALGORITMA UNTUK MELAKUKAN ANALISIS ANOVANE MENURUT VARIAN YANG SEDERHANA

Algoritme untuk melakukan analisis varians menggunakan metode yang disederhanakan memungkinkan Anda mendapatkan hasil yang sama, tetapi perhitungannya jauh lebih sederhana:

saya panggung. Konstruksi kompleks dispersi

Konstruksi kompleks dispersi berarti konstruksi tabel di mana faktor, tanda efektif dan pemilihan observasi (pasien) di setiap kelompok akan dibedakan dengan jelas.

Kompleks satu faktor terdiri dari beberapa gradasi satu faktor (A). Gradasi adalah sampel dari populasi umum yang berbeda (A1, A2, AZ).

Kompleks dua faktor - terdiri dari beberapa gradasi dua faktor dalam kombinasi satu sama lain. Faktor etiologi dalam kejadian pneumonia adalah sama (A1, A2, AZ) dalam kombinasi dengan berbagai bentuk perjalanan klinis pneumonia (H1 - akut, H2 - kronis).

Tanda hasil (rata-rata jumlah hari tidur) Faktor etiologi dalam perkembangan pneumonia
A1 A2 A3
H1 H2 H1 H2 H1 H2
M = 14 hari

tahap II. Perhitungan rata-rata keseluruhan (M obsh)

Perhitungan jumlah opsi untuk setiap gradasi faktor: Vj = V 1 + V 2 + V 3

Perhitungan jumlah total varian ( V total) pada semua gradasi atribut faktor: V total = Vj 1 + Vj 2 + Vj 3

Perhitungan kelompok rata-rata (M gr.) Tanda faktor: M gr. = Vj / N,
di mana N adalah jumlah jumlah pengamatan untuk semua gradasi fitur faktor I (Σn menurut grup).

tahap III. Perhitungan varians:

Tunduk pada semua kondisi untuk menerapkan analisis varians, rumus matematikanya adalah sebagai berikut:

D gen. = D fakta + D istirahat.

D gen. - varians total, yang dicirikan oleh penyebaran varian (nilai yang diamati) dari rata-rata umum;
D fakta. - varians faktorial (antarkelompok) mencirikan penyebaran rata-rata kelompok dari rata-rata umum;
D istirahat. - varians residual (intragroup) mencirikan dispersi varian dalam grup.

  1. Perhitungan varians faktorial (Fakta D.): D fakta. = h - H
  2. Perhitungan h dilakukan sesuai dengan rumus: h = (Σ Vj) / N
  3. Perhitungan H dilakukan sesuai dengan rumus: H = (Σ V) 2 / N
  4. Perhitungan varians sisa: D istirahat. = (Σ V) 2 - h
  5. Menghitung total varians: D gen. = (Σ V) 2 - H

tahap IV. Perhitungan indikator utama kekuatan pengaruh faktor yang diteliti Indikator kekuatan pengaruh (η 2) atribut faktor pada hasil ditentukan oleh pangsa varians faktorial (Fakta D.) dalam varians total (D umum), 2 (ini) - menunjukkan berapa proporsi pengaruh faktor yang diteliti menempati di antara semua faktor lain dan ditentukan oleh rumus:

tahap V. Penentuan reliabilitas hasil penelitian dengan metode Fisher dilakukan dengan rumus:


F - Kriteria Fisher;
Fst. - nilai tabular (lihat Lampiran 1).
2 fakta, 2 istirahat. - deviasi faktorial dan residual (dari lat. de - dari, melalui - jalan) - deviasi dari garis tengah, ditentukan oleh rumus:


r adalah jumlah gradasi dari atribut faktor.

Perbandingan kriteria Fisher (F) dengan standar (tabel) F dilakukan sesuai dengan kolom tabel, dengan mempertimbangkan derajat kebebasan:

v 1 \u003d n - 1
v 2 \u003d N - 1

Tentukan secara horizontal v 1 secara vertikal - v 2 , di persimpangannya tentukan nilai tabular F, di mana nilai tabular atas p 0,05, dan yang lebih rendah sesuai dengan p > 0,01, dan bandingkan dengan kriteria yang dihitung F. Jika nilai dari kriteria yang dihitung F sama dengan atau lebih besar dari tabel, maka hasilnya reliabel dan H 0 tidak ditolak.

Tugas:

Di perusahaan N., tingkat cedera meningkat, sehubungan dengan itu dokter melakukan studi faktor individu, di antaranya pengalaman kerja pekerja di toko dipelajari. Sampel diambil di perusahaan N. dari 4 toko dengan kondisi dan sifat pekerjaan yang sama. Tingkat cedera dihitung per 100 karyawan selama setahun terakhir.

Dalam kajian faktor pengalaman kerja, diperoleh data sebagai berikut:

Berdasarkan data penelitian, diajukan hipotesis nol (H 0) tentang pengaruh pengalaman kerja terhadap tingkat cedera karyawan perusahaan A.

Latihan
Konfirmasi atau bantah hipotesis nol menggunakan analisis varians satu arah:

  1. menentukan kekuatan pengaruh;
  2. mengevaluasi keandalan pengaruh faktor tersebut.

Tahapan penerapan analisis varians
untuk menentukan pengaruh suatu faktor (pengalaman kerja) terhadap hasil (tingkat cedera)

Kesimpulan. Di kompleks sampel terungkap bahwa pengaruh pengalaman kerja terhadap tingkat cedera adalah 80% dari jumlah faktor lainnya. Untuk semua bengkel pabrik, dapat dinyatakan dengan probabilitas 99,7% (13,3 > 8,7) bahwa pengalaman kerja mempengaruhi tingkat cedera.

Dengan demikian, hipotesis nol (Н 0) tidak ditolak dan pengaruh pengalaman kerja terhadap tingkat cedera di bengkel pabrik A dianggap terbukti.

Nilai F (uji Fisher) standar pada p 0,05 (nilai atas) pada p 0,01 (nilai bawah)

1 2 3 4 5 6 7 8 9 10 11
6 6,0
13,4
5,1
10,9
4,8
9,8
4,5
9,2
4,4
8,8
4,3
8,5
4,2
8,3
4,1
8,1
4,1
8,0
4,1
7,9
4,0
7,8
7 5,6
12,3
4,7
9,6
4,4
8,5
4,1
7,9
4,0
7,5
3,9
7,2
3,8
7,0
3,7
6,8
3,7
6,7
3,6
6,6
3,6
6,5
8 5,3
11,3
4,6
8,7
4,1
7,6
3,8
7,0
3,7
6,6
3,6
6,4
3,5
6,2
3,4
6,0
3,4
5,9
3,3
5,8
3,1
5,7
9 5,1
10,6
4,3
8,0
3,6
7,0
3,6
6,4
3,5
6,1
3,4
5,8
3,3
5,6
3,2
5,5
3,2
5,4
3,1
5,3
3,1
5,2
10 5,0
10,0
4,1
7,9
3,7
6,6
3,5
6,0
3,3
5,6
3,2
5,4
3,1
5,2
3,1
5,1
3,0
5,0
2,9
4,5
2,9
4,8
11 4,8
9,7
4,0
7,2
3,6
6,2
3,6
5,7
3,2
5,3
3,1
5,1
3,0
4,9
3,0
4,7
2,9
4,6
2,9
4,5
2,8
4,5
12 4,8
9,3
3,9
6,9
3,5
6,0
3,3
5,4
3,1
5,1
3,0
4,7
2,9
4,7
2,9
4,5
2,8
4,4
2,8
4,3
2,7
4,2
13 4,7
9,1
3,8
6,7
3,4
5,7
3,2
5,2
3,0
4,9
2,9
4,6
2,8
4,4
2,8
4,3
2,7
4,2
2,7
4,1
2,6
4,0
14 4,6
8,9
3,7
6,5
3,3
5,6
3,1
5,0
3,0
4,7
2,9
4,5
2,8
4,3
2,7
4,1
2,7
4,0
2,6
3,9
2,6
3,9
15 4,5
8,7
3,7
6,4
3,3
5,4
3,1
4,9
2,9
4,6
2,8
4,3
2,7
4,1
2,6
4,0
2,6
3,9
2,5
3,8
2,5
3,7
16 4,5
8,5
3,6
6,2
3,2
5,3
3,0
4,8
2,9
4,4
2,7
4,2
2,7
4,0
2,6
3,9
2,5
3,8
2,5
3,7
2,5
3,6
17 4,5
8,4
3,6
6,1
3,2
5,2
3,0
4,7
2,8
4,3
2,7
4,1
2,6
3,9
2,6
3,8
2,5
3,8
2,5
3,6
2,4
3,5
18 4,4
8,3
3,5
6,0
3,2
5,1
2,9
4,6
2,8
4,2
2,7
4,0
2,6
3,8
2,5
3,7
2,7
3,6
2,4
3,6
3,4
3,5
19 4,4
8,2
3,5
5,9
3,1
5,0
2,9
4,5
2,7
4,2
2,6
3,9
2,5
3,8
2,5
3,6
2,4
3,5
2,4
3,4
2,3
3,4
20 4,3
8,1
3,5
5,8
3,1
4,9
2,9
4,4
2,7
4,1
2,6
3,9
2,5
3,7
2,4
3,6
2,4
3,4
2,3
3,4
2,3
3,3

  1. Vlasov V.V. Epidemiologi. - M.: GEOTAR-MED, 2004. 464 hal.
  2. Arkhipova G.L., Lavrova I.G., Troshina I.M. Beberapa metode modern analisis statistik dalam kedokteran. - M.: Metrosnab, 1971. - 75 hal.
  3. Zaitsev V.M., Liflyandsky V.G., Marinkin V.I. Statistik Medis Terapan. - St. Petersburg: LLC "Rumah Penerbitan FOLIANT", 2003. - 432 hal.
  4. Platonov A.E. Analisis statistik dalam kedokteran dan biologi: tugas, terminologi, logika, metode komputer. - M.: Penerbitan Akademi Ilmu Kedokteran Rusia, 2000. - 52 hal.
  5. Plokhinsky N.A. Biometrik. - Rumah Penerbitan Cabang Siberia dari Akademi Ilmu Pengetahuan Uni Soviet Novosibirsk. - 1961. - 364 hal.

Semua orang secara alami mencari pengetahuan. (Aristoteles. Metafisika)

Analisis varians

Ikhtisar pengantar

Pada bagian ini, kami akan meninjau metode dasar, asumsi, dan terminologi ANOVA.

Perhatikan bahwa dalam literatur bahasa Inggris, analisis varians biasanya disebut analisis variasi. Oleh karena itu, untuk singkatnya, di bawah ini kadang-kadang kita akan menggunakan istilah ANOVA (Sebuah analisis Hai f va pembagian) untuk ANOVA konvensional dan istilah MANOVA untuk analisis varians multivariat. Pada bagian ini, kita akan secara berurutan mempertimbangkan ide-ide utama dari analisis varians ( ANOVA), analisis kovarians ( ANCOVA), analisis varians multivariat ( MANOVA) dan analisis kovarians multivariat ( MANCOVA). Setelah diskusi singkat tentang manfaat analisis kontras dan tes post hoc, mari kita lihat asumsi yang menjadi dasar metode ANOVA. Menjelang akhir bagian ini, keuntungan dari pendekatan multivariat untuk analisis tindakan berulang dijelaskan atas pendekatan satu dimensi tradisional.

Ide Kunci

Tujuan dari analisis varians. Tujuan utama dari analisis varians adalah untuk mempelajari signifikansi perbedaan antara rata-rata. Bab (Bab 8) memberikan pengantar singkat untuk pengujian signifikansi statistik. Jika Anda hanya membandingkan rata-rata dua sampel, analisis varians akan memberikan hasil yang sama seperti analisis normal. t- kriteria untuk sampel independen (jika dua kelompok objek atau pengamatan independen dibandingkan), atau t- kriteria untuk sampel dependen (jika dua variabel dibandingkan pada kumpulan objek atau pengamatan yang sama). Jika Anda tidak terbiasa dengan kriteria ini, kami sarankan Anda merujuk ke ikhtisar pendahuluan bab ini (Bab 9).

Dari mana nama itu berasal? Analisis varians? Mungkin tampak aneh bahwa prosedur untuk membandingkan rata-rata disebut analisis varians. Faktanya, ini disebabkan oleh fakta bahwa ketika kita menguji signifikansi statistik dari perbedaan antara rata-rata, kita sebenarnya menganalisis varians.

Membagi jumlah kuadrat

Untuk ukuran sampel n, varians sampel dihitung sebagai jumlah deviasi kuadrat dari rata-rata sampel dibagi dengan n-1 (ukuran sampel dikurangi satu). Jadi, untuk ukuran sampel tetap n, varians adalah fungsi dari jumlah kuadrat (deviasi), dilambangkan, untuk singkatnya, SS(dari Bahasa Inggris Jumlah Kuadrat - Jumlah Kuadrat). Analisis varians didasarkan pada pembagian (atau pemisahan) varians menjadi beberapa bagian. Pertimbangkan kumpulan data berikut:

Rata-rata dari kedua kelompok berbeda secara signifikan (masing-masing 2 dan 6). Jumlah simpangan kuadrat dalam masing-masing kelompok adalah 2. Jika dijumlahkan, kita mendapatkan 4. Jika sekarang kita ulangi perhitungan ini tidak termasuk keanggotaan kelompok, yaitu, jika kita menghitung SS berdasarkan rata-rata gabungan dari dua sampel, kami mendapatkan 28. Dengan kata lain, varians (jumlah kuadrat) berdasarkan variabilitas dalam kelompok menghasilkan nilai yang jauh lebih kecil daripada jika dihitung berdasarkan variabilitas total (relatif terhadap keseluruhan berarti). Alasan untuk ini jelas merupakan perbedaan yang signifikan antara rata-rata, dan perbedaan antara rata-rata ini menjelaskan perbedaan yang ada antara jumlah kuadrat. Memang, jika kita menggunakan modul Analisis varians, maka akan diperoleh hasil sebagai berikut:

Seperti dapat dilihat dari tabel, jumlah total kuadrat SS=28 dibagi jumlah kuadrat karena intragrup variabilitas ( 2+2=4 ; lihat baris kedua tabel) dan jumlah kuadrat karena perbedaan nilai rata-rata. (28-(2+2)=24; lihat baris pertama tabel).

SS kesalahan danSS memengaruhi. Variabilitas intragrup ( SS) biasanya disebut varians kesalahan. Ini berarti bahwa biasanya tidak dapat diprediksi atau dijelaskan ketika eksperimen dilakukan. Di sisi lain, SS memengaruhi(atau variabilitas antarkelompok) dapat dijelaskan dengan perbedaan antara rata-rata dalam kelompok yang dipelajari. Dengan kata lain, milik kelompok tertentu menjelaskan variabilitas antarkelompok, karena kita tahu bahwa kelompok-kelompok ini memiliki cara yang berbeda.

Pemeriksaan signifikansi. Gagasan utama pengujian signifikansi statistik dibahas dalam bab ini Konsep dasar statistik(Bab 8). Bab yang sama menjelaskan alasan mengapa banyak tes menggunakan rasio varians yang dijelaskan dan yang tidak dapat dijelaskan. Contoh penggunaan ini adalah analisis varians itu sendiri. Pengujian signifikansi di ANOVA didasarkan pada membandingkan varians karena variasi antar-kelompok (disebut efek kuadrat rata-rata atau NONAMemengaruhi) dan dispersi karena penyebaran dalam kelompok (disebut kesalahan kuadrat rata-rata atau NONAkesalahan). Jika hipotesis nol benar (kesamaan rata-rata dalam dua populasi), maka kita dapat mengharapkan perbedaan yang relatif kecil dalam rata-rata sampel karena variabilitas acak. Oleh karena itu, di bawah hipotesis nol, varians intragrup secara praktis akan bertepatan dengan varians total yang dihitung tanpa memperhitungkan keanggotaan grup. Varians dalam kelompok yang dihasilkan dapat dibandingkan dengan menggunakan F- tes yang memeriksa apakah rasio varians secara signifikan lebih besar dari 1. Dalam contoh di atas, F- Pengujian menunjukkan bahwa perbedaan antara rata-rata signifikan secara statistik.

Logika dasar ANOVA. Ringkasnya, kita dapat mengatakan bahwa tujuan analisis varians adalah untuk menguji signifikansi statistik dari perbedaan antara rata-rata (untuk kelompok atau variabel). Pemeriksaan ini dilakukan dengan menggunakan analisis varians, yaitu dengan membagi varians total (variasi) menjadi beberapa bagian, yang salah satunya disebabkan oleh kesalahan acak (yaitu, variabilitas intragroup), dan yang kedua dikaitkan dengan perbedaan nilai rata-rata. Komponen terakhir dari varians kemudian digunakan untuk menganalisis signifikansi statistik dari perbedaan antara rata-rata. Jika perbedaan ini signifikan, hipotesis nol ditolak dan hipotesis alternatif bahwa ada perbedaan antara rata-rata diterima.

Variabel terikat dan variabel bebas. Variabel yang nilainya ditentukan oleh pengukuran selama percobaan (misalnya, skor yang dicetak pada tes) disebut bergantung variabel. Variabel yang dapat dimanipulasi dalam percobaan (misalnya, metode pelatihan atau kriteria lain yang memungkinkan Anda untuk membagi pengamatan ke dalam kelompok) disebut faktor atau mandiri variabel. Konsep-konsep ini dijelaskan secara lebih rinci dalam bab Konsep dasar statistik(Bab 8).

Analisis varians multivariat

Dalam contoh sederhana di atas, Anda dapat menghitung uji-t sampel independen secara langsung menggunakan opsi modul yang sesuai Statistik dan tabel dasar. Hasil yang diperoleh tentunya bersesuaian dengan hasil analisis varians. Namun, analisis varians berisi alat teknis yang fleksibel dan kuat yang dapat digunakan untuk studi yang jauh lebih kompleks.

Banyak faktor. Dunia secara inheren kompleks dan multidimensi. Situasi di mana beberapa fenomena dijelaskan sepenuhnya oleh satu variabel sangat jarang terjadi. Misalnya, jika kita mencoba mempelajari cara menanam tomat besar, kita harus mempertimbangkan faktor-faktor yang berkaitan dengan struktur genetik tanaman, jenis tanah, cahaya, suhu, dll. Jadi, ketika melakukan eksperimen biasa, Anda harus berurusan dengan sejumlah besar faktor. Alasan utama mengapa menggunakan ANOVA lebih baik daripada membandingkan kembali dua sampel pada tingkat faktor yang berbeda menggunakan t- kriteria adalah bahwa analisis varians lebih efektif dan, untuk sampel kecil, lebih informatif.

Manajemen faktor. Mari kita asumsikan bahwa dalam contoh analisis dua sampel yang dibahas di atas, kita menambahkan satu faktor lagi, misalnya, Lantai- Jenis kelamin. Biarkan setiap kelompok terdiri dari 3 pria dan 3 wanita. Rancangan percobaan ini dapat disajikan dalam bentuk tabel 2 kali 2:

Percobaan. Grup 1 Percobaan. Grup 2
laki-laki2 6
3 7
1 5
Rata-rata2 6
Perempuan4 8
5 9
3 7
Rata-rata4 8

Sebelum melakukan perhitungan, Anda dapat melihat bahwa dalam contoh ini varians total memiliki setidaknya tiga sumber:

(1) kesalahan acak (dalam varians grup),

(2) variabilitas yang terkait dengan keanggotaan dalam kelompok eksperimen, dan

(3) variabilitas karena jenis kelamin objek yang diamati.

(Perhatikan bahwa ada kemungkinan sumber variabilitas lain - interaksi faktor, yang akan kita bahas nanti). Apa yang terjadi jika kita tidak menyertakan lantaijenis kelamin sebagai faktor dalam analisis dan hitung biasa t-kriteria? Jika kita menghitung jumlah kuadrat, abaikan lantai -jenis kelamin(yaitu, menggabungkan objek dari jenis kelamin yang berbeda ke dalam satu kelompok saat menghitung varians dalam kelompok, sambil memperoleh jumlah kuadrat untuk setiap kelompok sama dengan SS= 10, dan jumlah total kuadrat SS= 10+10 = 20), maka kita mendapatkan nilai dispersi intragrup yang lebih besar daripada analisis yang lebih akurat dengan pembagian tambahan ke dalam subgrup sesuai dengan semi jenis kelamin(dalam hal ini, rata-rata intragrup akan sama dengan 2, dan jumlah kuadrat total intragrup akan sama dengan SS = 2+2+2+2 = 8). Perbedaan ini disebabkan oleh fakta bahwa nilai rata-rata untuk laki-laki - laki-laki kurang dari rata-rata untuk perempuan -Perempuan, dan perbedaan rata-rata ini meningkatkan variabilitas total dalam kelompok jika jenis kelamin tidak diperhitungkan. Mengontrol varians kesalahan meningkatkan sensitivitas (kekuatan) tes.

Contoh ini menunjukkan keuntungan lain dari analisis varians atas analisis konvensional. t-kriteria untuk dua sampel. Analisis varians memungkinkan Anda mempelajari setiap faktor dengan mengontrol nilai faktor lainnya. Faktanya, ini adalah alasan utama untuk kekuatan statistiknya yang lebih besar (ukuran sampel yang lebih kecil diperlukan untuk mendapatkan hasil yang berarti). Untuk alasan ini, analisis varians, bahkan pada sampel kecil, memberikan hasil yang lebih signifikan secara statistik daripada yang sederhana. t- kriteria.

Efek interaksi

Ada keuntungan lain menggunakan analisis varians dibandingkan analisis konvensional. t- kriteria: analisis varians memungkinkan Anda untuk mendeteksi interaksi antara faktor dan karena itu memungkinkan model yang lebih kompleks untuk dipelajari. Sebagai ilustrasi, perhatikan contoh lain.

Efek utama, interaksi berpasangan (dua faktor). Mari kita asumsikan bahwa ada dua kelompok siswa, dan secara psikologis siswa dari kelompok pertama disesuaikan dengan pemenuhan tugas yang diberikan dan lebih terarah daripada siswa dari kelompok kedua, yang terdiri dari siswa yang lebih malas. Mari kita bagi setiap kelompok secara acak menjadi dua dan tawarkan satu setengah dari setiap kelompok tugas yang sulit, dan yang lainnya yang mudah. Setelah itu, kami mengukur seberapa keras siswa mengerjakan tugas-tugas ini. Rata-rata untuk penelitian (fiktif) ini ditunjukkan dalam tabel:

Kesimpulan apa yang dapat ditarik dari hasil ini? Apakah mungkin untuk menyimpulkan bahwa: (1) siswa bekerja lebih keras pada tugas yang sulit; (2) apakah siswa yang termotivasi bekerja lebih keras daripada siswa yang malas? Tak satu pun dari pernyataan ini mencerminkan esensi dari sifat sistematis rata-rata yang diberikan dalam tabel. Menganalisis hasilnya, akan lebih tepat untuk mengatakan bahwa hanya siswa yang termotivasi yang bekerja lebih keras pada tugas-tugas kompleks, sementara hanya siswa yang malas yang bekerja lebih keras pada tugas-tugas yang mudah. Dengan kata lain, sifat siswa dan kompleksitas tugas berinteraksi satu sama lain mempengaruhi jumlah usaha yang diperlukan. Itu contohnya interaksi pasangan antara sifat siswa dan kompleksitas tugas. Perhatikan bahwa pernyataan 1 dan 2 menjelaskan efek utama.

Interaksi orde yang lebih tinggi. Sementara interaksi berpasangan relatif mudah dijelaskan, interaksi tingkat tinggi jauh lebih sulit dijelaskan. Mari kita bayangkan bahwa dalam contoh yang dipertimbangkan di atas, satu faktor lagi diperkenalkan lantai -Jenis kelamin dan kami mendapatkan tabel rata-rata berikut:

Kesimpulan apa yang sekarang dapat ditarik dari hasil yang diperoleh? Plot rata-rata memudahkan untuk menginterpretasikan efek yang kompleks. Modul analisis varians memungkinkan Anda membuat grafik ini dengan hampir satu klik.

Gambar dalam grafik di bawah ini mewakili interaksi tiga arah yang diteliti.

Melihat grafik, kita dapat mengatakan bahwa ada interaksi antara sifat dan kesulitan tes untuk wanita: wanita yang termotivasi bekerja lebih keras pada tugas yang sulit daripada yang mudah. Pada pria, interaksi yang sama terbalik. Terlihat bahwa deskripsi interaksi antar faktor menjadi lebih membingungkan.

Cara umum untuk menggambarkan interaksi. Dalam kasus umum, interaksi antara faktor-faktor digambarkan sebagai perubahan dalam satu efek di bawah pengaruh yang lain. Dalam contoh yang dibahas di atas, interaksi dua faktor dapat digambarkan sebagai perubahan efek utama dari faktor yang mencirikan kompleksitas tugas, di bawah pengaruh faktor yang menggambarkan karakter siswa. Untuk interaksi tiga faktor dari paragraf sebelumnya, kita dapat mengatakan bahwa interaksi dua faktor (kompleksitas tugas dan karakter siswa) berubah di bawah pengaruh jenis kelaminJenis kelamin. Jika interaksi empat faktor dipelajari, kita dapat mengatakan bahwa interaksi tiga faktor berubah di bawah pengaruh faktor keempat, yaitu. ada berbagai jenis interaksi pada tingkat yang berbeda dari faktor keempat. Ternyata di banyak daerah interaksi lima faktor atau bahkan lebih bukanlah hal yang aneh.

Rencana kompleks

Rencana antarkelompok dan intrakelompok (rencana pengukuran ulang)

Ketika membandingkan dua kelompok yang berbeda, biasanya menggunakan t- kriteria untuk sampel independen (dari modul Statistik dan tabel dasar). Ketika dua variabel dibandingkan pada set objek yang sama (pengamatan), digunakan t-kriteria untuk sampel dependen. Untuk analisis varians, penting juga apakah sampel bergantung atau tidak. Jika ada pengukuran berulang dari variabel yang sama (dalam kondisi yang berbeda atau pada waktu yang berbeda) untuk objek yang sama, lalu mereka mengatakan tentang kehadiran faktor tindakan berulang(disebut juga faktor intragrup karena jumlah kuadrat dalam grup dihitung untuk mengevaluasi signifikansinya). Jika kelompok objek yang berbeda dibandingkan (misalnya, pria dan wanita, tiga jenis bakteri, dll.), maka perbedaan antara kelompok tersebut dijelaskan faktor antarkelompok. Metode untuk menghitung kriteria signifikansi untuk dua jenis faktor yang dijelaskan berbeda, tetapi logika umum dan interpretasinya sama.

Rencana antar dan intra kelompok. Dalam banyak kasus, eksperimen memerlukan pencantuman faktor antara kelompok dan faktor pengukuran berulang dalam desain. Misalnya, keterampilan matematika siswa perempuan dan laki-laki diukur (di mana: lantai -Jenis kelamin-faktor antarkelompok) di awal dan di akhir semester. Kedua dimensi keterampilan masing-masing siswa membentuk faktor dalam kelompok (repeated measures factor). Interpretasi dari efek utama dan interaksi antara kelompok dan faktor pengukuran berulang adalah sama, dan kedua jenis faktor tersebut jelas dapat berinteraksi satu sama lain (misalnya, perempuan memperoleh keterampilan selama semester, dan laki-laki kehilangan keterampilan tersebut).

Rencana tidak lengkap (bersarang)

Dalam banyak kasus, efek interaksi dapat diabaikan. Ini terjadi baik ketika diketahui bahwa tidak ada efek interaksi dalam populasi, atau ketika implementasi penuh faktorial rencana tidak mungkin. Misalnya, pengaruh empat aditif bahan bakar pada konsumsi bahan bakar sedang dipelajari. Empat mobil dan empat pengemudi dipilih. Penuh faktorial percobaan mengharuskan setiap kombinasi: suplemen, driver, mobil, muncul setidaknya sekali. Ini membutuhkan setidaknya 4 x 4 x 4 = 64 kelompok uji, yang terlalu memakan waktu. Selain itu, hampir tidak ada interaksi antara pengemudi dan aditif bahan bakar. Dengan mengingat hal ini, Anda dapat menggunakan rencana kotak latin, yang hanya berisi 16 kelompok pengujian (empat bahan tambahan ditandai dengan huruf A, B, C dan D):

Kotak Latin dijelaskan di sebagian besar buku desain eksperimental (misalnya Hays, 1988; Lindman, 1974; Milliken dan Johnson, 1984; Winer, 1962) dan tidak akan dibahas secara rinci di sini. Perhatikan bahwa kotak Latin adalah bukannpenuh rencana yang tidak mencakup semua kombinasi tingkat faktor. Misalnya, pengemudi 1 mengendarai mobil 1 dengan aditif A saja, pengemudi 3 mengendarai mobil 1 dengan aditif C saja. Tingkat faktor aditif ( A, B, C dan D) bersarang di sel tabel mobil x pengemudi - seperti telur dalam sarang. Aturan mnemonik ini berguna untuk memahami alam bersarang atau bersarang rencana. Modul Analisis varians menyediakan cara sederhana untuk menganalisis rencana jenis ini.

Analisis Kovarians

Ide utama

Dalam bab Ide Kunci ada diskusi singkat tentang ide faktor pengontrol dan bagaimana penyertaan faktor aditif dapat mengurangi jumlah kesalahan kuadrat dan meningkatkan kekuatan statistik desain. Semua ini dapat diperluas ke variabel dengan serangkaian nilai yang berkelanjutan. Ketika variabel kontinu seperti itu dimasukkan sebagai faktor dalam desain, mereka disebut kovariat.

Kovariat tetap

Misalkan kita membandingkan keterampilan matematika dua kelompok siswa yang diajar dari dua buku teks yang berbeda. Mari kita asumsikan juga bahwa kita memiliki data intelligence quotient (IQ) untuk setiap siswa. Kita dapat berasumsi bahwa IQ terkait dengan keterampilan matematika dan menggunakan informasi ini. Untuk masing-masing dari dua kelompok siswa, koefisien korelasi antara IQ dan keterampilan matematika dapat dihitung. Dengan menggunakan koefisien korelasi ini, dimungkinkan untuk membedakan antara bagian varians dalam kelompok yang dijelaskan oleh pengaruh IQ dan bagian varians yang tidak dapat dijelaskan (lihat juga Konsep dasar statistik(bab 8) dan Statistik dan tabel dasar(Bab 9)). Fraksi yang tersisa dari varians digunakan dalam analisis sebagai varians kesalahan. Jika ada korelasi antara IQ dan keterampilan matematika, maka varians kesalahan dapat dikurangi secara signifikan. SS/(n-1) .

Pengaruh kovariat padaF- kriteria. F- kriteria mengevaluasi signifikansi statistik dari perbedaan antara nilai rata-rata dalam kelompok, sedangkan rasio varians antarkelompok dihitung ( NONAmemengaruhi) dengan varian kesalahan ( NONAkesalahan) . Jika sebuah NONAkesalahan menurun, misalnya, ketika memperhitungkan faktor IQ, nilainya F meningkat.

Banyak kovariat. Alasan yang digunakan di atas untuk satu kovariat (IQ) dengan mudah meluas ke beberapa kovariat. Misalnya, selain IQ, Anda dapat memasukkan pengukuran motivasi, pemikiran spasial, dll. Alih-alih koefisien korelasi biasa, koefisien korelasi ganda digunakan.

Ketika nilaiF -kriteria berkurang Terkadang pengenalan kovariat dalam desain eksperimen mengurangi nilainya F- kriteria . Ini biasanya menunjukkan bahwa kovariat tidak hanya berkorelasi dengan variabel terikat (seperti keterampilan matematika) tetapi juga dengan faktor (seperti buku teks yang berbeda). Asumsikan bahwa IQ diukur pada akhir semester, setelah dua kelompok siswa menghabiskan hampir satu tahun mempelajari dua buku teks yang berbeda. Meskipun siswa dibagi menjadi beberapa kelompok secara acak, namun ternyata perbedaan dalam buku teks begitu besar sehingga baik IQ dan keterampilan matematika dalam kelompok yang berbeda akan sangat bervariasi. Dalam hal ini, kovariat tidak hanya mengurangi varians kesalahan, tetapi juga varians antar-kelompok. Dengan kata lain, setelah mengontrol perbedaan IQ antar kelompok, perbedaan keterampilan matematika tidak lagi signifikan. Bisa dikatakan sebaliknya. Setelah "menghilangkan" pengaruh IQ, pengaruh buku teks pada pengembangan keterampilan matematika secara tidak sengaja dikecualikan.

Rata-rata yang disesuaikan. Ketika kovariat mempengaruhi faktor antar-kelompok, seseorang harus menghitung rata-rata yang disesuaikan, yaitu cara tersebut, yang diperoleh setelah menghapus semua perkiraan kovariat.

Interaksi antara kovariat dan faktor. Sama seperti interaksi antar faktor yang dieksplorasi, interaksi antara kovariat dan antara kelompok faktor dapat dieksplorasi. Misalkan salah satu buku teks sangat cocok untuk siswa pintar. Buku pelajaran kedua membosankan bagi siswa yang pandai, dan buku pelajaran yang sama sulit bagi siswa yang kurang pandai. Akibatnya, ada korelasi positif antara IQ dan hasil belajar pada kelompok pertama (siswa lebih pintar, hasil lebih baik) dan korelasi negatif nol atau sedikit pada kelompok kedua (semakin pintar siswa, semakin kecil kemungkinan untuk memperoleh keterampilan matematika). dari buku teks kedua). Dalam beberapa penelitian, situasi ini dibahas sebagai contoh pelanggaran asumsi analisis kovarians. Namun, karena modul Analisis Varians menggunakan metode analisis kovarians yang paling umum, adalah mungkin, khususnya, untuk menilai signifikansi statistik dari interaksi antara faktor dan kovariat.

Kovariat variabel

Sementara kovariat tetap dibahas cukup sering dalam buku teks, kovariat variabel jauh lebih jarang disebutkan. Biasanya, ketika melakukan eksperimen dengan pengukuran berulang, kami tertarik pada perbedaan pengukuran besaran yang sama pada titik waktu yang berbeda. Yaitu, kami tertarik pada pentingnya perbedaan ini. Jika pengukuran kovariat dilakukan bersamaan dengan pengukuran variabel dependen, maka korelasi antara kovariat dan variabel dependen dapat dihitung.

Misalnya, Anda dapat mempelajari minat matematika dan keterampilan matematika di awal dan di akhir semester. Akan menarik untuk memeriksa apakah perubahan minat dalam matematika berkorelasi dengan perubahan keterampilan matematika.

Modul Analisis varians di STATISTIK secara otomatis menilai signifikansi statistik dari perubahan kovariat dalam rencana tersebut, jika memungkinkan.

Desain Multivariat: ANOVA Multivariat dan Analisis Kovarians

Rencana antar kelompok

Semua contoh yang dipertimbangkan sebelumnya hanya memasukkan satu variabel terikat. Ketika ada beberapa variabel terikat pada saat yang sama, hanya kompleksitas perhitungan yang meningkat, dan isi serta prinsip-prinsip dasar tidak berubah.

Misalnya, sebuah penelitian sedang dilakukan pada dua buku teks yang berbeda. Pada saat yang sama, keberhasilan siswa dalam studi fisika dan matematika dipelajari. Dalam hal ini, ada dua variabel dependen dan Anda perlu mencari tahu bagaimana dua buku teks yang berbeda mempengaruhi mereka secara bersamaan. Untuk melakukan ini, Anda dapat menggunakan analisis varians multivariat (MANOVA). Alih-alih satu dimensi F kriteria, multidimensi F uji (Wilks l-test) berdasarkan perbandingan matriks kovarians error dan matriks kovarians antarkelompok.

Jika variabel dependen berkorelasi satu sama lain, maka korelasi ini harus diperhitungkan saat menghitung uji signifikansi. Jelas, jika pengukuran yang sama diulang dua kali, maka tidak ada hal baru yang dapat diperoleh dalam kasus ini. Jika dimensi yang berkorelasi dengannya ditambahkan ke dimensi yang ada, maka beberapa informasi baru diperoleh, tetapi variabel baru mengandung informasi yang berlebihan, yang tercermin dalam kovarians antar variabel.

Interpretasi hasil. Jika kriteria multivariat keseluruhan signifikan, kita dapat menyimpulkan bahwa efek yang sesuai (misalnya jenis buku teks) adalah signifikan. Namun, pertanyaan berikut muncul. Apakah jenis buku teks berpengaruh terhadap peningkatan keterampilan matematika saja, keterampilan fisik saja, atau keduanya. Faktanya, setelah mendapatkan kriteria multivariat yang bermakna, untuk efek atau interaksi utama tunggal, satu dimensi F kriteria. Dengan kata lain, variabel dependen yang berkontribusi terhadap signifikansi uji multivariat diperiksa secara terpisah.

Rencana dengan pengukuran berulang

Jika kemampuan matematis dan fisik siswa diukur pada awal semester dan di akhir semester, maka pengukuran tersebut merupakan pengukuran yang berulang. Studi tentang kriteria signifikansi dalam rencana semacam itu adalah pengembangan logis dari kasus satu dimensi. Perhatikan bahwa metode ANOVA multivariat juga biasa digunakan untuk menyelidiki signifikansi faktor pengukuran berulang univariat yang memiliki lebih dari dua tingkat. Aplikasi yang sesuai akan dibahas nanti di bagian ini.

Penjumlahan nilai variabel dan analisis varians multivariat

Bahkan pengguna ANOVA univariat dan multivariat yang berpengalaman pun sering bingung ketika mereka mendapatkan hasil yang berbeda ketika menerapkan ANOVA multivariat ke, katakanlah, tiga variabel, dan ketika menerapkan ANOVA univariat pada jumlah ketiga variabel ini sebagai satu variabel.

Ide penjumlahan variabel adalah bahwa setiap variabel mengandung beberapa variabel benar, yang diselidiki, serta kesalahan pengukuran acak. Oleh karena itu, ketika rata-rata nilai variabel, kesalahan pengukuran akan mendekati 0 untuk semua pengukuran dan nilai rata-rata akan lebih dapat diandalkan. Sebenarnya, dalam hal ini, menerapkan ANOVA pada jumlah variabel adalah teknik yang masuk akal dan kuat. Namun, jika variabel dependen bersifat multivariat, menjumlahkan nilai variabel tidak tepat.

Misalnya, biarkan variabel dependen terdiri dari empat ukuran: sukses di masyarakat. Setiap indikator mencirikan sisi aktivitas manusia yang sepenuhnya independen (misalnya, kesuksesan profesional, kesuksesan bisnis, kesejahteraan keluarga, dll.). Menambahkan variabel-variabel ini bersama-sama seperti menambahkan apel dan jeruk. Jumlah dari variabel-variabel ini tidak akan menjadi ukuran univariat yang sesuai. Oleh karena itu, data tersebut harus diperlakukan sebagai indikator multidimensi dalam analisis varians multivariat.

Analisis kontras dan tes post hoc

Mengapa seperangkat sarana individu dibandingkan?

Biasanya hipotesis tentang data eksperimen dirumuskan tidak hanya dalam hal efek utama atau interaksi. Contohnya adalah hipotesis berikut: buku teks tertentu meningkatkan keterampilan matematika hanya pada siswa laki-laki, sementara buku teks lain kira-kira sama efektifnya untuk kedua jenis kelamin, tetapi masih kurang efektif untuk pria. Dapat diprediksi bahwa kinerja buku teks berinteraksi dengan jenis kelamin siswa. Namun, prediksi ini juga berlaku alam interaksi. Sebuah perbedaan yang signifikan antara jenis kelamin diharapkan untuk siswa dalam satu buku, dan hasil praktis gender-independen untuk siswa di buku lain. Jenis hipotesis ini biasanya dieksplorasi menggunakan analisis kontras.

Analisis Kontras

Singkatnya, analisis kontras memungkinkan kita untuk mengevaluasi signifikansi statistik dari beberapa kombinasi linier dari efek kompleks. Analisis kontras adalah elemen utama dan tak terpisahkan dari setiap rencana ANOVA yang kompleks. Modul Analisis varians memiliki beragam kemampuan analisis kontras yang memungkinkan Anda memilih dan menganalisis semua jenis perbandingan rata-rata.

sebuah posteriori perbandingan

Terkadang, sebagai hasil dari pemrosesan percobaan, efek yang tidak terduga ditemukan. Meskipun dalam banyak kasus peneliti kreatif akan dapat menjelaskan hasil apa pun, ini tidak memberikan peluang untuk analisis dan perkiraan lebih lanjut untuk perkiraan. Masalah ini adalah salah satunya yang kriteria post hoc, yaitu kriteria yang tidak menggunakan sebuah prioritas hipotesis. Sebagai ilustrasi, perhatikan percobaan berikut. Misalkan 100 kartu berisi angka dari 1 hingga 10. Setelah memasukkan semua kartu ini ke dalam header, kami memilih secara acak 20 kali 5 kartu, dan menghitung nilai rata-rata untuk setiap sampel (rata-rata angka yang tertulis di kartu). Bisakah kita berharap bahwa ada dua sampel yang rata-ratanya berbeda secara signifikan? Ini sangat masuk akal! Dengan memilih dua sampel dengan rata-rata maksimum dan minimum, dapat diperoleh perbedaan rata-rata yang sangat berbeda dengan perbedaan rata-rata, misalnya dua sampel pertama. Perbedaan ini dapat diselidiki, misalnya, menggunakan analisis kontras. Tanpa merinci, ada beberapa yang disebut sebuah posteriori kriteria yang didasarkan tepat pada skenario pertama (mengambil rata-rata ekstrim dari 20 sampel), yaitu kriteria ini didasarkan pada pemilihan cara yang paling berbeda untuk membandingkan semua cara dalam desain. Kriteria ini diterapkan agar tidak mendapatkan efek artifisial semata-mata karena kebetulan, misalnya untuk menemukan perbedaan yang signifikan antara rata-rata padahal tidak ada. Modul Analisis varians menawarkan berbagai kriteria tersebut. Ketika hasil yang tidak terduga ditemukan dalam percobaan yang melibatkan banyak kelompok, sebuah posteriori prosedur untuk memeriksa signifikansi statistik dari hasil yang diperoleh.

Jumlah kuadrat tipe I, II, III dan IV

Regresi multivariat dan analisis varians

Terdapat hubungan yang erat antara metode regresi multivariat dan analisis varians (analisis variasi). Dalam kedua metode, model linier dipelajari. Singkatnya, hampir semua desain eksperimental dapat dieksplorasi menggunakan regresi multivariat. Perhatikan denah sederhana kelompok silang 2 x 2 berikut.

DV A B kapak
3 1 1 1
4 1 1 1
4 1 -1 -1
5 1 -1 -1
6 -1 1 -1
6 -1 1 -1
3 -1 -1 1
2 -1 -1 1

Kolom A dan B berisi kode yang mencirikan tingkat faktor A dan B, kolom AxB berisi produk dari dua kolom A dan B. Kita dapat menganalisis data ini menggunakan regresi multivariat. Variabel DV didefinisikan sebagai variabel terikat, variabel dari A sebelum kapak sebagai variabel bebas. Studi signifikansi untuk koefisien regresi akan bertepatan dengan perhitungan dalam analisis varians dari signifikansi efek utama dari faktor A dan B dan efek interaksi kapak.

Paket Tidak Seimbang dan Seimbang

Ketika menghitung matriks korelasi untuk semua variabel, misalnya untuk data yang digambarkan di atas, dapat dilihat bahwa efek utama dari faktor-faktor tersebut A dan B dan efek interaksi kapak tidak berkorelasi. Sifat efek ini juga disebut ortogonalitas. Mereka mengatakan bahwa efeknya A dan B - ortogonal atau mandiri dari satu sama lain. Jika semua efek dalam rencana saling ortogonal, seperti pada contoh di atas, maka rencana tersebut dikatakan seimbang.

Rencana yang seimbang memiliki "properti yang baik." Perhitungan dalam analisis rencana semacam itu sangat sederhana. Semua perhitungan direduksi menjadi menghitung korelasi antara efek dan variabel dependen. Karena efeknya ortogonal, korelasi parsial (seperti secara penuh) multidimensi regresi) tidak dihitung. Namun, dalam kehidupan nyata, rencana tidak selalu seimbang.

Pertimbangkan data nyata dengan jumlah pengamatan yang tidak sama dalam sel.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 2

Jika kita mengkodekan data ini seperti di atas dan menghitung matriks korelasi untuk semua variabel, maka ternyata faktor desain berkorelasi satu sama lain. Faktor-faktor dalam rencana sekarang tidak ortogonal dan rencana semacam itu disebut tidak seimbang. Perhatikan bahwa dalam contoh ini, korelasi antara faktor-faktor tersebut sepenuhnya terkait dengan perbedaan frekuensi 1 dan -1 dalam kolom-kolom matriks data. Dengan kata lain, desain eksperimental dengan volume sel yang tidak sama (lebih tepatnya, volume yang tidak proporsional) akan menjadi tidak seimbang, yang berarti bahwa efek dan interaksi utama akan bercampur. Dalam hal ini, untuk menghitung signifikansi statistik dari efek, Anda perlu menghitung regresi multivariat sepenuhnya. Ada beberapa strategi di sini.

Jumlah kuadrat tipe I, II, III dan IV

Jenis jumlah kuadratSayadanAKU AKU AKU. Untuk mempelajari signifikansi setiap faktor dalam model multivariat, seseorang dapat menghitung korelasi parsial setiap faktor, asalkan semua faktor lain telah diperhitungkan dalam model. Anda juga dapat memasukkan faktor ke dalam model secara bertahap, memperbaiki semua faktor yang sudah dimasukkan ke dalam model dan mengabaikan semua faktor lainnya. Secara umum, ini adalah perbedaan antara Tipe AKU AKU AKU dan TipeSaya jumlah kuadrat (terminologi ini diperkenalkan di SAS, lihat misalnya SAS, 1982; diskusi terperinci juga dapat ditemukan di Searle, 1987, hlm. 461; Woodward, Bonett, dan Brecht, 1990, hlm. 216; atau Milliken dan Johnson, 1984, hlm. 138).

Jenis jumlah kuadratII. Strategi pembentukan model “perantara” berikutnya adalah: mengendalikan semua efek utama dalam studi signifikansi efek utama tunggal; dalam kontrol semua efek utama dan semua interaksi berpasangan, ketika signifikansi dari interaksi berpasangan tunggal diperiksa; dalam mengendalikan semua efek utama dari semua interaksi berpasangan dan semua interaksi tiga faktor; dalam studi interaksi terpisah dari tiga faktor, dll. Jumlah kuadrat untuk efek yang dihitung dengan cara ini disebut TipeII jumlah kuadrat. Jadi, TipeII jumlah kuadrat mengontrol semua efek dari urutan yang sama dan di bawahnya, mengabaikan semua efek dari urutan yang lebih tinggi.

Jenis jumlah kuadratIV. Akhirnya, untuk beberapa rencana khusus dengan sel yang hilang (rencana tidak lengkap), dimungkinkan untuk menghitung apa yang disebut Tipe IV jumlah kuadrat. Metode ini akan dibahas nanti sehubungan dengan rencana yang tidak lengkap (rencana dengan sel yang hilang).

Interpretasi Dugaan Jumlah Kuadrat Tipe I, II, dan III

jumlah kuadrat TipeAKU AKU AKU paling mudah untuk ditafsirkan. Ingatlah bahwa jumlah kuadrat TipeAKU AKU AKU memeriksa efek setelah mengendalikan semua efek lainnya. Misalnya, setelah menemukan signifikan secara statistik TipeAKU AKU AKU efek untuk faktor A dalam modul Analisis varians, kita dapat mengatakan bahwa ada satu pengaruh signifikan dari faktor A, setelah memperkenalkan semua efek (faktor) lain dan menafsirkan efek ini sesuai dengan itu. Mungkin dalam 99% dari semua aplikasi analisis varians, jenis kriteria ini menarik bagi peneliti. Jenis jumlah kuadrat ini biasanya dihitung dalam modul Analisis varians secara default, terlepas dari apakah opsi tersebut dipilih Pendekatan Regresi atau tidak (pendekatan standar diadopsi dalam modul Analisis varians didiskusikan di bawah).

Efek signifikan yang diperoleh dengan menggunakan jumlah kuadrat Tipe atau TipeII jumlah kuadrat tidak begitu mudah untuk ditafsirkan. Mereka paling baik ditafsirkan dalam konteks regresi multivariat bertahap. Jika menggunakan jumlah kuadrat TipeSaya pengaruh utama faktor B adalah signifikan (setelah dimasukkannya faktor A dalam model, tetapi sebelum ditambahkan interaksi antara A dan B), dapat disimpulkan bahwa terdapat pengaruh utama yang signifikan dari faktor B, asalkan tidak ada interaksi antara faktor A dan B. (Jika menggunakan kriteria TipeAKU AKU AKU, faktor B juga ternyata signifikan, maka kita dapat menyimpulkan bahwa ada pengaruh utama yang signifikan dari faktor B, setelah memasukkan semua faktor lain dan interaksinya ke dalam model).

Dalam hal sarana marjinal hipotesis TipeSaya dan TipeII biasanya tidak memiliki interpretasi yang sederhana. Dalam kasus ini, dikatakan bahwa seseorang tidak dapat menafsirkan signifikansi efek dengan hanya mempertimbangkan sarana marginal. agak disajikan p nilai rata-rata terkait dengan hipotesis kompleks yang menggabungkan cara dan ukuran sampel. Sebagai contoh, TipeII hipotesis untuk faktor A dalam contoh desain 2 x 2 sederhana yang dibahas sebelumnya adalah (lihat Woodward, Bonett, dan Brecht, 1990, hlm. 219):

nijo- jumlah pengamatan dalam sel

uij- nilai rata-rata dalam sel

n. j- rata-rata marjinal

Tanpa masuk ke rincian (untuk rincian lebih lanjut lihat Milliken dan Johnson, 1984, bab 10), jelas bahwa ini bukan hipotesis sederhana dan dalam banyak kasus tidak satupun dari mereka yang menarik bagi peneliti. Namun, ada kasus di mana hipotesis TipeSaya mungkin menarik.

Pendekatan komputasi default dalam modul Analisis varians

Default jika opsi tidak dicentang Pendekatan Regresi, modul Analisis varians menggunakan model rata-rata sel. Merupakan karakteristik dari model ini bahwa jumlah kuadrat untuk efek yang berbeda dihitung untuk kombinasi linier rata-rata sel. Dalam percobaan faktorial penuh, ini menghasilkan jumlah kuadrat yang sama dengan jumlah kuadrat yang dibahas sebelumnya sebagai Tipe AKU AKU AKU. Namun, dalam opsi Perbandingan Terjadwal(di jendela Analisis hasil varians), pengguna dapat menguji hipotesis tentang kombinasi linier dari rata-rata sel berbobot atau tidak berbobot. Dengan demikian, pengguna tidak hanya dapat menguji hipotesis TipeAKU AKU AKU, tetapi hipotesis jenis apa pun (termasuk TipeIV). Pendekatan umum ini sangat berguna ketika memeriksa desain dengan sel yang hilang (disebut desain yang tidak lengkap).

Untuk desain faktorial penuh, pendekatan ini juga berguna ketika seseorang ingin menganalisis rata-rata marginal tertimbang. Misalnya, dalam desain sederhana 2 x 2 yang dipertimbangkan sebelumnya, kami ingin membandingkan pembobotan (dalam hal tingkat faktor) B) rata-rata marjinal untuk faktor A. Ini berguna ketika distribusi pengamatan pada sel tidak disiapkan oleh eksperimen, tetapi dibangun secara acak, dan keacakan ini tercermin dalam distribusi jumlah pengamatan oleh tingkat faktor B dalam agregat .

Misalnya, ada faktor - usia janda. Kemungkinan sampel responden dibagi menjadi dua kelompok: lebih muda dari 40 dan lebih tua dari 40 (faktor B). Faktor kedua (faktor A) dalam rencana tersebut adalah apakah janda menerima dukungan sosial dari beberapa agen atau tidak (sementara beberapa janda dipilih secara acak, yang lain berfungsi sebagai kontrol). Dalam hal ini, distribusi usia janda dalam sampel mencerminkan distribusi usia janda yang sebenarnya dalam populasi. Menilai efektivitas kelompok dukungan sosial untuk janda semua umur akan sesuai dengan rata-rata tertimbang untuk dua kelompok usia (dengan bobot sesuai dengan jumlah pengamatan dalam kelompok).

Perbandingan Terjadwal

Perhatikan bahwa jumlah rasio kontras yang dimasukkan tidak harus sama dengan 0 (nol). Sebaliknya, program akan secara otomatis melakukan penyesuaian sehingga hipotesis yang sesuai tidak bercampur dengan rata-rata keseluruhan.

Untuk mengilustrasikannya, mari kembali ke denah sederhana 2 x 2 yang dibahas sebelumnya. Ingat bahwa jumlah sel dari desain tidak seimbang ini adalah -1, 2, 3, dan 1. Katakanlah kita ingin membandingkan rata-rata marjinal tertimbang untuk faktor A (ditimbang oleh frekuensi tingkat faktor B). Anda dapat memasukkan rasio kontras:

Perhatikan bahwa koefisien-koefisien ini tidak berjumlah 0. Program akan menyetel koefisien-koefisien tersebut sehingga berjumlah 0, dengan tetap mempertahankan nilai relatifnya, yaitu:

1/3 2/3 -3/4 -1/4

Kontras ini akan membandingkan rata-rata tertimbang untuk faktor A.

Hipotesis tentang mean utama. Hipotesis bahwa rata-rata utama tidak tertimbang adalah 0 dapat dieksplorasi menggunakan koefisien:

Hipotesis bahwa rata-rata utama tertimbang adalah 0 diuji dengan:

Dalam kasus apa pun program tidak mengoreksi rasio kontras.

Analisis rencana dengan sel yang hilang (rencana tidak lengkap)

Desain faktorial yang mengandung sel kosong (pemrosesan kombinasi sel yang tidak memiliki pengamatan) disebut tidak lengkap. Dalam desain seperti itu, beberapa faktor biasanya tidak ortogonal dan beberapa interaksi tidak dapat dihitung. Secara umum, tidak ada metode yang lebih baik untuk menganalisis rencana tersebut.

Pendekatan Regresi

Dalam beberapa program lama yang didasarkan pada analisis desain ANOVA menggunakan regresi multivariat, faktor-faktor dalam desain yang tidak lengkap ditetapkan secara default dengan cara biasa (seolah-olah rencana telah lengkap). Analisis regresi multivariat kemudian dilakukan untuk faktor-faktor kode-dummy ini. Sayangnya, metode ini mengarah pada hasil yang sangat sulit, jika bukan tidak mungkin, untuk ditafsirkan karena tidak jelas bagaimana masing-masing efek berkontribusi pada kombinasi linear rata-rata. Perhatikan contoh sederhana berikut.

Faktor A Faktor B
B1 B2
A1 3 4, 5
A2 6, 6, 7 Dirindukan

Jika regresi multivariat berbentuk Variabel terikat = Konstanta + Faktor A + Faktor B, maka hipotesis tentang signifikansi faktor A dan B dalam hal kombinasi linear rata-rata terlihat seperti ini:

Faktor A: Sel A1,B1 = Sel A2,B1

Faktor B: Sel A1,B1 = Sel A1,B2

Kasus ini sederhana. Dalam rencana yang lebih kompleks, tidak mungkin untuk benar-benar menentukan apa yang sebenarnya akan diperiksa.

Sel rata-rata, pendekatan analisis varians , hipotesis tipe IV

Pendekatan yang direkomendasikan dalam literatur dan tampaknya lebih disukai adalah studi yang bermakna (dalam hal tugas penelitian) sebuah prioritas hipotesis tentang cara yang diamati dalam sel rencana. Sebuah diskusi rinci tentang pendekatan ini dapat ditemukan di Dodge (1985), Heiberger (1989), Milliken dan Johnson (1984), Searle (1987), atau Woodward, Bonett, dan Brecht (1990). Jumlah kuadrat yang terkait dengan hipotesis tentang kombinasi linier sarana dalam desain yang tidak lengkap, menyelidiki perkiraan bagian dari efek, juga disebut jumlah kuadrat. IV.

Pembuatan hipotesis tipe otomatisIV. Ketika desain multivariat memiliki pola sel yang hilang yang kompleks, diinginkan untuk mendefinisikan hipotesis ortogonal (independen) yang penyelidikannya setara dengan penyelidikan efek atau interaksi utama. Strategi algoritmik (komputasi) (berdasarkan matriks desain terbalik semu) telah dikembangkan untuk menghasilkan bobot yang sesuai untuk perbandingan tersebut. Sayangnya, hipotesis akhir tidak ditentukan secara unik. Tentu saja, mereka bergantung pada urutan di mana efek didefinisikan dan jarang mudah untuk ditafsirkan. Oleh karena itu, disarankan untuk mempelajari dengan cermat sifat sel yang hilang, kemudian merumuskan hipotesis TipeIV, yang paling relevan dengan tujuan penelitian. Kemudian jelajahi hipotesis ini menggunakan opsi Perbandingan Terjadwal di jendela hasil. Cara termudah untuk menentukan perbandingan dalam kasus ini adalah dengan meminta pengenalan vektor kontras untuk semua faktor bersama di jendela Perbandingan terjadwal. Setelah memanggil kotak dialog Perbandingan Terjadwal semua grup dari paket saat ini akan ditampilkan dan grup yang dihilangkan akan ditandai.

Sel yang Dilewati dan Pemeriksaan Efek Spesifik

Ada beberapa jenis rencana di mana lokasi sel yang hilang tidak acak, tetapi direncanakan dengan hati-hati, yang memungkinkan analisis sederhana dari efek utama tanpa mempengaruhi efek lainnya. Misalnya, ketika jumlah sel yang diperlukan dalam rencana tidak tersedia, rencana sering digunakan. kotak latin untuk memperkirakan efek utama dari beberapa faktor dengan jumlah level yang banyak. Misalnya, desain faktorial 4 x 4 x 4 x 4 membutuhkan 256 sel. Pada saat yang sama, Anda dapat menggunakan Alun-alun Yunani-Latin untuk memperkirakan efek utama, hanya memiliki 16 sel dalam rencana (bab. Perencanaan percobaan, Volume IV, berisi penjelasan rinci tentang rencana tersebut). Desain tidak lengkap di mana efek utama (dan beberapa interaksi) dapat diperkirakan menggunakan kombinasi linear sederhana dari cara disebut rencana tidak lengkap yang seimbang.

Dalam desain seimbang, metode standar (default) menghasilkan kontras (bobot) untuk efek utama dan interaksi kemudian akan menghasilkan analisis tabel varians di mana jumlah kuadrat untuk masing-masing efek tidak bercampur satu sama lain. Pilihan Efek Spesifik jendela hasil akan menghasilkan kontras yang hilang dengan menulis nol ke sel rencana yang hilang. Segera setelah opsi diminta Efek Spesifik untuk pengguna yang mempelajari beberapa hipotesis, tabel hasil muncul dengan bobot sebenarnya. Perhatikan bahwa dalam desain seimbang, jumlah kuadrat dari masing-masing efek dihitung hanya jika efek tersebut ortogonal (tidak tergantung) terhadap semua efek dan interaksi utama lainnya. Jika tidak, gunakan opsi Perbandingan Terjadwal untuk mengeksplorasi perbandingan yang bermakna antara sarana.

Sel Hilang dan Efek/Anggota Kesalahan Gabungan

Jika opsi Pendekatan regresi di panel peluncuran modul Analisis varians tidak dipilih, model rata-rata sel akan digunakan saat menghitung jumlah kuadrat untuk efek (pengaturan default). Jika desainnya tidak seimbang, maka saat menggabungkan efek non-ortogonal (lihat diskusi opsi di atas Sel yang hilang dan efek spesifik) seseorang dapat memperoleh jumlah kuadrat yang terdiri dari komponen non-ortogonal (atau tumpang tindih). Hasil yang diperoleh dengan cara ini biasanya tidak dapat ditafsirkan. Oleh karena itu, seseorang harus sangat berhati-hati ketika memilih dan menerapkan desain eksperimen yang kompleks dan tidak lengkap.

Ada banyak buku dengan diskusi rinci tentang berbagai jenis rencana. (Dodge, 1985; Heiberger, 1989; Lindman, 1974; Milliken dan Johnson, 1984; Searle, 1987; Woodward dan Bonett, 1990), tetapi informasi semacam ini berada di luar cakupan buku teks ini. Namun, analisis berbagai jenis rencana akan ditunjukkan nanti di bagian ini.

Asumsi dan Akibat Pelanggaran Asumsi

Penyimpangan dari asumsi distribusi normal

Asumsikan bahwa variabel dependen diukur pada skala numerik. Mari kita asumsikan juga bahwa variabel dependen memiliki distribusi normal dalam setiap grup. Analisis varians berisi berbagai grafik dan statistik untuk mendukung asumsi ini.

Efek pelanggaran. Umumnya F kriteria tersebut sangat tahan terhadap penyimpangan dari normalitas (lihat Lindman, 1974 untuk hasil yang lebih rinci). Jika kurtosis lebih besar dari 0, maka nilai statistik F mungkin menjadi sangat kecil. Hipotesis nol diterima, meskipun mungkin tidak benar. Situasi terbalik ketika kurtosis kurang dari 0. Kemiringan distribusi biasanya memiliki sedikit efek pada F statistik. Jika jumlah pengamatan dalam sel cukup besar, maka penyimpangan dari normalitas tidak terlalu menjadi masalah karena teorema limit pusat, yang menurutnya, distribusi nilai rata-rata mendekati normal, terlepas dari distribusi awal. Diskusi mendetail tentang keberlanjutan F statistik dapat ditemukan di Box dan Anderson (1955), atau Lindman (1974).

Homogenitas dispersi

Asumsi. Diasumsikan bahwa varians dari kelompok yang berbeda dari rencana adalah sama. Asumsi ini disebut asumsi homogenitas dispersi. Ingatlah bahwa di awal bagian ini, ketika menjelaskan perhitungan jumlah kesalahan kuadrat, kami melakukan penjumlahan dalam setiap grup. Jika varians dalam dua kelompok berbeda satu sama lain, maka penambahannya tidak terlalu alami dan tidak memberikan estimasi total varians dalam grup (karena dalam kasus ini tidak ada varians umum sama sekali). Modul Analisis dispersi -ANOVA/MANOVA berisi satu set besar kriteria statistik untuk mendeteksi penyimpangan dari asumsi homogenitas varians.

Efek pelanggaran. Lindman (1974, hlm. 33) menunjukkan bahwa F kriteria cukup stabil sehubungan dengan pelanggaran asumsi homogenitas varians ( heterogenitas dispersi, lihat juga Kotak, 1954a, 1954b; Hsu, 1938).

Kasus khusus: korelasi rata-rata dan varians. Ada kalanya F statistik bisa menyesatkan. Ini terjadi ketika nilai rata-rata dalam sel desain berkorelasi dengan varians. Modul Analisis varians memungkinkan Anda untuk memplot varians atau sebar deviasi standar terhadap sarana untuk mendeteksi korelasi semacam itu. Alasan mengapa korelasi seperti itu berbahaya adalah sebagai berikut. Mari kita bayangkan bahwa ada 8 sel dalam rencana, 7 di antaranya memiliki rata-rata yang hampir sama, dan dalam satu sel rata-rata jauh lebih besar daripada yang lain. Kemudian F tes dapat mendeteksi efek yang signifikan secara statistik. Tetapi misalkan dalam sel dengan nilai rata-rata besar dan varians jauh lebih besar daripada yang lain, mis. mean dan varians dalam sel bergantung (semakin besar mean, semakin besar varians). Dalam hal ini, mean yang besar tidak dapat diandalkan, karena mungkin disebabkan oleh varians yang besar dalam data. Namun F statistik berdasarkan serikat varians dalam sel akan menangkap mean yang besar, meskipun kriteria berdasarkan varians di setiap sel tidak akan mempertimbangkan semua perbedaan mean sebagai signifikan.

Sifat data ini (rata-rata besar dan varians besar) sering ditemui ketika ada pengamatan outlier. Satu atau dua pengamatan outlier sangat menggeser mean dan sangat meningkatkan varians.

Homogenitas varians dan kovarians

Asumsi. Dalam desain multivariat, dengan ukuran dependen multivariat, asumsi homogenitas varians yang dijelaskan sebelumnya juga berlaku. Namun, karena ada variabel dependen multivariat, juga diperlukan korelasi silang (kovarians) yang seragam di semua sel rencana. Modul Analisis varians menawarkan cara yang berbeda untuk menguji asumsi ini.

Efek pelanggaran. Analog multidimensi F- kriteria - uji- Wilks. Tidak banyak yang diketahui tentang stabilitas (kekokohan) uji Wilks sehubungan dengan pelanggaran asumsi di atas. Namun, karena interpretasi hasil modul Analisis varians biasanya didasarkan pada signifikansi efek univariat (setelah menetapkan signifikansi kriteria umum), pembahasan ketahanan terutama menyangkut analisis varians univariat. Oleh karena itu, pentingnya efek satu dimensi harus diperiksa dengan cermat.

Kasus khusus: analisis kovarians. Pelanggaran yang sangat berat terhadap homogenitas varians/kovarians dapat terjadi ketika kovariat disertakan dalam desain. Secara khusus, jika korelasi antara kovariat dan ukuran dependen berbeda dalam sel desain yang berbeda, hasil yang salah interpretasi dapat terjadi. Harus diingat bahwa dalam analisis kovarians, pada dasarnya, analisis regresi dilakukan di dalam setiap sel untuk mengisolasi bagian varians yang sesuai dengan kovariat. Asumsi homogenitas varians/kovarians mengasumsikan bahwa analisis regresi ini dilakukan di bawah batasan berikut: semua persamaan regresi (kemiringan) untuk semua sel adalah sama. Jika ini tidak dimaksudkan, maka kesalahan besar dapat terjadi. Modul Analisis varians memiliki beberapa kriteria khusus untuk menguji asumsi ini. Mungkin disarankan untuk menggunakan kriteria ini untuk memastikan bahwa persamaan regresi untuk sel yang berbeda kira-kira sama.

Kebulatan dan simetri kompleks: alasan untuk menggunakan pendekatan pengukuran berulang multivariat dalam analisis varians

Dalam desain yang mengandung faktor ukuran berulang dengan lebih dari dua level, penerapan analisis varians univariat memerlukan asumsi tambahan: asumsi simetri kompleks dan asumsi sphericity. Asumsi ini jarang terpenuhi (lihat di bawah). Oleh karena itu, dalam beberapa tahun terakhir, analisis varians multivariat telah mendapatkan popularitas dalam rencana tersebut (kedua pendekatan digabungkan dalam modul Analisis varians).

Asumsi simetri kompleks Asumsi simetri kompleks adalah bahwa varians (total dalam grup) dan kovarians (berdasarkan grup) untuk pengukuran berulang yang berbeda adalah seragam (sama). Ini adalah kondisi yang cukup untuk uji F pengukuran berulang univariat agar valid (yaitu, nilai F yang dilaporkan, rata-rata, konsisten dengan distribusi F). Namun, dalam hal ini kondisi ini tidak diperlukan.

Asumsi kebulatan. Asumsi kebulatan adalah kondisi yang diperlukan dan cukup untuk kriteria-F untuk dibenarkan. Ini terdiri dari fakta bahwa di dalam kelompok semua pengamatan independen dan terdistribusi secara merata. Sifat asumsi ini, serta dampak pelanggarannya, biasanya tidak dijelaskan dengan baik dalam buku tentang analisis varians - yang satu ini akan dijelaskan dalam paragraf berikut. Juga akan ditunjukkan bahwa hasil pendekatan univariat mungkin berbeda dari hasil pendekatan multivariat, dan akan dijelaskan apa artinya ini.

Kebutuhan akan independensi hipotesis. Cara umum untuk menganalisis data dalam analisis varians adalah model cocok. Jika, sehubungan dengan model yang sesuai dengan data, ada beberapa: sebuah prioritas hipotesis, maka varians dibagi untuk menguji hipotesis ini (kriteria efek utama, interaksi). Dari sudut pandang komputasi, pendekatan ini menghasilkan beberapa set kontras (set perbandingan sarana dalam desain). Namun, jika kontras tidak independen satu sama lain, partisi varians menjadi tidak berarti. Misalnya, jika dua kontras A dan B identik dan bagian yang sesuai dipilih dari varians, kemudian bagian yang sama dipilih dua kali. Misalnya, konyol dan tidak ada gunanya untuk memilih dua hipotesis: "rata-rata di sel 1 lebih tinggi dari rata-rata di sel 2" dan "rata-rata di sel 1 lebih tinggi dari rata-rata di sel 2". Jadi hipotesis harus independen atau ortogonal.

Hipotesis independen dalam pengukuran berulang. Algoritma umum diimplementasikan dalam modul Analisis varians, akan mencoba menghasilkan kontras independen (ortogonal) untuk setiap efek. Untuk faktor ukuran berulang, kontras ini menimbulkan banyak hipotesis tentang perbedaan antara tingkat faktor yang dipertimbangkan. Namun, jika perbedaan ini dikorelasikan dalam kelompok, maka kontras yang dihasilkan tidak lagi independen. Misalnya, dalam pelatihan di mana peserta didik diukur tiga kali dalam satu semester, mungkin terjadi bahwa perubahan antara dimensi 1 dan 2 berkorelasi negatif dengan perubahan antara dimensi 2 dan 3 mata pelajaran. Mereka yang telah menguasai sebagian besar materi antara dimensi 1 dan 2 menguasai bagian yang lebih kecil selama waktu yang telah berlalu antara dimensi 2 dan 3. Bahkan, untuk kebanyakan kasus di mana analisis varians digunakan dalam pengukuran berulang, dapat diasumsikan bahwa perubahan tingkat berkorelasi di seluruh mata pelajaran. Namun, ketika ini terjadi, asumsi simetri dan kebulatan kompleks tidak terpenuhi dan kontras independen tidak dapat dihitung.

Dampak pelanggaran dan cara memperbaikinya. Ketika asumsi simetri atau kebulatan kompleks tidak terpenuhi, analisis varians dapat menghasilkan hasil yang salah. Sebelum prosedur multivariat cukup dikembangkan, beberapa asumsi dibuat untuk mengkompensasi pelanggaran asumsi ini. (Lihat, misalnya, Rumah Kaca & Geisser, 1959 dan Huynh & Feldt, 1970). Metode-metode ini masih banyak digunakan sampai sekarang (itulah sebabnya mereka disajikan dalam modul Analisis varians).

Analisis multivariat pendekatan varians untuk tindakan berulang. Secara umum, masalah simetri kompleks dan kebulatan mengacu pada fakta bahwa set kontras termasuk dalam studi efek faktor tindakan berulang (dengan lebih dari 2 tingkat) tidak independen satu sama lain. Namun, mereka tidak harus mandiri jika digunakan. multidimensi kriteria untuk secara simultan menguji signifikansi statistik dari dua atau lebih kontras faktor ukuran berulang. Inilah alasan mengapa metode analisis varians multivariat menjadi semakin banyak digunakan untuk menguji signifikansi faktor-faktor pengukuran berulang univariat dengan lebih dari 2 level. Pendekatan ini banyak digunakan karena umumnya tidak memerlukan asumsi simetri kompleks dan asumsi sphericity.

Kasus-kasus di mana pendekatan analisis varians multivariat tidak dapat digunakan. Ada contoh (rencana) ketika pendekatan analisis varians multivariat tidak dapat diterapkan. Ini biasanya kasus di mana ada sejumlah kecil subjek dalam desain dan banyak level dalam faktor tindakan berulang. Maka mungkin ada terlalu sedikit pengamatan untuk melakukan analisis multivariat. Misalnya, jika ada 12 entitas, p = 4 faktor pengukuran berulang, dan setiap faktor memiliki k = 3 tingkat. Maka interaksi 4 faktor akan “menghabiskan” (k-1)P = 2 4 = 16 derajat kebebasan. Namun, hanya ada 12 mata pelajaran, maka uji multivariat tidak dapat dilakukan dalam contoh ini. Modul Analisis varians akan secara independen mendeteksi pengamatan ini dan menghitung hanya kriteria satu dimensi.

Perbedaan hasil univariat dan multivariat. Jika studi mencakup sejumlah besar tindakan berulang, mungkin ada kasus di mana pendekatan tindakan berulang univariat dari ANOVA menghasilkan hasil yang sangat berbeda dari yang diperoleh dengan pendekatan multivariat. Ini berarti bahwa perbedaan antara tingkat pengukuran berulang masing-masing berkorelasi di seluruh mata pelajaran. Terkadang fakta ini memiliki kepentingan tersendiri.

Analisis multivariat varians dan pemodelan struktural persamaan

Dalam beberapa tahun terakhir, pemodelan persamaan struktural telah menjadi populer sebagai alternatif untuk analisis dispersi multivariat (lihat, misalnya, Bagozzi dan Yi, 1989; Bagozzi, Yi, dan Singh, 1991; Cole, Maxwell, Arvey, dan Salas, 1993). Pendekatan ini memungkinkan Anda untuk menguji hipotesis tidak hanya tentang rata-rata dalam kelompok yang berbeda, tetapi juga tentang matriks korelasi variabel dependen. Misalnya, Anda dapat mengendurkan asumsi tentang homogenitas varians dan kovarians dan secara eksplisit memasukkan kesalahan dalam model untuk setiap kelompok varians dan kovarians. Modul STATISTIKPemodelan Persamaan Struktural (SEPATH) (lihat Jilid III) memungkinkan dilakukannya analisis semacam itu.

Metode di atas untuk menguji hipotesis statistik tentang signifikansi perbedaan antara dua rata-rata dalam praktiknya terbatas penggunaannya. Ini disebabkan oleh fakta bahwa untuk mengidentifikasi pengaruh semua kondisi dan faktor yang mungkin pada sifat yang dihasilkan, percobaan lapangan dan laboratorium, sebagai suatu peraturan, dilakukan dengan menggunakan bukan dua, tetapi lebih banyak sampel (1220 atau lebih). ).

Seringkali, peneliti membandingkan cara beberapa sampel digabungkan menjadi satu kompleks. Misalnya, ketika mempelajari pengaruh berbagai jenis dan dosis pupuk terhadap hasil panen, percobaan diulang dalam versi yang berbeda. Dalam kasus ini, perbandingan berpasangan menjadi rumit, dan analisis statistik seluruh kompleks memerlukan penggunaan metode khusus. Metode ini, yang dikembangkan dalam statistik matematika, disebut analisis varians. Ini pertama kali digunakan oleh ahli statistik Inggris R. Fisher ketika memproses hasil percobaan agronomi (1938).

Analisis varians- ini adalah metode penilaian statistik keandalan manifestasi ketergantungan fitur efektif pada satu atau lebih faktor. Dengan menggunakan metode analisis varians, hipotesis statistik diuji mengenai rata-rata pada beberapa populasi umum yang berdistribusi normal.

Analisis varians adalah salah satu metode utama evaluasi statistik hasil percobaan. Hal ini juga semakin banyak digunakan dalam analisis informasi ekonomi. Analisis varians memungkinkan untuk menetapkan seberapa selektif indikator hubungan antara tanda-tanda efektif dan faktor yang cukup untuk menyebarkan data yang diperoleh dari sampel ke populasi umum. Keuntungan dari metode ini adalah memberikan kesimpulan yang cukup andal dari sampel kecil.

Dengan memeriksa variasi atribut yang dihasilkan di bawah pengaruh satu atau lebih faktor, dengan menggunakan analisis varians, seseorang dapat memperoleh, selain perkiraan umum tentang signifikansi dependensi, juga penilaian perbedaan dalam nilai rata-rata yang terbentuk pada berbagai tingkat faktor, dan pentingnya interaksi faktor. Analisis dispersi digunakan untuk mempelajari ketergantungan karakteristik kuantitatif dan kualitatif, serta kombinasinya.

Inti dari metode ini terletak pada studi statistik tentang kemungkinan pengaruh satu atau lebih faktor, serta interaksinya pada fitur yang efektif. Dengan demikian, dengan bantuan analisis varians, tiga tugas utama diselesaikan: 1) penilaian umum tentang signifikansi perbedaan antara rata-rata kelompok; 2) penilaian probabilitas interaksi faktor-faktor; 3) penilaian signifikansi perbedaan antara pasangan rata-rata. Paling sering, peneliti harus memecahkan masalah seperti itu ketika melakukan eksperimen lapangan dan zootechnical, ketika pengaruh beberapa faktor pada sifat yang dihasilkan dipelajari.

Skema prinsip analisis dispersi meliputi penetapan sumber utama variasi dari atribut yang dihasilkan dan penentuan volume variasi (jumlah simpangan kuadrat) menurut sumber pembentukannya; penentuan jumlah derajat kebebasan yang sesuai dengan komponen variasi total; perhitungan varians sebagai rasio volume variasi yang sesuai dengan jumlah derajat kebebasannya; analisis hubungan antar dispersi; penilaian keandalan perbedaan antara rata-rata dan perumusan kesimpulan.

Skema ini dipertahankan baik dalam model ANOVA sederhana, ketika data dikelompokkan menurut satu atribut, dan dalam model kompleks, ketika data dikelompokkan menurut dua atau lebih atribut. Namun, dengan bertambahnya jumlah karakteristik kelompok, proses penguraian variasi umum menurut sumber pembentukannya menjadi lebih rumit.

Menurut diagram skema, analisis varians dapat direpresentasikan sebagai lima tahap berturut-turut:

1) definisi dan dekomposisi variasi;

2) penentuan jumlah derajat kebebasan variasi;

3) perhitungan dispersi dan rasionya;

4) analisis dispersi dan rasionya;

5) penilaian reliabilitas selisih rata-rata dan rumusan kesimpulan pada pengujian hipotesis nol.

Bagian yang paling memakan waktu dari analisis varians adalah tahap pertama - definisi dan dekomposisi variasi berdasarkan sumber pembentukannya. Urutan ekspansi total volume variasi dibahas secara rinci dalam Bab 5.

Dasar untuk memecahkan masalah analisis varians adalah hukum ekspansi (penjumlahan) variasi, yang menurutnya variasi total (fluktuasi) dari atribut yang dihasilkan dibagi menjadi dua: variasi karena tindakan faktor yang dipelajari (faktor) , dan variasi yang disebabkan oleh aksi penyebab acak, yaitu

Misalkan populasi yang diteliti dibagi menjadi beberapa kelompok menurut suatu atribut faktor, yang masing-masing dicirikan oleh nilai rata-rata atribut efektifnya. Pada saat yang sama, variasi nilai-nilai ini dapat dijelaskan oleh dua jenis alasan: yang secara sistematis bertindak berdasarkan fitur efektif dan dapat disesuaikan selama eksperimen dan tidak dapat disesuaikan. Jelas bahwa variasi antarkelompok (faktorial atau sistematis) tergantung terutama pada aksi faktor yang dipelajari, dan intragrup (sisa atau acak) - pada aksi faktor acak.

Untuk menilai signifikansi perbedaan rata-rata kelompok, perlu ditentukan variasi antarkelompok dan intrakelompok. Jika variasi antarkelompok (faktorial) secara signifikan melebihi variasi intrakelompok (sisa), maka faktor tersebut mempengaruhi sifat yang dihasilkan, secara signifikan mengubah nilai rata-rata kelompok. Tetapi timbul pertanyaan, berapakah rasio antara variasi antarkelompok dan intrakelompok yang dapat dianggap cukup untuk kesimpulan tentang reliabilitas (signifikansi) perbedaan antara sarana kelompok.

Untuk menilai signifikansi perbedaan antara rata-rata dan merumuskan kesimpulan pada pengujian hipotesis nol (H0: x1 = x2 = ... = xn), analisis varians menggunakan semacam standar - kriteria-G, hukum distribusi yang didirikan oleh R. Fisher. Kriteria ini adalah rasio dua varians: faktorial, yang dihasilkan oleh tindakan faktor yang diteliti, dan residual, karena tindakan penyebab acak:

Rasio dispersi r = t>u : £ * 2 oleh ahli statistik Amerika Snedecor diusulkan untuk dilambangkan dengan huruf G untuk menghormati penemu analisis varians R. Fisher.

Dispersi °2 io2 adalah perkiraan varians dari populasi umum. Jika sampel dengan dispersi °2 °2 dibuat dari populasi umum yang sama, di mana variasi nilainya acak, maka selisih nilai °2 °2 juga acak.

Jika percobaan memeriksa pengaruh beberapa faktor (A, B, C, dll.) pada fitur efektif pada saat yang sama, maka dispersi karena aksi masing-masing faktor harus sebanding dengan °e.gP, yaitu

Jika nilai varians faktor secara signifikan lebih besar dari residual, maka faktor tersebut berpengaruh signifikan terhadap atribut yang dihasilkan dan sebaliknya.

Dalam eksperimen multifaktorial, selain variasi akibat aksi masing-masing faktor, hampir selalu ada variasi akibat interaksi faktor ($av: ^ls ^ss $liіs). Inti dari interaksi adalah bahwa efek dari satu faktor berubah secara signifikan pada tingkat yang berbeda dari yang kedua (misalnya, efektivitas kualitas tanah pada dosis pupuk yang berbeda).

Interaksi faktor juga harus dinilai dengan membandingkan varians masing-masing 3 ^w.gr:

Saat menghitung nilai sebenarnya dari kriteria B, varians terbesar diambil di pembilang, oleh karena itu B > 1. Jelas, semakin besar kriteria B, semakin besar perbedaan antara varians. Jika B = 1, maka pertanyaan untuk menilai signifikansi perbedaan varians dihilangkan.

Untuk menentukan batas fluktuasi acak, rasio varians G. Fisher mengembangkan tabel khusus distribusi-B (Lampiran 4 dan 5). Kriteria B secara fungsional terkait dengan probabilitas dan bergantung pada jumlah derajat kebebasan variasi k1 dan k2 dari dua varians yang dibandingkan. Dua tabel biasanya digunakan untuk menarik kesimpulan tentang nilai maksimum kriteria untuk tingkat signifikansi 0,05 dan 0,01. Tingkat signifikansi 0,05 (atau 5%) berarti bahwa hanya dalam 5 kasus dari 100 kriteria B yang dapat memperoleh nilai yang sama atau lebih tinggi dari yang ditunjukkan dalam tabel. Penurunan tingkat signifikansi dari 0,05 menjadi 0,01 menyebabkan peningkatan nilai kriteria B antara dua varians karena aksi penyebab acak saja.

Nilai kriteria juga tergantung langsung pada jumlah derajat kebebasan dari dua dispersi yang dibandingkan. Jika jumlah derajat kebebasan cenderung tak terhingga (k-me), maka rasio akan untuk dua dispersi cenderung satu.

Nilai tabular kriteria B menunjukkan nilai acak yang mungkin dari rasio dua varians pada tingkat signifikansi tertentu dan jumlah derajat kebebasan yang sesuai untuk masing-masing varians yang dibandingkan. Pada tabel tersebut, nilai B diberikan untuk sampel yang dibuat dari populasi umum yang sama, dimana alasan perubahan nilai hanya bersifat acak.

Nilai G ditemukan dari tabel (Lampiran 4 dan 5) di persimpangan kolom yang sesuai (jumlah derajat kebebasan untuk dispersi yang lebih besar - k1) dan baris (jumlah derajat kebebasan untuk dispersi yang lebih kecil -k2). Jadi, jika varians yang lebih besar (pembilang G) k1 = 4, dan yang lebih kecil (penyebut G) k2 = 9, maka Ga pada taraf signifikansi a = 0,05 menjadi 3,63 (app. 4). Jadi, sebagai akibat dari tindakan penyebab acak, karena sampelnya kecil, varians dari satu sampel dapat, pada tingkat signifikansi 5%, melebihi varians untuk sampel kedua sebesar 3,63 kali. Dengan penurunan tingkat signifikansi dari 0,05 menjadi 0,01, nilai tabel kriteria D, seperti disebutkan di atas, akan meningkat. Jadi, dengan derajat kebebasan yang sama k1 = 4 dan k2 = 9 dan a = 0,01, nilai tabel kriteria G akan menjadi 6,99 (app. 5).

Pertimbangkan prosedur untuk menentukan jumlah derajat kebebasan dalam analisis varians. Jumlah derajat kebebasan, yang sesuai dengan jumlah total deviasi kuadrat, didekomposisi menjadi komponen yang sesuai sama dengan dekomposisi jumlah deviasi kuadrat (k1) dan variasi intragrup (k2).

Jadi, jika suatu populasi sampel terdiri dari N pengamatan dibagi t grup (jumlah opsi eksperimen) dan P subkelompok (jumlah pengulangan), maka jumlah derajat kebebasan k, masing-masing, adalah:

a) untuk jumlah total deviasi kuadrat (dszar)

b) untuk jumlah simpangan kuadrat antarkelompok ^m.gP)

c) untuk jumlah deviasi kuadrat intragrup di w.gr)

Menurut aturan variasi penambahan:

Misalnya, jika empat varian percobaan dibentuk dalam percobaan (m = 4) dalam lima pengulangan masing-masing (n = 5), dan jumlah total pengamatan N = = t o p \u003d 4 * 5 \u003d 20, maka jumlah derajat kebebasan, masing-masing, sama dengan:

Mengetahui jumlah deviasi kuadrat dari jumlah derajat kebebasan, dimungkinkan untuk menentukan taksiran tak bias (disesuaikan) untuk tiga varian:

Hipotesis nol H0 dengan kriteria B diuji dengan cara yang sama seperti dengan uji-u Student. Untuk membuat keputusan dalam memeriksa H0, perlu untuk menghitung nilai aktual dari kriteria dan membandingkannya dengan nilai tabular Ba untuk tingkat signifikansi a yang diterima dan jumlah derajat kebebasan k1 dan k2 untuk dua dispersi.

Jika Bfakg > Ba, maka, sesuai dengan tingkat signifikansi yang diterima, kita dapat menyimpulkan bahwa perbedaan varians sampel ditentukan tidak hanya oleh faktor acak; mereka signifikan. Dalam hal ini, hipotesis nol ditolak dan ada alasan untuk percaya bahwa faktor tersebut secara signifikan mempengaruhi atribut yang dihasilkan. Jika< Ба, то нулевую гипотезу принимают и есть основание утверждать, что различия между сравниваемыми дисперсиями находятся в границах возможных случайных колебаний: действие фактора на результативный признак не является существенным.

Penggunaan satu atau beberapa model analisis varians bergantung pada jumlah faktor yang dipelajari dan metode pengambilan sampel.

Tergantung pada jumlah faktor yang menentukan variasi fitur efektif, sampel dapat dibentuk oleh satu, dua atau lebih faktor. Menurut analisis varians ini dibagi menjadi faktor tunggal dan faktor ganda. Jika tidak, itu juga disebut kompleks dispersi faktor tunggal dan multifaktor.

Skema dekomposisi variasi umum tergantung pada pembentukan kelompok. Itu bisa acak (pengamatan satu kelompok tidak terkait dengan pengamatan kelompok kedua) dan non-acak (pengamatan dua sampel saling berhubungan oleh kondisi umum percobaan). Dengan demikian, sampel independen dan dependen diperoleh. Sampel independen dapat dibentuk dengan angka yang sama dan tidak sama. Pembentukan sampel dependen mengasumsikan jumlah mereka yang sama.

Jika kelompok-kelompok itu dibentuk dalam tatanan non-kekerasan, maka jumlah total variasi sifat yang dihasilkan termasuk, bersama dengan variasi faktorial (antarkelompok) dan residual, variasi pengulangan, yaitu

Dalam prakteknya, dalam banyak kasus perlu untuk mempertimbangkan sampel dependen ketika kondisi untuk grup dan subgrup disamakan. Jadi, dalam percobaan lapangan, seluruh area dibagi menjadi blok-blok, dengan kondisi yang paling layak. Pada saat yang sama, setiap varian eksperimen mendapat peluang yang sama untuk diwakili di semua blok, yang mencapai pemerataan kondisi untuk semua opsi yang diuji, pengalaman. Metode membangun pengalaman ini disebut metode blok acak. Eksperimen dengan hewan dilakukan dengan cara yang sama.

Ketika memproses data sosial-ekonomi dengan metode analisis dispersi, harus diingat bahwa, karena banyaknya faktor dan keterkaitannya, sulit, bahkan dengan penyelarasan kondisi yang paling hati-hati, untuk menetapkan tingkat pengaruh objektif setiap faktor individu pada atribut efektif. Oleh karena itu, tingkat variasi residual ditentukan tidak hanya oleh penyebab acak, tetapi juga oleh faktor signifikan yang tidak diperhitungkan saat membangun model ANOVA. Akibatnya, dispersi residual sebagai dasar untuk perbandingan kadang-kadang menjadi tidak memadai untuk tujuannya, itu jelas ditaksir terlalu tinggi dan tidak dapat bertindak sebagai kriteria untuk signifikansi pengaruh faktor. Dalam hal ini, ketika membangun model analisis dispersi, masalah memilih faktor yang paling penting dan meratakan kondisi untuk manifestasi tindakan masing-masing menjadi relevan. Di samping itu. penggunaan analisis varians mengasumsikan distribusi normal atau mendekati normal dari populasi statistik yang diteliti. Jika kondisi ini tidak terpenuhi, maka estimasi yang diperoleh dalam analisis varians akan dilebih-lebihkan.