Cara mencari varians pada barisan bilangan. Ekspektasi matematis dari variabel acak diskrit

Untuk data yang dikelompokkan dispersi sisa- rata-rata dispersi intragroup:

Dimana 2 j adalah varians intra-grup dari grup ke-j.

Untuk data yang tidak dikelompokkan dispersi sisa adalah ukuran akurasi aproksimasi, yaitu perkiraan garis regresi ke data asli:
di mana y(t) adalah ramalan menurut persamaan tren; y t – deret awal dinamika; n adalah jumlah poin; p adalah jumlah koefisien persamaan regresi (jumlah variabel penjelas).
Dalam contoh ini disebut penduga tak bias varians.

Contoh 1. Distribusi pekerja dari tiga perusahaan dari satu asosiasi berdasarkan kategori tarif dicirikan oleh data berikut:

Kategori upah pekerjaJumlah pekerja di perusahaan
perusahaan 1perusahaan 2perusahaan 3
1 50 20 40
2 100 80 60
3 150 150 200
4 350 300 400
5 200 150 250
6 150 100 150

Mendefinisikan:
1. dispersi untuk setiap perusahaan (intragroup dispersion);
2. rata-rata dispersi intragrup;
3. dispersi antarkelompok;
4. total varians.

Keputusan.
Sebelum melanjutkan untuk memecahkan masalah, perlu diketahui fitur mana yang efektif dan mana yang faktorial. Dalam contoh yang sedang dipertimbangkan, fitur efektif adalah "Kategori tarif", dan fitur faktor adalah "Nomor (nama) perusahaan".
Kemudian kami memiliki tiga grup (perusahaan) yang perlu dihitung rata-rata grup dan varians intragrup:


Perusahaanrata-rata kelompok,varian dalam kelompok,
1 4 1,8

Rata-rata varians intragrup ( dispersi sisa) dihitung dengan rumus:


di mana Anda dapat menghitung:
atau:


kemudian:
Dispersi total akan sama dengan: s 2 \u003d 1.6 + 0 \u003d 1.6.
Varians total juga dapat dihitung menggunakan salah satu dari dua rumus berikut:

Ketika memecahkan masalah praktis, seseorang sering harus berurusan dengan tanda yang hanya membutuhkan dua nilai alternatif. Dalam hal ini, mereka tidak berbicara tentang bobot nilai tertentu dari suatu fitur, tetapi tentang bagiannya secara agregat. Jika proporsi unit populasi yang memiliki sifat yang diteliti dilambangkan dengan “ R", dan tidak memiliki - melalui" q”, maka dispersi dapat dihitung dengan rumus:
s 2 = p×q

Contoh #2. Berdasarkan data keluaran enam pekerja brigade, tentukan varians antarkelompok dan evaluasi dampak shift kerja terhadap produktivitas kerja mereka jika varians total adalah 12,2.

Jumlah brigade kerjaHasil kerja, pcs.
di shift pertamadi shift ke-2
1 18 13
2 19 14
3 22 15
4 20 17
5 24 16
6 23 15

Keputusan. data awal

Xf1f2f 3f4f5f6Total
1 18 19 22 20 24 23 126
2 13 14 15 17 16 15 90
Total 31 33 37 37 40 38

Kemudian kami memiliki 6 grup yang diperlukan untuk menghitung mean grup dan varians intragroup.
1. Temukan nilai rata-rata setiap kelompok.







2. Temukan kuadrat rata-rata dari setiap kelompok.







Kami merangkum hasil perhitungan dalam tabel:
Nomor grupRata-rata grupVarians intragrup
1 1.42 0.24
2 1.42 0.24
3 1.41 0.24
4 1.46 0.25
5 1.4 0.24
6 1.39 0.24

3. Varians intragrup mencirikan perubahan (variasi) dari sifat yang dipelajari (dihasilkan) dalam kelompok di bawah pengaruh semua faktor, kecuali untuk faktor yang mendasari pengelompokan:
Kami menghitung rata-rata dispersi intragroup menggunakan rumus:


4. Varian antargrup mencirikan perubahan (variasi) dari sifat yang dipelajari (dihasilkan) di bawah pengaruh faktor (sifat faktorial) yang mendasari pengelompokan.
Dispersi antargrup didefinisikan sebagai:

di mana


Kemudian

Varians total mencirikan perubahan (variasi) dari sifat yang dipelajari (dihasilkan) di bawah pengaruh semua faktor (sifat faktorial) tanpa kecuali. Dengan kondisi masalah, itu sama dengan 12.2.
Hubungan korelasi empiris mengukur seberapa besar fluktuasi total dari atribut yang dihasilkan disebabkan oleh faktor yang dipelajari. Ini adalah rasio varians faktorial dengan varians total:

Kami menentukan hubungan korelasi empiris:

Hubungan antar fitur bisa lemah atau kuat (dekat). Kriteria mereka dievaluasi pada skala Chaddock:
0.1 0.3 0.5 0.7 0.9 Dalam contoh kita, hubungan antara fitur Y faktor X lemah
Koefisien determinasi.

Mari kita tentukan koefisien determinasi:

Dengan demikian, 0,67% variasi disebabkan oleh perbedaan antar sifat, dan 99,37% disebabkan oleh faktor lain.
Kesimpulan: dalam hal ini output pekerja tidak bergantung pada pekerjaan pada shift tertentu, yaitu pengaruh shift kerja terhadap produktivitas kerja mereka tidak signifikan dan disebabkan oleh faktor lain.

Contoh #3. Berdasarkan data upah rata-rata dan kuadrat deviasi dari nilainya untuk dua kelompok pekerja, carilah varians total dengan menerapkan aturan penjumlahan varians:

Keputusan:
Rata-rata varians dalam grup

Dispersi antargrup didefinisikan sebagai:


Varians totalnya adalah: 480 + 13824 = 14304

Dispersi dalam statistik ditemukan sebagai nilai individual dari fitur di kuadrat . Bergantung pada data awal, itu ditentukan oleh rumus varians sederhana dan berbobot:

1. (untuk data yang tidak dikelompokkan) dihitung dengan rumus:

2. Varians tertimbang (untuk seri variasi):

di mana n adalah frekuensi (faktor pengulangan X)

Contoh mencari varians

Halaman ini menjelaskan contoh standar untuk menemukan varians, Anda juga dapat melihat tugas lain untuk menemukannya

Contoh 1. Kami memiliki data berikut untuk sekelompok 20 siswa korespondensi. Perlu dibangun deret interval dari distribusi fitur, menghitung nilai rata-rata fitur dan mempelajari variansnya

Mari kita buat pengelompokan interval. Mari kita tentukan rentang interval dengan rumus:

di mana X max adalah nilai maksimum fitur pengelompokan;
X min adalah nilai minimum fitur pengelompokan;
n adalah jumlah interval:

Kami menerima n=5. Langkahnya adalah: h \u003d (192 - 159) / 5 \u003d 6.6

Mari kita buat pengelompokan interval

Untuk perhitungan lebih lanjut, kami akan membuat tabel bantu:

X'i adalah tengah interval. (misalnya, tengah interval 159 - 165,6 = 162,3)

Rata-rata pertumbuhan siswa ditentukan dengan rumus rata-rata tertimbang aritmatika:

Kami menentukan dispersi dengan rumus:

Rumus varians dapat dikonversi sebagai berikut:

Dari rumus ini berikut bahwa variansnya adalah perbedaan antara rata-rata kuadrat dari opsi dan kuadrat dan rata-rata.

Varians dalam seri variasi dengan interval yang sama menurut metode momen dapat dihitung dengan cara berikut menggunakan properti dispersi kedua (membagi semua opsi dengan nilai interval). Definisi varians, dihitung dengan metode momen, menurut rumus berikut ini memakan waktu lebih sedikit:

di mana i adalah nilai interval;
A - nol bersyarat, yang nyaman digunakan di tengah interval dengan frekuensi tertinggi;
m1 adalah kuadrat momen orde pertama;
m2 - momen orde kedua

(jika dalam populasi statistik atribut berubah sedemikian rupa sehingga hanya ada dua opsi yang saling eksklusif, maka variabilitas tersebut disebut alternatif) dapat dihitung dengan rumus:

Mensubstitusikan dalam rumus dispersi ini q = 1- p, kita mendapatkan:

Jenis dispersi

Varians total mengukur variasi suatu sifat pada seluruh populasi secara keseluruhan di bawah pengaruh semua faktor yang menyebabkan variasi ini. Itu sama dengan kuadrat rata-rata dari deviasi nilai individu atribut x dari nilai rata-rata total x dan dapat didefinisikan sebagai varians sederhana atau varians tertimbang.

mencirikan variasi acak, yaitu bagian dari variasi, yang disebabkan oleh pengaruh faktor-faktor yang tidak diperhitungkan dan tidak bergantung pada faktor-tanda yang mendasari pengelompokan tersebut. Varians seperti itu sama dengan kuadrat rata-rata dari deviasi nilai individual fitur dalam grup X dari mean aritmatika grup dan dapat dihitung sebagai varians sederhana atau sebagai varians tertimbang.

Dengan demikian, ukuran varians dalam kelompok variasi sifat dalam suatu kelompok dan ditentukan oleh rumus:

di mana xi - rata-rata kelompok;
ni adalah jumlah unit dalam grup.

Misalnya, varians intra-kelompok yang perlu ditentukan dalam tugas mempelajari pengaruh kualifikasi pekerja pada tingkat produktivitas tenaga kerja di sebuah toko menunjukkan variasi output di setiap kelompok yang disebabkan oleh semua faktor yang mungkin (kondisi teknis peralatan, ketersediaan alat dan bahan, usia pekerja, intensitas tenaga kerja, dll.), kecuali untuk perbedaan kategori kualifikasi (dalam kelompok, semua pekerja memiliki kualifikasi yang sama).

Rata-rata varians dalam-kelompok mencerminkan acak, yaitu bagian dari variasi yang terjadi di bawah pengaruh semua faktor lain, kecuali faktor pengelompokan. Itu dihitung dengan rumus:

Ini mencirikan variasi sistematis dari sifat yang dihasilkan, yang disebabkan oleh pengaruh faktor sifat yang mendasari pengelompokan. Ini sama dengan kuadrat rata-rata dari deviasi rata-rata grup dari rata-rata keseluruhan. Varians antargrup dihitung dengan rumus:

Aturan penambahan varians dalam statistik

Berdasarkan aturan penjumlahan varians varians total sama dengan jumlah rata-rata varians intragrup dan intergrup:

Arti dari aturan ini adalah bahwa varians total yang terjadi di bawah pengaruh semua faktor sama dengan jumlah varians yang muncul di bawah pengaruh semua faktor lain dan varians yang muncul karena faktor pengelompokan.

Menggunakan rumus untuk menambahkan varians, dimungkinkan untuk menentukan yang ketiga tidak diketahui dari dua varians yang diketahui, dan juga untuk menilai kekuatan pengaruh atribut pengelompokan.

Sifat Dispersi

1. Jika semua nilai atribut dikurangi (ditambah) dengan nilai konstanta yang sama, maka varians tidak akan berubah dari ini.
2. Jika semua nilai atribut dikurangi (naik) dengan jumlah yang sama sebanyak n kali, maka variansnya akan berkurang (naik) sebanyak n^2 kali.

Di antara banyak indikator yang digunakan dalam statistik, perlu untuk menyoroti perhitungan varians. Perlu dicatat bahwa melakukan perhitungan ini secara manual adalah tugas yang agak membosankan. Untungnya, ada fungsi di Excel yang memungkinkan Anda mengotomatiskan prosedur penghitungan. Mari kita cari tahu algoritma untuk bekerja dengan alat-alat ini.

Dispersi adalah indikator variasi, yang merupakan kuadrat rata-rata deviasi dari ekspektasi matematis. Dengan demikian, ini mengungkapkan penyebaran angka tentang rata-rata. Perhitungan dispersi dapat dilakukan baik untuk populasi umum maupun untuk sampel.

Metode 1: perhitungan pada populasi umum

Untuk menghitung indikator ini di Excel untuk populasi umum, fungsi yang digunakan DISP.G. Sintaks untuk ekspresi ini adalah sebagai berikut:

DISP.G(Nomor1;Nomor2;…)

Secara total, dari 1 hingga 255 argumen dapat diterapkan. Argumen dapat berupa nilai numerik dan referensi ke sel di mana mereka berada.

Mari kita lihat cara menghitung nilai ini untuk rentang data numerik.


Metode 2: perhitungan sampel

Berbeda dengan perhitungan nilai untuk populasi umum, dalam perhitungan sampel, penyebutnya bukan jumlah bilangan seluruhnya, melainkan kurang satu. Ini dilakukan untuk memperbaiki kesalahan. Excel memperhitungkan nuansa ini dalam fungsi khusus yang dirancang untuk jenis perhitungan ini - DISP.V. Sintaksnya diwakili oleh rumus berikut:

VAR.B(Nomor1;Nomor2;…)

Jumlah argumen, seperti pada fungsi sebelumnya, juga dapat berkisar dari 1 hingga 255.


Seperti yang Anda lihat, program Excel dapat sangat memudahkan perhitungan varians. Statistik ini dapat dihitung dengan aplikasi baik untuk populasi maupun sampel. Dalam hal ini, semua tindakan pengguna sebenarnya dikurangi hanya untuk menentukan kisaran angka yang akan diproses, dan Excel melakukan pekerjaan utama itu sendiri. Tentu saja, ini akan menghemat banyak waktu bagi pengguna.

Mari kita hitung dalamNONAUNGGULvarians dan standar deviasi sampel. Kami juga menghitung varians dari variabel acak jika distribusinya diketahui.

Pertimbangkan dulu penyebaran, kemudian simpangan baku.

Varians sampel

Varians sampel (varians sampel,Sampelperbedaan) mencirikan penyebaran nilai dalam larik relatif terhadap .

Semua 3 rumus setara secara matematis.

Dapat dilihat dari rumus pertama bahwa varians sampel adalah jumlah deviasi kuadrat dari setiap nilai dalam array dari rata-rata dibagi dengan ukuran sampel dikurangi 1.

penyebaran sampel fungsi DISP() digunakan, eng. nama VAR, mis. Perbedaan. Sejak MS EXCEL 2010, disarankan untuk menggunakan analognya DISP.V() , eng. nama VARS, yaitu Varians Sampel. Selain itu, mulai dari versi MS EXCEL 2010, ada fungsi DISP.G(), eng. Nama VARP, mis. VARIansi populasi yang menghitung penyebaran untuk populasi. Seluruh perbedaan datang ke penyebut: alih-alih n-1 seperti DISP.V() , DISP.G() hanya memiliki n dalam penyebut. Sebelum MS EXCEL 2010, fungsi VARP() digunakan untuk menghitung varians populasi.

Varians sampel
=KOTAK(Sampel)/(JUMLAH(Sampel)-1)
=(SUMSQ(Sampel)-COUNT(Sampel)*AVERAGE(Sampel)^2)/ (JUMLAH(Sampel)-1)- rumus biasa
=SUM((Sampel -AVERAGE(Sampel))^2)/ (JUMLAH(Sampel)-1) –

Varians sampel sama dengan 0 hanya jika semua nilai sama satu sama lain dan, karenanya, sama nilai rata-rata. Biasanya, semakin besar nilainya penyebaran, semakin besar penyebaran nilai dalam array.

Varians sampel adalah perkiraan titik penyebaran distribusi variabel acak dari mana Sampel. Tentang konstruksi interval kepercayaan saat mengevaluasi penyebaran bisa dibaca di artikel

Varians dari variabel acak

Menghitung penyebaran variabel acak, Anda perlu mengetahuinya.

Untuk penyebaran variabel acak X sering menggunakan notasi Var(X). Penyebaran sama dengan kuadrat deviasi dari mean E(X): Var(X)=E[(X-E(X)) 2 ]

penyebaran dihitung dengan rumus:

di mana x i adalah nilai yang dapat diambil oleh variabel acak, dan adalah nilai rata-rata (), p(x) adalah probabilitas bahwa variabel acak akan mengambil nilai x.

Jika variabel acak memiliki , maka penyebaran dihitung dengan rumus:

Dimensi penyebaran sesuai dengan kuadrat unit pengukuran nilai asli. Misalnya, jika nilai dalam sampel adalah pengukuran berat bagian (dalam kg), maka dimensi variansnya adalah kg 2 . Ini bisa sulit untuk ditafsirkan, oleh karena itu, untuk mengkarakterisasi penyebaran nilai, nilai yang sama dengan akar kuadrat dari penyebaransimpangan baku.

Beberapa properti penyebaran:

Var(X+a)=Var(X), di mana X adalah variabel acak dan a adalah konstanta.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2=E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Sifat dispersi ini digunakan dalam artikel tentang regresi linier.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), di mana X dan Y adalah variabel acak, Cov(X;Y) adalah kovarians dari variabel acak ini.

Jika variabel acak bebas, maka kovarians adalah 0, dan karenanya Var(X+Y)=Var(X)+Var(Y). Properti varians ini digunakan dalam output.

Mari kita tunjukkan bahwa untuk besaran bebas Var(X-Y)=Var(X+Y). Memang, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Properti varians ini digunakan untuk plot .

Standar deviasi sampel

Standar deviasi sampel adalah ukuran seberapa luas nilai-nilai yang tersebar dalam sampel relatif terhadap .

A-prioritas, simpangan baku sama dengan akar kuadrat dari penyebaran:

Standar deviasi tidak memperhitungkan besarnya nilai dalam contoh, tetapi hanya tingkat hamburan nilai di sekitar mereka tengah. Mari kita ambil contoh untuk menggambarkan hal ini.

Mari kita hitung simpangan baku untuk 2 sampel: (1; 5; 9) dan (1001; 1005; 1009). Dalam kedua kasus, s=4. Jelas bahwa rasio deviasi standar dengan nilai array berbeda secara signifikan untuk sampel. Untuk kasus seperti itu, gunakan Koefisien variasi(Koefisien Variasi, CV) - rasio simpangan baku ke rata-rata hitung, dinyatakan sebagai persentase.

Di MS EXCEL 2007 dan versi sebelumnya untuk perhitungan Standar deviasi sampel fungsi =STDEV() digunakan, eng. nama STDEV, yaitu standar deviasi. Sejak MS EXCEL 2010, disarankan untuk menggunakan analognya = STDEV.B () , eng. beri nama STDEV.S, mis. Contoh DEViasi STANDAR.

Selain itu, mulai dari versi MS EXCEL 2010, ada fungsi STDEV.G () , eng. beri nama STDEV.P, mis. DEViasi Standar Populasi yang menghitung simpangan baku untuk populasi. Seluruh perbedaan terletak pada penyebutnya: alih-alih n-1 seperti STDEV.V() , STDEV.G() hanya memiliki n dalam penyebut.

Standar deviasi juga dapat dihitung langsung dari rumus di bawah ini (lihat file contoh)
=SQRT(SQUADROTIV(Sampel)/(JUMLAH(Sampel)-1))
=SQRT((SUMSQ(Sampel)-COUNT(Sampel)*AVERAGE(Sampel)^2)/(COUNT(Sampel)-1))

Tindakan dispersi lainnya

Fungsi SQUADRIVE() menghitung dengan umm kuadrat deviasi nilai dari mereka tengah. Fungsi ini akan mengembalikan hasil yang sama dengan rumus =VAR.G( Sampel)*MEMERIKSA( Sampel) , di mana Sampel- referensi ke rentang yang berisi larik nilai sampel (). Perhitungan dalam fungsi QUADROTIV() dibuat sesuai dengan rumus:

Fungsi SROOT() juga merupakan ukuran pencar dari sekumpulan data. Fungsi SIROTL() menghitung rata-rata nilai absolut dari deviasi nilai dari tengah. Fungsi ini akan mengembalikan hasil yang sama dengan rumus =SUMPRODUCT(ABS(Contoh-AVERAGE(Sampel)))/COUNT(Sampel), di mana Sampel- referensi ke rentang yang berisi larik nilai sampel.

Perhitungan dalam fungsi SROOTKL() dibuat sesuai dengan rumus:

.

Sebaliknya, jika adalah non-negatif a.e. fungsi sedemikian rupa sehingga , maka ada ukuran probabilitas yang benar-benar kontinu pada sedemikian rupa sehingga kerapatannya.

    Perubahan ukuran dalam integral Lebesgue:

,

di mana setiap fungsi Borel terintegrasi sehubungan dengan ukuran probabilitas.

Dispersi, jenis dan sifat dispersi Konsep dispersi

Dispersi dalam statistik ditemukan sebagai standar deviasi dari nilai-nilai individu sifat kuadrat dari rata-rata aritmatika. Bergantung pada data awal, itu ditentukan oleh rumus varians sederhana dan berbobot:

1. varian sederhana(untuk data yang tidak dikelompokkan) dihitung dengan rumus:

2. Varians tertimbang (untuk seri variasi):

di mana n - frekuensi (faktor pengulangan X)

Contoh mencari varians

Halaman ini menjelaskan contoh standar untuk menemukan varians, Anda juga dapat melihat tugas lain untuk menemukannya

Contoh 1. Penentuan grup, rata-rata grup, antar grup dan varians total

Contoh 2. Menemukan varians dan koefisien variasi dalam tabel pengelompokan

Contoh 3. Menemukan varians dalam deret diskrit

Contoh 4. Kami memiliki data berikut untuk sekelompok 20 siswa korespondensi. Perlu dibangun deret interval dari distribusi fitur, menghitung nilai rata-rata fitur dan mempelajari variansnya

Mari kita buat pengelompokan interval. Mari kita tentukan rentang interval dengan rumus:

di mana X max adalah nilai maksimum fitur pengelompokan; X min adalah nilai minimum fitur pengelompokan; n adalah jumlah interval:

Kami menerima n=5. Langkahnya adalah: h \u003d (192 - 159) / 5 \u003d 6.6

Mari kita buat pengelompokan interval

Untuk perhitungan lebih lanjut, kami akan membuat tabel bantu:

X "i - bagian tengah interval. (misalnya, bagian tengah interval 159 - 165.6 \u003d 162.3)

Rata-rata pertumbuhan siswa ditentukan dengan rumus rata-rata tertimbang aritmatika:

Kami menentukan dispersi dengan rumus:

Rumusnya bisa diubah seperti ini:

Dari rumus ini didapat bahwa variansnya adalah perbedaan antara rata-rata kuadrat dari opsi dan kuadrat dan rata-rata.

Varians dalam seri variasi dengan interval yang sama menurut metode momen dapat dihitung dengan cara berikut menggunakan properti dispersi kedua (membagi semua opsi dengan nilai interval). Definisi varians, dihitung dengan metode momen, menurut rumus berikut ini memakan waktu lebih sedikit:

di mana i adalah nilai interval; A - nol bersyarat, yang nyaman digunakan di tengah interval dengan frekuensi tertinggi; m1 adalah kuadrat momen orde pertama; m2 - momen orde kedua

Varian fitur (jika dalam populasi statistik atribut berubah sedemikian rupa sehingga hanya ada dua opsi yang saling eksklusif, maka variabilitas tersebut disebut alternatif) dapat dihitung dengan rumus:

Mensubstitusikan dalam rumus dispersi ini q = 1- p, kita mendapatkan:

Jenis dispersi

Varians total mengukur variasi suatu sifat pada seluruh populasi secara keseluruhan di bawah pengaruh semua faktor yang menyebabkan variasi ini. Itu sama dengan kuadrat rata-rata dari deviasi nilai individu atribut x dari nilai rata-rata total x dan dapat didefinisikan sebagai varians sederhana atau varians tertimbang.

Varians intragrup mencirikan variasi acak, yaitu bagian dari variasi, yang disebabkan oleh pengaruh faktor-faktor yang tidak diperhitungkan dan tidak bergantung pada faktor-tanda yang mendasari pengelompokan tersebut. Varians seperti itu sama dengan kuadrat rata-rata dari deviasi nilai individual fitur dalam grup X dari mean aritmatika grup dan dapat dihitung sebagai varians sederhana atau sebagai varians tertimbang.

Dengan demikian, ukuran varians dalam kelompok variasi sifat dalam suatu kelompok dan ditentukan oleh rumus:

di mana xi - rata-rata kelompok; ni adalah jumlah unit dalam grup.

Misalnya, varians intra-kelompok yang perlu ditentukan dalam tugas mempelajari pengaruh kualifikasi pekerja pada tingkat produktivitas tenaga kerja di sebuah toko menunjukkan variasi output di setiap kelompok yang disebabkan oleh semua faktor yang mungkin (kondisi teknis peralatan, ketersediaan alat dan bahan, usia pekerja, intensitas tenaga kerja, dll.), kecuali untuk perbedaan kategori kualifikasi (dalam kelompok, semua pekerja memiliki kualifikasi yang sama).

Rata-rata varians dalam kelompok mencerminkan variasi acak, yaitu bagian dari variasi yang terjadi di bawah pengaruh semua faktor lain, kecuali faktor pengelompokan. Itu dihitung dengan rumus:

Varian antargrup mencirikan variasi sistematis dari sifat yang dihasilkan, yang disebabkan oleh pengaruh faktor sifat yang mendasari pengelompokan. Ini sama dengan kuadrat rata-rata dari deviasi rata-rata grup dari rata-rata keseluruhan. Varians antargrup dihitung dengan rumus: