Pengertian deret variasi. Seri variasi dan karakteristiknya

Seri variasi adalah serangkaian nilai numerik dari suatu fitur.

Karakteristik utama dari seri variasi: v - varian, p - frekuensi kemunculannya.

Jenis seri variasi:

    menurut frekuensi kemunculan varian: sederhana - varian muncul satu kali, berbobot - varian muncul dua kali atau lebih;

    opsi berdasarkan lokasi: peringkat - opsi disusun dalam urutan menurun dan naik, tidak berperingkat - opsi ditulis tanpa urutan tertentu;

    dengan mengelompokkan opsi ke dalam grup: dikelompokkan - opsi digabungkan ke dalam grup, tidak dikelompokkan - opsi tidak dikelompokkan;

    berdasarkan opsi nilai: kontinu - opsi dinyatakan sebagai bilangan bulat dan bilangan pecahan, diskrit - opsi dinyatakan sebagai bilangan bulat, kompleks - opsi diwakili oleh nilai relatif atau rata-rata.

Serangkaian variasi dikompilasi dan dibuat untuk menghitung nilai rata-rata.

Bentuk notasi deret variasi:

8. Nilai rata-rata, jenis, cara perhitungan, penerapan dalam pelayanan kesehatan

Nilai rata-rata- karakteristik generalisasi total dari karakteristik kuantitatif. Penerapan rata-rata:

1. Untuk mengkarakterisasi organisasi kerja institusi medis dan mengevaluasi kegiatannya:

a) di poliklinik: indikator beban kerja dokter, rata-rata jumlah kunjungan, rata-rata jumlah penduduk di daerah;

b) di rumah sakit: rata-rata jumlah hari tidur per tahun; rata-rata lama tinggal di rumah sakit;

c) di pusat kebersihan, epidemiologi dan kesehatan masyarakat: rata-rata area (atau kapasitas kubik) per 1 orang, standar gizi rata-rata (protein, lemak, karbohidrat, vitamin, garam mineral, kalori), norma dan standar sanitasi, dll .;

2. Untuk mengkarakterisasi perkembangan fisik (fitur antropometrik utama morfologi dan fungsional);

3. Untuk menentukan parameter medis dan fisiologis tubuh dalam kondisi normal dan patologis dalam studi klinis dan eksperimental.

4. Dalam penelitian ilmiah khusus.

Perbedaan antara nilai rata-rata dan indikator:

1. Koefisien mencirikan fitur alternatif yang hanya terjadi di beberapa bagian dari tim statistik, yang mungkin atau mungkin tidak terjadi.

Nilai rata-rata mencakup tanda-tanda yang melekat pada semua anggota tim, tetapi dengan derajat yang berbeda-beda (berat badan, tinggi badan, hari perawatan di rumah sakit).

2. Koefisien digunakan untuk mengukur fitur kualitatif. Nilai rata-rata adalah untuk berbagai sifat kuantitatif.

Jenis rata-rata:

    rata-rata aritmatika, karakteristiknya - simpangan baku dan kesalahan rata-rata

    modus dan median. Mode (Mo)- sesuai dengan nilai sifat yang paling sering ditemukan pada populasi ini. Median (Saya)- nilai atribut, yang menempati nilai median dalam populasi ini. Ini membagi seri menjadi 2 bagian yang sama sesuai dengan jumlah pengamatan. Nilai rata-rata aritmatika (M)- tidak seperti modus dan median, itu bergantung pada semua pengamatan yang dilakukan, oleh karena itu merupakan karakteristik penting untuk seluruh distribusi.

    jenis rata-rata lain yang digunakan dalam studi khusus: akar rata-rata kuadrat, kubik, harmonik, geometris, progresif.

Rata-rata aritmatika mencirikan tingkat rata-rata populasi statistik.

Untuk seri sederhana di mana

v – opsi penjumlahan,

n adalah jumlah pengamatan.

untuk deret berbobot, di mana

vr adalah jumlah produk dari setiap opsi dan frekuensi kemunculannya

n adalah jumlah pengamatan.

Standar deviasi mean aritmatika atau sigma (σ) mencirikan keragaman fitur

- untuk baris sederhana

d 2 - jumlah kuadrat selisih antara rata-rata aritmatika dan setiap opsi (d = M-V│)

n adalah jumlah pengamatan

- untuk seri tertimbang

d 2 p adalah jumlah perkalian kuadrat selisih antara rata-rata aritmatika dan setiap opsi dan frekuensi kemunculannya,

n adalah jumlah pengamatan.

Derajat keanekaragaman dapat dinilai dengan nilai koefisien variasi
. Lebih dari 20% - keanekaragaman kuat, 10-20% - keanekaragaman sedang, kurang dari 10% - keanekaragaman lemah.

Jika satu sigma (M ± 1σ) ditambahkan dan dikurangkan dari rata-rata aritmatika, maka dengan distribusi normal, setidaknya 68,3% dari semua varian (pengamatan) akan berada dalam batas-batas ini, yang dianggap sebagai norma untuk fenomena yang diteliti. . Jika k 2 ± 2σ, maka 95,5% dari semua pengamatan akan berada dalam batas-batas ini, dan jika k M ± 3σ, maka 99,7% dari semua pengamatan akan berada dalam batas-batas ini. Jadi, deviasi standar adalah deviasi standar, yang memungkinkan untuk memprediksi kemungkinan terjadinya nilai sifat yang diteliti, yang berada dalam batas yang ditentukan.

Kesalahan rata-rata dari mean aritmatika atau kesalahan keterwakilan. Untuk deret berbobot sederhana dan dengan aturan momen:

.

Untuk menghitung nilai rata-rata, perlu: homogenitas bahan, jumlah pengamatan yang cukup. Jika jumlah pengamatan kurang dari 30, n-1 digunakan dalam rumus untuk menghitung dan m.

Saat mengevaluasi hasil yang diperoleh dengan ukuran kesalahan rata-rata, koefisien kepercayaan digunakan, yang memungkinkan untuk menentukan probabilitas jawaban yang benar, yaitu, ini menunjukkan bahwa nilai kesalahan pengambilan sampel yang diperoleh tidak akan lebih besar dari kesalahan yang sebenarnya dibuat sebagai hasil dari pengamatan terus menerus. Akibatnya, dengan peningkatan probabilitas kepercayaan, lebar interval kepercayaan meningkat, yang, pada gilirannya, meningkatkan kepercayaan penilaian, dukungan dari hasil yang diperoleh.

Tempat khusus dalam analisis statistik termasuk dalam penentuan tingkat rata-rata fitur atau fenomena yang dipelajari. Tingkat rata-rata fitur diukur dengan nilai rata-rata.

Nilai rata-rata mencirikan tingkat kuantitatif umum dari sifat yang dipelajari dan merupakan properti kelompok dari populasi statistik. Ini meratakan, melemahkan penyimpangan acak dari pengamatan individu dalam satu arah atau yang lain dan menyoroti sifat utama dan khas dari sifat yang diteliti.

Rata-rata banyak digunakan:

1. Mengkaji status kesehatan penduduk: ciri-ciri perkembangan fisik (tinggi badan, berat badan, lingkar dada, dll), mengidentifikasi prevalensi dan durasi berbagai penyakit, menganalisis indikator demografi (perpindahan penduduk alami, harapan hidup rata-rata, reproduksi penduduk , rata-rata populasi dan lain-lain).

2. Mempelajari kegiatan institusi medis, tenaga medis dan menilai kualitas pekerjaannya, merencanakan dan menentukan kebutuhan penduduk di berbagai jenis perawatan medis (rata-rata jumlah permintaan atau kunjungan per penduduk per tahun, rata-rata lama tinggal). pasien di rumah sakit, rata-rata lama pemeriksaan pasien, rata-rata penyediaan dokter, tempat tidur, dll).

3. Untuk mengkarakterisasi keadaan sanitasi dan epidemiologis (rata-rata debu udara di bengkel, rata-rata area per orang, konsumsi rata-rata protein, lemak dan karbohidrat, dll.).

4. Untuk menentukan parameter medis dan fisiologis dalam norma dan patologi, dalam pemrosesan data laboratorium, untuk menetapkan keandalan hasil studi selektif dalam studi sosio-higienis, klinis, eksperimental.

Perhitungan nilai rata-rata dilakukan berdasarkan seri variasi. Seri variasi- ini adalah kumpulan statistik yang homogen secara kualitatif, unit individual yang mencirikan perbedaan kuantitatif dari fitur atau fenomena yang dipelajari.

Variasi kuantitatif dapat terdiri dari dua jenis: diskontinyu (diskrit) dan kontinu.

Tanda diskontinyu (diskrit) hanya dinyatakan sebagai bilangan bulat dan tidak dapat memiliki nilai antara (misalnya, jumlah kunjungan, populasi situs, jumlah anak dalam keluarga, tingkat keparahan penyakit dalam poin , dll.).

Tanda kontinu dapat mengambil nilai apa pun dalam batas tertentu, termasuk yang pecahan, dan hanya diekspresikan kira-kira (misalnya, berat - untuk orang dewasa dapat dibatasi hingga kilogram, dan untuk bayi baru lahir - gram; tinggi, tekanan darah, waktu dihabiskan untuk melihat pasien, dan lain-lain).



Nilai digital dari setiap fitur atau fenomena individu yang termasuk dalam seri variasi disebut varian dan ditunjukkan dengan huruf V . Ada juga notasi lain dalam literatur matematika, misalnya x atau y.

Serangkaian variasi, di mana setiap opsi ditunjukkan satu kali, disebut sederhana. Deret tersebut digunakan di sebagian besar masalah statistik dalam hal pemrosesan data komputer.

Dengan peningkatan jumlah pengamatan, sebagai aturan, ada nilai varian yang berulang. Dalam hal ini, itu menciptakan seri variasi berkelompok, di mana jumlah pengulangan ditunjukkan (frekuensi, dilambangkan dengan huruf " R »).

Seri variasi peringkat terdiri dari opsi yang diatur dalam urutan menaik atau menurun. Seri sederhana dan berkelompok dapat disusun dengan peringkat.

Seri variasi interval dibuat untuk menyederhanakan perhitungan selanjutnya yang dilakukan tanpa menggunakan komputer, dengan jumlah unit pengamatan yang sangat besar (lebih dari 1000).

Seri variasi berkelanjutan menyertakan nilai varian, yang dapat berupa nilai apa pun.

Jika dalam deret variasi nilai-nilai atribut (pilihan) diberikan dalam bentuk angka-angka tertentu yang terpisah, maka deret semacam itu disebut diskrit.

Ciri-ciri umum dari nilai-nilai atribut yang dicerminkan dalam deret variasi adalah nilai rata-rata. Di antara mereka, yang paling banyak digunakan adalah: mean aritmatika M, mode mo dan median Saya. Masing-masing karakteristik ini unik. Mereka tidak dapat menggantikan satu sama lain, dan hanya dalam agregat, cukup lengkap dan dalam bentuk yang ringkas, adalah fitur dari seri variasi.

Mode (bulan) sebutkan nilai opsi yang paling sering muncul.

median (Saya) adalah nilai varian yang membagi deret variasi terentang menjadi dua (di setiap sisi median ada setengah varian). Dalam kasus yang jarang terjadi, ketika ada deret variasi simetris, modus dan median sama satu sama lain dan bertepatan dengan nilai rata-rata aritmatika.

Karakteristik paling khas dari nilai varian adalah rata-rata aritmatika nilai( M ). Dalam literatur matematika, itu dilambangkan .

Rata-rata aritmatika (M, ) adalah karakteristik kuantitatif umum dari fitur tertentu dari fenomena yang dipelajari, yang membentuk kumpulan statistik yang homogen secara kualitatif. Bedakan antara mean aritmatika sederhana dan mean tertimbang. Mean aritmatika sederhana dihitung untuk deret variasi sederhana dengan menjumlahkan semua opsi dan membagi jumlah ini dengan jumlah opsi yang termasuk dalam deret variasi ini. Perhitungan dilakukan sesuai dengan rumus:

,

di mana: M - rata-rata aritmatika sederhana;

Σ V - opsi jumlah;

n- jumlah pengamatan.

Dalam deret variasi berkelompok, rata-rata aritmatika berbobot ditentukan. Rumus untuk perhitungannya:

,

di mana: M - rata-rata tertimbang aritmatika;

Σ vp - jumlah produk varian pada frekuensinya;

n- jumlah pengamatan.

Dengan banyaknya pengamatan dalam kasus perhitungan manual, metode momen dapat digunakan.

Rata-rata aritmatika memiliki sifat-sifat berikut:

jumlah deviasi varian dari mean ( Σ d ) sama dengan nol (lihat Tabel 15);

Saat mengalikan (membagi) semua opsi dengan faktor yang sama (pembagi), mean aritmatika dikalikan (dibagi) dengan faktor yang sama (pembagi);

Jika Anda menambahkan (mengurangi) angka yang sama ke semua opsi, rata-rata aritmatika meningkat (menurun) dengan angka yang sama.

Rata-rata aritmatika, yang diambil dengan sendirinya, tanpa memperhitungkan variabilitas deret dari mana mereka dihitung, mungkin tidak sepenuhnya mencerminkan sifat deret variasi, terutama bila perbandingan dengan rata-rata lain diperlukan. Nilai rata-rata mendekati nilai dapat diperoleh dari deret dengan derajat dispersi yang berbeda. Semakin dekat pilihan individu satu sama lain dalam hal karakteristik kuantitatifnya, semakin sedikit hamburan (fluktuasi, variabilitas) seri, semakin khas rata-ratanya.

Parameter utama yang memungkinkan penilaian variabilitas suatu sifat adalah:

· ruang lingkup;

Amplitudo;

· Standar deviasi;

· Koefisien variasi.

Kira-kira, fluktuasi suatu sifat dapat dinilai dari cakupan dan amplitudo rangkaian variasi. Rentang menunjukkan opsi maksimum (V max) dan minimum (V min) dalam rangkaian. Amplitudo (A m) adalah perbedaan antara opsi ini: A m = V max - V min .

Ukuran utama yang diterima secara umum dari fluktuasi deret variasi adalah: penyebaran (D ). Tetapi parameter yang lebih nyaman paling sering digunakan, dihitung berdasarkan varians - standar deviasi ( σ ). Ini memperhitungkan nilai deviasi ( d ) dari setiap varian deret variasi dari mean aritmatikanya ( d=V - M ).

Karena penyimpangan varian dari mean bisa positif dan negatif, ketika dijumlahkan mereka memberikan nilai "0" (S d=0). Untuk menghindari hal ini, nilai deviasi ( d) dipangkatkan kedua dan dirata-ratakan. Jadi, varians dari deret variasi adalah kuadrat rata-rata dari deviasi varian dari mean aritmatika dan dihitung dengan rumus:

.

Ini adalah karakteristik variabilitas yang paling penting dan digunakan untuk menghitung banyak uji statistik.

Karena varians dinyatakan sebagai kuadrat deviasi, nilainya tidak dapat digunakan dibandingkan dengan mean aritmatika. Untuk tujuan ini, digunakan simpangan baku, yang dilambangkan dengan tanda "Sigma" ( σ ). Ini mencirikan deviasi rata-rata semua varian deret variasi dari mean aritmatika dalam unit yang sama dengan mean itu sendiri, sehingga mereka dapat digunakan bersama.

Standar deviasi ditentukan oleh rumus:

Rumus ini diterapkan untuk jumlah pengamatan ( n ) lebih besar dari 30. Dengan angka yang lebih kecil n nilai standar deviasi akan memiliki kesalahan yang terkait dengan bias matematika ( n - satu). Dalam hal ini, hasil yang lebih akurat dapat diperoleh dengan memperhitungkan bias seperti itu dalam rumus untuk menghitung deviasi standar:

simpangan baku (s ) adalah perkiraan simpangan baku variabel acak X relatif terhadap ekspektasi matematisnya berdasarkan estimasi variansnya yang tidak bias.

Untuk nilai n > 30 simpangan baku ( σ ) dan simpangan baku ( s ) akan tetap sama ( =s ). Oleh karena itu, dalam sebagian besar manual praktis, kriteria ini dianggap memiliki arti yang berbeda. Di Excel, perhitungan simpangan baku dapat dilakukan dengan fungsi =STDEV(range). Dan untuk menghitung simpangan baku, Anda perlu membuat rumus yang sesuai.

Kuadrat rata-rata akar atau simpangan baku memungkinkan Anda menentukan seberapa besar nilai suatu fitur dapat berbeda dari nilai rata-rata. Misalkan ada dua kota dengan suhu rata-rata harian yang sama di musim panas. Salah satu kota ini terletak di pantai, dan yang lainnya di benua. Diketahui bahwa di kota-kota yang terletak di pantai, perbedaan suhu siang hari lebih sedikit daripada di kota-kota yang terletak di pedalaman. Oleh karena itu, standar deviasi suhu siang hari di dekat kota pesisir akan lebih kecil dari kota kedua. Dalam praktiknya, ini berarti bahwa suhu udara rata-rata setiap hari tertentu di kota yang terletak di benua akan lebih berbeda dari nilai rata-rata daripada di kota di pantai. Selain itu, standar deviasi memungkinkan untuk memperkirakan kemungkinan penyimpangan suhu dari rata-rata dengan tingkat probabilitas yang diperlukan.

Menurut teori probabilitas, dalam fenomena yang mematuhi hukum distribusi normal, ada hubungan yang ketat antara nilai rata-rata aritmatika, standar deviasi dan opsi ( aturan tiga sigma). Misalnya, 68,3% dari nilai atribut variabel berada dalam M ± 1 σ , 95,5% - dalam M ± 2 σ dan 99,7% - dalam M ± 3 σ .

Nilai simpangan baku memungkinkan untuk menilai sifat homogenitas deret variasi dan kelompok yang diteliti. Jika nilai simpangan bakunya kecil, maka hal ini menunjukkan homogenitas yang cukup tinggi dari fenomena yang diteliti. Rata-rata aritmatika dalam hal ini harus diakui sebagai karakteristik yang cukup dari deret variasi ini. Namun, sigma yang terlalu kecil membuat orang berpikir tentang seleksi pengamatan buatan. Dengan sigma yang sangat besar, rata-rata aritmatika mencirikan seri variasi pada tingkat yang lebih rendah, yang menunjukkan variabilitas signifikan dari sifat atau fenomena yang dipelajari atau heterogenitas kelompok studi. Namun, perbandingan nilai simpangan baku hanya mungkin untuk tanda-tanda dengan dimensi yang sama. Memang jika kita membandingkan keragaman berat badan bayi baru lahir dan orang dewasa, kita akan selalu mendapatkan nilai sigma yang lebih tinggi pada orang dewasa.

Perbandingan variabilitas fitur dari dimensi yang berbeda dapat dilakukan dengan menggunakan koefisien variasi. Ini mengungkapkan keragaman sebagai persentase dari rata-rata, yang memungkinkan perbandingan sifat-sifat yang berbeda. Koefisien variasi dalam literatur medis ditunjukkan dengan tanda " Dengan ", dan dalam matematika" v» dan dihitung dengan rumus:

.

Nilai koefisien variasi kurang dari 10% menunjukkan hamburan kecil, dari 10 hingga 20% - tentang rata-rata, lebih dari 20% - tentang hamburan kuat di sekitar rata-rata aritmatika.

Rata-rata aritmatika biasanya dihitung berdasarkan data sampel. Dengan studi berulang di bawah pengaruh fenomena acak, rata-rata aritmatika dapat berubah. Hal ini disebabkan fakta bahwa, sebagai suatu peraturan, hanya sebagian dari unit pengamatan yang mungkin, yaitu populasi sampel, yang diselidiki. Informasi tentang semua unit yang mungkin mewakili fenomena yang diteliti dapat diperoleh dengan mempelajari seluruh populasi umum, yang tidak selalu mungkin. Pada saat yang sama, untuk menggeneralisasi data eksperimen, nilai rata-rata dalam populasi umum menarik. Oleh karena itu, untuk merumuskan kesimpulan umum tentang fenomena yang diteliti, hasil yang diperoleh atas dasar populasi sampel harus ditransfer ke populasi umum dengan metode statistik.

Untuk menentukan tingkat kebetulan antara studi sampel dan populasi umum, perlu untuk memperkirakan jumlah kesalahan yang pasti muncul selama pengamatan sampel. Kesalahan seperti itu disebut kesalahan keterwakilan” atau “Kesalahan rata-rata dari rata-rata aritmatika”. Faktanya, perbedaan antara rata-rata yang diperoleh dari pengamatan statistik selektif dan nilai serupa yang akan diperoleh dari studi berkelanjutan dari objek yang sama, yaitu. ketika mempelajari populasi umum. Karena rata-rata sampel adalah variabel acak, ramalan semacam itu dibuat dengan tingkat probabilitas yang dapat diterima oleh peneliti. Dalam penelitian medis, setidaknya 95%.

Kesalahan keterwakilan tidak boleh dikacaukan dengan kesalahan pendaftaran atau kesalahan perhatian (salah cetak, salah perhitungan, salah cetak, dll.), yang harus diminimalkan dengan metodologi dan alat yang memadai yang digunakan dalam percobaan.

Besarnya kesalahan keterwakilan tergantung pada ukuran sampel dan variabilitas sifat. Semakin besar jumlah pengamatan, semakin dekat sampel dengan populasi umum dan semakin kecil kesalahannya. Semakin banyak variabel fitur, semakin besar kesalahan statistik.

Dalam praktiknya, rumus berikut digunakan untuk menentukan kesalahan keterwakilan dalam deret variasi:

,

di mana: m – kesalahan keterwakilan;

σ – simpangan baku;

n adalah jumlah pengamatan dalam sampel.

Dapat dilihat dari rumus bahwa ukuran kesalahan rata-rata berbanding lurus dengan standar deviasi, yaitu variabilitas sifat yang diteliti, dan berbanding terbalik dengan akar kuadrat dari jumlah pengamatan.

Saat melakukan analisis statistik berdasarkan perhitungan nilai relatif, konstruksi deret variasi tidak wajib. Dalam hal ini, penentuan kesalahan rata-rata untuk indikator relatif dapat dilakukan dengan menggunakan rumus yang disederhanakan:

,

di mana: R- nilai indikator relatif, dinyatakan sebagai persentase, ppm, dll.;

q- kebalikan dari P dan dinyatakan sebagai (1-P), (100-P), (1000-P), dll., tergantung pada dasar penghitungan indikator;

n adalah jumlah pengamatan dalam sampel.

Namun, rumus yang ditunjukkan untuk menghitung kesalahan keterwakilan untuk nilai relatif hanya dapat diterapkan ketika nilai indikator lebih kecil dari basisnya. Dalam beberapa kasus penghitungan indikator intensif, kondisi ini tidak terpenuhi, dan indikator tersebut dapat dinyatakan sebagai angka lebih dari 100% atau 1000%o. Dalam situasi seperti itu, seri variasi dibangun dan kesalahan keterwakilan dihitung menggunakan rumus untuk nilai rata-rata berdasarkan standar deviasi.

Peramalan nilai rata-rata aritmatika dalam populasi umum dilakukan dengan indikasi dua nilai - minimum dan maksimum. Nilai ekstrim dari kemungkinan penyimpangan, di mana nilai rata-rata yang diinginkan dari populasi umum dapat berfluktuasi, disebut " Batas kepercayaan».

Dalil-dalil teori probabilitas membuktikan bahwa dengan distribusi normal suatu fitur dengan probabilitas 99,7%, nilai ekstrim deviasi mean tidak akan melebihi nilai triple error of representativeness ( M ± 3 m ); di 95,5% - tidak lebih dari nilai kesalahan rata-rata dua kali lipat dari nilai rata-rata ( M ±2 m ); di 68,3% - tidak lebih dari nilai satu kesalahan rata-rata ( M ± 1 m ) (Gbr. 9).

P%

Beras. 9. Probabilitas kepadatan distribusi normal.

Perhatikan bahwa pernyataan di atas hanya berlaku untuk fitur yang mematuhi hukum distribusi Gaussian normal.

Sebagian besar studi eksperimental, termasuk di bidang kedokteran, dikaitkan dengan pengukuran, yang hasilnya dapat mengambil hampir semua nilai dalam interval tertentu, oleh karena itu, sebagai suatu peraturan, mereka dijelaskan oleh model variabel acak kontinu. Dalam hal ini, sebagian besar metode statistik mempertimbangkan distribusi kontinu. Salah satu distribusi ini, yang memainkan peran mendasar dalam statistik matematika, adalah distribusi normal, atau Gaussian.

Hal ini disebabkan oleh beberapa alasan.

1. Pertama-tama, banyak pengamatan eksperimental dapat berhasil dijelaskan dengan menggunakan distribusi normal. Harus segera dicatat bahwa tidak ada distribusi data empiris yang benar-benar normal, karena variabel acak terdistribusi normal berada dalam rentang dari , yang tidak pernah terjadi dalam praktik. Namun, distribusi normal seringkali merupakan pendekatan yang baik.

Apakah pengukuran berat badan, tinggi badan dan parameter fisiologis lainnya dari tubuh manusia dilakukan - di mana-mana sejumlah besar faktor acak (penyebab alami dan kesalahan pengukuran) mempengaruhi hasil. Dan, sebagai aturan, efek dari masing-masing faktor ini tidak signifikan. Pengalaman menunjukkan bahwa hasil dalam kasus seperti itu akan didistribusikan kira-kira secara normal.

2. Banyak distribusi yang terkait dengan sampel acak, dengan peningkatan volume yang terakhir, menjadi normal.

3. Distribusi normal sangat cocok sebagai deskripsi perkiraan distribusi kontinu lainnya (misalnya, yang asimetris).

4. Distribusi normal memiliki sejumlah sifat matematika yang menguntungkan, yang sebagian besar memastikan penggunaannya secara luas dalam statistik.

Pada saat yang sama, perlu dicatat bahwa dalam data medis ada banyak distribusi eksperimental yang tidak dapat digambarkan dengan model distribusi normal. Untuk melakukan ini, statistik telah mengembangkan metode yang biasa disebut "Nonparametrik".

Pilihan metode statistik yang cocok untuk memproses data dari eksperimen tertentu harus dibuat tergantung pada apakah data yang diperoleh termasuk dalam hukum distribusi normal. Pengujian hipotesis untuk subordinasi tanda ke hukum distribusi normal dilakukan dengan menggunakan histogram dari distribusi frekuensi (grafik), serta sejumlah kriteria statistik. Diantara mereka:

Kriteria asimetri ( b );

Kriteria untuk memeriksa kurtosis ( g );

Kriteria Shapiro–Wilks ( W ) .

Analisis sifat distribusi data (juga disebut uji normalitas distribusi) dilakukan untuk setiap parameter. Untuk menilai dengan yakin kepatuhan distribusi parameter dengan hukum normal, diperlukan jumlah unit pengamatan yang cukup besar (setidaknya 30 nilai).

Untuk distribusi normal, kriteria skewness dan kurtosis mengambil nilai 0. Jika distribusi digeser ke kanan b > 0 (asimetri positif), dengan b < 0 - график распределения смещен влево (отрицательная асимметрия). Критерий асимметрии проверяет форму кривой распределения. В случае нормального закона g =0. Pada g > 0 kurva distribusi lebih tajam jika g < 0 пик более сглаженный, чем функция нормального распределения.

Untuk menguji normalitas menggunakan uji Shapiro-Wilks, perlu dicari nilai kriteria ini menggunakan tabel statistik pada tingkat signifikansi yang dipersyaratkan dan tergantung pada jumlah satuan pengamatan (derajat bebas). Lampiran 1. Hipotesis normalitas ditolak untuk nilai kecil dari kriteria ini, sebagai aturan, untuk w <0,8.

Konsep seri variasi. Langkah pertama dalam mensistematisasikan bahan observasi statistik adalah menghitung jumlah satuan yang memiliki satu atau lain ciri. Setelah mengatur unit dalam urutan menaik atau menurun dari atribut kuantitatif mereka dan menghitung jumlah unit dengan nilai atribut tertentu, kami memperoleh seri variasi. Deret variasi mencirikan distribusi unit populasi statistik tertentu menurut beberapa atribut kuantitatif.

Deret variasi terdiri dari dua kolom, kolom kiri berisi nilai-nilai atribut variabel, yang disebut varian dan dilambangkan dengan (x), dan kolom kanan berisi angka absolut yang menunjukkan berapa kali setiap varian muncul. Nilai dalam kolom ini disebut frekuensi dan dilambangkan dengan (f).

Secara skematis, deret variasi dapat direpresentasikan dalam bentuk Tabel 5.1:

Tabel 5.1

Jenis seri variasi

Opsi (x)

Frekuensi (f)

Di kolom kanan, indikator relatif yang mencirikan proporsi frekuensi varian individu dalam jumlah total frekuensi juga dapat digunakan. Indikator relatif ini disebut frekuensi dan secara konvensional dilambangkan dengan , yaitu. . Jumlah semua frekuensi sama dengan satu. Frekuensi juga dapat dinyatakan sebagai persentase, dan kemudian jumlahnya akan sama dengan 100%.

Tanda-tanda variabel dapat memiliki sifat yang berbeda. Varian dari beberapa tanda dinyatakan dalam bilangan bulat, misalnya, jumlah kamar di apartemen, jumlah buku yang diterbitkan, dll. Tanda-tanda ini disebut diskontinyu, atau diskrit. Varian fitur lain dapat mengambil nilai apa pun dalam batas tertentu, seperti pemenuhan target yang direncanakan, upah, dll. Fitur ini disebut kontinu.

Seri variasi diskrit. Jika varian dari deret variasi dinyatakan sebagai nilai diskrit, maka deret variasi tersebut disebut diskrit, penampakannya disajikan pada Tabel. 5.2:

Tabel 5.2

Distribusi siswa berdasarkan nilai yang diperoleh dalam ujian

Peringkat (x)

Jumlah siswa (f)

Dalam % dari total ()

Sifat distribusi dalam deret diskrit digambarkan secara grafis sebagai poligon distribusi, Gbr.5.1.

Beras. 5.1. Distribusi siswa berdasarkan nilai yang diperoleh dalam ujian.

Seri variasi interval. Untuk fitur kontinu, deret variasi dibangun sebagai deret interval, mis. nilai fitur di dalamnya dinyatakan sebagai interval "dari dan ke". Dalam hal ini, nilai minimum fitur dalam interval seperti itu disebut batas bawah interval, dan nilai maksimum disebut batas atas interval.

Seri variasi interval dibuat baik untuk fitur diskontinyu (diskrit) dan untuk fitur yang bervariasi dalam rentang yang besar. Baris interval dapat dengan interval yang sama dan tidak sama. Dalam praktik ekonomi, sebagian besar, interval yang tidak sama digunakan, secara progresif meningkat atau menurun. Kebutuhan seperti itu muncul terutama dalam kasus-kasus di mana fluktuasi tanda dilakukan secara tidak merata dan dalam batas-batas yang besar.

Perhatikan jenis deret interval dengan interval yang sama, Tabel. 5.3:

Tabel 5.3

Distribusi pekerja berdasarkan output

Keluaran, tr. (X)

Jumlah pekerja (f)

Frekuensi kumulatif (f´)

Deret distribusi interval secara grafis digambarkan sebagai histogram, Gbr.5.2.

Gbr.5.2. Distribusi pekerja berdasarkan output

Akumulasi (kumulatif) frekuensi. Dalam praktiknya, ada kebutuhan untuk mengubah deret distribusi menjadi baris kumulatif, dibangun di atas frekuensi yang terakumulasi. Mereka dapat digunakan untuk menentukan rata-rata struktural yang memfasilitasi analisis data deret distribusi.

Frekuensi kumulatif ditentukan dengan menambahkan secara berurutan ke frekuensi (atau frekuensi) dari grup pertama dari indikator ini dari grup berikutnya dari seri distribusi. Cumulates dan ogives digunakan untuk menggambarkan deret distribusi. Untuk membangunnya, nilai-nilai fitur diskrit (atau ujung interval) ditandai pada sumbu absis, dan total frekuensi yang berkembang (kumulasi) ditandai pada sumbu ordinat, Gbr.5.3.

Beras. 5.3. Distribusi kumulatif pekerja menurut pembangunan

Jika skala frekuensi dan varian dipertukarkan, mis. mencerminkan akumulasi frekuensi pada sumbu absis, dan nilai opsi pada sumbu ordinat, maka kurva yang mencirikan perubahan frekuensi dari grup ke grup akan disebut ogive distribusi, Gambar 5.4.

Beras. 5.4. Distribusi Ogiva pekerja untuk produksi

Deret variasi dengan interval yang sama memberikan salah satu persyaratan terpenting untuk deret distribusi statistik, memastikan komparabilitasnya dalam ruang dan waktu.

Kepadatan distribusi. Namun, frekuensi interval individu yang tidak sama dalam seri ini tidak dapat dibandingkan secara langsung. Dalam kasus seperti itu, untuk memastikan komparabilitas yang diperlukan, kepadatan distribusi dihitung, mis. tentukan berapa banyak unit dalam setiap kelompok per unit nilai interval.

Saat membuat grafik distribusi deret variasi dengan interval yang tidak sama, ketinggian persegi panjang ditentukan secara proporsional bukan dengan frekuensi, tetapi dengan indikator kepadatan distribusi nilai-nilai sifat yang dipelajari dalam interval yang sesuai. .

Penyusunan deret variasi dan representasi grafisnya merupakan langkah pertama dalam mengolah data awal dan langkah pertama dalam analisis populasi yang diteliti. Langkah selanjutnya dalam analisis deret variasi adalah penentuan indikator generalisasi utama, yang disebut karakteristik deret. Karakteristik ini harus memberikan gambaran tentang nilai rata-rata atribut dalam satuan populasi.

nilai rata-rata. Nilai rata-rata adalah karakteristik umum dari sifat yang dipelajari dalam populasi yang diteliti, yang mencerminkan tingkat tipikalnya per unit populasi dalam kondisi tempat dan waktu tertentu.

Nilai rata-rata selalu bernama, memiliki dimensi yang sama dengan atribut unit individu dari populasi.

Sebelum menghitung nilai rata-rata, perlu untuk mengelompokkan unit populasi yang diteliti, dengan menyoroti kelompok yang homogen secara kualitatif.

Rata-rata yang dihitung untuk populasi secara keseluruhan disebut rata-rata umum, dan untuk setiap kelompok - rata-rata kelompok.

Ada dua jenis rata-rata: daya (rata-rata aritmatika, rata-rata harmonik, rata-rata geometris, akar rata-rata kuadrat); struktural (modus, median, kuartil, desil).

Pilihan rata-rata untuk perhitungan tergantung pada tujuannya.

Jenis rata-rata daya dan metode perhitungannya. Dalam praktik pemrosesan statistik dari bahan yang dikumpulkan, berbagai masalah muncul, yang membutuhkan solusi rata-rata yang berbeda.

Statistik matematika memperoleh berbagai cara dari rumus rata-rata daya:

di mana nilai rata-rata; x - opsi individual (nilai fitur); z - eksponen (pada z = 1 - rata-rata aritmatika, z = 0 rata-rata geometrik, z = - 1 - rata-rata harmonik, z = 2 - rata-rata kuadrat).

Namun, pertanyaan tentang jenis rata-rata apa yang harus diterapkan dalam setiap kasus individu diselesaikan dengan analisis spesifik dari populasi yang diteliti.

Jenis rata-rata yang paling umum dalam statistik adalah rata-rata aritmatika. Ini dihitung dalam kasus-kasus ketika volume atribut rata-rata dibentuk sebagai jumlah nilainya untuk unit individu dari populasi statistik yang dipelajari.

Bergantung pada sifat data awal, mean aritmatika ditentukan dengan berbagai cara:

Jika data tidak dikelompokkan, maka perhitungan dilakukan sesuai dengan rumus nilai rata-rata sederhana

Perhitungan mean aritmatika dalam deret diskrit terjadi menurut rumus 3.4.

Perhitungan mean aritmatika dalam deret interval. Dalam deret variasi interval, di mana tengah interval diambil secara kondisional sebagai nilai fitur dalam setiap grup, mean aritmatika mungkin berbeda dari mean yang dihitung dari data yang tidak dikelompokkan. Selain itu, semakin besar interval dalam kelompok, semakin besar kemungkinan penyimpangan dari rata-rata yang dihitung dari data yang dikelompokkan dari rata-rata yang dihitung dari data yang tidak dikelompokkan.

Saat menghitung rata-rata untuk seri variasi interval, untuk melakukan perhitungan yang diperlukan, seseorang melewati dari interval ke titik tengahnya. Dan kemudian menghitung nilai rata-rata dengan rumus rata-rata tertimbang aritmatika.

Sifat mean aritmatika. Rata-rata aritmatika memiliki beberapa properti yang memungkinkan kita untuk menyederhanakan perhitungan, mari kita pertimbangkan.

1. Rata-rata aritmatika dari bilangan konstan sama dengan bilangan konstan ini.

Jika x = a. Kemudian .

2. Jika bobot semua opsi diubah secara proporsional, mis. bertambah atau berkurang dengan jumlah yang sama, maka rata-rata aritmatika dari deret baru tidak akan berubah dari ini.

Jika semua bobot f dikurangi sebanyak k kali, maka .

3. Jumlah deviasi positif dan negatif dari opsi individu dari rata-rata, dikalikan dengan bobot, sama dengan nol, mis.

Jika kemudian . Dari sini.

Jika semua opsi dikurangi atau ditambah dengan beberapa angka, maka rata-rata aritmatika dari seri baru akan berkurang atau bertambah dengan jumlah yang sama.

Kurangi semua opsi x pada sebuah, yaitu x´ = xsebuah.

Kemudian

Rata-rata aritmatika dari deret awal dapat diperoleh dengan menambahkan ke angka rata-rata tereduksi yang sebelumnya dikurangkan dari varian sebuah, yaitu .

5. Jika semua opsi dikurangi atau ditingkatkan dalam k kali, maka rata-rata aritmatika dari deret baru akan berkurang atau bertambah dengan jumlah yang sama, yaitu di k sekali.

Biarkan kemudian .

Oleh karena itu , yaitu untuk mendapatkan rata-rata deret asli, rata-rata aritmatika deret baru (dengan opsi yang dikurangi) harus ditingkatkan dengan k sekali.

Harmonik rata-rata. Rata-rata harmonik adalah kebalikan dari rata-rata aritmatika. Ini digunakan ketika informasi statistik tidak mengandung frekuensi untuk pilihan populasi individu, tetapi disajikan sebagai produk mereka (M = xf). Rata-rata harmonik akan dihitung menggunakan rumus 3.5

Aplikasi praktis dari rata-rata harmonik adalah untuk menghitung beberapa indeks, khususnya, indeks harga.

Rata-rata geometris. Saat menggunakan rata-rata geometrik, nilai individu dari atribut, sebagai aturan, nilai relatif dari dinamika, dibangun dalam bentuk nilai rantai, sebagai rasio ke level sebelumnya dari setiap level dalam deret dinamika. . Rata-rata dengan demikian mencirikan tingkat pertumbuhan rata-rata.

Mean geometrik juga digunakan untuk menentukan nilai jarak yang sama dari nilai maksimum dan minimum atribut. Misalnya, perusahaan asuransi mengadakan kontrak untuk penyediaan layanan asuransi mobil. Tergantung pada peristiwa tertentu yang diasuransikan, pembayaran asuransi dapat bervariasi dari 10.000 hingga 100.000 dolar per tahun. Pembayaran asuransi rata-rata adalah US$.

Rata-rata geometrik adalah nilai yang digunakan sebagai rata-rata rasio atau dalam deret distribusi, yang disajikan sebagai deret geometri, ketika z = 0. Rata-rata ini mudah digunakan jika perhatian diberikan bukan pada perbedaan mutlak, tetapi pada rasio dua angka.

Rumus untuk perhitungannya adalah sebagai berikut

di mana varian fitur rata-rata; - produk opsi; f- frekuensi pilihan.

Rata-rata geometrik digunakan dalam menghitung tingkat pertumbuhan tahunan rata-rata.

Berarti persegi. Rumus akar rata-rata kuadrat digunakan untuk mengukur tingkat fluktuasi nilai individu suatu sifat di sekitar rata-rata aritmatika dalam deret distribusi. Jadi, ketika menghitung indikator variasi, rata-rata dihitung dari kuadrat deviasi nilai individu sifat dari rata-rata aritmatika.

Nilai kuadrat rata-rata dihitung dengan rumus

Dalam penelitian ekonomi, bentuk modifikasi dari akar rata-rata kuadrat banyak digunakan dalam perhitungan indikator variasi suatu sifat, seperti varians, standar deviasi.

Aturan mayoritas. Berikut adalah hubungan antara rata-rata eksponensial - semakin besar eksponen, semakin besar nilai rata-ratanya, Tabel 5.4:

Tabel 5.4

Hubungan antara rata-rata

nilai z

Rasio antara rata-rata

Hubungan ini disebut rule of majorance.

Rata-rata struktural. Untuk mengkarakterisasi struktur populasi, indikator khusus digunakan, yang dapat disebut rata-rata struktural. Ukuran-ukuran ini termasuk modus, median, kuartil, dan desil.

Mode. Modus (Mo) adalah nilai fitur yang paling sering muncul dalam satuan populasi. Modus adalah nilai atribut yang sesuai dengan titik maksimum dari kurva distribusi teoritis.

Fashion banyak digunakan dalam praktik komersial dalam mempelajari permintaan konsumen (saat menentukan ukuran pakaian dan sepatu yang banyak diminati), pendaftaran harga. Mungkin ada beberapa mod secara total.

Perhitungan mode dalam seri diskrit. Dalam deret diskrit, modus adalah varian dengan frekuensi tertinggi. Pertimbangkan untuk menemukan mode dalam deret diskrit.

Perhitungan mode dalam seri interval. Dalam deret variasi interval, varian sentral dari interval modal kira-kira dianggap sebagai mode, yaitu interval yang memiliki frekuensi (frekuensi) tertinggi. Dalam interval, perlu untuk menemukan nilai atribut, yang merupakan mode. Untuk deret interval, modus akan ditentukan oleh rumus

di mana adalah batas bawah interval modal; adalah nilai interval modal; adalah frekuensi yang sesuai dengan interval modal; adalah frekuensi sebelum interval modal; adalah frekuensi interval yang mengikuti modal.

median. Median () adalah nilai fitur di unit tengah deret peringkat. Seri peringkat adalah seri di mana nilai karakteristik ditulis dalam urutan menaik atau menurun. Atau median adalah nilai yang membagi jumlah deret variasi terurut menjadi dua bagian yang sama: satu bagian memiliki nilai fitur variabel yang lebih kecil dari varian rata-rata, dan yang lainnya besar.

Untuk mencari median, terlebih dahulu ditentukan nomor serinya. Untuk melakukan ini, dengan jumlah unit ganjil, satu ditambahkan ke jumlah semua frekuensi dan semuanya dibagi dua. Dengan jumlah unit genap, median ditemukan sebagai nilai atribut unit, yang nomor serinya ditentukan oleh jumlah total frekuensi dibagi dua. Mengetahui nomor urut median, mudah untuk menemukan nilainya dari frekuensi yang terakumulasi.

Perhitungan median dalam deret diskrit. Berdasarkan sampel survei diperoleh data sebaran keluarga menurut jumlah anak, Tabel. 5.5. Untuk menentukan median, tentukan dulu bilangan urutnya

Dalam keluarga tersebut, jumlah anak adalah 2, oleh karena itu, = 2. Jadi, dalam 50% keluarga, jumlah anak tidak melebihi 2.

– frekuensi terakumulasi sebelum interval median;

Di satu sisi, ini adalah properti yang sangat positif. dalam hal ini, efek dari semua penyebab yang mempengaruhi semua unit populasi yang diteliti diperhitungkan. Di sisi lain, bahkan satu pengamatan yang secara tidak sengaja dimasukkan dalam data awal dapat secara signifikan mendistorsi gagasan tentang tingkat perkembangan sifat yang dipelajari dalam populasi yang sedang dipertimbangkan (terutama dalam seri pendek).

Kuartil dan desil. Dengan analogi dengan mencari median dalam deret variasi, kita dapat menemukan nilai suatu fitur di setiap unit deret berperingkat secara berurutan. Jadi, secara khusus, seseorang dapat menemukan nilai fitur untuk unit yang membagi deret menjadi 4 bagian yang sama, menjadi 10, dst.

Kuartil. Varian yang membagi deret peringkat menjadi empat bagian yang sama disebut kuartil.

Pada saat yang sama, berikut ini dibedakan: kuartil bawah (atau pertama) (Q1) - nilai fitur unit deret peringkat, membagi populasi dalam rasio ke dan atas (atau ketiga ) kuartil (Q3) - nilai fitur unit deret peringkat, membagi populasi dalam rasio hingga .

– frekuensi interval kuartil (bawah dan atas)

Interval yang mengandung Q1 dan Q3 ditentukan dari akumulasi frekuensi (atau frekuensi).

Desil. Selain kuartil, desil dihitung - opsi yang membagi seri peringkat menjadi 10 bagian yang sama.

Mereka dilambangkan dengan D, desil pertama D1 membagi seri dalam rasio 1/10 dan 9/10, D2 kedua - 2/10 dan 8/10, dll. Mereka dihitung dengan cara yang sama seperti median dan kuartil.

Baik median, dan kuartil, dan desil termasuk dalam apa yang disebut statistik ordinal, yang dipahami sebagai varian yang menempati tempat ordinal tertentu dalam deret peringkat.

​ Seri variasi - seri di mana mereka dibandingkan (dalam urutan menaik atau menurun) pilihan dan masing-masing frekuensi

Varian adalah ekspresi kuantitatif yang terpisah dari suatu sifat. Ditandai dengan huruf latin V . Pemahaman klasik tentang istilah "varian" mengasumsikan bahwa setiap nilai unik dari suatu fitur disebut varian, terlepas dari jumlah pengulangannya.

Misalnya, dalam serangkaian variasi indikator tekanan darah sistolik yang diukur pada sepuluh pasien:

110, 120, 120, 130, 130, 130, 140, 140, 160, 170;

hanya 6 nilai yang menjadi opsi:

110, 120, 130, 140, 160, 170.

Frekuensi adalah angka yang menunjukkan berapa kali opsi diulang. Dilambangkan dengan huruf latin P . Jumlah semua frekuensi (yang, tentu saja, sama dengan jumlah semua yang dipelajari) dilambangkan sebagai n.

    Dalam contoh kita, frekuensi akan mengambil nilai berikut:
  • untuk varian 110 frekuensi P = 1 (nilai 110 terjadi pada satu pasien),
  • untuk varian 120 frekuensi P = 2 (nilai 120 terjadi pada dua pasien),
  • untuk varian 130 frekuensi P = 3 (nilai 130 terjadi pada tiga pasien),
  • untuk varian 140 frekuensi P = 2 (nilai 140 terjadi pada dua pasien),
  • untuk varian 160 frekuensi P = 1 (nilai 160 terjadi pada satu pasien),
  • untuk varian 170 frekuensi P = 1 (nilai 170 terjadi pada satu pasien),

Jenis seri variasi:

  1. sederhana- ini adalah seri di mana setiap opsi hanya muncul sekali (semua frekuensi sama dengan 1);
  2. tergantung- rangkaian di mana satu atau lebih opsi muncul berulang kali.

Seri variasi digunakan untuk menggambarkan susunan angka yang besar; dalam bentuk inilah data yang dikumpulkan dari sebagian besar studi medis pada awalnya disajikan. Untuk mengkarakterisasi seri variasi, indikator khusus dihitung, termasuk nilai rata-rata, indikator variabilitas (yang disebut dispersi), indikator keterwakilan data sampel.

Indikator seri variasi

1) Rata-rata aritmatika adalah indikator generalisasi yang mencirikan ukuran sifat yang dipelajari. Rata-rata aritmatika dilambangkan sebagai M , adalah jenis rata-rata yang paling umum. Rata-rata aritmatika dihitung sebagai rasio jumlah nilai indikator semua unit pengamatan dengan jumlah semua yang diperiksa. Metode untuk menghitung mean aritmatika berbeda untuk deret variasi sederhana dan deret berbobot.

Rumus untuk perhitungan rata-rata aritmatika sederhana:

Rumus untuk perhitungan rata-rata aritmatika berbobot:

M = (V * P)/ n

​ 2) Mode - nilai rata-rata lain dari seri variasi, sesuai dengan varian yang paling sering diulang. Atau, dengan kata lain, ini adalah opsi yang sesuai dengan frekuensi tertinggi. Ditunjuk sebagai mo . Mode dihitung hanya untuk seri berbobot, karena dalam seri sederhana tidak ada opsi yang diulang dan semua frekuensi sama dengan satu.

Misalnya, dalam rangkaian variasi nilai detak jantung:

80, 84, 84, 86, 86, 86, 90, 94;

nilai mode adalah 86, karena varian ini muncul 3 kali, oleh karena itu frekuensinya adalah yang tertinggi.

3) Median - nilai opsi, membagi seri variasi menjadi dua: di kedua sisinya ada jumlah opsi yang sama. Median, serta mean dan modus aritmatika, mengacu pada nilai rata-rata. Ditunjuk sebagai Saya

4) Standar deviasi (sinonim: simpangan baku, simpangan sigma, sigma) - ukuran variabilitas seri variasi. Ini adalah indikator integral yang menggabungkan semua kasus penyimpangan varian dari mean. Faktanya, ini menjawab pertanyaan: seberapa jauh dan seberapa sering opsi menyebar dari mean aritmatika. Dilambangkan dengan huruf Yunani σ ("sigma").

Ketika ukuran populasi lebih dari 30 unit, standar deviasi dihitung menggunakan rumus berikut:

Untuk populasi kecil - 30 unit pengamatan atau kurang - standar deviasi dihitung menggunakan rumus yang berbeda:

(definisi deret variasi; komponen deret variasi; tiga bentuk deret variasi; kemanfaatan membangun deret interval; kesimpulan yang dapat ditarik dari deret yang dibangun)

Deret variasi adalah barisan semua elemen sampel yang disusun dalam urutan yang tidak menurun. Elemen yang sama diulang

Variasi - ini adalah seri yang dibangun secara kuantitatif.

Deret distribusi variasi terdiri dari dua elemen: varian dan frekuensi:

Varian adalah nilai numerik dari sifat kuantitatif dalam deret variasi distribusi. Mereka bisa positif atau negatif, absolut atau relatif. Jadi, ketika mengelompokkan perusahaan sesuai dengan hasil kegiatan ekonomi, opsinya positif - ini untung, dan angka negatif - ini rugi.

Frekuensi adalah jumlah varian individu atau setiap kelompok dari seri variasi, mis. ini adalah angka yang menunjukkan seberapa sering opsi tertentu muncul dalam rangkaian distribusi. Jumlah semua frekuensi disebut volume populasi dan ditentukan oleh jumlah elemen dari seluruh populasi.

Frekuensi adalah frekuensi yang dinyatakan sebagai nilai relatif (fraksi satuan atau persentase). Jumlah frekuensi sama dengan satu atau 100%. Penggantian frekuensi dengan frekuensi memungkinkan untuk membandingkan deret variasi dengan jumlah pengamatan yang berbeda.

Ada tiga bentuk seri variasi: deret peringkat, deret diskrit, dan deret interval.

Seri peringkat adalah distribusi unit individu dari populasi dalam urutan menaik atau menurun dari sifat yang diteliti. Pemeringkatan memudahkan untuk membagi data kuantitatif ke dalam kelompok, segera mendeteksi nilai terkecil dan terbesar dari suatu fitur, dan menyoroti nilai yang paling sering diulang.

Bentuk lain dari deret variasi adalah tabel kelompok yang disusun menurut sifat variasi nilai sifat yang diteliti. Berdasarkan sifat variasinya, tanda-tanda diskrit (terputus-putus) dan kontinu dibedakan.

Deret diskrit adalah deret variasional yang konstruksinya didasarkan pada tanda-tanda dengan perubahan terputus-putus (tanda-tanda diskrit). Yang terakhir termasuk kategori tarif, jumlah anak dalam keluarga, jumlah karyawan di perusahaan, dll. Tanda-tanda ini hanya dapat mengambil sejumlah nilai tertentu yang terbatas.

Deret variasi diskrit adalah tabel yang terdiri dari dua kolom. Kolom pertama menunjukkan nilai spesifik atribut, dan yang kedua - jumlah unit populasi dengan nilai spesifik atribut.

Jika sebuah tanda memiliki perubahan yang terus-menerus (jumlah pendapatan, pengalaman kerja, biaya aset tetap suatu perusahaan, dll., yang dapat mengambil nilai berapa pun dalam batas-batas tertentu), maka rangkaian variasi interval harus dibangun untuk tanda ini.



Tabel grup di sini juga memiliki dua kolom. Yang pertama menunjukkan nilai fitur dalam interval "dari - ke" (opsi), yang kedua - jumlah unit yang termasuk dalam interval (frekuensi).

Frekuensi (frekuensi pengulangan) - jumlah pengulangan varian tertentu dari nilai atribut, dilambangkan fi , dan jumlah frekuensi yang sama dengan volume populasi yang dipelajari, dilambangkan

Di mana k adalah jumlah opsi nilai atribut

Sangat sering, tabel dilengkapi dengan kolom di mana akumulasi frekuensi S dihitung, yang menunjukkan berapa banyak unit populasi yang memiliki nilai fitur tidak lebih besar dari nilai ini.

Deret distribusi variasi diskrit adalah deret yang grupnya disusun menurut fitur yang bervariasi secara diskrit dan hanya mengambil nilai integer.

Deret distribusi variasi interval adalah deret di mana atribut pengelompokan, yang menjadi dasar pengelompokan, dapat mengambil nilai apa pun dalam interval tertentu, termasuk yang pecahan.

Deret variasi interval adalah himpunan interval variasi terurut dari nilai-nilai variabel acak dengan frekuensi yang sesuai atau frekuensi nilai kuantitas yang jatuh ke masing-masingnya.

Adalah bijaksana untuk membangun deret distribusi interval, pertama-tama, dengan variasi sifat yang berkesinambungan, dan juga jika variasi diskrit memanifestasikan dirinya pada rentang yang luas, mis. jumlah opsi untuk fitur diskrit cukup besar.

Beberapa kesimpulan sudah bisa ditarik dari seri ini. Misalnya, elemen rata-rata dari deret variasi (median) dapat menjadi perkiraan hasil pengukuran yang paling mungkin. Elemen pertama dan terakhir dari seri variasi (yaitu, elemen minimum dan maksimum sampel) menunjukkan penyebaran elemen sampel. Terkadang, jika elemen pertama atau terakhir sangat berbeda dari sampel lainnya, maka mereka dikeluarkan dari hasil pengukuran, mengingat nilai-nilai ini diperoleh sebagai akibat dari beberapa jenis kegagalan kotor, misalnya, teknologi.