Nilai numerik dari deret variasi disebut. Seri variasi

variasi disebut deret distribusi yang dibangun atas dasar kuantitatif. Nilai-nilai karakteristik kuantitatif dalam unit individu populasi tidak konstan, kurang lebih berbeda satu sama lain.

Variasi- fluktuasi, variabilitas nilai atribut dalam satuan populasi. Nilai numerik terpisah dari sifat yang terjadi pada populasi yang diteliti disebut pilihan nilai-nilai. Ketidakcukupan nilai rata-rata untuk karakterisasi lengkap populasi membuatnya perlu untuk melengkapi nilai rata-rata dengan indikator yang memungkinkan untuk menilai kekhasan rata-rata ini dengan mengukur fluktuasi (variasi) sifat yang diteliti.

Adanya variasi disebabkan oleh pengaruh sejumlah besar faktor terhadap pembentukan tingkat sifat. Faktor-faktor ini bertindak dengan kekuatan yang tidak sama dan dalam arah yang berbeda. Indikator variasi digunakan untuk menggambarkan ukuran variabilitas sifat.

Tugas studi statistik variasi:

  • 1) studi tentang sifat dan tingkat variasi tanda dalam unit individu populasi;
  • 2) penentuan peran faktor individu atau kelompoknya dalam variasi ciri-ciri tertentu dari populasi.

Dalam statistik, metode khusus untuk mempelajari variasi digunakan, berdasarkan penggunaan sistem indikator, dengan dimana variasi diukur.

Studi tentang variasi sangat penting. Pengukuran variasi diperlukan ketika melakukan observasi sampel, analisis korelasi dan varians, dll. Ermolaev O.Yu. Statistik matematika untuk psikolog: Textbook [Teks] / O.Yu. Ermolaev. - M.: Rumah Penerbitan Flint dari Institut Psikologi dan Sosial Moskow, 2012. - 335p.

Menurut tingkat variasi, seseorang dapat menilai homogenitas populasi, stabilitas nilai fitur individu dan kekhasan rata-rata. Atas dasar mereka, indikator kedekatan hubungan antara tanda-tanda, indikator untuk menilai keakuratan pengamatan selektif dikembangkan.

Ada variasi dalam ruang dan variasi dalam waktu.

Variasi dalam ruang dipahami sebagai fluktuasi nilai-nilai fitur dalam satuan populasi yang mewakili wilayah yang terpisah. Di bawah variasi waktu berarti perubahan nilai atribut dalam periode waktu yang berbeda.

Untuk mempelajari variasi deret distribusi, semua varian nilai atribut disusun secara ascending atau descending. Proses ini disebut peringkat seri.

Tanda-tanda variasi yang paling sederhana adalah minimal dan maksimal- nilai terkecil dan terbesar dari atribut dalam agregat. Banyaknya pengulangan varian individu dari nilai ciri disebut frekuensi pengulangan (fi). Lebih mudah untuk mengganti frekuensi dengan frekuensi - wi. Frekuensi - indikator frekuensi relatif, yang dapat dinyatakan dalam pecahan unit atau persentase dan memungkinkan Anda untuk membandingkan rangkaian variasi dengan jumlah pengamatan yang berbeda. Dinyatakan dengan rumus:

di mana Xmax, Xmin - nilai maksimum dan minimum atribut dalam agregat; n adalah jumlah grup.

Untuk mengukur variasi suatu sifat, digunakan berbagai indikator absolut dan relatif. Indikator mutlak variasi meliputi rentang variasi, deviasi linier rata-rata, varians, standar deviasi. Indikator relatif fluktuasi meliputi koefisien osilasi, deviasi linier relatif, koefisien variasi.

Contoh menemukan deret variasi

Latihan. Untuk sampel ini:

  • a) Temukan deret variasi;
  • b) Membangun fungsi distribusi;

Tidak.=42. Item sampel:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Keputusan.

  • a) konstruksi deret variasi berperingkat:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) konstruksi deret variasi diskrit.

Mari kita hitung jumlah grup dalam deret variasi menggunakan rumus Sturgess:

Misalkan banyaknya kelompok sama dengan 7.

Mengetahui jumlah grup, kami menghitung nilai interval:

Untuk kenyamanan membuat tabel, kami akan mengambil jumlah grup yang sama dengan 8, intervalnya adalah 1.

Beras. satu Volume penjualan barang oleh toko untuk jangka waktu tertentu

Metode pengelompokan juga memungkinkan Anda untuk mengukur variasi(variabilitas, fluktuasi) tanda. Dengan jumlah unit populasi yang relatif kecil, variasi diukur atas dasar deret peringkat unit yang membentuk populasi. Baris disebut peringkat jika unit disusun dalam fitur menaik (menurun).

Namun, seri peringkat agak indikatif ketika karakteristik komparatif variasi diperlukan. Selain itu, dalam banyak kasus kita harus berurusan dengan agregat statistik yang terdiri dari sejumlah besar unit, yang secara praktis sulit untuk direpresentasikan dalam bentuk deret tertentu. Dalam hal ini, untuk pengenalan umum awal dengan data statistik dan terutama untuk memfasilitasi studi tentang variasi tanda, fenomena dan proses yang dipelajari biasanya digabungkan ke dalam kelompok, dan hasil pengelompokan tersebut disusun dalam bentuk tabel kelompok. .

Jika hanya ada dua kolom dalam tabel grup - grup sesuai dengan fitur yang dipilih (opsi) dan jumlah grup (frekuensi atau frekuensi), itu disebut dekat distribusi.

Rentang distribusi - jenis pengelompokan struktural paling sederhana menurut satu atribut, ditampilkan dalam tabel grup dengan dua kolom yang berisi varian dan frekuensi atribut. Dalam banyak kasus, dengan pengelompokan struktural seperti itu, mis. dengan penyusunan deret distribusi, kajian materi statistik awal dimulai.

Pengelompokan struktural dalam bentuk deret distribusi dapat diubah menjadi pengelompokan struktural sejati jika grup yang dipilih tidak hanya dicirikan oleh frekuensi, tetapi juga oleh indikator statistik lainnya. Tujuan utama dari deret distribusi adalah untuk mempelajari variasi fitur. Teori deret distribusi dikembangkan secara rinci oleh statistik matematika.

Seri distribusi dibagi menjadi: atributif(pengelompokan berdasarkan karakteristik atributif, misalnya, pembagian populasi berdasarkan jenis kelamin, kebangsaan, status perkawinan, dll.) dan variasi(pengelompokan berdasarkan karakteristik kuantitatif).

Seri variasi adalah tabel grup yang berisi dua kolom: pengelompokan unit menurut satu atribut kuantitatif dan jumlah unit di setiap grup. Interval dalam deret variasi biasanya dibentuk sama dan tertutup. Seri variasi adalah pengelompokan penduduk Rusia berikut dalam hal pendapatan tunai rata-rata per kapita (Tabel 3.10).

Tabel 3.10

Distribusi populasi Rusia berdasarkan pendapatan per kapita rata-rata pada tahun 2004-2009

Kelompok penduduk menurut rata-rata pendapatan tunai per kapita, gosok/bulan

Populasi dalam kelompok, dalam % dari total

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Lebih dari 25.000.0

Semua populasi

Deret variasi, pada gilirannya, dibagi menjadi diskrit dan interval. Diskrit seri variasi menggabungkan varian fitur diskrit yang bervariasi dalam batas yang sempit. Contoh deret variasi diskrit adalah distribusi keluarga Rusia menurut jumlah anak yang mereka miliki.

Selang seri variasi menggabungkan varian fitur kontinu atau fitur diskrit yang berubah dalam rentang yang luas. Deret interval adalah deret variasi dari distribusi penduduk Rusia dalam hal pendapatan tunai rata-rata per kapita.

Deret variasi diskrit tidak terlalu sering digunakan dalam praktik. Sedangkan untuk menyusunnya tidaklah sulit, karena komposisi kelompok ditentukan oleh varian-varian tertentu yang sebenarnya dimiliki oleh ciri-ciri pengelompokan yang dipelajari.

Deret variasi interval lebih tersebar luas. Dalam menyusunnya, muncul pertanyaan sulit tentang jumlah kelompok, serta ukuran interval yang harus ditetapkan.

Prinsip-prinsip untuk menyelesaikan masalah ini ditetapkan dalam bab tentang metodologi untuk menyusun pengelompokan statistik (lihat paragraf 3.3).

Deret variasi adalah sarana untuk meruntuhkan atau memadatkan informasi yang beragam ke dalam bentuk yang ringkas; deret variasi dapat digunakan untuk membuat penilaian yang cukup jelas tentang sifat variasi, untuk mempelajari perbedaan tanda-tanda fenomena yang termasuk dalam himpunan yang diteliti. Tetapi signifikansi terpenting dari deret variasi adalah bahwa atas dasar mereka, karakteristik generalisasi khusus dari variasi dihitung (lihat Bab 7).

Konsep seri variasi. Langkah pertama dalam mensistematisasikan bahan observasi statistik adalah menghitung jumlah satuan yang memiliki satu atau lain ciri. Setelah mengatur unit dalam urutan menaik atau menurun dari atribut kuantitatif mereka dan menghitung jumlah unit dengan nilai atribut tertentu, kami memperoleh seri variasi. Deret variasi mencirikan distribusi unit populasi statistik tertentu menurut beberapa atribut kuantitatif.

Deret variasi terdiri dari dua kolom, kolom kiri berisi nilai-nilai atribut variabel, yang disebut varian dan dilambangkan dengan (x), dan kolom kanan berisi angka absolut yang menunjukkan berapa kali setiap varian muncul. Nilai dalam kolom ini disebut frekuensi dan dilambangkan dengan (f).

Secara skematis, deret variasi dapat direpresentasikan dalam bentuk Tabel 5.1:

Tabel 5.1

Jenis seri variasi

Opsi (x)

Frekuensi (f)

Di kolom kanan, indikator relatif yang mencirikan proporsi frekuensi varian individu dalam jumlah total frekuensi juga dapat digunakan. Indikator relatif ini disebut frekuensi dan secara konvensional dilambangkan dengan , yaitu. . Jumlah semua frekuensi sama dengan satu. Frekuensi juga dapat dinyatakan sebagai persentase, dan kemudian jumlahnya akan sama dengan 100%.

Tanda-tanda variabel dapat memiliki sifat yang berbeda. Varian dari beberapa tanda dinyatakan dalam bilangan bulat, misalnya, jumlah kamar di apartemen, jumlah buku yang diterbitkan, dll. Tanda-tanda ini disebut diskontinyu, atau diskrit. Varian fitur lain dapat mengambil nilai apa pun dalam batas tertentu, seperti pemenuhan target yang direncanakan, upah, dll. Fitur ini disebut kontinu.

Seri variasi diskrit. Jika varian dari deret variasi dinyatakan sebagai nilai diskrit, maka deret variasi tersebut disebut diskrit, penampakannya disajikan pada Tabel. 5.2:

Tabel 5.2

Distribusi siswa berdasarkan nilai yang diperoleh dalam ujian

Peringkat (x)

Jumlah siswa (f)

Dalam % dari total ()

Sifat distribusi dalam deret diskrit digambarkan secara grafis sebagai poligon distribusi, Gbr.5.1.

Beras. 5.1. Distribusi siswa berdasarkan nilai yang diperoleh dalam ujian.

Seri variasi interval. Untuk fitur kontinu, deret variasi dibangun sebagai deret interval, mis. nilai fitur di dalamnya dinyatakan sebagai interval "dari dan ke". Dalam hal ini, nilai minimum fitur dalam interval seperti itu disebut batas bawah interval, dan nilai maksimum disebut batas atas interval.

Seri variasi interval dibuat baik untuk fitur diskontinyu (diskrit) dan untuk fitur yang bervariasi dalam rentang yang besar. Baris interval dapat dengan interval yang sama dan tidak sama. Dalam praktik ekonomi, sebagian besar, interval yang tidak sama digunakan, secara progresif meningkat atau menurun. Kebutuhan seperti itu muncul terutama dalam kasus-kasus di mana fluktuasi tanda dilakukan secara tidak merata dan dalam batas-batas yang besar.

Perhatikan jenis deret interval dengan interval yang sama, Tabel. 5.3:

Tabel 5.3

Distribusi pekerja berdasarkan output

Keluaran, tr. (X)

Jumlah pekerja (f)

Frekuensi kumulatif (f´)

Deret distribusi interval secara grafis digambarkan sebagai histogram, Gbr.5.2.

Gbr.5.2. Distribusi pekerja berdasarkan output

Akumulasi (kumulatif) frekuensi. Dalam praktiknya, ada kebutuhan untuk mengubah deret distribusi menjadi baris kumulatif, dibangun di atas akumulasi frekuensi. Mereka dapat digunakan untuk menentukan rata-rata struktural yang memfasilitasi analisis data deret distribusi.

Frekuensi kumulatif ditentukan dengan menambahkan frekuensi (atau frekuensi) berturut-turut dari kelompok pertama dari indikator ini dari kelompok berikutnya dari deret distribusi. Cumulates dan ogives digunakan untuk menggambarkan deret distribusi. Untuk membangunnya, nilai-nilai fitur diskrit (atau ujung interval) ditandai pada sumbu absis, dan total frekuensi yang berkembang (kumulasi) ditandai pada sumbu ordinat, Gbr.5.3.

Beras. 5.3. Distribusi kumulatif pekerja menurut pembangunan

Jika skala frekuensi dan varian dipertukarkan, mis. mencerminkan akumulasi frekuensi pada sumbu absis, dan nilai opsi pada sumbu ordinat, maka kurva yang mencirikan perubahan frekuensi dari grup ke grup akan disebut ogive distribusi, Gambar 5.4.

Beras. 5.4. Distribusi Ogiva pekerja untuk produksi

Deret variasi dengan interval yang sama menyediakan salah satu persyaratan terpenting untuk deret distribusi statistik, memastikan komparabilitasnya dalam ruang dan waktu.

Kepadatan distribusi. Namun, frekuensi interval individu yang tidak sama dalam seri ini tidak dapat dibandingkan secara langsung. Dalam kasus seperti itu, untuk memastikan komparabilitas yang diperlukan, kepadatan distribusi dihitung, mis. tentukan berapa banyak unit dalam setiap kelompok per unit nilai interval.

Saat membuat grafik distribusi deret variasi dengan interval yang tidak sama, ketinggian persegi panjang ditentukan secara proporsional bukan dengan frekuensi, tetapi dengan indikator kepadatan distribusi nilai-nilai sifat yang dipelajari dalam interval yang sesuai. .

Penyusunan deret variasi dan representasi grafisnya merupakan langkah pertama dalam mengolah data awal dan langkah pertama dalam analisis populasi yang diteliti. Langkah selanjutnya dalam analisis deret variasi adalah penentuan indikator generalisasi utama, yang disebut karakteristik deret. Karakteristik ini harus memberikan gambaran tentang nilai rata-rata atribut dalam satuan populasi.

nilai rata-rata. Nilai rata-rata adalah karakteristik umum dari sifat yang dipelajari dalam populasi yang diteliti, yang mencerminkan tingkat tipikalnya per unit populasi dalam kondisi tempat dan waktu tertentu.

Nilai rata-rata selalu bernama, memiliki dimensi yang sama dengan atribut unit individu dari populasi.

Sebelum menghitung nilai rata-rata, perlu untuk mengelompokkan unit-unit populasi yang diteliti, dengan menyoroti kelompok-kelompok yang homogen secara kualitatif.

Rata-rata yang dihitung untuk populasi secara keseluruhan disebut rata-rata umum, dan untuk setiap kelompok - rata-rata kelompok.

Ada dua jenis rata-rata: daya (rata-rata aritmatika, rata-rata harmonik, rata-rata geometris, akar rata-rata kuadrat); struktural (modus, median, kuartil, desil).

Pilihan rata-rata untuk perhitungan tergantung pada tujuannya.

Jenis rata-rata daya dan metode perhitungannya. Dalam praktik pemrosesan statistik dari bahan yang dikumpulkan, berbagai masalah muncul, yang membutuhkan solusi rata-rata yang berbeda.

Statistik matematika memperoleh berbagai cara dari rumus rata-rata daya:

di mana nilai rata-rata; x - opsi individual (nilai fitur); z - eksponen (pada z = 1 - rata-rata aritmatika, z = 0 rata-rata geometrik, z = - 1 - rata-rata harmonik, z = 2 - rata-rata kuadrat).

Namun, pertanyaan tentang jenis rata-rata apa yang harus diterapkan dalam setiap kasus individual diselesaikan dengan analisis spesifik dari populasi yang diteliti.

Jenis rata-rata yang paling umum dalam statistik adalah rata-rata aritmatika. Itu dihitung dalam kasus-kasus ketika volume atribut rata-rata dibentuk sebagai jumlah nilainya untuk unit individu dari populasi statistik yang dipelajari.

Bergantung pada sifat data awal, mean aritmatika ditentukan dengan berbagai cara:

Jika data tidak dikelompokkan, maka perhitungan dilakukan sesuai dengan rumus nilai rata-rata sederhana

Perhitungan mean aritmatika dalam deret diskrit terjadi menurut rumus 3.4.

Perhitungan mean aritmatika dalam deret interval. Dalam deret variasi interval, di mana tengah interval diambil secara kondisional sebagai nilai fitur dalam setiap grup, mean aritmatika mungkin berbeda dari mean yang dihitung dari data yang tidak dikelompokkan. Selain itu, semakin besar interval dalam kelompok, semakin besar kemungkinan penyimpangan dari rata-rata yang dihitung dari data yang dikelompokkan dari rata-rata yang dihitung dari data yang tidak dikelompokkan.

Saat menghitung rata-rata untuk seri variasi interval, untuk melakukan perhitungan yang diperlukan, seseorang melewati dari interval ke titik tengahnya. Dan kemudian menghitung nilai rata-rata dengan rumus rata-rata tertimbang aritmatika.

Sifat mean aritmatika. Rata-rata aritmatika memiliki beberapa properti yang memungkinkan kita untuk menyederhanakan perhitungan, mari kita pertimbangkan.

1. Rata-rata aritmatika dari bilangan konstan sama dengan bilangan konstan ini.

Jika x = a. Kemudian .

2. Jika bobot semua opsi diubah secara proporsional, mis. bertambah atau berkurang dengan jumlah yang sama, maka rata-rata aritmatika dari deret baru tidak akan berubah dari ini.

Jika semua bobot f dikurangi sebanyak k kali, maka .

3. Jumlah deviasi positif dan negatif dari opsi individu dari rata-rata, dikalikan dengan bobot, sama dengan nol, mis.

Jika kemudian . Dari sini.

Jika semua opsi dikurangi atau ditambah dengan beberapa angka, maka rata-rata aritmatika dari seri baru akan berkurang atau bertambah dengan jumlah yang sama.

Kurangi semua opsi x pada sebuah, yaitu x´ = xsebuah.

Kemudian

Rata-rata aritmatika dari deret awal dapat diperoleh dengan menambahkan ke angka rata-rata tereduksi yang sebelumnya dikurangkan dari varian sebuah, yaitu .

5. Jika semua opsi dikurangi atau ditambah k kali, maka rata-rata aritmatika dari deret baru akan berkurang atau bertambah dengan jumlah yang sama, yaitu di k sekali.

Biarkan kemudian .

Oleh karena itu , yaitu untuk mendapatkan rata-rata dari deret asli, rata-rata aritmatika dari deret baru (dengan opsi yang dikurangi) harus ditingkatkan dengan k sekali.

Harmonik rata-rata. Rata-rata harmonik adalah kebalikan dari rata-rata aritmatika. Ini digunakan ketika informasi statistik tidak mengandung frekuensi untuk pilihan populasi individu, tetapi disajikan sebagai produk mereka (M = xf). Rata-rata harmonik akan dihitung menggunakan rumus 3.5

Aplikasi praktis dari rata-rata harmonik adalah untuk menghitung beberapa indeks, khususnya, indeks harga.

Rata-rata geometris. Saat menggunakan rata-rata geometrik, nilai individu dari atribut, sebagai aturan, nilai relatif dari dinamika, dibangun dalam bentuk nilai rantai, sebagai rasio ke level sebelumnya dari setiap level dalam deret dinamika. . Rata-rata dengan demikian mencirikan tingkat pertumbuhan rata-rata.

Mean geometrik juga digunakan untuk menentukan nilai jarak yang sama dari nilai maksimum dan minimum atribut. Misalnya, perusahaan asuransi mengadakan kontrak untuk penyediaan layanan asuransi mobil. Tergantung pada peristiwa tertentu yang diasuransikan, pembayaran asuransi dapat bervariasi dari 10.000 hingga 100.000 dolar per tahun. Pembayaran asuransi rata-rata adalah US$.

Rata-rata geometrik adalah nilai yang digunakan sebagai rata-rata rasio atau dalam deret distribusi, yang disajikan sebagai deret geometri, ketika z = 0. Rata-rata ini mudah digunakan jika perhatian diberikan bukan pada perbedaan mutlak, tetapi pada rasio dua angka.

Rumus untuk perhitungannya adalah sebagai berikut

di mana varian fitur rata-rata; - produk opsi; f- frekuensi pilihan.

Rata-rata geometrik digunakan dalam menghitung tingkat pertumbuhan tahunan rata-rata.

Berarti persegi. Rumus akar rata-rata kuadrat digunakan untuk mengukur tingkat fluktuasi nilai individu suatu sifat di sekitar rata-rata aritmatika dalam deret distribusi. Jadi, ketika menghitung indikator variasi, rata-rata dihitung dari kuadrat deviasi nilai individu sifat dari rata-rata aritmatika.

Nilai kuadrat rata-rata dihitung dengan rumus

Dalam penelitian ekonomi, bentuk modifikasi dari akar rata-rata kuadrat banyak digunakan dalam perhitungan indikator variasi suatu sifat, seperti varians, standar deviasi.

Aturan mayoritas. Ada hubungan berikut antara rata-rata kekuasaan-hukum - semakin besar eksponen, semakin besar nilai rata-rata, Tabel 5.4:

Tabel 5.4

Hubungan antara rata-rata

nilai z

Rasio antara rata-rata

Hubungan ini disebut rule of majorance.

Rata-rata struktural. Untuk mengkarakterisasi struktur populasi, indikator khusus digunakan, yang dapat disebut rata-rata struktural. Ukuran-ukuran ini termasuk modus, median, kuartil, dan desil.

Mode. Modus (Mo) adalah nilai fitur yang paling sering muncul dalam satuan populasi. Modus adalah nilai atribut yang sesuai dengan titik maksimum dari kurva distribusi teoritis.

Fashion banyak digunakan dalam praktik komersial dalam mempelajari permintaan konsumen (saat menentukan ukuran pakaian dan sepatu yang banyak diminati), pendaftaran harga. Mungkin ada beberapa mod secara total.

Perhitungan mode dalam seri diskrit. Dalam deret diskrit, modus adalah varian dengan frekuensi tertinggi. Pertimbangkan untuk menemukan mode dalam deret diskrit.

Perhitungan mode dalam seri interval. Dalam deret variasi interval, varian sentral dari interval modal kira-kira dianggap sebagai mode, yaitu interval yang memiliki frekuensi (frekuensi) tertinggi. Dalam interval, perlu untuk menemukan nilai atribut, yang merupakan mode. Untuk deret interval, modus akan ditentukan oleh rumus

di mana adalah batas bawah interval modal; adalah nilai interval modal; adalah frekuensi yang sesuai dengan interval modal; adalah frekuensi sebelum interval modal; adalah frekuensi interval mengikuti modal.

median. Median () adalah nilai fitur di unit tengah deret peringkat. Seri peringkat adalah seri di mana nilai karakteristik ditulis dalam urutan menaik atau menurun. Atau median adalah nilai yang membagi jumlah deret variasi terurut menjadi dua bagian yang sama: satu bagian memiliki nilai fitur variabel yang lebih kecil dari varian rata-rata, dan yang lainnya besar.

Untuk mencari median, terlebih dahulu ditentukan nomor serinya. Untuk melakukan ini, dengan jumlah unit ganjil, satu ditambahkan ke jumlah semua frekuensi dan semuanya dibagi dua. Dengan jumlah unit genap, median ditemukan sebagai nilai atribut unit, yang nomor serinya ditentukan oleh jumlah total frekuensi dibagi dua. Mengetahui nomor urut median, mudah untuk menemukan nilainya dari frekuensi yang terakumulasi.

Perhitungan median dalam deret diskrit. Berdasarkan sampel survei diperoleh data sebaran keluarga menurut jumlah anak, Tabel. 5.5. Untuk menentukan median, tentukan dulu bilangan urutnya

Dalam keluarga tersebut, jumlah anak adalah 2, oleh karena itu, = 2. Jadi, dalam 50% keluarga, jumlah anak tidak melebihi 2.

– frekuensi terakumulasi sebelum interval median;

Di satu sisi, ini adalah properti yang sangat positif. dalam hal ini, efek dari semua penyebab yang mempengaruhi semua unit populasi yang diteliti diperhitungkan. Di sisi lain, bahkan satu pengamatan yang secara tidak sengaja dimasukkan dalam data awal dapat secara signifikan mendistorsi gagasan tentang tingkat perkembangan sifat yang dipelajari dalam populasi yang sedang dipertimbangkan (terutama dalam seri pendek).

Kuartil dan desil. Dengan analogi dengan mencari median dalam deret variasi, kita dapat menemukan nilai suatu fitur di setiap unit deret berperingkat secara berurutan. Jadi, secara khusus, seseorang dapat menemukan nilai fitur untuk unit yang membagi deret menjadi 4 bagian yang sama, menjadi 10, dst.

Kuartil. Varian yang membagi deret peringkat menjadi empat bagian yang sama disebut kuartil.

Pada saat yang sama, berikut ini dibedakan: kuartil bawah (atau pertama) (Q1) - nilai fitur unit deret peringkat, membagi populasi dalam rasio ke dan atas (atau ketiga ) kuartil (Q3) - nilai fitur unit deret peringkat, membagi populasi dalam rasio hingga .

– frekuensi interval kuartil (bawah dan atas)

Interval yang mengandung Q1 dan Q3 ditentukan dari akumulasi frekuensi (atau frekuensi).

Desil. Selain kuartil, desil dihitung - opsi yang membagi seri peringkat menjadi 10 bagian yang sama.

Mereka dilambangkan dengan D, desil pertama D1 membagi seri dalam rasio 1/10 dan 9/10, D2 kedua - 2/10 dan 8/10, dll. Mereka dihitung dengan cara yang sama seperti median dan kuartil.

Baik median, dan kuartil, dan desil termasuk dalam apa yang disebut statistik ordinal, yang dipahami sebagai varian yang menempati tempat ordinal tertentu dalam deret peringkat.

Baris dibangun berdasarkan kuantitas, disebut variasi.

Rangkaian distribusi terdiri dari pilihan(nilai karakteristik) dan frekuensi(jumlah kelompok). Frekuensi yang dinyatakan sebagai nilai relatif (saham, persentase) disebut frekuensi. Jumlah semua frekuensi disebut volume deret distribusi.

Berdasarkan jenisnya, rangkaian distribusi dibagi menjadi: diskrit(dibangun di atas nilai fitur yang terputus-putus) dan selang(dibangun di atas nilai fitur berkelanjutan).

Seri variasi mewakili dua kolom (atau baris); salah satunya memberikan nilai individual dari atribut variabel, yang disebut varian dan dilambangkan dengan X; dan di sisi lain - angka absolut yang menunjukkan berapa kali (seberapa sering) setiap opsi muncul. Indikator kolom kedua disebut frekuensi dan secara konvensional dilambangkan dengan f. Sekali lagi, kami mencatat bahwa di kolom kedua, indikator relatif yang mencirikan bagian frekuensi varian individu dalam jumlah total frekuensi juga dapat digunakan. Indikator relatif ini disebut frekuensi dan secara konvensional dilambangkan dengan Jumlah semua frekuensi dalam hal ini sama dengan satu. Namun, frekuensi juga dapat dinyatakan sebagai persentase, dan kemudian jumlah semua frekuensi memberikan 100%.

Jika varian dari deret variasi dinyatakan sebagai nilai diskrit, maka deret variasi tersebut disebut diskrit.

Untuk fitur kontinu, seri variasi dibuat sebagai selang, yaitu, nilai-nilai atribut di dalamnya dinyatakan "dari ... ke ...". Dalam hal ini, nilai minimum atribut dalam interval seperti itu disebut batas bawah interval, dan maksimum - batas atas.

Seri variasi interval juga dibuat untuk fitur diskrit yang bervariasi pada rentang yang luas. Deret interval dapat menjadi setara dan tidak setara interval.

Pertimbangkan bagaimana nilai interval yang sama ditentukan. Mari kita perkenalkan notasi berikut:

saya– nilai interval;

- nilai maksimum atribut untuk unit populasi;

- nilai minimum atribut untuk unit populasi;

n- jumlah kelompok yang dialokasikan.

jika n diketahui.

Jika jumlah kelompok yang dialokasikan sulit ditentukan sebelumnya, maka rumus yang diusulkan oleh Sturgess pada tahun 1926 dapat direkomendasikan untuk menghitung ukuran interval yang optimal dengan ukuran populasi yang memadai:

n = 1+ 3,322 log N, di mana N adalah jumlah yang ada dalam populasi.

Nilai interval yang tidak sama ditentukan dalam setiap kasus individu, dengan mempertimbangkan karakteristik objek penelitian.

Distribusi statistik sampel panggil daftar opsi dan frekuensi yang sesuai (atau frekuensi relatif).

Distribusi statistik sampel dapat ditentukan dalam bentuk tabel, di kolom pertama ada opsi, dan di kolom kedua - frekuensi yang sesuai dengan opsi ini. ni, atau frekuensi relatif Pi .

Distribusi statistik sampel

Deret interval disebut deret variasi di mana nilai-nilai fitur yang mendasari pembentukannya dinyatakan dalam batas-batas tertentu (interval). Frekuensi dalam hal ini tidak mengacu pada nilai individual dari atribut, tetapi ke seluruh interval.

Seri distribusi interval dibangun menurut karakteristik kuantitatif kontinu, serta menurut karakteristik diskrit, bervariasi dalam rentang yang signifikan.

Seri interval dapat diwakili oleh distribusi statistik sampel, yang menunjukkan interval dan frekuensi yang sesuai. Dalam hal ini, jumlah frekuensi varian yang termasuk dalam interval ini diambil sebagai frekuensi interval.

Saat mengelompokkan berdasarkan fitur kontinu kuantitatif, penting untuk menentukan ukuran interval.

Selain mean sampel dan varians sampel, karakteristik lain dari deret variasi juga digunakan.

Mode sebutkan varian yang memiliki frekuensi tertinggi.

Sebagai hasil dari menguasai bab ini, siswa harus: tahu

  • indikator variasi dan hubungannya;
  • hukum dasar distribusi fitur;
  • esensi dari kriteria persetujuan; mampu untuk
  • menghitung tingkat variasi dan kesesuaian;
  • menentukan karakteristik distribusi;
  • mengevaluasi karakteristik numerik utama deret distribusi statistik;

memiliki

  • metode analisis statistik deret distribusi;
  • dasar-dasar analisis dispersi;
  • metode untuk memeriksa seri distribusi statistik untuk memenuhi hukum dasar distribusi.

Indikator variasi

Dalam studi statistik fitur dari berbagai populasi statistik, sangat menarik untuk mempelajari variasi fitur unit statistik individu dari populasi, serta sifat distribusi unit menurut fitur ini. Variasi - ini adalah perbedaan nilai individu dari sifat di antara unit-unit populasi yang diteliti. Studi tentang variasi sangat penting secara praktis. Dengan tingkat variasi, seseorang dapat menilai batas-batas variasi sifat, homogenitas populasi untuk sifat ini, kekhasan rata-rata, hubungan faktor-faktor yang menentukan variasi. Indikator variasi digunakan untuk mengkarakterisasi dan mengurutkan populasi statistik.

Hasil rangkuman dan pengelompokan bahan observasi statistik, yang disusun dalam bentuk deret distribusi statistik, merupakan distribusi yang teratur dari satuan-satuan populasi yang diteliti ke dalam kelompok-kelompok menurut atribut pengelompokan (variabel). Jika sifat kualitatif diambil sebagai dasar pengelompokan, maka deret distribusi seperti itu disebut atributif(distribusi menurut profesi, jenis kelamin, warna kulit, dll.). Jika deret distribusi dibangun secara kuantitatif, maka deret seperti itu disebut variasi(distribusi menurut tinggi, berat, upah, dll.). Membangun deret variasi berarti mengurutkan distribusi kuantitatif satuan populasi menurut nilai karakteristiknya, menghitung banyaknya satuan populasi dengan nilai tersebut (frekuensi), menyusun hasilnya dalam tabel.

Alih-alih frekuensi varian, dimungkinkan untuk menggunakan rasionya terhadap total volume pengamatan, yang disebut frekuensi (frekuensi relatif).

Ada dua jenis deret variasi: diskrit dan interval. Seri diskrit- Ini adalah rangkaian yang sangat bervariasi, yang konstruksinya didasarkan pada tanda-tanda dengan perubahan terputus-putus (tanda-tanda diskrit). Yang terakhir termasuk jumlah karyawan di perusahaan, kategori upah, jumlah anak dalam keluarga, dll. Deret variasi diskrit adalah tabel yang terdiri dari dua kolom. Kolom pertama menunjukkan nilai spesifik atribut, dan yang kedua - jumlah unit populasi dengan nilai spesifik atribut. Jika sebuah tanda memiliki perubahan terus-menerus (jumlah pendapatan, pengalaman kerja, biaya aset tetap perusahaan, dll., yang, dalam batas-batas tertentu, dapat mengambil nilai apa pun), maka untuk tanda ini dimungkinkan untuk membangun seri variasi interval. Tabel saat membuat deret variasi interval juga memiliki dua kolom. Yang pertama menunjukkan nilai fitur dalam interval "dari - ke" (opsi), yang kedua - jumlah unit yang termasuk dalam interval (frekuensi). Frekuensi (frekuensi pengulangan) - jumlah pengulangan varian tertentu dari nilai atribut. Interval dapat tertutup dan terbuka. Interval tertutup dibatasi di kedua sisi, mis. memiliki batas bawah ("dari") dan atas ("ke"). Interval terbuka memiliki satu batas: atas atau bawah. Jika opsi disusun dalam urutan menaik atau menurun, maka baris tersebut disebut peringkat.

Untuk deret variasi, ada dua jenis opsi respons frekuensi: frekuensi kumulatif dan frekuensi kumulatif. Frekuensi kumulatif menunjukkan berapa banyak pengamatan yang dilakukan nilai fitur pada nilai yang kurang dari nilai yang ditentukan. Frekuensi kumulatif ditentukan dengan menjumlahkan nilai frekuensi karakteristik untuk grup tertentu dengan semua frekuensi grup sebelumnya. Frekuensi yang terakumulasi mencirikan proporsi unit pengamatan di mana nilai-nilai fitur tidak melebihi batas atas kelompok hari. Dengan demikian, frekuensi yang terakumulasi menunjukkan bobot spesifik varian dalam agregat, yang memiliki nilai tidak lebih besar dari yang diberikan. Frekuensi, frekuensi, kerapatan absolut dan relatif, frekuensi kumulatif dan frekuensi merupakan ciri-ciri besaran varian.

Variasi tanda satuan statistik populasi, serta sifat distribusi, dipelajari dengan menggunakan indikator dan karakteristik deret variasi, yang meliputi tingkat rata-rata deret, deviasi linier rata-rata, deviasi standar, dispersi , koefisien osilasi, variasi, asimetri, kurtosis, dll.

Nilai rata-rata digunakan untuk mengkarakterisasi pusat distribusi. Rata-rata adalah karakteristik statistik generalisasi, di mana tingkat khas dari sifat yang dimiliki oleh anggota populasi yang dipelajari diukur. Namun, mungkin ada kasus di mana rata-rata aritmatika bertepatan dengan sifat distribusi yang berbeda, oleh karena itu, sebagai karakteristik statistik dari deret variasi, yang disebut rata-rata struktural dihitung - mode, median, serta kuantil yang membagi distribusi seri menjadi bagian yang sama (kuartil, desil, persentil, dll). ).

Mode - ini adalah nilai fitur yang lebih sering muncul dalam deret distribusi daripada nilai lainnya. Untuk seri diskrit, ini adalah varian dengan frekuensi tertinggi. Dalam deret variasi interval, untuk menentukan modus, pertama-tama perlu ditentukan interval tempatnya, yang disebut interval modal. Dalam deret variasi dengan interval yang sama, interval modal ditentukan oleh frekuensi tertinggi, dalam deret dengan interval yang tidak sama - tetapi oleh kepadatan distribusi tertinggi. Kemudian, untuk menentukan modus pada baris dengan interval yang sama, gunakan rumus

di mana Mo adalah nilai mode; x Mo - batas bawah interval modal; h- lebar interval modal; / Mo - frekuensi interval modal; / Mo j - frekuensi interval pra-modal; / Mo+1 adalah frekuensi interval pasca-modal, dan untuk deret dengan interval yang tidak sama dalam rumus perhitungan ini, alih-alih frekuensi / Mo, / Mo, / Mo, kepadatan distribusi harus digunakan Pikiran 0 _| , Pikiran 0> UMO+"

Jika ada mode tunggal, maka distribusi probabilitas dari variabel acak disebut unimodal; jika ada lebih dari satu mode, itu disebut multimodal (polymodal, multimodal), dalam kasus dua mode - bimodal. Sebagai aturan, multimodality menunjukkan bahwa distribusi yang diteliti tidak mengikuti hukum distribusi normal. Populasi homogen, sebagai suatu peraturan, dicirikan oleh distribusi unimodal. Multivertex juga menunjukkan heterogenitas populasi yang diteliti. Munculnya dua atau lebih simpul membuat perlunya pengelompokan ulang data untuk mengisolasi kelompok yang lebih homogen.

Dalam seri variasi interval, mode dapat ditentukan secara grafis menggunakan histogram. Untuk melakukan ini, dua garis berpotongan ditarik dari titik teratas kolom tertinggi histogram ke titik teratas dari dua kolom yang berdekatan. Kemudian, dari titik perpotongannya, sebuah garis tegak lurus diturunkan ke sumbu absis. Nilai ciri pada absis yang bersesuaian dengan tegak lurus adalah modus. Dalam banyak kasus, ketika mengkarakterisasi populasi sebagai indikator umum, preferensi diberikan pada mode, daripada mean aritmatika.

median - ini adalah nilai sentral dari fitur; itu dimiliki oleh anggota pusat dari seri distribusi peringkat. Dalam deret diskrit, untuk mencari nilai median, terlebih dahulu ditentukan nomor urutnya. Untuk melakukan ini, dengan jumlah unit ganjil, satu ditambahkan ke jumlah semua frekuensi, jumlahnya dibagi dua. Jika ada bilangan genap dari 1, akan ada 2 median 1 dalam deret tersebut, jadi dalam hal ini median didefinisikan sebagai rata-rata nilai dari 2 median 1s. Jadi, median dalam deret variasi diskrit adalah nilai yang membagi deret tersebut menjadi dua bagian yang berisi jumlah opsi yang sama.

Dalam deret interval, setelah menentukan jumlah ordinal median, interval median ditemukan oleh akumulasi frekuensi (frekuensi), dan kemudian, dengan menggunakan rumus untuk menghitung median, nilai median itu sendiri ditentukan:

di mana Me adalah nilai median; x Saya - batas bawah interval median; h- lebar interval median; - jumlah frekuensi seri distribusi; /D - akumulasi frekuensi interval pra-median; / Me - frekuensi interval median.

Median dapat ditemukan secara grafis menggunakan cumulate. Untuk melakukan ini, pada skala akumulasi frekuensi (frekuensi) kumulasi, dari titik yang sesuai dengan nomor urut median, garis lurus ditarik sejajar dengan sumbu absis hingga berpotongan dengan kumulasi. Selanjutnya, dari titik perpotongan garis lurus yang ditunjukkan dengan kumulasi, tegak lurus diturunkan ke sumbu absis. Nilai fitur pada sumbu x yang sesuai dengan ordinat yang ditarik (tegak lurus) adalah median.

Median dicirikan oleh sifat-sifat berikut.

  • 1. Itu tidak tergantung pada nilai atribut yang terletak di kedua sisinya.
  • 2. Memiliki sifat minimalitas, yang berarti bahwa jumlah simpangan mutlak nilai atribut dari median adalah nilai minimum dibandingkan dengan simpangan nilai atribut dari nilai lainnya.
  • 3. Saat menggabungkan dua distribusi dengan median yang diketahui, tidak mungkin untuk memprediksi nilai median dari distribusi baru terlebih dahulu.

Properti median ini banyak digunakan dalam merancang lokasi titik layanan massal - sekolah, klinik, pompa bensin, pompa air, dll. Misalnya, jika direncanakan untuk membangun poliklinik di suatu bagian kota tertentu, maka lebih bijaksana untuk menempatkannya pada suatu titik di dalam wilayah yang tidak membagi dua panjang wilayah tersebut, tetapi jumlah penduduknya.

Rasio mode, median, dan mean aritmatika menunjukkan sifat distribusi sifat dalam agregat, memungkinkan Anda untuk mengevaluasi simetri distribusi. Jika sebuah x Me maka ada asimetri tangan kanan dari deret tersebut. Dengan distribusi normal X - Saya - Mo.

K. Pearson, berdasarkan keselarasan berbagai jenis kurva, menentukan bahwa untuk distribusi asimetris sedang, hubungan perkiraan berikut antara mean aritmatika, median dan modus adalah valid:

di mana Me adalah nilai median; Mo - nilai mode; x arithm - nilai mean aritmatika.

Jika ada kebutuhan untuk mempelajari struktur deret variasi secara lebih rinci, maka dihitung nilai karakteristiknya, mirip dengan median. Nilai fitur seperti itu membagi semua unit distribusi menjadi angka yang sama, mereka disebut kuantil atau gradien. Kuantil dibagi lagi menjadi kuartil, desil, persentil, dll.

Kuartil membagi populasi menjadi empat bagian yang sama. Kuartil pertama dihitung sama dengan median menggunakan rumus untuk menghitung kuartil pertama, setelah sebelumnya menentukan interval kuartalan pertama:

di mana Qi adalah nilai kuartil pertama; xQ^- batas bawah interval kuartil pertama; h- lebar interval triwulanan pertama; /, - frekuensi seri interval;

Akumulasi frekuensi dalam interval sebelum interval kuartil pertama; Jq ( - frekuensi interval kuartil pertama.

Kuartil pertama menunjukkan bahwa 25% unit populasi kurang dari nilainya, dan 75% lebih. Kuartil kedua sama dengan median, mis. Q2 = Saya.

Dengan analogi, kuartil ketiga dihitung, setelah sebelumnya menemukan interval kuartalan ketiga:

di mana adalah batas bawah interval kuartil ketiga; h- lebar interval kuartil ketiga; /, - frekuensi seri interval; /X"- akumulasi frekuensi dalam interval sebelumnya

G

interval kuartil ketiga; Jq - frekuensi interval kuartil ketiga.

Kuartil ketiga menunjukkan bahwa 75% unit populasi kurang dari nilainya, dan 25% lebih.

Selisih antara kuartil ketiga dan pertama adalah interval antarkuartil:

di mana Aq adalah nilai interval antarkuartil; Q 3 - nilai kuartil ketiga; Q, - nilai kuartil pertama.

Desil membagi populasi menjadi 10 bagian yang sama. Desil adalah nilai fitur dalam deret distribusi yang sesuai dengan sepersepuluh populasi. Dengan analogi dengan kuartil, desil pertama menunjukkan bahwa 10% unit populasi kurang dari nilainya, dan 90% lebih, dan desil kesembilan menunjukkan bahwa 90% unit populasi kurang dari nilainya, dan 10% adalah lagi. Rasio desil kesembilan dan pertama, mis. koefisien desil, banyak digunakan dalam studi diferensiasi pendapatan untuk mengukur rasio tingkat pendapatan 10% dari populasi paling kaya dan 10% dari populasi paling tidak kaya. Persentil membagi populasi peringkat menjadi 100 bagian yang sama. Perhitungan, arti dan penggunaan persentil mirip dengan desil.

Kuartil, desil dan karakteristik struktural lainnya dapat ditentukan secara grafis dengan analogi dengan median menggunakan cumulate.

Untuk mengukur besarnya variasi, digunakan indikator sebagai berikut: rentang variasi, deviasi linier rata-rata, deviasi standar, dan varians. Besarnya rentang variasi bergantung sepenuhnya pada keacakan distribusi anggota ekstrem dari deret tersebut. Indikator ini menarik dalam kasus di mana penting untuk mengetahui berapa amplitudo fluktuasi nilai atribut:

di mana R- nilai kisaran variasi; x max - nilai maksimum fitur; xtt - nilai minimum dari fitur tersebut.

Saat menghitung rentang variasi, nilai sebagian besar anggota deret tidak diperhitungkan, sedangkan variasi dikaitkan dengan setiap nilai anggota deret. Kekurangan ini tidak memiliki indikator yang merupakan rata-rata yang diperoleh dari deviasi nilai sifat individu dari nilai rata-ratanya: deviasi linier rata-rata dan deviasi standar. Ada hubungan langsung antara penyimpangan individu dari rata-rata dan fluktuasi sifat tertentu. Semakin kuat volatilitas, semakin besar ukuran absolut penyimpangan dari rata-rata.

Deviasi linier rata-rata adalah rata-rata aritmatika dari nilai absolut dari deviasi opsi individu dari nilai rata-ratanya.

Deviasi Linier Rata-rata untuk Data yang Tidak Dikelompokkan

di mana / pr - nilai deviasi linier rata-rata; x, - - nilai fitur; X - P - jumlah unit populasi.

Deviasi Linier Rata-Rata Seri yang Dikelompokkan

di mana / vz - nilai deviasi linier rata-rata; x, - nilai fitur; X - nilai rata-rata sifat untuk populasi yang diteliti; / - jumlah unit populasi dalam kelompok terpisah.

Tanda-tanda penyimpangan diabaikan dalam kasus ini, jika tidak, jumlah semua penyimpangan akan sama dengan nol. Deviasi linier rata-rata tergantung pada pengelompokan data yang dianalisis dihitung dengan menggunakan rumus yang berbeda: untuk data berkelompok dan tidak berkelompok. Deviasi linier rata-rata, karena persyaratannya, secara terpisah dari indikator variasi lainnya, relatif jarang digunakan dalam praktik (khususnya, untuk mengkarakterisasi pemenuhan kewajiban kontrak dalam hal keseragaman pasokan; dalam analisis omset perdagangan luar negeri, komposisi karyawan, ritme produksi, kualitas produk, dengan mempertimbangkan fitur teknologi produksi, dll.).

Standar deviasi mencirikan seberapa banyak nilai individu dari sifat yang dipelajari menyimpang rata-rata dari nilai rata-rata untuk populasi, dan dinyatakan dalam satuan sifat yang dipelajari. Standar deviasi, menjadi salah satu ukuran utama variasi, banyak digunakan dalam menilai batas-batas variasi suatu sifat dalam populasi homogen, dalam menentukan nilai-nilai ordinat kurva distribusi normal, serta dalam perhitungan yang berkaitan dengan organisasi pengamatan sampel dan menetapkan keakuratan karakteristik sampel. Simpangan baku untuk data yang tidak dikelompokkan dihitung sesuai dengan algoritma berikut: setiap penyimpangan dari rata-rata dikuadratkan, semua kuadrat dijumlahkan, setelah itu jumlah kuadrat dibagi dengan jumlah suku dalam deret dan akar kuadrat diambil dari hasil bagi:

di mana a Iip - nilai standar deviasi; Xj- nilai fitur; X- nilai rata-rata atribut untuk populasi yang diteliti; P - jumlah unit populasi.

Untuk data yang dianalisis dikelompokkan, standar deviasi data dihitung menggunakan rumus berbobot

di mana - nilai simpangan baku; Xj- nilai fitur; X - nilai rata-rata sifat untuk populasi yang diteliti; fx- jumlah unit populasi dalam kelompok tertentu.

Ekspresi di bawah akar dalam kedua kasus disebut varians. Dengan demikian, varians dihitung sebagai kuadrat rata-rata penyimpangan nilai sifat dari nilai rata-ratanya. Untuk nilai fitur yang tidak berbobot (sederhana), varians didefinisikan sebagai berikut:

Untuk nilai karakteristik tertimbang

Ada juga cara khusus yang disederhanakan untuk menghitung varians: secara umum

untuk nilai fitur yang tidak berbobot (sederhana) untuk nilai karakteristik tertimbang
menggunakan metode menghitung dari nol bersyarat

di mana a 2 - nilai dispersi; x, - - nilai fitur; X - nilai rata-rata fitur, h- nilai interval grup, t 1 - berat (A =

Dispersi memiliki ekspresi independen dalam statistik dan merupakan salah satu indikator variasi yang paling penting. Ini diukur dalam unit yang sesuai dengan kuadrat unit pengukuran sifat yang diteliti.

Dispersi memiliki sifat-sifat berikut.

  • 1. Dispersi nilai konstanta adalah nol.
  • 2. Mengurangi semua nilai fitur dengan nilai A yang sama tidak mengubah nilai varians. Ini berarti bahwa kuadrat deviasi rata-rata dapat dihitung bukan dari nilai atribut yang diberikan, tetapi dari deviasinya dari beberapa angka konstan.
  • 3. Menurunkan semua nilai fitur di k kali mengurangi dispersi dalam k 2 kali, dan simpangan baku - in k kali, yaitu semua nilai fitur dapat dibagi dengan beberapa angka konstan (katakanlah, dengan nilai interval deret), hitung simpangan baku, dan kemudian kalikan dengan angka konstan.
  • 4. Jika kita menghitung kuadrat rata-rata deviasi dari nilai apapun Dan di berbeda sampai batas tertentu dari rata-rata aritmatika, maka itu akan selalu lebih besar dari kuadrat rata-rata dari deviasi yang dihitung dari rata-rata aritmatika. Dalam hal ini, kuadrat deviasi rata-rata akan lebih besar dengan nilai yang ditentukan dengan baik - dengan kuadrat selisih antara rata-rata dan nilai yang diambil secara bersyarat ini.

Variasi ciri alternatif adalah ada tidaknya sifat yang dipelajari dalam satuan populasi. Secara kuantitatif, variasi fitur alternatif dinyatakan dengan dua nilai: keberadaan properti yang dipelajari dalam suatu unit dilambangkan dengan satu (1), dan ketidakhadirannya dilambangkan dengan nol (0). Proporsi unit yang memiliki properti yang diteliti dilambangkan dengan P, dan proporsi unit yang tidak memiliki properti ini dilambangkan dengan G. Dengan demikian, varians dari suatu atribut alternatif sama dengan produk dari proporsi unit yang memiliki properti tertentu (P) dengan proporsi unit yang tidak memiliki properti ini. (G). Variasi terbesar dari populasi dicapai dalam kasus di mana bagian dari populasi, yaitu 50% dari total volume populasi, memiliki fitur, dan bagian lain dari populasi, juga sama dengan 50%, tidak memiliki ini. fitur, sedangkan varians mencapai nilai maksimum 0,25, m.e. P = 0,5, G= 1 - P \u003d 1 - 0,5 \u003d 0,5 dan o 2 \u003d 0,5 0,5 \u003d 0,25. Batas bawah indikator ini sama dengan nol, yang sesuai dengan situasi di mana tidak ada variasi dalam agregat. Aplikasi praktis dari varians fitur alternatif adalah untuk membangun interval kepercayaan ketika melakukan pengamatan sampel.

Semakin kecil nilai varians dan standar deviasi, maka populasi akan semakin homogen dan rata-ratanya akan semakin khas. Dalam praktik statistik, seringkali diperlukan untuk membandingkan variasi dari berbagai fitur. Misalnya, menarik untuk membandingkan variasi usia pekerja dan kualifikasi mereka, masa kerja dan upah, biaya dan keuntungan, masa kerja dan produktivitas tenaga kerja, dll. Untuk perbandingan seperti itu, indikator variabilitas absolut karakteristik tidak cocok: tidak mungkin untuk membandingkan variabilitas pengalaman kerja, yang dinyatakan dalam tahun, dengan variasi upah, yang dinyatakan dalam rubel. Untuk melakukan perbandingan tersebut, serta perbandingan fluktuasi atribut yang sama di beberapa populasi dengan rata-rata aritmatika yang berbeda, indikator variasi digunakan - koefisien osilasi, koefisien variasi linier dan koefisien variasi, yang menunjukkan ukuran fluktuasi nilai ekstrim di sekitar rata-rata.

Faktor osilasi:

di mana V R - nilai koefisien osilasi; R- nilai kisaran variasi; X -

Koefisien variasi linier".

di mana vj- nilai koefisien variasi linier; SAYA- nilai deviasi linier rata-rata; X - nilai rata-rata sifat untuk populasi yang diteliti.

Koefisien variasi:

di mana Va- nilai koefisien variasi; a - nilai simpangan baku; X - nilai rata-rata sifat untuk populasi yang diteliti.

Koefisien osilasi adalah persentase rentang variasi terhadap nilai rata-rata sifat yang diteliti, dan koefisien variasi linier adalah rasio deviasi linier rata-rata terhadap nilai rata-rata sifat yang diteliti, yang dinyatakan sebagai persentase. Koefisien variasi adalah persentase simpangan baku terhadap nilai rata-rata sifat yang diteliti. Sebagai nilai relatif, dinyatakan sebagai persentase, koefisien variasi digunakan untuk membandingkan derajat variasi berbagai sifat. Dengan menggunakan koefisien variasi, homogenitas populasi statistik diperkirakan. Jika koefisien variasi kurang dari 33%, maka populasi yang diteliti homogen, dan variasinya lemah. Jika koefisien variasi lebih besar dari 33%, maka populasi yang diteliti adalah heterogen, variasinya kuat, dan nilai rata-ratanya atipikal dan tidak dapat digunakan sebagai indikator generalisasi populasi ini. Selain itu, koefisien variasi digunakan untuk membandingkan fluktuasi satu sifat dalam populasi yang berbeda. Misalnya, untuk menilai variasi masa kerja pekerja di dua perusahaan. Semakin tinggi nilai koefisiennya, semakin signifikan variasi fitur tersebut.

Berdasarkan kuartil yang dihitung, indikator relatif variasi triwulanan juga dapat dihitung dengan menggunakan rumus:

dimana Q 2 dan

Rentang interkuartil ditentukan oleh rumus

Deviasi kuartil digunakan sebagai pengganti rentang variasi untuk menghindari kerugian yang terkait dengan penggunaan nilai ekstrem:

Untuk deret variasi interval yang tidak sama, kerapatan distribusi juga dihitung. Ini didefinisikan sebagai hasil bagi dari frekuensi yang sesuai atau frekuensi dibagi dengan nilai interval. Dalam seri interval yang tidak sama, kerapatan distribusi absolut dan relatif digunakan. Kepadatan distribusi absolut adalah frekuensi per satuan panjang interval. Kepadatan distribusi relatif - frekuensi per satuan panjang interval.

Semua hal di atas berlaku untuk deret distribusi yang hukum distribusinya dijelaskan dengan baik oleh hukum distribusi normal atau mendekatinya.