Buat deret distribusi interval. Ringkasan dan pengelompokan statistik

Lab #1

Menurut statistik matematika

Topik: Pemrosesan primer data eksperimen

3. Evaluasi dalam poin. satu

5. Pertanyaan keamanan.. 2

6. Metodologi untuk melakukan pekerjaan laboratorium .. 3

Objektif

Akuisisi keterampilan pemrosesan utama data empiris dengan metode statistik matematika.

Atas dasar satu set data eksperimental, lakukan tugas-tugas berikut:

Latihan 1. Buatlah deret distribusi variasi interval.

Tugas 2. Buatlah histogram frekuensi deret variasi interval.

Tugas 3. Buatlah sebuah fungsi distribusi empiris dan plot.

a) modus dan median;

b) momen awal bersyarat;

c) rata-rata sampel;

d) varians sampel, varians populasi terkoreksi, standar deviasi terkoreksi;

e) koefisien variasi;

e) asimetri;

g) kurtosis;

Tugas 5. Tentukan batas-batas nilai sebenarnya dari karakteristik numerik dari variabel acak yang diteliti dengan keandalan yang diberikan.

Tugas 6. Interpretasi yang bermakna dari hasil pengolahan primer sesuai dengan kondisi masalah.

Skor dalam poin

Tugas 1-56 poin

Tugas 62 poin

Perlindungan Lab(wawancara lisan tentang pertanyaan kontrol dan pekerjaan laboratorium) - 2 poin

Karya diajukan secara tertulis pada lembar A4 dan meliputi:

1) Halaman judul (Lampiran 1)

2) Data awal.

3) Presentasi pekerjaan sesuai dengan sampel yang ditentukan.

4) Hasil perhitungan (dilakukan secara manual dan/atau menggunakan MS Excel) dalam urutan yang ditentukan.

5) Kesimpulan - interpretasi yang bermakna dari hasil pemrosesan primer sesuai dengan kondisi masalah.

6) Wawancara lisan tentang pekerjaan dan pertanyaan kontrol.



5. Pertanyaan keamanan


Metodologi untuk melakukan pekerjaan laboratorium

Tugas 1. Membuat deret distribusi variasi interval

Untuk menyajikan data statistik dalam bentuk deret variasi dengan varian yang berjarak sama, diperlukan:

1. Dalam tabel data asli, temukan nilai terkecil dan terbesar.

2. Tentukan berbagai variasi :

3. Tentukan panjang interval h, jika ada hingga 1000 data dalam sampel, gunakan rumus: , di mana n - ukuran sampel - jumlah data dalam sampel; lgn diambil untuk perhitungan).

Rasio yang dihitung dibulatkan menjadi nilai bilangan bulat yang nyaman .

4. Untuk menentukan awal interval pertama untuk jumlah interval genap, disarankan untuk mengambil nilai ; dan untuk jumlah interval ganjil.

5. Rekam interval pengelompokan dan atur dalam urutan batas yang menaik

, ,………., ,

di mana adalah batas bawah interval pertama. Angka yang tepat diambil untuk tidak lebih dari , batas atas interval terakhir harus tidak kurang dari . Direkomendasikan bahwa interval berisi nilai awal dari variabel acak dan dipisahkan dari 5 sampai 20 interval.

6. Tuliskan data awal pada interval pengelompokan, yaitu menghitung dari tabel asli jumlah nilai variabel acak yang termasuk dalam interval yang ditentukan. Jika beberapa nilai bertepatan dengan batas interval, kemudian mereka dikaitkan baik hanya untuk sebelumnya atau hanya untuk interval berikutnya.

Catatan 1. Interval tidak perlu dianggap sama panjangnya. Di area di mana nilainya lebih padat, lebih mudah untuk mengambil interval pendek yang lebih kecil, dan di mana yang lebih jarang - yang lebih besar.

Catatan 2.Jika untuk beberapa nilai "nol" atau nilai frekuensi yang kecil diperoleh, maka perlu untuk mengelompokkan kembali data, memperbesar interval (meningkatkan langkah ).

Tahap paling penting dalam studi fenomena dan proses sosial-ekonomi adalah sistematisasi data primer dan, atas dasar ini, memperoleh karakteristik ringkasan dari seluruh objek menggunakan indikator generalisasi, yang dicapai dengan meringkas dan mengelompokkan materi statistik primer.

Ringkasan statistik - ini adalah kompleks operasi sekuensial untuk menggeneralisasi fakta tunggal tertentu yang membentuk satu set untuk mengidentifikasi ciri khas dan pola yang melekat pada fenomena yang diteliti secara keseluruhan. Melakukan ringkasan statistik mencakup langkah-langkah berikut: :

  • pilihan fitur pengelompokan;
  • penetapan urutan pembentukan kelompok;
  • pengembangan sistem indikator statistik untuk mengkarakterisasi kelompok dan objek secara keseluruhan;
  • pengembangan tata letak tabel statistik untuk menyajikan hasil ringkasan.

Pengelompokan statistik disebut pembagian unit-unit populasi yang diteliti ke dalam kelompok-kelompok homogen menurut karakteristik tertentu yang penting bagi mereka. Pengelompokan adalah metode statistik yang paling penting untuk meringkas data statistik, dasar untuk perhitungan indikator statistik yang benar.

Ada jenis pengelompokan berikut: tipologis, struktural, analitis. Semua pengelompokan ini disatukan oleh fakta bahwa unit objek dibagi menjadi beberapa kelompok menurut beberapa atribut.

tanda pengelompokan disebut tanda dimana unit-unit populasi dibagi menjadi kelompok-kelompok yang terpisah. Kesimpulan dari studi statistik tergantung pada pilihan yang benar dari atribut pengelompokan. Sebagai dasar untuk pengelompokan, perlu untuk menggunakan fitur yang signifikan dan didukung secara teoritis (kuantitatif atau kualitatif).

Tanda-tanda kuantitatif pengelompokan memiliki ekspresi numerik (volume perdagangan, usia seseorang, pendapatan keluarga, dll.), dan fitur kualitatif pengelompokan mencerminkan keadaan unit populasi (jenis kelamin, status perkawinan, afiliasi industri perusahaan, bentuk kepemilikannya, dll.).

Setelah dasar pengelompokan ditentukan, pertanyaan tentang jumlah kelompok di mana populasi penelitian harus dibagi harus diputuskan. Jumlah kelompok tergantung pada tujuan studi dan jenis indikator yang mendasari pengelompokan, volume populasi, derajat variasi sifat.

Misalnya, pengelompokan perusahaan menurut bentuk kepemilikan memperhitungkan kota, federal, dan properti subjek federasi. Jika pengelompokan dilakukan menurut atribut kuantitatif, maka perlu perhatian khusus pada jumlah unit objek yang diteliti dan tingkat fluktuasi atribut pengelompokan.

Ketika jumlah kelompok ditentukan, maka interval pengelompokan harus ditentukan. Selang - ini adalah nilai dari karakteristik variabel yang berada dalam batas-batas tertentu. Setiap interval memiliki nilainya sendiri, batas atas dan bawah, atau setidaknya salah satunya.

Batas bawah interval disebut nilai terkecil dari atribut dalam interval, dan batas atas - nilai terbesar dari atribut dalam interval. Nilai interval adalah selisih antara batas atas dan batas bawah.

Interval pengelompokan, tergantung pada ukurannya, adalah: sama dan tidak sama. Jika variasi sifat memanifestasikan dirinya dalam batas-batas yang relatif sempit dan distribusinya seragam, maka pengelompokan dibangun dengan interval yang sama. Nilai interval yang sama ditentukan oleh rumus berikut: :

di mana Xmax, Xmin - nilai maksimum dan minimum atribut dalam agregat; n adalah jumlah grup.

Pengelompokan paling sederhana, di mana setiap kelompok yang dipilih dicirikan oleh satu indikator, adalah deret distribusi.

Seri distribusi statistik - ini adalah distribusi unit populasi yang teratur ke dalam kelompok-kelompok menurut atribut tertentu. Tergantung pada sifat yang mendasari pembentukan deret distribusi, deret distribusi atributif dan variasi dibedakan.

atributif mereka menyebut rangkaian distribusi yang dibangun sesuai dengan karakteristik kualitatif, yaitu, tanda-tanda yang tidak memiliki ekspresi numerik (distribusi berdasarkan jenis pekerjaan, berdasarkan jenis kelamin, berdasarkan profesi, dll.). Deret distribusi atribut mencirikan komposisi populasi menurut satu atau lain fitur penting. Diambil selama beberapa periode, data ini memungkinkan kita untuk mempelajari perubahan struktur.

Baris variasi disebut deret distribusi yang dibangun atas dasar kuantitatif. Setiap deret variasi terdiri dari dua elemen: varian dan frekuensi. Pilihan nilai individu dari atribut yang diambil dalam rangkaian variasi disebut, yaitu nilai spesifik dari atribut variabel.

frekuensi disebut jumlah varian individu atau setiap kelompok deret variasi, yaitu angka yang menunjukkan seberapa sering varian tertentu muncul dalam deret distribusi. Jumlah semua frekuensi menentukan ukuran seluruh populasi, volumenya. frekuensi frekuensi disebut, dinyatakan dalam pecahan unit atau sebagai persentase dari total. Dengan demikian, jumlah frekuensi sama dengan 1 atau 100%.

Tergantung pada sifat variasi sifat, tiga bentuk deret variasi dibedakan: deret peringkat, deret diskrit, dan deret interval.

Seri variasi peringkat - ini adalah distribusi unit individu dari populasi dalam urutan menaik atau menurun dari sifat yang diteliti. Pemeringkatan memudahkan untuk membagi data kuantitatif ke dalam kelompok, segera mendeteksi nilai terkecil dan terbesar dari suatu fitur, dan menyoroti nilai yang paling sering diulang.

Seri variasi diskrit mencirikan distribusi unit populasi menurut atribut diskrit yang hanya mengambil nilai integer. Misalnya, kategori tarif, jumlah anak dalam keluarga, jumlah karyawan di perusahaan, dll.

Jika suatu tanda mengalami perubahan yang terus menerus, yang dalam batas-batas tertentu dapat mengambil nilai apapun ("dari - ke"), maka untuk tanda ini perlu dibangun seri variasi interval . Misalnya, jumlah pendapatan, pengalaman kerja, biaya aset tetap perusahaan, dll.

Contoh penyelesaian masalah dengan topik "Ringkasan dan pengelompokan statistik"

Tugas 1 . Terdapat informasi jumlah buku yang diterima siswa dengan berlangganan selama satu tahun ajaran terakhir.

Bangun deret distribusi variasional jarak jauh dan diskrit, yang menunjukkan elemen deret tersebut.

Keputusan

Himpunan ini adalah seperangkat pilihan untuk jumlah buku yang diterima siswa. Mari kita hitung jumlah varian tersebut dan menyusunnya dalam bentuk peringkat variasi dan deret distribusi diskrit variasi.

Tugas 2 . Ada data tentang nilai aset tetap untuk 50 perusahaan, ribuan rubel.

Bangun seri distribusi, sorot 5 grup perusahaan (dengan interval yang sama).

Keputusan

Untuk solusinya, kami memilih nilai terbesar dan terkecil dari biaya aset tetap perusahaan. Ini adalah 30,0 dan 10,2 ribu rubel.

Temukan ukuran interval: h \u003d (30.0-10.2): 5 \u003d 3,96 ribu rubel.

Kemudian kelompok pertama akan mencakup perusahaan, yang jumlah aset tetapnya adalah dari 10,2 ribu rubel. hingga 10,2 + 3,96 = 14,16 ribu rubel. Akan ada 9 perusahaan seperti itu, kelompok kedua akan mencakup perusahaan, yang jumlah aset tetapnya akan berasal dari 14,16 ribu rubel. hingga 14,16 + 3,96 = 18,12 ribu rubel. Akan ada 16 perusahaan seperti itu.Serupa dengan itu, kami menemukan jumlah perusahaan yang termasuk dalam kelompok ketiga, keempat dan kelima.

Deret distribusi yang dihasilkan ditempatkan dalam tabel.

Tugas 3 . Untuk sejumlah perusahaan industri ringan, diperoleh data sebagai berikut:

Buatlah pengelompokan perusahaan menurut jumlah pekerja, membentuk 6 kelompok dengan interval yang sama. Hitung untuk setiap grup:

1. jumlah perusahaan
2. jumlah pekerja
3. volume produk yang diproduksi per tahun
4. output aktual rata-rata per pekerja
5. jumlah aset tetap
6. ukuran rata-rata aset tetap dari satu perusahaan
7. nilai rata-rata produk manufaktur oleh satu perusahaan

Catat hasil perhitungan dalam tabel. Buatlah kesimpulan Anda sendiri.

Keputusan

Untuk solusinya, kami memilih nilai terbesar dan terkecil dari rata-rata jumlah pekerja di perusahaan. Ini adalah 43 dan 256.

Temukan ukuran interval: h = (256-43): 6 = 35,5

Kemudian kelompok pertama akan mencakup perusahaan dengan jumlah rata-rata pekerja berkisar antara 43 hingga 43 + 35,5 = 78,5 orang. Akan ada 5 perusahaan seperti itu.Kelompok kedua akan mencakup perusahaan, jumlah rata-rata pekerja di mana akan menjadi 78,5-78,5 + 35,5 = 114 orang. Akan ada 12 perusahaan seperti itu.Serupa dengan itu, kami menemukan jumlah perusahaan yang termasuk dalam kelompok ketiga, keempat, kelima dan keenam.

Kami menempatkan seri distribusi yang dihasilkan dalam tabel dan menghitung indikator yang diperlukan untuk setiap grup:

Kesimpulan : Seperti dapat dilihat dari tabel, kelompok usaha kedua adalah yang paling banyak. Ini mencakup 12 perusahaan. Yang terkecil adalah kelompok kelima dan keenam (masing-masing dua perusahaan). Ini adalah perusahaan terbesar (dalam hal jumlah pekerja).

Karena kelompok kedua adalah yang paling banyak, volume output per tahun oleh perusahaan kelompok ini dan volume aset tetap jauh lebih tinggi daripada yang lain. Pada saat yang sama, output aktual rata-rata dari satu pekerja di perusahaan kelompok ini bukanlah yang tertinggi. Perusahaan-perusahaan dari kelompok keempat memimpin di sini. Kelompok ini juga menyumbang jumlah aset tetap yang cukup besar.

Sebagai kesimpulan, kami mencatat bahwa ukuran rata-rata aset tetap dan nilai rata-rata output dari satu perusahaan berbanding lurus dengan ukuran perusahaan (dalam hal jumlah pekerja).

Jika variabel acak yang diteliti adalah kontinu, maka peringkat dan pengelompokan nilai yang diamati seringkali tidak memungkinkan kita untuk menyoroti fitur karakteristik dari variasi nilainya. Ini dijelaskan oleh fakta bahwa nilai individu dari variabel acak dapat berbeda sesedikit yang diinginkan satu sama lain, dan oleh karena itu, dalam totalitas data yang diamati, nilai kuantitas yang sama jarang dapat terjadi, dan frekuensi varian sedikit berbeda satu sama lain.

Juga tidak praktis untuk membuat deret diskrit untuk variabel acak diskrit, yang jumlah kemungkinan nilainya besar. Dalam kasus seperti itu, seseorang harus membangun seri variasi interval distribusi.

Untuk membangun deret seperti itu, seluruh interval variasi dari nilai yang diamati dari variabel acak dibagi menjadi deret interval parsial dan menghitung frekuensi kemunculan nilai magnitudo pada setiap interval parsial.

Seri variasi interval disebut set interval terurut dari variasi nilai-nilai variabel acak dengan frekuensi yang sesuai atau frekuensi relatif hit di masing-masing dari nilai kuantitas.

Untuk membangun seri interval, Anda perlu:

  1. mendefinisikan nilai interval parsial;
  2. mendefinisikan lebar interval;
  3. atur untuk setiap interval it atas dan batas bawah ;
  4. mengelompokkan hasil pengamatan.

1 . Pertanyaan memilih jumlah dan lebar interval pengelompokan harus diputuskan dalam setiap kasus tertentu berdasarkan sasaran riset, volume pengambilan sampel dan derajat variasi fitur dalam sampel.

Perkiraan jumlah interval k hanya dapat diperkirakan dari ukuran sampel n dengan salah satu cara berikut:

  • sesuai dengan rumus Sturges : k = 1 + 3,32 log n ;
  • menggunakan tabel 1.

Tabel 1

2 . Interval dengan lebar yang sama umumnya lebih disukai. Untuk menentukan lebar interval h menghitung:

  • kisaran variasi R - nilai sampel: R = x maks - x min ,

di mana xmax dan xmin - opsi sampel maksimum dan minimum;

  • lebar setiap interval h ditentukan dengan rumus berikut: h = R/k .

3 . Intinya interval pertama x h1 dipilih sehingga varian sampel minimum xmin jatuh kira-kira di tengah interval ini: x h1 = x mnt - 0,5 h .

Interval diperoleh dengan menambahkan ke akhir interval sebelumnya panjang interval parsial h :

xhi = xhi-1 +h.

Konstruksi skala interval berdasarkan perhitungan batas interval berlanjut sampai nilai x hai memenuhi hubungan:

x hai< x max + 0,5·h .

4 . Sesuai dengan skala interval, nilai atribut dikelompokkan - untuk setiap interval parsial, jumlah frekuensi dihitung dan aku varian tertangkap saya -interval. Dalam hal ini, interval mencakup nilai variabel acak yang lebih besar atau sama dengan batas bawah dan lebih kecil dari batas atas interval.

Poligon dan histogram

Untuk kejelasan, berbagai grafik distribusi statistik dibangun.

Berdasarkan data dari deret variasi diskrit, kami membangun poligon frekuensi atau frekuensi relatif.

Poligon frekuensi x 1 ; n 1 ), (x2 ; n 2 ), ..., (x k ; nk ). Untuk membangun poligon frekuensi pada sumbu absis, opsi disisihkan x saya , dan pada sumbu y - frekuensi yang sesuai dan aku . Poin ( x saya ; dan aku ) dihubungkan oleh segmen garis lurus dan poligon frekuensi diperoleh (Gbr. 1).

Poligon frekuensi relatif disebut polyline yang segmennya menghubungkan titik-titik ( x 1 ; W 1 ), (x2 ; W2 ), ..., (x k ; wk ). Untuk membangun poligon frekuensi relatif pada absis, hentikan opsi x saya , dan pada sumbu y - frekuensi relatif yang sesuai dengannya Wi . Poin ( x saya ; Wi ) dihubungkan oleh segmen garis lurus dan poligon frekuensi relatif diperoleh.

Kapan fitur berkelanjutan itu bijaksana untuk membangun histogram .

histogram frekuensi disebut bangun datar yang terdiri dari persegi panjang yang alasnya merupakan interval parsial panjangnya h , dan tingginya sama dengan rasio n saya / jam (kerapatan frekuensi).

Untuk membangun histogram frekuensi, interval parsial diplot pada sumbu absis, dan segmen digambar di atasnya sejajar dengan sumbu absis pada jarak n saya / jam .

pengelompokan- ini adalah pembagian populasi menjadi kelompok-kelompok yang homogen dalam beberapa cara.

tugas layanan. Dengan kalkulator online Anda dapat:

  • buat seri variasi, membangun histogram dan poligon;
  • menemukan indikator variasi (rata-rata, modus (termasuk grafik), median, kisaran variasi, kuartil, desil, koefisien diferensiasi kuartil, koefisien variasi dan indikator lainnya);

Petunjuk. Untuk mengelompokkan rangkaian, Anda harus memilih jenis rangkaian variasi yang dihasilkan (diskrit atau interval) dan menentukan jumlah data (jumlah baris). Solusi yang dihasilkan disimpan dalam file Word (lihat contoh pengelompokan data statistik).

Jumlah input data
",0);">

Jika pengelompokan sudah dilakukan dan seri variasi diskrit atau seri interval, maka Anda perlu menggunakan indikator Variasi kalkulator online. Menguji hipotesis tentang jenis distribusi diproduksi menggunakan layanan Studi bentuk distribusi.

Jenis pengelompokan statistik

Seri variasi. Dalam kasus pengamatan variabel acak diskrit, nilai yang sama dapat ditemukan beberapa kali. Nilai seperti itu dari variabel acak x i dicatat yang menunjukkan n i berapa kali muncul dalam n pengamatan, ini adalah frekuensi nilai ini.
Dalam kasus variabel acak kontinu, pengelompokan digunakan dalam praktik.
  1. Pengelompokan tipologis- ini adalah pembagian populasi heterogen yang dipelajari secara kualitatif ke dalam kelas, tipe sosial-ekonomi, kelompok unit yang homogen. Untuk membangun pengelompokan ini, gunakan parameter Deret variasi diskrit.
  2. Pengelompokan struktural disebut, di mana populasi homogen dibagi menjadi kelompok-kelompok yang mencirikan strukturnya menurut beberapa fitur yang bervariasi. Untuk membangun pengelompokan ini, gunakan parameter seri Interval.
  3. Pengelompokan yang mengungkapkan hubungan antara fenomena yang dipelajari dan ciri-cirinya disebut kelompok analitis(lihat pengelompokan analitik dari seri).

Prinsip membangun pengelompokan statistik

Serangkaian pengamatan yang diurutkan secara menaik disebut deret variasi. tanda pengelompokan adalah tanda dimana populasi dibagi menjadi kelompok-kelompok yang terpisah. Ini disebut basis grup. Pengelompokan dapat didasarkan pada karakteristik kuantitatif dan kualitatif.
Setelah menentukan dasar pengelompokan, pertanyaan tentang jumlah kelompok di mana populasi penelitian harus dibagi harus diputuskan.

Saat menggunakan komputer pribadi untuk memproses data statistik, pengelompokan unit suatu objek dilakukan dengan menggunakan prosedur standar.
Salah satu prosedur tersebut didasarkan pada penggunaan rumus Sturgess untuk menentukan jumlah grup yang optimal:

k = 1+3.322*lg(N)

Dimana k adalah jumlah kelompok, N adalah jumlah unit populasi.

Panjang interval parsial dihitung sebagai h=(x max -x min)/k

Kemudian hitung jumlah hit pengamatan dalam interval ini, yang diambil sebagai frekuensi n i . Beberapa frekuensi, yang nilainya kurang dari 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Titik tengah interval x i =(c i-1 +c i)/2 diambil sebagai nilai baru.

Apa pengelompokan data statistik, dan bagaimana kaitannya dengan deret distribusi, dibahas dalam kuliah ini, di mana Anda juga dapat mempelajari apa itu deret distribusi diskrit dan variasi.

Deret distribusi merupakan salah satu jenis deret statistik (selain deret dinamika digunakan dalam statistika), deret juga digunakan untuk menganalisis data tentang fenomena kehidupan sosial. Konstruksi deret variasi adalah tugas yang cukup layak untuk semua orang. Namun, ada aturan yang perlu diingat.

Bagaimana membangun seri distribusi variasi diskrit

Contoh 1 Tersedia data jumlah anak dalam 20 keluarga yang disurvei. Buatlah deret variasi diskrit distribusi keluarga berdasarkan jumlah anak.

0 1 2 3 1
2 1 2 1 0
4 3 2 1 1
1 0 1 0 2

Keputusan:

  1. Mari kita mulai dengan tata letak tabel, di mana kita kemudian akan memasukkan data. Karena baris distribusi memiliki dua elemen, tabel akan terdiri dari dua kolom. Kolom pertama selalu varian - apa yang kita pelajari - kita ambil namanya dari tugas (akhir kalimat dengan tugas dalam kondisi) - berdasarkan jumlah anak- jadi versi kami adalah jumlah anak.

Kolom kedua adalah frekuensi - seberapa sering varian kami muncul dalam fenomena yang diteliti - kami juga mengambil nama kolom dari tugas - distribusi keluarga - jadi frekuensi kami adalah jumlah keluarga dengan jumlah anak yang sesuai.

  1. Sekarang, dari data awal, kami memilih nilai-nilai yang muncul setidaknya sekali. Dalam kasus kami, ini

Dan mari kita atur data ini di kolom pertama tabel kita dalam urutan logis, dalam hal ini meningkat dari 0 menjadi 4. Kita dapatkan

Dan sebagai kesimpulan, mari kita hitung berapa kali setiap nilai opsi muncul.

0 1 2 3 1

2 1 2 1 0

4 3 2 1 1

1 0 1 0 2

Hasilnya, kami memperoleh tabel lengkap atau deret distribusi keluarga yang diperlukan dengan jumlah anak.

Latihan . Ada data tentang kategori tarif 30 pekerja perusahaan. Buatlah deret variasi diskrit untuk distribusi pekerja menurut kategori upah. 2 3 2 4 4 5 5 4 6 3

1 4 4 5 5 6 4 3 2 3

4 5 4 5 5 6 6 3 3 4

Bagaimana membangun deret distribusi variasi interval

Mari kita buat deret distribusi interval, dan lihat bagaimana konstruksinya berbeda dari deret diskrit.

Contoh 2 Ada data tentang jumlah keuntungan yang diterima oleh 16 perusahaan, juta rubel. — 23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63. Buatlah deret variasi interval untuk distribusi perusahaan menurut volume laba, dengan memilih 3 kelompok pada interval yang sama.

Prinsip umum dalam membangun suatu deret, tentu saja, akan dipertahankan, dua kolom yang sama, varian dan frekuensi yang sama, tetapi dalam hal ini varian akan ditempatkan dalam interval dan frekuensi akan dihitung secara berbeda.

Keputusan:

  1. Mari kita mulai dengan cara yang sama dengan tugas sebelumnya dengan membangun tata letak tabel, di mana kita kemudian akan memasukkan data. Karena baris distribusi memiliki dua elemen, tabel akan terdiri dari dua kolom. Kolom pertama selalu varian - apa yang kita pelajari - kita ambil namanya dari tugas (akhir kalimat dengan tugas dalam kondisi) - dengan jumlah keuntungan - yang berarti varian kami adalah jumlah keuntungan diterima.

Kolom kedua adalah frekuensi - seberapa sering varian kami muncul dalam fenomena yang diteliti - kami juga mengambil nama kolom dari penugasan - distribusi perusahaan - ini berarti frekuensi kami adalah jumlah perusahaan dengan laba yang sesuai, di kasus ini jatuh ke dalam interval.

Hasilnya, tata letak tabel kita akan terlihat seperti ini:

di mana i adalah nilai atau panjang interval,

Xmax dan Xmin - nilai maksimum dan minimum fitur,

n adalah jumlah kelompok yang dibutuhkan sesuai dengan kondisi masalah.

Mari kita hitung nilai interval untuk contoh kita. Untuk melakukan ini, di antara data awal, kami menemukan yang terbesar dan terkecil

23 48 57 12 118 9 16 22 27 48 56 87 45 98 88 63 - nilai maksimum adalah 118 juta rubel, dan minimum adalah 9 juta rubel. Mari kita hitung rumusnya.

Dalam perhitungan kita mendapat angka 36, ​​(3) tiga pada periode, dalam situasi seperti itu nilai interval harus dibulatkan menjadi lebih besar sehingga setelah perhitungan data maksimum tidak hilang, itulah sebabnya nilainya interval dalam perhitungan adalah 36,4 juta rubel.

  1. Sekarang mari kita buat interval - opsi kita dalam masalah ini. Interval pertama dimulai dari nilai minimum, nilai interval ditambahkan ke dalamnya dan diperoleh batas atas interval pertama. Kemudian batas atas interval pertama menjadi batas bawah interval kedua, nilai interval ditambahkan padanya dan diperoleh interval kedua. Dan seterusnya sebanyak yang diperlukan untuk membangun interval sesuai dengan kondisi.

Perhatikan, jika kita tidak membulatkan nilai interval menjadi 36,4, tetapi membiarkannya menjadi 36,3, maka nilai terakhirnya adalah 117,9. Untuk menghindari kehilangan data maka perlu dilakukan pembulatan nilai interval ke nilai yang lebih besar.

  1. Mari kita hitung jumlah perusahaan yang termasuk dalam setiap interval tertentu. Saat memproses data, harus diingat bahwa nilai atas interval dalam interval ini tidak diperhitungkan (tidak termasuk dalam interval ini), tetapi diperhitungkan pada interval berikutnya (batas bawah interval disertakan dalam interval ini, dan yang atas tidak termasuk), kecuali untuk interval terakhir.

Saat melakukan pemrosesan data, yang terbaik adalah menunjukkan data yang dipilih dengan ikon atau warna konvensional untuk menyederhanakan pemrosesan.

23 48 57 12 118 9 16 22

27 48 56 87 45 98 88 63

Kami akan menandai interval pertama dengan warna kuning - dan menentukan berapa banyak data yang masuk ke dalam interval dari 9 hingga 45,4, sedangkan 45,4 ini akan diperhitungkan dalam interval kedua (asalkan ada dalam data) - sebagai hasilnya, kami dapatkan 7 perusahaan dalam interval pertama. Begitu seterusnya untuk semua interval.

  1. (tindakan tambahan) Mari kita hitung jumlah total keuntungan yang diterima oleh perusahaan untuk setiap interval dan secara umum. Untuk melakukan ini, tambahkan data yang ditandai dengan warna berbeda dan dapatkan nilai total keuntungan.

Untuk interval pertama 23 + 12 + 9 + 16 + 22 + 27 + 45 = 154 juta rubel

Untuk interval kedua - 48 + 57 + 48 + 56 + 63 = 272 juta rubel.

Untuk interval ketiga - 118 + 87 + 98 + 88 = 391 juta rubel.

Latihan . Ada data tentang ukuran setoran di bank 30 deposan, ribu rubel. 150, 120, 300, 650, 1500, 900, 450, 500, 380, 440,

600, 80, 150, 180, 250, 350, 90, 470, 1100, 800,

500, 520, 480, 630, 650, 670, 220, 140, 680, 320

Membangun seri variasi interval distribusi deposan, dengan ukuran kontribusi, menyoroti 4 kelompok pada interval yang sama. Untuk setiap kelompok, hitung jumlah total iuran.