kelompok sekunder. Penataan ulang sekunder untuk contoh sederhana

Seiring dengan pengelompokan utama dalam statistik, pengelompokan sekunder banyak digunakan. di Pengelompokan sekunder disebut pembentukan kelompok baru atas dasar pengelompokan yang dilakukan sebelumnya.

Pengelompokan sekunder digunakan untuk memecahkan berbagai masalah, yang terpenting adalah: 1) pembentukan kelompok (jenis) yang homogen secara kualitatif berdasarkan pengelompokan menurut sifat kuantitatif; 2) membawa dua (atau lebih) pengelompokan dengan interval yang berbeda ke dalam satu bentuk untuk tujuan perbandingan dan analisis; 3) pembentukan kelompok yang lebih besar, di mana sifat sebarannya lebih jelas termanifestasi.

Inti dari teknik ini adalah untuk mendapatkan data yang dapat dibandingkan pada berbagai kelompok, yang: ukuran kelompok (dengan persentase) ditetapkan pada tingkat yang sama untuk semua kelompok; di semua grup, jumlah grup yang sama dan konten tabel grup yang sama juga dibuat. Bukan indikator mutlak untuk kelompok yang menjadi subyek perbandingan dan perbandingan, tetapi nilai relatif, persentase.

Ada dua metode pengelompokan sekunder: 1) dengan mengubah interval dari pengelompokan primer (lebih sering dengan memperbesar interval sederhana) dan 2) dengan menugaskan ke setiap kelompok bagian tertentu dari unit populasi (pengaturan ulang sebagian). Saat menggunakan metode pengelompokan sekunder ini, biasanya diasumsikan bahwa distribusi fitur dalam interval akan seragam.

Penggunaan pengelompokan sekunder untuk membawa dua pengelompokan dengan interval yang berbeda ke satu bentuk untuk tujuan perbandingan akan diilustrasikan dengan contoh berikut. Untuk melakukan ini, kami menggunakan data pengelompokan primer dua kabupaten dengan jumlah pekerja ternak (Tabel 3.7).

Tabel 3.7. Pengelompokan peternakan di dua kabupaten berdasarkan jumlah pekerja ternak

Distrik I

Distrik II

kelompok pertanian

kelompok pertanian

pada akhirnya

jumlah karyawan, orang

pada akhirnya

Data pengelompokan kedua kabupaten tersebut tidak dapat dibandingkan secara langsung, karena lahan pertanian dibagi menjadi beberapa kelompok dengan interval yang berbeda: 20 orang. di distrik I dan 30 orang. di wilayah II. Jumlah grup yang dipilih juga tidak sama.

Untuk membawa dua pengelompokan ke dalam bentuk yang sebanding, kami akan melakukan pengelompokan sekunder. Untuk tujuan ini, kami mengelompokkan kembali materi ke dalam kelompok yang sama untuk kedua area: mari kita ambil interval 40 orang. (Tabel 3.8).

Karena dimungkinkan untuk melakukan pengelompokan sekunder pertanian di wilayah tersebut dan untuk melakukan metode pembesaran interval sederhana (ada kebetulan interval bawah dan atas dalam dua pengelompokan), kami menggunakan metode ini untuk menyelesaikan masalah.

Mari kita jelaskan urutan perhitungannya. Di kelompok pertama peternakan dengan hingga 160 karyawan. akan mencakup peternakan kelompok I dan II.

Tabel 3.8. Pengelompokan sekunder peternakan di dua kabupaten dengan jumlah pekerja ternak

Bagian pertanian dalam kelompok ini akan berjumlah 16% (4+12). Pada kelompok peternakan kedua dengan jumlah karyawan 160 hingga 200 orang. peternakan kelompok III dan IV akan dimasukkan, bagian mereka secara total akan menjadi 45% (18 + 27). Perhitungan dilakukan dengan cara yang sama untuk pembentukan kelompok lain.

Pengelompokan kembali lahan pertanian wilayah II. Karena pembesaran interval untuk tambak wilayah II tidak sesuai dan tidak menyelesaikan masalah, kami menggunakan metode pengelompokan ulang parsial dari data pengelompokan primer.

Kelompok peternakan pertama yang baru dibuat di wilayah II dengan jumlah pekerja ternak hingga 160 orang akan sepenuhnya mencakup peternakan kelompok utama dengan interval yang sama. Bagian pertanian dalam kelompok ini adalah 8%.

Pada kelompok kedua peternakan kelompok sekunder dengan jumlah karyawan 160-200 orang. peternakan kelompok II (16%) dan sebagian peternakan kelompok III akan dimasukkan secara lengkap. Untuk menentukan bagian peternakan yang harus diambil dari kelompok III, perlu dibagi menjadi beberapa subkelompok dengan jumlah karyawan 190 - 200, 200 - 210, 210 - 220 orang. Indikator bagian pertanian dalam subkelompok ini ditentukan secara proporsional dengan pembagian interval. Ukuran interval yang kita pertimbangkan adalah 30 orang. dan dibagi menjadi tiga bagian yang sama. Untuk mendapatkan interval yang diinginkan 160 - 200 orang. untuk ukuran interval kelompok II (160 - 190 orang), sepertiga dari ukuran interval kelompok III (190 - 220 orang) harus ditambahkan dan bagian yang sama dari pertanian kelompok ini.

Jadi, grup peternakan lain yang baru dibuat akan mencakup 16% peternakan kelompok kedua dan sepertiga dari grup III - 10% (1/3-30), yang akan menjadi 26% dari total jumlah peternakan di wilayah II.

Peternakan kelompok III dari kelompok sekunder (200 - 240 orang) akan mencakup bagian dari peternakan kelompok III (190 - 220 orang), sisanya - 20% (% -30) dan dua pertiga dari peternakan Kelompok IV (220 - 250 orang) - 14% (% -21), yaitu 34% dari total jumlah peternakan di wilayah II.

Perhitungan serupa dibuat untuk pembentukan kelompok pertanian lain yang baru dibuat: 240 - 280 dan lebih dari 280 orang. Seperti di meja. 3.7, bersama dengan data bagian pertanian menurut kelompok, data jumlah mereka diberikan, kemudian perhitungan dalam kelompok yang baru dibuat akan dilakukan dengan rasio yang sama seperti untuk bagian pertanian.

Setelah pengelompokan sekunder, materi primer menjadi sebanding, karena diambil kelompok yang sama menurut jumlah pegawai untuk kedua distrik tersebut. Dari data pada Tabel. 3.8 dapat dilihat bahwa distribusi peternakan menurut jumlah pekerja peternakan di kedua kabupaten berbeda secara signifikan: di distrik I, peternakan dengan jumlah pekerja ternak hingga 200 orang mendominasi. (61% dari total jumlah peternakan), di wilayah II - peternakan dengan jumlah pekerja ternak - lebih dari 200 orang. (66% dari total jumlah peternakan).

Pengelompokan analitis

analitis- pengelompokan yang digunakan untuk mempelajari hubungan antar fenomena. Untuk melakukan pengelompokan analitik, perlu ditentukan faktor dan tanda resultannya.

Faktorial adalah fitur-fitur yang berdampak pada fitur terkait lainnya.

Produktif- ini adalah tanda-tanda yang berubah di bawah pengaruh faktorial.

Pengelompokan analitis memungkinkan Anda untuk mempelajari berbagai hubungan dan ketergantungan antara berbagai fitur. Untuk menyelidiki hubungan antara fitur, unit populasi dikelompokkan menurut fitur faktor. Di setiap kelompok, nilai rata-rata fitur efektif dihitung. Perubahan tanda dari kelompok ke kelompok di bawah pengaruh suatu faktor akan menunjukkan ada tidaknya hubungan antar faktor.


Pengelompokan yang dibangun untuk periode waktu yang sama, tetapi untuk wilayah yang berbeda, atau, sebaliknya, untuk wilayah yang sama, tetapi untuk dua periode yang berbeda, mungkin tidak dapat dibandingkan karena jumlah kelompok yang berbeda atau perbedaan batas interval. Untuk membawa pengelompokan tersebut ke bentuk yang sebanding (ini memungkinkan analisis komparatif mereka), metode pengelompokan sekunder digunakan.

Pengelompokan sekunder- operasi untuk membentuk kelompok baru berdasarkan pengelompokan yang dilakukan sebelumnya.

Ada dua cara untuk membentuk kelompok baru. Cara pertama, paling sederhana dan paling umum adalah menggabungkan interval asli. Ini digunakan dalam kasus transisi dari interval kecil ke interval yang lebih besar dan ketika batas interval baru dan lama bertepatan. Metode kedua disebut penataan ulang pecahan dan terdiri dari pembentukan kelompok-kelompok baru atas dasar pemberian kepada setiap kelompok suatu proporsi tertentu dari unit-unit populasi. Metode ini digunakan ketika diperlukan untuk menentukan, selama pengelompokan ulang data, bagian (bagian) unit mana dalam populasi yang akan berpindah dari kelompok lama ke kelompok baru.

Mari kita pertimbangkan metode pertama untuk melakukan pengelompokan sekunder.

Contoh 1 Biarkan dua pengelompokan pinjaman menurut jangka waktu penerbitan untuk bulan November dan Desember diberikan (tabel 3.1, tabel 3.2).

Tabel 3.1 Pengelompokan pinjaman dari bank umum berdasarkan jatuh tempo, November 2011 (data bersyarat)



Tabel 3.2 - Pengelompokan pinjaman bank umum berdasarkan jatuh tempo, Desember 2011 (data bersyarat)

Untuk memudahkan membandingkan pengelompokan pinjaman November dan Desember, kami akan membuat pengelompokan sekunder pinjaman November, dengan menggunakan pengelompokan pinjaman Desember sebagai dasar. Mari kita buat tabel 3.3.

Tabel 3.3 - Pengelompokan pinjaman bank umum berdasarkan jatuh tempo, November-Desember 2011 (data bersyarat)

Sekarang Anda dapat membandingkan pengelompokan pinjaman November dan Desember. Bagian dari perjanjian yang disepakati pada pinjaman jangka pendek menurun hampir 11 poin persentase, bagian pinjaman jangka menengah tetap tidak berubah, dan jumlah pinjaman jangka panjang meningkat secara signifikan pada periode yang dianalisis. Terlepas dari perubahan ini, pada bulan Desember, serta pada bulan November, pinjaman jangka pendek berlaku dalam struktur jumlah pinjaman yang dikeluarkan, diikuti oleh pinjaman jangka menengah, dan terakhir - pinjaman jangka panjang. Untuk memecahkan contoh ini, kami menggunakan metode menggabungkan interval awal.

Contoh2 Tersedia data tentang struktur pertanian kolektif dalam hal jumlah rumah tangga. Data awal tidak memungkinkan untuk analisis komparatif struktur, karena ada jumlah kelompok yang berbeda di daerah yang berbeda.

Struktur pertanian kolektif dengan jumlah rumah tangga

1 distrik 2 distrik
nomor grup Oud. berat pertanian kolektif, % nomor grup Kelompok pertanian kolektif menurut jumlah rumah tangga Oud. berat pertanian kolektif, %
Sampai dengan 100 4,3 Hingga 50 1,0
100-200 18,3 50-70 1,0
200-300 19,5 70-100 2,0
300-500 28,2 100-150 10,0
lebih dari 500 29,7 150-250 18,0
250-400 21,0
400-500 23,0
lebih dari 500 24,0
TOTAL 100,0 100,0

Kami akan melakukan pengelompokan sekunder pertanian kolektif di wilayah kedua, mengambil dasar pengelompokan wilayah pertama, menggunakan metode pengelompokan ulang bersama (tabel 3.5).Tabel 3.5 - Pengelompokan sekunder

Mari kita jelaskan perhitungannya. Kelompok pertanian kolektif pertama yang baru dibentuk di distrik kedua dengan hingga 100 rumah tangga akan mencakup tiga kelompok pertanian kolektif pertama, yang bagiannya adalah 4% (1 + 1 + 2). kelompok kedua pertanian kolektif dengan jumlah rumah tangga dari 100 hingga 200. termasuk kelompok keempat pertanian kolektif dengan jumlah rumah tangga dari 100 hingga 150, yang merupakan 10% dari jumlah total pertanian kolektif, serta bagian dari kelima kelompok, dari mana 50 rumah tangga akan dipindahkan. Untuk menentukan jumlah lahan kolektif yang akan diambil dari kelompok kelima ke kelompok yang baru dibentuk, diasumsikan secara kondisional proporsional dengan proporsi rumah tangga yang dipilih. Bagian 50 rumah tangga pada kelompok kelima adalah: , atau 50%.

Akibatnya, setengah dari pertanian kolektif dari kelompok kelima harus dimasukkan ke dalam kelompok baru: .

Dengan demikian, proporsi pertanian kolektif dalam kelompok baru dengan 100–200 rumah tangga akan menjadi 19% (10+9).

Ketika membentuk kelompok pertanian kolektif dengan jumlah rumah tangga 200 - 300, jelas bahwa itu akan mencakup bagian dari kelompok kelima dengan bagian dari pertanian kolektif 9% dan bagian dari kelompok keenam, dari mana 50 rumah tangga harus menjadi ditambahkan ke kelompok ketiga, dengan proporsi 7% yang harus dipilih dari pertanian kolektif kelompok ini: .Kemudian kelompok pertanian kolektif dengan 200-300 rumah tangga akan menjadi 16% (9+7).

Demikian pula perhitungan dilakukan untuk pembentukan kelompok lain. Jika, bersama dengan bobot spesifik, ada nilai absolut indikator untuk grup, maka semua perhitungan indikator untuk grup yang baru terbentuk dilakukan dalam rasio yang sama dengan jumlah unit distribusi. Dengan demikian, membandingkan kedua kabupaten dalam hal jumlah rumah tangga di pertanian kolektif, jelas bahwa di distrik kedua lebih terdiferensiasi daripada di distrik pertama.

Pengelompokan yang dibangun untuk periode waktu yang sama, tetapi untuk objek yang berbeda, atau, sebaliknya, untuk objek yang sama, tetapi untuk dua periode waktu yang berbeda, mungkin tidak dapat dibandingkan karena jumlah grup yang dipilih berbeda atau perbedaan batas wilayah. interval.

Pengelompokan sekunder, atau pengelompokan ulang data yang dikelompokkan, digunakan untuk lebih mencirikan fenomena yang diteliti (dalam kasus ketika pengelompokan awal tidak memungkinkan untuk secara jelas mengidentifikasi sifat distribusi unit populasi), atau untuk membawa pengelompokan ke sejenis untuk melakukan analisis komparatif.

Pengelompokan sekunder- operasi untuk membentuk kelompok baru berdasarkan pengelompokan yang dilakukan sebelumnya.

Ada dua cara untuk membentuk kelompok baru. Cara pertama, paling sederhana dan paling umum adalah mengubah (lebih sering memperbesar) interval awal. Metode kedua disebut pengelompokan ulang bersama dan terdiri dari pembentukan kelompok-kelompok baru atas dasar pemberian kepada setiap kelompok suatu proporsi tertentu dari unit-unit populasi. Mari kita ilustrasikan teknik pengelompokan sekunder dengan contoh berikut.

Distribusi karyawan perusahaan berdasarkan tingkat pendapatan

Kami akan mengelompokkan kembali data, membentuk grup baru dengan interval hingga 5, 5-10, 10-20, 20-30, lebih dari 30 ribu rubel.

Grup baru pertama akan mencakup seluruh kelompok karyawan pertama dan sebagian dari kelompok kedua. Untuk membentuk grup hingga 5 ribu rubel, perlu mengambil 1,0 ribu rubel dari interval grup kedua. Nilai interval grup ini adalah 6,0 ribu rubel. Oleh karena itu, perlu untuk mengambil 1/6 (1.0:6.0) bagian darinya. Bagian serupa dalam kelompok pertama yang baru dibentuk juga harus diambil dari jumlah karyawan, yaitu 20 x 1/6 \u003d 3 orang. Kemudian pada kelompok pertama akan ada pekerja: 16 + 3 = 19 orang.

Kelompok baru kedua dibentuk oleh pekerja dari kelompok kedua dikurangi yang ditugaskan pada yang pertama, yaitu 20-3 = 17 orang. Kelompok ketiga yang baru dibentuk akan mencakup semua karyawan kelompok ketiga dan sebagian dari karyawan kelompok keempat. Untuk menentukan bagian ini dari interval 18-30 (lebar interval adalah 12), Anda perlu menambahkan 2,0 ke yang sebelumnya (sehingga batas atas interval sama dengan 2,0 ribu rubel). Oleh karena itu, perlu untuk mengambil bagian dari interval yang sama dengan . Ada 74 orang dalam grup ini, jadi kita perlu mengambil 74x (1:6) = 12 orang. Kelompok ketiga yang baru akan mencakup 44 + 12 = 56 orang. Kelompok keempat yang baru terbentuk akan mencakup 74-12 = 62 orang yang tersisa dari kelompok keempat sebelumnya. Kelompok kelima yang baru terbentuk akan terdiri dari pekerja dari kelompok kelima dan keenam sebelumnya: 37 + 9 = 46 orang.

Saat menganalisis dan membandingkan beberapa pengelompokan, misalnya, untuk beberapa bengkel, perusahaan, dll., situasi dapat muncul ketika pengelompokan awal tidak dapat dibandingkan karena jumlah grup yang berbeda atau nilai interval yang digunakan berbeda. Untuk membawa pengelompokan tersebut ke dalam bentuk yang sebanding, yaitu. baik ke satu jumlah grup atau ke satu nilai interval, metode pengelompokan sekunder digunakan. Metode pengelompokan sekunder - ini adalah metode pembentukan kelompok baru berdasarkan pengelompokan yang ada sesuai dengan persyaratan yang ditentukan. Untuk melakukan pengelompokan sekunder digunakan 2 metode: 1) penyatuan kelompok asal, 2) pengelompokan ulang bersama.

Membawa beberapa pengelompokan yang berbeda ke dalam bentuk yang sebanding dilakukan dalam tiga tahap. Pada tahap pertama, analisis pengelompokan awal dilakukan untuk mengidentifikasi kondisi ketidakterbandingan pengelompokan awal. Pada tahap kedua, sebuah metode dipilih untuk membawa pengelompokan asli ke dalam bentuk yang sebanding. Pada tahap ketiga, dilakukan penataan ulang sekunder dari pengelompokan awal dan analisis hasil yang diperoleh. Jika perlu, pengelompokan ulang dilakukan. Pertimbangkan metode penataan ulang sekunder.

1 cara Pengamatan statistik terhadap sebaran pekerja perusahaan menurut masa kerja tahun 2000 memberikan hasil sebagai berikut (Tabel 2.7).

Tabel 2.7

Pada tahun 2002, pengamatan statistik berulang dilakukan, yang memberikan hasil sebagai berikut (Tabel 2.8). Tidak mungkin memperkirakan perubahan distribusi pekerja berdasarkan masa kerja selama 2 tahun secara langsung dari data kedua tabel. Analisis kedua tabel menunjukkan bahwa mereka tidak kompatibel karena jumlah kelompok yang berbeda dan interval yang berbeda.

Tabel 2.8

Untuk membawa data kedua tabel ke bentuk yang sebanding, dimungkinkan untuk menggabungkan kedua kelompok 1 dan 2, dan kelompok 3 dan 4 pada tabel 2.7. Ini akan memungkinkan untuk menilai perubahan dalam distribusi pekerja berdasarkan masa kerja yang telah terjadi di perusahaan dalam dua tahun. Hasil pengelompokan ulang data observasi statistik tahun 2000 (Tabel 2.7) ditunjukkan pada Tabel 2.9.

Tabel 2.9

Membandingkan data tahun 2002 (Tabel 2.8) dengan data regrouped tahun 2000 (Tabel 2.9), dapat disimpulkan bahwa dalam dua tahun jumlah pekerja dengan pengalaman hingga 6 tahun mengalami penurunan, yaitu. muda, dan jumlah pekerja dengan lebih banyak pengalaman telah meningkat.

2 jalan Biarkan pengamatan statistik pada tahun 2002 memberikan hasil seperti itu (Tabel 2.10). Membandingkan data tahun 2000 (Tabel 2.9) dan data tahun 2002 (Tabel 2.7), kita dapat menyimpulkan bahwa keduanya tidak konsisten karena jumlah kelompok yang berbeda dan interval yang berbeda. Analisis menunjukkan bahwa tidak mungkin untuk menerapkan metode pertama membawa data ke bentuk yang sebanding. Oleh karena itu, kami menggunakan metode 2 untuk mengelompokkan kembali data tahun 2000 (Tabel 2.7) sehingga sesuai dengan pengelompokan data tahun 2002 (Tabel 2.10)

Tabel 2.10

Penggunaan metode kedua mengasumsikan distribusi frekuensi yang seragam dalam setiap kelompok. Ini adalah kondisi yang sangat diperlukan untuk menggunakan metode kedua. Untuk mengelompokkan kembali data tahun 2000 (Tabel 2.7), kita akan membuat perhitungan berikut. Jadi kelompok pertama yang baru (1-4) (Tabel 2.10) akan mencakup semua data kelompok pertama yang lama (1-3) (Tabel 22.7) dan data jumlah pekerja dengan pengalaman 4 tahun dari kelompok kedua yang lama . Jumlah pekerja dengan pengalaman 4 tahun adalah 3 (9/3=3, karena ada 9 pekerja di kelompok kedua yang lama, dan intervalnya adalah 3). Dengan demikian, kelompok baru pertama (1-4) akan mencakup 18 pekerja (18=15+3) Kelompok baru kedua (5-8) akan mencakup 6 pekerja dengan pengalaman 5,6 tahun (dari kelompok kedua yang lama 6=9/ 3 2) dan 18 pekerja dengan pengalaman 7,8 tahun (dari kelompok ketiga yang lama 18=27/3 2) Jadi, kelompok kedua yang baru (5-8) akan mencakup 24 pekerja (24=6+18). Kelompok ketiga yang baru (9-12) akan mencakup pekerja dengan pengalaman 9 tahun (9=27/3) dan semua 9 pekerja dari kelompok keempat yang lama (10-12). Jadi, pada kelompok ketiga yang baru (9-12) akan ada 18 pekerja (18=9+9). Data yang dikumpulkan kembali untuk tahun 2000 dan data untuk tahun 2002 akan diringkas dalam satu tabel (2.11), yang akan memungkinkan untuk analisis komparatif.

Tabel 2.11

Analisis sebaran pekerja perusahaan menurut masa kerja (Tabel 2.11) menunjukkan bahwa pada tahun 2002 jumlah pekerja dengan pengalaman lebih lama (9 menjadi 12 tahun) meningkat, sedangkan yang kurang pengalaman (dari 1 menjadi 8 tahun) menurun. . Dengan demikian, pengelompokan ulang data memungkinkan untuk membawa data ke dalam bentuk yang sebanding, melakukan analisis dan menarik kesimpulan yang diperlukan.

Kontrol pertanyaan dan tugas

1. Apa yang dimaksud dengan observasi statistik? Kondisi apa yang harus dipenuhi saat melakukan pengamatan statistik (lihat definisi)?

2. Dengan kriteria apa observasi statistik dapat diklasifikasikan? Berikan contoh pengamatan statistik.

3. Kesalahan apa yang terjadi selama pengamatan statistik dan metode kontrol apa yang dapat digunakan?

4. Tentukan contoh mana yang memiliki ringkasan sederhana dan mana yang memiliki ringkasan kompleks. Contoh 1. Pada hari Senin, 200 pekerja bekerja di toko tenun. Contoh 2. Pada hari Senin, 40 pekerja bekerja di bengkel tenun di seksi No. 1, 60 pekerja di seksi No. 2, dan total 100 pekerja bekerja.

5. Pengelompokan apa yang digunakan dalam pengolahan informasi statistik? Bagaimana mereka berbeda satu sama lain?

6. Ada 15 orang di departemen kepala teknolog, dan 10 orang di departemen pemasaran dan penjualan. Dalam hal ini tim departemen adalah agregat homogen, dan dalam hal ini mereka adalah agregat heterogen.

7. Penjualan harian barang kain A di toko Kain pada bulan Oktober ditandai dengan data berikut (dalam meter): 4, 11, 8, 14, 10, 19, 12, 11, 3, 6, 21, 9, 9 , 5, 10 , 13, 15, 7, 10, 13, 16, 12, 8, 11, 14, 15, 17. Kelompokkan data menggunakan interval yang sama.

8. Kelompokkan kembali hasil pengelompokan data paragraf 7 ke dalam kelompok berikut: (3-9), (9-15), 15-21).

Topik No. 3 DERI STATISTIK DISTRIBUSI, TABEL, GRAFIK

3.1 Seri distribusi statistik - konsep, jenis, bentuk presentasi

Salah satu bentuk penyajian data pengamatan statistik adalah statistik deret distribusi. Seri Statistik Distribusi adalah susunan unit-unit populasi yang teratur ke dalam kelompok-kelompok menurut atribut pengelompokan. Dengan bantuan deret distribusi statistik, dimungkinkan untuk mempelajari struktur dan batas-batas perubahan populasi, menilai homogenitas dan menentukan pola perkembangan unit-unit populasi. Berdasarkan jenisnya, deret distribusi statistik dibagi menjadi deret atributif, variasional dan waktu.

Deret atribut dan variasi terdiri dari dua elemen yaitu varian dan frekuensi (frekuensi atau densitas). Varian() - ini adalah nilai spesifik dari fitur yang dibutuhkan dalam rangkaian distribusi. Frekuensi () adalah angka absolut yang menunjukkan berapa kali (seberapa sering) nilai fitur (varian) tertentu muncul dalam populasi atau berapa banyak unit populasi yang memiliki satu atau beberapa nilai fitur (varian). frekuensi() - ini adalah nilai relatif yang menentukan bagian opsi individu dalam total volume populasi (). Frekuensi dapat dinyatakan dalam bagian, dalam hal ini volume populasi sama dengan satu (), atau sebagai persentase, dalam hal ini volume populasi adalah 100% (). Secara umum, frekuensi dihitung sebagai berikut:

dimana volume penduduk

Kepadatan() adalah nilai relatif yang menunjukkan berapa banyak unit populasi (dalam bentuk absolut atau relatif) per satuan panjang interval grup (). Kepadatan bisa mutlak atau relatif. Kepadatan mutlak adalah sama dengan

Kepadatan relatif adalah sama dengan

Saat menghitung kerapatan relatif, frekuensi digunakan, dinyatakan dalam pecahan.

Seri atributadalah seri yang dibangun atas dasar fitur kualitatif populasi. Rangkaian ini dibangun menggunakan pengelompokan tipologis dan dapat diekspresikan dalam bentuk tabel. Misalnya, distribusi pekerja perusahaan menurut kategori upah (Tabel 3.1).

Tabel 3.1

Dalam contoh yang diberikan (Tabel 3.1), agregatnya adalah semua perusahaan yang bekerja. Jumlah populasinya adalah 250 orang. Satuan dari populasi adalah satu pekerja. Sebagai fitur unit populasi, kategori tarif dipilih. Tanda itu memiliki beberapa arti khusus - opsi (kategori ke-1, kategori ke-2, kategori ke-3, kategori ke-4, kategori ke-5). Pada tabel, nilai atribut diberikan pada kolom 2, nilai frekuensi pada kolom 3, nilai frekuensi pada kolom 4.

Seri variasi- ini adalah seri yang dibangun berdasarkan tanda kuantitatif populasi. Seri ini dibangun terutama dengan bantuan pengelompokan struktural dan dapat diekspresikan dalam bentuk tabel. Deret variasi ada dua jenis: deret variasi diskrit dan deret interval. Seri variasi diskrit adalah seri di mana nilai atribut (opsi) diwakili oleh nilai diskrit. Seri variasi interval adalah deret di mana nilai karakteristik dinyatakan sebagai interval. Berdasarkan data omset harian dari 34 pengusaha individu yang diberikan pada halaman , kami akan membangun rangkaian interval variasi (Tabel 3.2)

Tabel 3.2

Kolom 3 menunjukkan frekuensi – jumlah pengusaha yang omzetnya dalam satu hari berada dalam selang waktu tertentu (kolom 2). Pada kolom 4, persentase frekuensi dihitung menurut rumus 3.1. Jadi frekuensi untuk kelompok pertama (3.1 - 3.9) akan sama dengan

Demikian pula, frekuensi dihitung untuk kelompok lain. Kolom 5 menunjukkan frekuensi dalam pecahan. Itu dapat diperoleh dengan menghitung

atau dengan mengubah persentase menjadi saham. Saat menghitung, data dalam bentuk desimal harus ditampilkan dengan akurasi hingga 3 tempat desimal. Ini meningkatkan akurasi perhitungan dan penerimaan data akhir yang sesuai. Jadi jumlah frekuensi dalam persentase harus sama dengan 100%, dan dalam pecahan - sama dengan 1.

Kolom 6 dari Tabel 3.2 menunjukkan nilai kerapatan mutlak. Perhitungan dilakukan sesuai dengan rumus 3.2. Jadi untuk kelompok pertama, kerapatan mutlak akan sama dengan

Jika frekuensi () diambil dari kolom 3, maka nilai interval () didefinisikan sebagai selisih antara batas atas (3,9) dan batas bawah (3,1) interval kelompok pertama, yaitu . Demikian pula, kepadatan absolut dihitung untuk kelompok lain. Setelah melakukan perhitungan, perlu memberi mereka interpretasi ekonomi. Jadi, misalnya, kepadatan absolut dari kelompok pertama menunjukkan bahwa untuk setiap seribu rubel. omzet pada kelompok pertama menyumbang 5 pengusaha.

Kolom 7 dari Tabel 3.2 menunjukkan nilai kerapatan relatif. Perhitungan dilakukan sesuai dengan rumus 3.3. Jadi untuk kelompok pertama, kerapatan relatif akan sama dengan

Demikian pula, kepadatan relatif dihitung untuk kelompok lain. Kepadatan relatif kelompok pertama menunjukkan bahwa pangsa pengusaha yang datang untuk setiap seribu omset pada kelompok pertama adalah 0,147.

Kolom 2 pada Tabel 3.3 menunjukkan pergantian dalam bentuk interval, dan kolom 3 menunjukkan pergantian dalam bentuk nilai diskrit. Untuk kelompok pertama, nilai diskrit dihitung sebagai berikut:

Demikian pula, omset dihitung sebagai nilai diskrit untuk kelompok lain.

Seringkali, ketika menganalisis deret variasi, ada kebutuhan untuk memahami perubahan volume populasi ketika mengubah (terutama dalam urutan menaik) nilai-nilai atribut. Untuk ini, konsep seperti frekuensi kumulatif atau frekuensi kumulatif digunakan. Akumulasi Frekuensi ( )adalah jumlah frekuensi pada awal deret hingga nilai fitur tertentu, inklusif. Akumulasi Frekuensi adalah jumlah frekuensi dari awal deret hingga nilai fitur tertentu, inklusif. Pertimbangkan untuk menemukan nilai indikator ini menurut Tabel. 3.4 Di kolom 6 tabel. 3.4 menunjukkan frekuensi akumulasi. Pada kelompok pertama (kolom 1) 4 pengusaha (kolom 4) memiliki omset 3,1 hingga 3,9 ribu rubel. (grup 2) atau omset rata-rata 3,5 ribu rubel. (kelompok 3). Karena ini adalah grup pertama, akumulasi frekuensi, mis. jumlah pengusaha sama dengan 4 (kolom 6). Di kelompok kedua, jumlah pengusaha dengan omset 3,9 hingga 4,7 ribu rubel. atau omset rata-rata 4,3 ribu rubel. sama dengan 5 orang. Oleh karena itu frekuensi akumulasi, yaitu jumlah pengusaha dengan omset 3,1 hingga 4,7 ribu rubel. atau rata-rata dari dan kurang dari 4,3 ribu rubel, akan sama dengan 9=4+5. Untuk grup ketiga, frekuensi kumulatifnya adalah 16=4+5+7, dan seterusnya. Frekuensi kumulatif dihitung dengan cara yang sama.

Pengelompokan tersebut adalah:

  1. Utama disusun berdasarkan bahan utama yang dikumpulkan selama pengamatan.
  2. Sekunder, dikompilasi berdasarkan yang utama, digunakan dalam dua kasus:
    • ketika perlu untuk mereformasi kelompok formal kecil menjadi kelompok yang lebih besar;
    • ketika diperlukan untuk memberikan penilaian komparatif dari bahan yang dikumpulkan di tempat yang berbeda dan menggunakan metode yang berbeda.
Pengelompokan yang terdiri dari dua atau lebih fitur disebut kombinasional.
Tanda yang dengannya pemilihan kelompok atau jenis fenomena terjadi disebut pengelompokan atau dasar pengelompokan. Dasarnya bisa kuantitatif atau atributif. Atributif- ini adalah tanda yang memiliki nama (misalnya, profesi: penjahit, guru, dll.).

Contoh 1. Berikut adalah data sebaran perusahaan dagang menurut jumlah pegawai di kedua wilayah tersebut.


Buatlah pengelompokan sekunder dari data distribusi perusahaan dengan menghitung ulang data wilayah 1 menurut pengelompokan wilayah 2. Wilayah mana yang memiliki jumlah rata-rata karyawan terbesar?

Keputusan:
Grup pertama "Kurang dari 5" akan mencakup 4/5 dari grup "1-5". Maka jumlah perusahaan adalah: 6*4/5 = 4,8 5.
Grup "5-10" sepenuhnya mencakup grup "6-10" dan bagian dari grup "1-5", yaitu. nomor perusahaan akan menjadi 4 + (6-5) = 5
Grup "11-20" akan sepenuhnya mencakup grup "11-15" dan bagian dari grup "16-20", yaitu * 50 \u003d 12,5 13.
Grup "21-30" sepenuhnya mencakup grup "16-20" dan grup "21-25", dan grup "di atas 25". Kami mendapatkan: (50-13) + 20 + 15 = 72


Temukan jumlah rata-rata karyawan:
untuk wilayah pertama.

Rata-rata tertimbang: x sr = 1960/105 = 18,67

untuk wilayah kedua.


Rata-rata tertimbang: xav = 3502,5/117 = 29,94
Dengan demikian, di wilayah kedua, rata-rata jumlah pegawainya lebih tinggi.

Contoh #2.
Distribusi pekerja berdasarkan masa kerja

nomor grupKelompok pekerja menurut masa kerja, tahunJumlah pekerja, pers.Jumlah pekerja sebagai persentase dari total
Saya2-6 6 30,0
II6-10 6 30,0
AKU AKU AKU10-14 5 25,0
IV14-18 3 15,0
TOTAL20 100,0

Dalam deret distribusi, untuk kejelasan, sifat yang diteliti dihitung sebagai persentase. Hasil pengelompokan primer menunjukkan bahwa 60,0% pekerja memiliki pengalaman hingga 10 tahun, dan sama-sama dari 2-6 tahun - 30% dan dari 6-10 tahun - 30%, dan 40% pekerja memiliki pengalaman 10 sampai 18 tahun.
Untuk mempelajari hubungan antara pengalaman kerja dan output, perlu dibangun suatu pengelompokan analitis. Pada dasarnya, kami mengambil grup yang sama seperti pada seri distribusi. Hasil pengelompokan disajikan pada Tabel 2.

Tabel 2 - Pengelompokan pekerja berdasarkan masa kerja

nomor grupKelompok pekerja berdasarkan pengalaman bertahun-tahunJumlah pekerja, pers.Pengalaman kerja rata-rata, tahunPengembangan produk, gosok.
TotalUntuk satu pekerja.
Saya2-6 6 3,25 1335,0 222,5
II6-10 6 7,26 1613,0 268,8
AKU AKU AKU10-14 5 11,95 1351,0 270,2
IV14-18 3 16,5 965,0 321,6
TOTAL:20 8,62 5264 236

Untuk mengisi tabel 2. perlu dibuat tabel kerja 3.

Tabel 3

nomor p / pKelompok pekerja menurut masa kerja, tahunnomor pekerjaPengalamanProduksi di gosok.
1 2 3 4 5
1 2-6 1, 2, 3, 4, 2,0; 2,3; 3,0; 5,0; 4,5; 2,7 205, 200, 205, 250, 225, 250
Jumlah untuk grup:6 19,5 1335
2 6-10 5, 6, 8, 13, 17, 19 6,2; 8,0; 6,9; 7,0; 9,0; 6,5 208, 290, 270, 250, 270, 253
Jumlah Grup6 43,6 1613
3 10-14 9, 12, 15, 16, 18 12,5; 13,0; 11,0; 10,5; 12,8 230, 300, 287, 276, 258
Jumlah Grup5 59,8 1351
4 14-18 11, 20, 14 16, 18, 15,5 295, 320, 350
Jumlah Grup3 49,5 965
Total20 172.4 5264,0

Membagi grafik (4:3); (5:3) tab. 3 kami akan menerima data yang relevan untuk mengisi tabel 2. Jadi selanjutnya untuk semua kelompok. Mengisi tabel 2. kita mendapatkan tabel analitis.
Setelah menghitung tabel kerja, kami membandingkan hasil akhir tabel dengan kondisi masalah yang diberikan, mereka harus cocok. Jadi, selain membangun pengelompokan, menemukan nilai rata-rata, kami juga akan memeriksa kontrol aritmatika.
Menganalisis tabel analitik 2, kita dapat menyimpulkan bahwa fitur (indikator) yang dipelajari saling bergantung satu sama lain. Dengan pertumbuhan pengalaman kerja, output per pekerja terus meningkat. Pengembangan pekerja dari kelompok keempat untuk 99,1 rubel. lebih tinggi dari yang pertama atau sebesar 44,5%, kami menganggap contoh pengelompokan menurut satu atribut. Tetapi dalam beberapa kasus, pengelompokan seperti itu tidak cukup untuk menyelesaikan kumpulan tugas. Dalam kasus seperti itu, mereka melanjutkan ke pengelompokan menurut dua atau lebih fitur, yaitu. untuk kombinasi. Mari kita membuat pengelompokan data sekunder pada keluaran rata-rata.
Kami mengkarakterisasi setiap kelompok dengan jumlah pekerja, pengalaman kerja rata-rata, output rata-rata - secara total dan per pekerja, perhitungannya disajikan pada Tabel 4.

Tabel 4 - Pengelompokan pekerja berdasarkan masa kerja dan keluaran rata-rata

nomor p / pKelompok pekerjaJumlah pekerja, pers.Rata-rata pengalaman kerja, tahunOutput rata-rata, gosok.
berdasarkan senioritassesuai dengan output rata-rata melecut. dalam rubelTotaluntuk satu pekerja.
1 2-6 200,0-250,0 4 2,5 835,0 208,75
Jumlah Grup6 3,25 1335,0 222,5
2 6-10 200,0-250,0 - - - -
3 10-14 200,0-250,0 1 12,5 230,0 230,0
Jumlah Grup5 11,96 1351,0 270,2
4 14-18 200,0-250,0 - - - -
Jumlah Grup3 16,5 965,0 321,6
Jumlah menurut grup200,0-250,0 5 3,0 1065,0 213,0
Total20 8,62 5264 263,2

Untuk membangun pengelompokan analitik sekunder berdasarkan rata-rata keluaran produk dalam grup yang dibuat awal, kami menentukan interval pengelompokan sekunder, dengan menyoroti tiga grup, yaitu. satu kurang dari pada pengelompokan asli.
Kemudian, i=(350-200)/3 = 50 rubel.
Tidak masuk akal untuk mengambil lebih banyak grup, akan ada interval yang sangat kecil, lebih sedikit yang mungkin. Data akhir untuk grup dihitung sebagai jumlah pengalaman untuk grup, dikirim untuk 19, 5 tahun pertama dibagi dengan jumlah pekerja - 6 orang, kami mendapatkan 3,25 tahun.
Data dalam tabel menunjukkan bahwa pengembangan produk secara langsung bergantung pada lamanya layanan.

Terkadang pengelompokan awal tidak memungkinkan untuk mengidentifikasi secara jelas sifat dari distribusi unit populasi, atau untuk membawa pengelompokan ke tipe yang sebanding untuk tujuan melakukan analisis komparatif, perlu sedikit mengubah pengelompokan yang ada. : menggabungkan kelompok-kelompok yang relatif kecil yang diidentifikasi sebelumnya menjadi sejumlah kecil kelompok tipikal yang lebih besar atau mengubah batas-batas kelompok sebelumnya, untuk membuat pengelompokan tersebut sebanding dengan yang lain.