Setiap seri variasi terdiri dari. Seri Variasi

Baris dibangun berdasarkan kuantitas, disebut variasi.

Rangkaian distribusi terdiri dari pilihan(nilai karakteristik) dan frekuensi(jumlah kelompok). Frekuensi dinyatakan sebagai nilai relatif(saham, persen) disebut frekuensi. Jumlah semua frekuensi disebut volume deret distribusi.

Berdasarkan jenisnya, seri distribusi dibagi menjadi: diskrit(dibangun di atas nilai fitur yang terputus-putus) dan selang(dibangun di atas nilai berkelanjutan tanda).

Seri variasi mewakili dua kolom (atau baris); salah satunya memberikan nilai individual dari atribut variabel, yang disebut varian dan dilambangkan dengan X; dan di sisi lain - bilangan mutlak, menunjukkan berapa kali (seberapa sering) setiap opsi muncul. Indikator kolom kedua disebut frekuensi dan secara konvensional dilambangkan dengan f. Perhatikan lagi bahwa kolom kedua juga dapat menggunakan kinerja relatif mencirikan proporsi frekuensi varian individu dalam jumlah total frekuensi. Indikator relatif ini disebut frekuensi dan secara konvensional dilambangkan dengan Jumlah semua frekuensi dalam hal ini sama dengan satu. Namun, frekuensi juga dapat dinyatakan sebagai persentase, dan kemudian jumlah semua frekuensi memberikan 100%.

Jika varian dari deret variasi dinyatakan sebagai nilai diskrit, maka deret variasi tersebut disebut diskrit.

Untuk fitur kontinu, seri variasi dibuat sebagai selang, yaitu, nilai-nilai atribut di dalamnya dinyatakan "dari ... ke ...". Dalam hal ini, nilai minimum atribut dalam interval seperti itu disebut batas bawah interval, dan maksimum - batas atas.

Seri variasi interval juga dibuat untuk fitur diskrit yang bervariasi pada rentang yang luas. Deret interval dapat menjadi setara dan tidak setara interval.

Pertimbangkan bagaimana nilai interval yang sama ditentukan. Mari kita perkenalkan notasi berikut:

saya– nilai interval;

- nilai maksimum tanda dalam satuan populasi;

- nilai minimum atribut untuk unit populasi;

n- jumlah kelompok yang dialokasikan.

jika n diketahui.

Jika jumlah kelompok yang dialokasikan sulit ditentukan sebelumnya, maka rumus yang diusulkan oleh Sturgess pada tahun 1926 dapat direkomendasikan untuk menghitung ukuran interval yang optimal dengan ukuran populasi yang memadai:

n = 1+ 3,322 log N, di mana N adalah jumlah yang ada dalam populasi.

Nilai interval yang tidak sama ditentukan dalam setiap kasus individu, dengan mempertimbangkan karakteristik objek penelitian.

Distribusi statistik sampel panggil daftar opsi dan frekuensi yang sesuai (atau frekuensi relatif).

Distribusi statistik sampel dapat ditentukan dalam bentuk tabel, di kolom pertama ada opsi, dan di kolom kedua - frekuensi yang sesuai dengan opsi ini. ni, atau frekuensi relatif Pi .

Distribusi statistik sampel

Deret interval disebut deret variasi di mana nilai-nilai fitur yang mendasari pembentukannya dinyatakan dalam batas-batas tertentu (interval). Frekuensi dalam hal ini tidak mengacu pada nilai individual dari atribut, tetapi ke seluruh interval.

Seri distribusi interval dibangun menurut karakteristik kuantitatif kontinu, serta menurut karakteristik diskrit, bervariasi dalam rentang yang signifikan.

Seri interval dapat diwakili oleh distribusi statistik sampel, yang menunjukkan interval dan frekuensi yang sesuai. Dalam hal ini, jumlah frekuensi varian yang masuk ke dalam interval ini diambil sebagai frekuensi interval.

Saat mengelompokkan berdasarkan fitur kontinu kuantitatif, penting untuk menentukan ukuran interval.

Selain mean sampel dan varians sampel, karakteristik lain dari deret variasi juga digunakan.

Mode sebutkan varian yang memiliki frekuensi tertinggi.

Nama parameter Arti
Subjek artikel: Seri variasi
Rubrik (kategori tematik) Produksi

Nilai yang diamati variabel acak X 1 , X 2 , …, x k ditelepon pilihan.

Frekuensi pilihan X saya dipanggil nomor dan aku (saya=1,…,k) menunjukkan berapa kali varian ini muncul dalam sampel.

Frekuensi(frekuensi relatif, pembagian) opsi x saya (saya=1,…,k) biasanya disebut rasio frekuensinya dan aku untuk ukuran sampel n.

Frekuensi dan frekuensi disebut timbangan.

Akumulasi frekuensi itu adalah kebiasaan untuk memanggil jumlah opsi, yang nilainya kurang dari yang diberikan X:

Akumulasi frekuensi Merupakan kebiasaan untuk menyebut rasio frekuensi akumulasi dengan ukuran sampel:

seri variasi(seri statistik) - merupakan kebiasaan untuk memanggil urutan opsi yang ditulis dalam urutan menaik dan bobotnya yang sesuai.

Seri variasi seharusnya diskrit(contoh nilai variabel acak diskrit) dan terus menerus (interval)(pemilihan nilai variabel acak kontinu).

Deret variasi diskrit memiliki bentuk:

Ketika jumlah opsi besar atau fiturnya kontinu (variabel acak dapat mengambil nilai apa pun dalam interval tertentu), mereka adalah selang seri variasi.

Untuk membangun deret variasi interval, lakukan pengelompokan opsi - mereka dibagi menjadi interval terpisah:

Jumlah interval kadang-kadang ditentukan menggunakan Rumus Sturges:

Kemudian jumlah varian yang termasuk dalam setiap interval dihitung - frekuensi dan aku(atau frekuensi dan aku/n). Jika varian berada di perbatasan interval, maka itu dilampirkan ke interval yang tepat.

Deret variasi interval memiliki bentuk:

Pilihan
Frekuensi

Fungsi distribusi empiris (statistik) itu adalah kebiasaan untuk memanggil fungsi yang nilainya di titik X sama dengan Frekuensi relatif fakta bahwa varian akan mengambil nilai kurang dari X(frekuensi kumulatif untuk X):

Poligon frekuensi disebut polyline yang segmennya menghubungkan titik-titik dengan koordinat ( X 1 ; n 1), (X 2 ; n 2), …, (x k; nk). Itu poligon frekuensi, yang merupakan analog statistik dari poligon distribusi.

Patut dikatakan bahwa untuk deret variasi kontinu, poligon dapat dibangun jika nilainya X 1 , X 2 , …, x k ambil titik tengah interval.

Deret variasi interval biasanya digambarkan secara grafis menggunakan histogram.

grafik batang- sosok melangkah yang terdiri dari persegi panjang yang alasnya adalah interval panjang parsial h= x saya +1 – x saya, saya= 0,…,k-1, dan tingginya sama dengan frekuensi (atau frekuensi) interval dan aku (aku).

Mengumpul(kurva kumulatif) - kurva akumulasi frekuensi (frekuensi). Untuk seri diskrit cumulate adalah garis putus-putus yang menghubungkan titik-titik atau , . Untuk seri interval kumulasi dimulai dari suatu titik, yang absisnya sama dengan awal interval pertama, dan ordinatnya adalah akumulasi frekuensi (frekuensi), nol. Titik-titik lain dari garis putus-putus ini berhubungan dengan ujung-ujung interval.

Seri variasi - konsep dan tipe. Klasifikasi dan fitur kategori "Seri variasi" 2017, 2018.

  • - Variasi rangkaian distribusi

    Distribusi omset ritel Federasi Rusia pada tahun 1995 berdasarkan jenis kepemilikan, juta rubel Jenis-Jenis Distribusi Seri Kuliah VIII. Deret distribusi Sebagai hasil dari pemrosesan dan sistematisasi data statistik primer, mereka memperoleh ....


  • - Variasi seri

    Transformasi data statistik yang paling sederhana adalah urutannya berdasarkan besarnya. Volume sampel dari populasi, diurutkan dalam urutan elemen yang tidak menurun, mis. , disebut seri variasi: . Dalam kasus ketika volume pengamatan ... .


  • - Tugas 2. Seri variasi interval

    1. Berdasarkan sampel tertentu yang sesuai dengan varian tugas, buat rangkaian variasi interval; buat histogram dan kumulasi (gunakan dua metode: menyisipkan bagan Excel dan mode "Histogram" dari paket "Analisis Data"). 2. Analisis histogram yang dihasilkan. ... .


  • - Menyusun seri variasi variabilitas sifat biji kacang atau daun tanaman apa pun pada usia yang sama. Mengungkapkan pola variabilitas sifat.

    Populasi - unit struktural jenis. Jumlah populasi. Penyebab fluktuasi populasi. Hubungan individu dalam populasi dan antara populasi yang berbeda dari spesies yang sama dan berbeda. 1. Ciri penting suatu spesies adalah distribusinya dalam kelompok, populasi dalam ...

  • (definisi deret variasi; komponen deret variasi; tiga bentuk deret variasi; kemanfaatan membangun deret interval; kesimpulan yang dapat ditarik dari deret yang dibangun)

    Deret variasi adalah urutan semua elemen sampel yang disusun dalam urutan yang tidak menurun. Elemen identik diulangi

    Variasi - ini adalah seri yang dibangun secara kuantitatif.

    Seri Variasi distribusi terdiri dari dua elemen: varian dan frekuensi:

    Pilihannya adalah nilai numerik sifat kuantitatif dalam deret distribusi variasi. Mereka bisa positif atau negatif, absolut atau relatif. Jadi, ketika mengelompokkan perusahaan menurut hasil aktivitas ekonomi pilihan positif adalah keuntungan, dan angka negatif adalah kerugian.

    Frekuensi adalah jumlah varian individu atau setiap kelompok dari seri variasi, mis. ini adalah angka yang menunjukkan seberapa sering opsi tertentu muncul dalam rangkaian distribusi. Jumlah semua frekuensi disebut volume populasi dan ditentukan oleh jumlah elemen dari seluruh populasi.

    Frekuensi adalah frekuensi yang dinyatakan sebagai nilai relatif (fraksi satuan atau persentase). Jumlah frekuensi sama dengan satu atau 100%. Mengganti frekuensi dengan frekuensi memungkinkan Anda untuk membandingkan seri variasi dengan nomor berbeda pengamatan.

    Ada tiga bentuk seri variasi: deret peringkat, deret diskrit dan seri interval.

    Seri peringkat adalah distribusi unit individu dari populasi dalam urutan menaik atau menurun dari sifat yang diteliti. Pemeringkatan memudahkan untuk membagi data kuantitatif ke dalam kelompok, segera mendeteksi yang terkecil dan nilai terbesar fitur, sorot nilai yang paling sering diulang.

    Bentuk lain dari deret variasi adalah tabel kelompok yang disusun menurut sifat variasi nilai sifat yang diteliti. Berdasarkan sifat variasinya, tanda-tanda diskrit (terputus-putus) dan kontinu dibedakan.

    Seri diskrit- ini adalah rangkaian variasional, yang konstruksinya didasarkan pada tanda-tanda dengan perubahan terputus-putus (tanda-tanda diskrit). Yang terakhir termasuk kategori tarif, jumlah anak dalam keluarga, jumlah karyawan di perusahaan, dll. Tanda-tanda ini hanya dapat mengambil sejumlah nilai tertentu yang terbatas.

    Deret variasi diskrit adalah tabel yang terdiri dari dua kolom. Kolom pertama menunjukkan nilai spesifik atribut, dan yang kedua - jumlah unit populasi dengan nilai tertentu tanda.

    Jika sebuah tanda memiliki perubahan terus-menerus (jumlah pendapatan, pengalaman kerja, biaya aset tetap suatu perusahaan, dll., yang dapat mengambil nilai berapa pun dalam batas-batas tertentu), maka rangkaian variasi interval harus dibangun untuk tanda ini.



    Tabel grup di sini juga memiliki dua kolom. Yang pertama menunjukkan nilai fitur dalam interval "dari - ke" (opsi), yang kedua - jumlah unit yang termasuk dalam interval (frekuensi).

    Frekuensi (frekuensi pengulangan) - jumlah pengulangan varian tertentu dari nilai atribut, dilambangkan fi , dan jumlah frekuensi yang sama dengan volume populasi yang dipelajari, dilambangkan

    Di mana k adalah jumlah opsi nilai atribut

    Sangat sering, tabel dilengkapi dengan kolom di mana akumulasi frekuensi S dihitung, yang menunjukkan berapa banyak unit populasi yang memiliki nilai fitur tidak lebih dari nilai yang diberikan.

    Deret distribusi variasi diskrit adalah deret di mana grup-grup disusun menurut fitur yang bervariasi secara diskrit dan hanya mengambil nilai integer.

    Deret distribusi variasi interval adalah deret di mana atribut pengelompokan, yang menjadi dasar pengelompokan, dapat mengambil nilai apa pun dalam interval tertentu, termasuk pecahan.

    Deret variasi interval adalah himpunan interval variasi terurut dari nilai-nilai variabel acak dengan frekuensi yang sesuai atau frekuensi nilai kuantitas yang jatuh ke masing-masingnya.

    Adalah bijaksana untuk membangun deret distribusi interval, pertama-tama, dengan variasi sifat yang berkesinambungan, dan juga jika variasi diskrit memanifestasikan dirinya pada rentang yang luas, mis. jumlah opsi untuk fitur diskrit cukup besar.

    Beberapa kesimpulan sudah dapat ditarik dari seri ini. Misalnya, elemen rata-rata dari deret variasi (median) dapat menjadi perkiraan hasil pengukuran yang paling mungkin. Elemen pertama dan terakhir dari deret variasi (yaitu, elemen minimum dan maksimum sampel) menunjukkan penyebaran elemen sampel. Terkadang, jika elemen pertama atau terakhir sangat berbeda dari sampel lainnya, maka mereka dikeluarkan dari hasil pengukuran, mengingat nilai-nilai ini diperoleh sebagai akibat dari beberapa jenis kegagalan kotor, misalnya, teknologi.

    Latihan 1

    VARIASI SERI DISTRIBUSI

    seri variasi atau dekat distribusi disebut distribusi teratur unit populasi menurut peningkatan (lebih sering) atau penurunan (kurang sering) nilai atribut dan menghitung jumlah unit dengan satu atau lain nilai atribut.

    Ada 3 jenis rentang distribusi:

    1) baris peringkat- ini adalah daftar unit individu populasi dalam urutan menaik dari sifat yang dipelajari; jika jumlah unit populasi cukup besar, deret peringkat menjadi rumit, dan dalam kasus seperti itu, deret distribusi dibangun dengan mengelompokkan unit populasi sesuai dengan nilai-nilai sifat yang dipelajari (jika sifat itu mengambil sejumlah kecil nilai, maka deret diskrit dibangun, dan sebaliknya, deret interval);

    2) seri diskrit- ini adalah tabel yang terdiri dari dua kolom (baris) - nilai spesifik dari atribut yang bervariasi X saya dan jumlah unit populasi dengan nilai fitur yang diberikan f saya– frekuensi; jumlah grup dalam deret diskrit ditentukan oleh jumlah nilai atribut variabel yang sebenarnya ada;

    3) seri interval- ini adalah tabel yang terdiri dari dua kolom (baris) - interval dari tanda yang bervariasi X saya dan jumlah unit populasi yang termasuk dalam interval (frekuensi) tertentu, atau proporsi jumlah ini dalam jumlah total populasi (frekuensi).

    Angka yang menunjukkan berapa kali opsi individu muncul dalam populasi tertentu disebut frekuensi atau timbangan pilihan dan ditandai huruf kecil alfabet latin f. Jumlah total frekuensi deret variasi sama dengan volume populasi ini, mis.

    di mana k- jumlah kelompok, njumlah total pengamatan, atau ukuran populasi.

    Frekuensi (bobot) dinyatakan tidak hanya secara absolut, tetapi juga dalam jumlah relatif - dalam pecahan unit atau sebagai persentase dari jumlah total varian yang membentuk himpunan ini. Dalam kasus seperti itu, bobotnya disebut frekuensi relatif atau frekuensi. Jumlah total keterangan sama dengan satu

    atau
    ,

    jika frekuensi dinyatakan sebagai persentase dari jumlah total pengamatan P. Penggantian frekuensi dengan frekuensi tidak wajib, tetapi kadang-kadang ternyata berguna dan bahkan diperlukan dalam kasus-kasus ketika perlu untuk membandingkan satu sama lain seri variasi yang sangat berbeda dalam volumenya.

    Bergantung pada bagaimana atribut bervariasi - secara terpisah atau terus-menerus, dalam rentang yang luas atau sempit - populasi statistik didistribusikan dalam tanpa interval atau selang garis variasi. Dalam kasus pertama, frekuensi merujuk langsung ke nilai peringkat fitur, yang memperoleh posisi kelompok individu atau kelas dari deret variasi, di detik, frekuensi yang terkait dengan interval individu atau interval (dari - ke) dihitung, di mana variasi umum sifat dibagi dalam rentang dari varian minimum hingga maksimum dari populasi ini . Ruang-ruang ini, atau ruang kelas, mungkin sama lebarnya atau tidak. Dari sini mereka membedakan deret variasi interval yang sama dan tidak sama. Dalam deret interval tak sama, sifat distribusi frekuensi berubah seiring dengan perubahan lebar interval kelas. Pengelompokan interval yang tidak sama dalam biologi relatif jarang digunakan. Sebagai aturan, data biometrik didistribusikan dalam seri interval yang sama, yang memungkinkan tidak hanya untuk mengidentifikasi pola variasi, tetapi juga memfasilitasi perhitungan data ringkasan. karakteristik numerik seri variasi, perbandingan seri distribusi satu sama lain.

    Saat mulai membangun deret variasi interval sama, penting untuk menguraikan dengan benar lebar interval kelas. Faktanya adalah bahwa pengelompokan kasar (ketika interval kelas yang sangat lebar ditetapkan) mendistorsi fitur khas variasi dan menyebabkan penurunan akurasi karakteristik numerik dari deret tersebut. Ketika memilih interval yang terlalu sempit, akurasi karakteristik numerik generalisasi meningkat, tetapi deretnya ternyata terlalu panjang dan tidak memberikan gambaran yang jelas tentang variasi.

    Untuk mendapatkan deret variasi yang terdefinisi dengan baik dan Untuk memastikan akurasi yang memadai dari karakteristik numerik yang dihitung darinya, perlu untuk membagi variasi sifat (dalam kisaran dari opsi minimum hingga maksimum) ke dalam sejumlah kelompok atau kelas yang akan memenuhi kedua persyaratan. Masalah ini diselesaikan dengan membagi rentang variasi atribut dengan jumlah grup atau kelas yang direncanakan saat membangun deret variasi:

    ,

    di mana h– nilai interval; X m a x saya X min adalah maksimum dan nilai minimum Secara keseluruhan; k adalah jumlah kelompok.

    Saat membangun deret distribusi interval, perlu untuk memilih jumlah grup (interval karakter) yang optimal dan mengatur panjang (rentang) interval. Karena analisis deret distribusi membandingkan frekuensi dalam interval yang berbeda, panjang interval harus konstan. Jika Anda harus berurusan dengan deret distribusi interval dengan interval yang tidak sama, maka untuk keterbandingan Anda perlu membawa frekuensi atau frekuensi ke unit interval, nilai yang dihasilkan disebut kepadatan ρ , itu adalah
    .

    Jumlah kelompok yang optimal dipilih sehingga keragaman nilai sifat dalam agregat cukup tercermin dan pada saat yang sama keteraturan distribusi, bentuknya tidak terdistorsi oleh fluktuasi frekuensi acak. Jika terlalu sedikit kelompok, tidak akan ada pola variasi; jika ada terlalu banyak kelompok, lompatan frekuensi acak akan mendistorsi bentuk distribusi.

    Paling sering, jumlah grup dalam deret distribusi ditentukan oleh rumus Sturgess:

    di mana n- ukuran populasi.

    Representasi grafis memberikan bantuan penting dalam analisis deret distribusi dan propertinya. Seri interval diwakili oleh grafik batang, di mana alas batang, yang terletak di sepanjang sumbu absis, adalah interval nilai dari atribut yang bervariasi, dan ketinggian batang adalah frekuensi yang sesuai dengan skala sepanjang sumbu ordinat. Jenis diagram ini disebut histogram.

    Jika ada deret distribusi diskrit atau interval tengah yang digunakan, maka representasi grafik dari deret tersebut disebut poligon, yang diperoleh dengan menghubungkan titik-titik lurus dengan koordinat X saya dan f saya .

    Jika nilai kelas diplot sepanjang sumbu absis, dan frekuensi akumulasi diplot di sepanjang sumbu ordinat, diikuti dengan menghubungkan titik-titik dengan garis lurus, diperoleh grafik yang disebut kumulatif. Frekuensi yang terakumulasi ditemukan dengan penjumlahan berturut-turut, atau penumpukan frekuensi dalam arah dari kelas pertama ke akhir seri variasi.

    Contoh. Terdapat data produksi telur 50 ekor ayam petelur selama 1 tahun yang dipelihara pada suatu peternakan unggas (Tabel 1.1).

    T a b l e 1.1

    Ayam petelur

    Jumlah ayam petelur

    Produksi telur, buah.

    Jumlah ayam petelur

    Produksi telur, buah.

    Jumlah ayam petelur

    Produksi telur, buah.

    Jumlah ayam petelur

    Produksi telur, buah.

    Jumlah ayam petelur

    Produksi telur, buah.

    Diperlukan untuk membangun deret distribusi interval dan menampilkannya secara grafis dalam bentuk histogram, poligon, dan cumulate.

    Dapat dilihat bahwa sifat tersebut bervariasi dari 212 hingga 245 butir telur yang diperoleh dari ayam petelur dalam 1 tahun.

    Dalam contoh kami, menggunakan rumus Sturgess, kami menentukan jumlah grup:

    k = 1 + 3,322lg 50 = 6,643 ≈ 7.

    Hitung panjang (rentang) interval menggunakan rumus:

    .

    Mari kita buat deret interval dengan 7 grup dan interval 5 buah. telur (Tabel 1.2). Untuk membuat grafik dalam tabel, kami menghitung bagian tengah interval dan frekuensi yang terakumulasi.

    T a b l e 1.2

    Rangkaian interval distribusi produksi telur

    Kelompok ayam petelur menurut ukuran produksi telur

    X saya

    Jumlah ayam petelur

    f saya

    Titik tengah interval

    X saya'

    Akumulasi frekuensi

    f saya

    Mari kita buat histogram distribusi produksi telur (Gbr. 1.1).

    Beras. 1.1. Histogram distribusi produksi telur

    Histogram ini menunjukkan bentuk karakteristik distribusi banyak sifat: nilai interval rata-rata sifat lebih umum, lebih jarang nilai ekstrim (kecil dan besar) sifat. Bentuk distribusi ini mendekati hukum distribusi normal, yang terbentuk jika suatu variabel variabel dipengaruhi oleh sejumlah besar faktor, tidak ada satupun yang memiliki nilai predominan.

    Poligon dan kumulasi distribusi produksi telur berbentuk (Gbr. 1.2 dan 1.3).

    Beras. 1.2. Poligon distribusi telur

    Beras. 1.3. Akumulasi distribusi produksi telur

    Teknologi pemecahan masalah di prosesor spreadsheet Microsoft unggul Berikutnya.

    1. Masukkan data awal sesuai dengan gambar. 1.4.

    2. Peringkat baris.

    2.1. Pilih sel A2:A51.

    2.2. Klik kiri pada bilah alat pada tombol<Сортировка по возрастанию > .

    3. Tentukan ukuran interval untuk membangun deret interval dari distribusi.

    3.1. Salin sel A2 ke sel E53.

    3.2. Salin sel A51 ke sel E54.

    3.3. Hitung kisaran variasi. Untuk melakukan ini, masukkan rumus di sel E55 =E54-E53.

    3.4. Hitung jumlah kelompok variasi. Untuk melakukan ini, masukkan rumus di sel E56 =1+3.322*LOG10(50).

    3.5. Masukkan di sel E57 jumlah grup yang dibulatkan.

    3.6. Hitung panjang intervalnya. Untuk melakukan ini, masukkan rumus di sel E58 =E55/E57.

    3.7. Masukkan di sel E59 panjang interval yang dibulatkan.

    4. Membangun seri interval.

    4.1. Salin sel E53 ke sel B64.

    4.2. Masukkan rumus di sel B65 =B64+$E$59.

    4.3. Salin sel B65 ke sel B66:B70.

    4.4. Masukkan rumus di sel C64 = B65.

    4.5. Masukkan rumus di sel C65 =C64+$E$59.

    4.6. Salin sel C65 ke sel C66:C70.

    Hasil dari solusi ditampilkan pada tampilan layar dalam bentuk berikut (Gbr. 1.5).

    5. Hitung frekuensi intervalnya.

    5.1. Jalankan perintah Melayani,Analisis data dengan mengklik bergantian dengan tombol kiri mouse.

    5.2. Di kotak dialog Analisis data atur dengan tombol kiri mouse: Alat Analisis<Гистограмма>(Gbr. 1.6).

    5.3. Klik kiri pada tombol<ОК>.

    5.4. Di tab grafik batang mengatur parameter sesuai dengan gambar. 1.7.

    5.5. Klik kiri pada tombol<ОК>.

    Hasil dari solusi ditampilkan pada tampilan layar dalam bentuk berikut (Gbr. 1.8).

    6. Isi tabel “Deret interval distribusi”.

    6.1. Salin sel B74:B80 ke sel D64:D70.

    6.2. Hitung jumlah frekuensinya. Untuk melakukan ini, pilih sel D64:D70 dan klik kiri pada tombol pada bilah alat<Автосумма > .

    6.3. Hitung pertengahan interval. Untuk melakukan ini, masukkan rumus di sel E64 =(B64+C64)/2 dan salin ke sel E65:E70.

    6.4. Hitung frekuensi yang terkumpul. Untuk melakukan ini, salin sel D64 ke sel F64. Di sel F65, masukkan rumus =F64+D65 dan salin ke sel F66:F70.

    Hasil dari solusi ditampilkan pada tampilan layar dalam bentuk berikut (Gbr. 1.9).

    7. Mengedit histogram.

    7.1. Klik kanan pada diagram pada nama "saku" dan di tab yang muncul, klik tombol<Очистить>.

    7.2. Klik kanan pada grafik dan pada tab yang muncul, klik tombol<Исходные данные>.

    7.3. Di kotak dialog Data awal ubah label sumbu x. Untuk melakukannya, pilih sel B64:C70 (Gbr. 1.10).

    7.5. tekan tombol .

    Hasilnya ditampilkan di layar di bentuk berikut(Gbr. 1.11).

    8. Buat poligon distribusi telur.

    8.1. Klik kiri pada bilah alat pada tombol<Мастер диаграмм > .

    8.2. Di kotak dialog Chart Wizard (Langkah 1 dari 4) gunakan tombol kiri mouse untuk mengatur: Standar<График>(Gbr. 1.12).

    8.3. Klik kiri pada tombol<Далее>.

    8.4. Di kotak dialog Chart Wizard (Langkah 2 dari 4) mengatur parameter sesuai dengan gambar. 1.13.

    8.5. Klik kiri pada tombol<Далее>.

    8.6. Di kotak dialog Chart Wizard (Langkah 3 dari 4) masukkan nama grafik dan sumbu Y (Gbr. 1.14).

    8.7. Klik kiri pada tombol<Далее>.

    8.8. Di kotak dialog Chart Wizard (Langkah 4 dari 4) mengatur parameter sesuai dengan gambar. 1.15.

    8.9. Klik kiri pada tombol<Готово>.

    Hasilnya ditampilkan pada tampilan layar dalam bentuk berikut (Gbr. 1.16).

    9. Sisipkan label data pada bagan.

    9.1. Klik kanan pada grafik dan pada tab yang muncul, klik tombol<Исходные данные>.

    9.2. Di kotak dialog Data awal ubah label sumbu x. Untuk melakukannya, pilih sel E64:E70 (Gbr. 1.17).

    9.3. tekan tombol .

    Hasilnya ditampilkan pada tampilan layar dalam bentuk berikut (Gbr. 1.18).

    Kumulasi distribusi dibangun mirip dengan poligon distribusi berdasarkan frekuensi akumulasi.

    Mereka disajikan dalam bentuk seri distribusi dan diformat sebagai .

    Seri distribusi adalah salah satu jenis pengelompokan.

    Jangkauan distribusi- mewakili distribusi yang teratur dari unit-unit populasi yang dipelajari ke dalam kelompok-kelompok sesuai dengan atribut tertentu yang bervariasi.

    Tergantung pada sifat yang mendasari pembentukan deret distribusi, ada: atributif dan variasional peringkat distribusi:

    • atributif- memanggil seri distribusi yang dibangun atas dasar kualitatif.
    • Deret distribusi yang dibangun dalam urutan nilai atribut kuantitatif menaik atau menurun disebut variasi.
    Deret variasi distribusi terdiri dari dua kolom:

    Kolom pertama berisi nilai kuantitatif sifat variabel, yang disebut pilihan dan ditandai. Varian diskrit - dinyatakan sebagai bilangan bulat. Opsi interval berada dalam rentang dari dan ke. Bergantung pada jenis varian, dimungkinkan untuk membuat deret variasi diskrit atau interval.
    Kolom kedua berisi jumlah pilihan tertentu , dinyatakan dalam frekuensi atau frekuensi:

    Frekuensi- ini adalah angka absolut yang menunjukkan berapa kali secara agregat nilai fitur yang diberikan muncul, yang menunjukkan . Jumlah semua frekuensi harus sama dengan jumlah unit seluruh populasi.

    Frekuensi() adalah frekuensi yang dinyatakan sebagai persentase dari total. Jumlah semua frekuensi yang dinyatakan sebagai persentase harus sama dengan 100% dalam pecahan satu.

    Representasi grafis dari seri distribusi

    Seri distribusi divisualisasikan menggunakan gambar grafis.

    Seri distribusi ditampilkan sebagai:
    • Poligon
    • Histogram
    • terakumulasi
    • memberikan

    Poligon

    Saat membangun poligon pada sumbu horizontal (sumbu absis), nilai-nilai atribut yang bervariasi diplot, dan pada sumbu vertikal(sumbu y) - frekuensi atau frekuensi.

    Poligon pada gambar. 6.1 dibangun sesuai dengan sensus mikro populasi Rusia pada tahun 1994.

    6.1. Distribusi rumah tangga menurut ukuran

    Kondisi: Data diberikan pada distribusi 25 karyawan dari salah satu perusahaan berdasarkan kategori tarif:
    4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
    Sebuah tugas: Buat deret variasi diskrit dan gambarkan secara grafis sebagai poligon distribusi.
    Larutan:
    PADA contoh ini pilihan adalah kategori upah karyawan. Untuk menentukan frekuensi, perlu dilakukan penghitungan jumlah karyawan dengan kategori upah yang sesuai.

    Poligon digunakan untuk seri variasi diskrit.

    Untuk membangun poligon distribusi (Gbr. 1), di sepanjang absis (X), kami memplot nilai kuantitatif dari berbagai sifat - varian, dan di sepanjang ordinat - frekuensi atau frekuensi.

    Jika nilai karakteristik dinyatakan sebagai interval, maka deret seperti itu disebut deret interval.
    seri interval distribusi ditampilkan secara grafis sebagai histogram, cumulate atau ogive.

    tabel statistik

    Kondisi: Data ukuran deposit 20 diberikan individu dalam satu bank (seribu rubel) 60; 25; 12; sepuluh; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; delapan belas; 7; 42.
    Sebuah tugas: Membangun seri variasi interval dengan interval yang sama.
    Larutan:

    1. Populasi awal terdiri dari 20 unit (N = 20).
    2. Menggunakan rumus Sturgess, kami mendefinisikan jumlah yang dibutuhkan grup yang digunakan: n=1+3.322*lg20=5
    3. Mari kita hitung nilai interval yang sama: i=(152 - 2) /5 = 30 ribu rubel
    4. Kami membagi populasi awal menjadi 5 kelompok dengan interval 30 ribu rubel.
    5. Hasil pengelompokan disajikan dalam tabel:

    Dengan perekaman fitur kontinu seperti itu, ketika nilai yang sama muncul dua kali (sebagai batas atas satu interval dan batas bawah interval lain), maka nilai ini termasuk dalam kelompok di mana nilai ini bertindak sebagai batas atas.

    grafik batang

    Untuk membuat histogram di sepanjang absis, tunjukkan nilai batas interval dan, atas dasar mereka, buat persegi panjang yang tingginya sebanding dengan frekuensi (atau frekuensi).

    pada gambar. 6.2. histogram distribusi populasi Rusia pada tahun 1997 berdasarkan kelompok umur ditampilkan.

    Beras. 6.2. Distribusi populasi Rusia berdasarkan kelompok umur

    Kondisi: Pembagian 30 karyawan perusahaan sesuai dengan besarnya gaji bulanan yang diberikan

    Sebuah tugas: Menampilkan rangkaian variasi interval secara grafis sebagai histogram dan kumulasi.
    Larutan:

    1. Batas yang tidak diketahui dari interval terbuka (pertama) ditentukan oleh nilai interval kedua: 7000 - 5000 = 2000 rubel. Dengan nilai yang sama kita temukan batas bawah interval pertama: 5000 - 2000 = 3000 rubel.
    2. Untuk membangun histogram dalam sistem koordinat persegi panjang, di sepanjang sumbu absis, kami menyisihkan segmen yang nilainya sesuai dengan interval baris varian.
      Segmen ini berfungsi sebagai alas bawah, dan frekuensi yang sesuai (frekuensi) berfungsi sebagai ketinggian persegi panjang yang terbentuk.
    3. Mari kita membangun histogram:

    Untuk menyusun kumulasi, perlu dihitung frekuensi akumulasi (frekuensi). Mereka ditentukan oleh penjumlahan berturut-turut dari frekuensi (frekuensi) dari interval sebelumnya dan dilambangkan dengan S. Frekuensi yang terakumulasi menunjukkan berapa banyak unit populasi yang memiliki nilai fitur tidak lebih besar dari yang dipertimbangkan.

    Mengumpul

    Distribusi suatu sifat dalam deret variasi menurut akumulasi frekuensi (frekuensi) digambarkan dengan menggunakan cumulate.

    Mengumpul atau kurva kumulatif, berbeda dengan poligon, dibangun di atas frekuensi atau frekuensi yang terakumulasi. Pada saat yang sama, nilai fitur ditempatkan pada sumbu absis, dan frekuensi atau frekuensi yang terakumulasi ditempatkan pada sumbu ordinat (Gbr. 6.3).

    Beras. 6.3. Distribusi kumulatif rumah tangga menurut ukuran

    4. Hitung frekuensi akumulasi:
    Frekuensi lutut interval pertama dihitung sebagai berikut: 0 + 4 = 4, untuk yang kedua: 4 + 12 = 16; untuk yang ketiga: 4 + 12 + 8 = 24, dst.

    Saat membangun kumulasi, akumulasi frekuensi (frekuensi) dari interval yang sesuai ditetapkan ke batas atasnya:

    Ogiva

    Ogiva dibangun mirip dengan cumulate dengan satu-satunya perbedaan bahwa frekuensi yang terakumulasi ditempatkan pada sumbu absis, dan nilai fitur ditempatkan pada sumbu ordinat.

    Variasi dari cumulate adalah kurva konsentrasi atau plot Lorenz. Untuk memplot kurva konsentrasi pada kedua sumbu sistem persegi panjang koordinat, skala skala diterapkan dalam persen dari 0 hingga 100. Dalam hal ini, absis menunjukkan frekuensi yang terakumulasi, dan ordinat menunjukkan nilai akumulasi bagian (dalam persen) dengan volume fitur.

    Distribusi seragam tanda sesuai dengan diagonal alun-alun pada grafik (Gbr. 6.4). Dengan distribusi yang tidak merata, grafiknya adalah kurva cekung tergantung pada tingkat konsentrasi sifat tersebut.

    6.4. kurva konsentrasi