Pengamatan selektif: konsep, jenis, kesalahan pengambilan sampel, evaluasi hasil. Contoh pemecahan masalah

Selama pengamatan selektif, itu harus dipastikan kecelakaan pemilihan unit. Setiap unit harus memiliki kesempatan yang sama untuk dipilih dengan yang lain. Inilah yang menjadi dasar pengambilan sampel acak.

KE sampel acak yang tepat mengacu pada pemilihan unit dari seluruh populasi umum (tanpa membaginya terlebih dahulu ke dalam kelompok mana pun) dengan menggambar undian (terutama) atau metode serupa lainnya, misalnya, menggunakan tabel angka acak. Seleksi acak Pemilihan ini tidak sembarangan. Prinsip keacakan menunjukkan bahwa masuk atau keluarnya suatu objek dari sampel tidak dapat dipengaruhi oleh faktor apa pun selain kebetulan. Sebuah contoh sebenarnya acak seleksi dapat berfungsi sebagai sirkulasi kemenangan: dari jumlah total tiket yang dikeluarkan, bagian tertentu dari angka yang memperhitungkan kemenangan dipilih secara acak. Selain itu, semua nomor diberi kesempatan yang sama untuk masuk ke dalam sampel. Dalam hal ini, jumlah unit yang dipilih dalam kumpulan sampel biasanya ditentukan berdasarkan proporsi sampel yang diterima.

Berbagi sampel adalah rasio jumlah unit populasi sampel dengan jumlah unit populasi umum:

Jadi, dengan sampel 5% dari sekumpulan suku cadang dalam 1000 unit. ukuran sampel P adalah 50 unit, dan dengan sampel 10% - 100 unit. dll. Dengan organisasi pengambilan sampel ilmiah yang benar, kesalahan keterwakilan dapat dikurangi menjadi nilai minimal, akibatnya, pengamatan selektif menjadi cukup akurat.

Seleksi acak yang tepat "dalam bentuknya yang murni" jarang digunakan dalam praktik observasi selektif, tetapi ini adalah titik awal di antara semua jenis seleksi lainnya, yang berisi dan menerapkan prinsip dasar observasi selektif.

Mari kita pertimbangkan beberapa pertanyaan tentang teori metode pengambilan sampel dan rumus kesalahan untuk sampel acak sederhana.

Saat menerapkan metode pengambilan sampel dalam statistik, biasanya digunakan dua jenis utama indikator generalisasi: nilai rata-rata dari sifat kuantitatif Dan nilai relatif dari fitur alternatif(proporsi atau proporsi unit dalam populasi statistik, yang berbeda dari semua unit lain dari populasi ini hanya dengan adanya sifat yang dipelajari).

Berbagi sampel (w), atau frekuensi, ditentukan oleh perbandingan jumlah satuan yang memiliki sifat yang diteliti T, dengan jumlah total unit sampling P:

Misalnya, jika dari 100 detail sampel ( N=100), 95 bagian ternyata standar (T=95), maka fraksi sampel

w=95/100=0,95 .

Untuk mencirikan keandalan indikator sampel, ada tengah Dan kesalahan pengambilan sampel marjinal.

Kesalahan pengambilan sampel ? atau, dengan kata lain, kesalahan keterwakilan adalah perbedaan antara sampel yang sesuai dan karakteristik umum:

*

*

Kesalahan pengambilan sampel hanya karakteristik dari pengamatan selektif. Semakin besar nilai kesalahan ini, semakin banyak indikator sampel yang berbeda dari indikator umum yang sesuai.

Rata-rata sampel dan bagian sampel secara inheren variabel acak, yang dapat mengambil nilai yang berbeda tergantung pada unit populasi mana yang menjadi sampel. Oleh karena itu, kesalahan pengambilan sampel juga merupakan variabel acak dan dapat mengambil nilai yang berbeda. Oleh karena itu, tentukan rata-rata kemungkinan kesalahan - kesalahan sampel rata-rata.

Tergantung pada apa berarti kesalahan sampling? Tunduk pada prinsip pemilihan acak, kesalahan sampling rata-rata ditentukan terutama ukuran sampel: semakin besar populasi, ceteris paribus, rata-rata kesalahan pengambilan sampel semakin kecil. Meliputi survei sampel dengan semakin banyak unit populasi umum, kami mengkarakterisasi seluruh populasi dengan lebih akurat.

Kesalahan pengambilan sampel rata-rata juga tergantung pada derajat variasi mempelajari sifat. Tingkat variasi, seperti yang Anda ketahui, dicirikan oleh dispersi? 2 atau w(1-w)-- untuk fitur alternatif. Semakin kecil variasi fitur, dan karenanya varians, semakin kecil rata-rata kesalahan pengambilan sampel, dan sebaliknya. Dengan dispersi nol (atribut tidak bervariasi), kesalahan pengambilan sampel rata-rata adalah nol, yaitu, setiap unit populasi umum akan secara akurat mencirikan seluruh populasi menurut atribut ini.

Ketergantungan rata-rata kesalahan pengambilan sampel pada volumenya dan tingkat variasi fitur tercermin dalam rumus yang dapat digunakan untuk menghitung kesalahan pengambilan sampel rata-rata dalam kondisi pengamatan sampel, ketika karakteristik umum ( x,p) tidak diketahui, dan oleh karena itu, tidak mungkin menemukan kesalahan pengambilan sampel yang sebenarnya langsung dari rumus (form.1), (form.2).

W Dengan pemilihan acak kesalahan rata-rata secara teoritis dihitung dengan rumus berikut:

* untuk sifat kuantitatif rata-rata

* untuk berbagi (karakteristik alternatif)

Sejak praktis varian atribut dalam populasi umum? 2 tidak diketahui secara pasti, dalam praktiknya mereka menggunakan nilai varians S 2 yang dihitung untuk populasi sampel berdasarkan hukum bilangan besar, yang menurutnya populasi sampel dengan ukuran sampel yang cukup besar secara akurat mereproduksi karakteristik populasi umum.

Dengan demikian, rumus perhitungan tengah kesalahan pengambilan sampel resampling acak akan menjadi sebagai berikut:

* untuk sifat kuantitatif rata-rata

* untuk berbagi (karakteristik alternatif)

Namun, varians populasi sampel tidak sama dengan varians populasi umum, dan oleh karena itu, kesalahan pengambilan sampel rata-rata yang dihitung dengan rumus (form.5) dan (form.6) akan menjadi perkiraan. Tetapi dalam teori probabilitas terbukti bahwa varians umum dinyatakan melalui elektif dengan hubungan berikut:

Karena P/(N-1) untuk cukup besar P -- nilai yang mendekati satu, dapat diasumsikan bahwa, dan oleh karena itu, dalam perhitungan praktis rata-rata kesalahan pengambilan sampel, rumus (bentuk 5) dan (bentuk 6) dapat digunakan. Dan hanya dalam kasus sampel kecil (ketika ukuran sampel tidak melebihi 30) koefisien harus diperhitungkan P/(N-1) dan hitung kesalahan rata-rata sampel kecil sesuai dengan rumus:

WX Dengan pemilihan acak non-berulang dalam rumus di atas untuk menghitung kesalahan pengambilan sampel rata-rata, ekspresi akar harus dikalikan dengan 1-(n / N), karena jumlah unit dalam populasi umum berkurang dalam proses pengambilan sampel non-berulang. Oleh karena itu, untuk seleksi non-berulang rumus perhitungan rata-rata kesalahan sampling akan mengambil bentuk sebagai berikut:

* untuk sifat kuantitatif rata-rata

* untuk berbagi (karakteristik alternatif)

. (bentuk.10)

Karena P selalu kurang N, maka faktor tambahan 1-( t/t) akan selalu kurang dari satu. Oleh karena itu, kesalahan rata-rata dengan pemilihan non-berulang akan selalu lebih kecil dibandingkan dengan pemilihan berulang. Pada saat yang sama, dengan persentase sampel yang relatif kecil, faktor ini mendekati satu (misalnya, dengan sampel 5% adalah 0,95; dengan sampel 2% adalah 0,98, dll.). Oleh karena itu, terkadang dalam praktiknya, rumus (bentuk 5) dan (bentuk 6) digunakan untuk menentukan rata-rata kesalahan pengambilan sampel tanpa pengali yang ditentukan, meskipun sampel diatur sebagai sampel yang tidak berulang. Ini terjadi ketika jumlah unit populasi umum N tidak diketahui atau tidak terbatas, atau kapan P sangat sedikit dibandingkan dengan N, dan pada dasarnya, pengenalan faktor tambahan, yang nilainya mendekati satu, secara praktis tidak akan mempengaruhi nilai kesalahan pengambilan sampel rata-rata.

Pengambilan sampel mekanis terdiri dari fakta bahwa pemilihan unit dalam sampel dari umum, dibagi dengan kriteria netral ke dalam interval (kelompok) yang sama, dilakukan sedemikian rupa sehingga hanya satu unit yang dipilih dari setiap kelompok tersebut dalam sampel. Untuk menghindari kesalahan sistematis, unit yang berada di tengah setiap kelompok harus dipilih.

Saat mengatur seleksi mekanis, unit populasi diatur sebelumnya (biasanya dalam daftar) dalam urutan tertentu (misalnya, menurut abjad, berdasarkan lokasi, dalam urutan naik atau turun dari nilai indikator apa pun yang tidak terkait dengan properti yang sedang dipelajari, dll.), dll.), setelah itu sejumlah unit tertentu dipilih secara mekanis, pada interval tertentu. Dalam hal ini, ukuran interval pada populasi umum sama dengan kebalikan dari bagian sampel. Jadi, dengan sampel 2%, setiap unit ke-50 (1: 0,02) dipilih dan diperiksa, dengan sampel 5%, setiap unit ke-20 (1: 0,05), misalnya detail yang menurun dari mesin.

Dengan populasi yang cukup besar, pemilihan mekanis dalam hal akurasi hasil mendekati acak yang tepat. Oleh karena itu, untuk menentukan kesalahan rata-rata sampel mekanis, digunakan rumus untuk pengambilan sampel acak sendiri yang tidak berulang (form.9), (form.10).

Untuk memilih unit dari populasi yang heterogen, yang disebut sampel khas , yang digunakan dalam kasus di mana semua unit populasi umum dapat dibagi menjadi beberapa kelompok yang homogen secara kualitatif, serupa sesuai dengan karakteristik yang memengaruhi indikator yang diteliti.

Saat mensurvei perusahaan, kelompok tersebut dapat berupa, misalnya industri dan subsektor, bentuk kepemilikan. Kemudian, dari masing-masing kelompok tipikal, pemilihan unit individu ke dalam sampel dibuat dengan sampel acak atau mekanis yang tepat.

Sampel tipikal biasanya digunakan dalam studi populasi statistik yang kompleks. Misalnya, dalam survei sampel anggaran keluarga pekerja dan karyawan di sektor ekonomi tertentu, produktivitas tenaga kerja pekerja di suatu perusahaan, yang diwakili oleh kelompok keterampilan terpisah.

Sampel tipikal memberikan hasil yang lebih akurat dibandingkan dengan metode lain untuk memilih unit dalam kumpulan sampel. Tipifikasi populasi umum memastikan keterwakilan sampel semacam itu, representasi setiap kelompok tipologis di dalamnya, yang memungkinkan untuk mengecualikan pengaruh penyebaran antarkelompok pada kesalahan sampel rata-rata.

Saat menentukan kesalahan rata-rata dari sampel tipikal sebagai indikator variasi adalah rata-rata varian intragroup.

Kesalahan sampel rata-rata ditemukan dengan rumus:

* untuk sifat kuantitatif rata-rata

(seleksi ulang); (bentuk.11)

(pilihan ireversibel); (bentuk.12)

* untuk berbagi (karakteristik alternatif)

(seleksi ulang); (form.13)

(seleksi non-berulang), (form. 14)

di mana rata-rata varians intra-grup untuk populasi sampel;

Rata-rata varian intra-grup dari pangsa (sifat alternatif) dalam populasi sampel.

pengambilan sampel serial melibatkan pemilihan acak dari populasi umum bukan dari unit individu, tetapi dari kelompok yang setara (sarang, seri) untuk mengarahkan semua unit tanpa kecuali ke pengamatan dalam kelompok tersebut.

Penggunaan pengambilan sampel serial disebabkan oleh fakta bahwa banyak barang untuk transportasi, penyimpanan, dan penjualannya dikemas dalam kemasan, kotak, dll. Oleh karena itu, saat mengontrol kualitas barang yang dikemas, lebih rasional memeriksa beberapa paket (seri) daripada memilih jumlah barang yang dibutuhkan dari semua paket.

Karena dalam kelompok (seri) semua unit diperiksa tanpa kecuali, kesalahan pengambilan sampel rata-rata (ketika memilih seri yang sama) hanya bergantung pada varian antarkelompok (antarseri).

W Rata-rata sampling error untuk skor rata-rata selama pemilihan seri, mereka ditemukan dengan rumus:

(seleksi ulang); (bentuk.15)

(seleksi non-berulang), (form. 16)

Di mana R- jumlah seri yang dipilih; R- jumlah total episode.

Varian antarkelompok dari sampel serial dihitung sebagai berikut:

dimana rata-rata Saya- seri th; - rata-rata umum untuk seluruh populasi sampel.

W Kesalahan pengambilan sampel rata-rata untuk berbagi (fitur alternatif) dalam pemilihan seri:

(seleksi ulang); (bentuk.17)

(seleksi tidak berulang). (bentuk.18)

Antarkelompok(antar seri) varians dari bagian sampel serial ditentukan dengan rumus:

, (bentuk.19)

di mana bagian fitur di Saya seri th; - total bagian dari sifat di seluruh sampel.

Dalam praktik survei statistik, selain metode seleksi yang telah dipertimbangkan sebelumnya, kombinasi keduanya digunakan (pemilihan gabungan).

Konsep dan perhitungan sampling error.

Tugas observasi selektif adalah memberikan ide yang benar tentang indikator ringkasan dari seluruh populasi berdasarkan beberapa bagian dari mereka yang diamati. Kemungkinan penyimpangan dari bagian sampel dan rata-rata sampel dari bagian dan rata-rata dalam populasi umum disebut kesalahan pengambilan sampel atau kesalahan keterwakilan. Semakin besar nilai kesalahan ini, semakin banyak perbedaan indikator pengamatan sampel dengan populasi umum.

Berbeda:

Kesalahan pengambilan sampel;

Kesalahan pendaftaran.

Kesalahan pendaftaran terjadi ketika fakta salah ditetapkan dalam proses observasi. Mereka adalah karakteristik dari pengamatan terus menerus dan pengamatan selektif, tetapi mereka kurang dalam pengamatan selektif.

Sifat kesalahannya adalah:

Tendensi - disengaja, mis. baik unit terbaik atau terburuk dari populasi dipilih. Dalam hal ini, pengamatan kehilangan maknanya;

Acak - prinsip organisasi utama pengamatan selektif adalah untuk mencegah pemilihan yang disengaja, mis. memastikan kepatuhan yang ketat terhadap prinsip pemilihan acak.

Aturan umum pemilihan acak adalah: unit individu dari populasi umum harus memiliki kondisi dan peluang yang persis sama untuk masuk ke dalam jumlah unit yang termasuk dalam sampel. Ini mencirikan independensi hasil sampel dari kehendak pengamat. Kehendak pengamat menghasilkan kesalahan tendensius. Kesalahan pengambilan sampel dalam pemilihan acak adalah acak. Ini mencirikan ukuran penyimpangan karakteristik umum dari sampel.

Karena karakteristik populasi yang diteliti berbeda-beda, komposisi unit dalam sampel mungkin tidak sama dengan komposisi unit seluruh populasi. Itu artinya R dan tidak cocok dengan W Dan . Perbedaan yang mungkin antara karakteristik ini ditentukan oleh kesalahan pengambilan sampel, yang ditentukan oleh rumus:

dimana adalah varians umum.

di mana adalah varians sampel.

Ini menunjukkan di mana varians umum berbeda dari varians sampel pada waktunya.

Ada seleksi berulang dan tidak berulang. Inti dari seleksi ulang adalah setiap unit dalam sampel, setelah observasi, kembali ke populasi umum dan dapat diperiksa ulang. Saat pengambilan sampel ulang, kesalahan pengambilan sampel rata-rata dihitung:

Untuk indikator pangsa atribut alternatif, varians sampel ditentukan dengan rumus:

Dalam praktiknya, pemilihan ulang jarang digunakan. Dengan seleksi non-berulang, ukuran populasi umum N menurun selama pengambilan sampel, rumus kesalahan pengambilan sampel rata-rata untuk atribut kuantitatif adalah:



Salah satu nilai yang mungkin di mana bagian dari sifat yang dipelajari adalah sama dengan:

dimana adalah sampling error dari fitur alternatif.

Contoh.

Selama survei sampel 10% produk dari suatu batch produk jadi menurut metode tanpa pemilihan ulang, diperoleh data berikut tentang kadar air dalam sampel.

Tentukan % kelembaban rata-rata, varians, standar deviasi, dengan probabilitas 0,954, batas yang mungkin di mana rata-rata diharapkan. % kadar air semua produk jadi, dengan probabilitas 0,987, kemungkinan batas berat jenis produk standar, asalkan produk dengan kadar air hingga 13 dan di atas 19% termasuk dalam bets non-standar.

Hanya dengan probabilitas tertentu dapat dikatakan bahwa bagian umum dari bagian sampel dan rata-rata umum dari rata-rata sampel menyimpang dalam T sekali.

Dalam statistik, penyimpangan ini disebut kesalahan pengambilan sampel marjinal dan ditandai.

Probabilitas penilaian dapat dinaikkan atau diturunkan T sekali. Dengan probabilitas 0,683, dengan 0,954, dengan 0,987, maka ditentukan indikator populasi umum menurut indikator sampel:

Kesalahan pengambilan sampel rata-rata selalu ada dalam studi sampel dan muncul karena fakta bahwa tidak semua unit populasi statistik disurvei, tetapi hanya sebagian saja.

Rata-rata sampling error menjadi kesalahan marjinal Δ jika dikalikan dengan faktor kepercayaan T , yang diatur sebelumnya berdasarkan akurasi pengamatan yang diperlukan. Kesalahan marjinal memungkinkan Anda untuk menilai ukuran parameter "sebenarnya" dalam populasi umum dengan tingkat probabilitas tertentu

Untuk pemilihan tipikal dan serial, saat menghitung kesalahan pengambilan sampel, bukan varian total 2 ) gunakan rata-rata varian dalam kelompok dan varian antar kelompok
, Di mana
- varian pribadi grup i, volume i kelompok

Rumus kesalahan marjinal sampel acak dalam menentukan rata-rata

Untuk seleksi ulang

Rumus kesalahan marjinal sampel acak dalam menentukan proporsi

Untuk seleksi ulang

Untuk pemilihan yang tidak berulang

Rumus ukuran sampel acak dalam menentukan nilai rata-rata

Rumus jumlah sampel acak dalam menentukan bagian dari sifat yang dipelajari

Perbedaan marjinal antara rata-rata umum dan sampel sesuai dengan kesalahan marjinal

Nilai probabilitas dan masing-masing T ada di tabel distribusi:

  • Siswa (dalam kasus sampel kecil)

Rumus pengambilan sampel acak juga cocok untuk pengambilan sampel mekanis.

Jika pembulatan diperlukan, dengan pengambilan sampel acak - pembulatan ke atas, dengan pengambilan sampel mekanis - pembulatan ke bawah.

Sampel kecil

Jika ukuran sampel tidak lebih dari 30 satuan, maka kesalahan rata-rata sampel kecil dalam menentukan nilai rata-rata dihitung dengan rumus:

Untuk menghitung kesalahan sampel kecil, rumus varians halus digunakan

Jenis tugas sampling

    definisi kesalahan sampling,

    penentuan ukuran sampel N ,

    penentuan probabilitas bahwa rata-rata sampel (atau bagian) menyimpang dari yang umum tidak lebih dari jumlah tertentu t=Δ/μ,

    penilaian keacakan perbedaan dalam indikator pengamatan sampel,

    transfer karakteristik sampel ke populasi umum.

Pengujian Hipotesis Mean dan Proporsi

Estimasi keacakan perbedaan dalam indikator pengamatan sampel


Metode untuk mentransfer data sampel ke populasi umum

    metode penimbangan;

    metode penimbangan ulang;

    metode pengisian dengan pemilihan acak di kelas pengganti.

kesalahan marjinal- perbedaan maksimum yang mungkin antara rata-rata atau kesalahan maksimum untuk probabilitas terjadinya tertentu.

1. Kesalahan pengambilan sampel marjinal untuk rata-rata selama pemilihan berulang dihitung dengan rumus:

di mana t - deviasi yang dinormalisasi - "faktor kepercayaan", yang bergantung pada probabilitas yang menjamin kesalahan pengambilan sampel marjinal;

mu x adalah mean sampling error.

2. Kesalahan Sampling Marjinal untuk Proporsi ketika pemilihan ulang ditentukan oleh rumus:

3. Kesalahan pengambilan sampel marjinal untuk rata-rata dengan pemilihan non-berulang:

Batasi kesalahan relatif pengambilan sampel didefinisikan sebagai rasio persentase kesalahan pengambilan sampel marjinal dengan karakteristik yang sesuai dari populasi pengambilan sampel. Ini didefinisikan seperti ini:

Sampel kecil

Teori sampel kecil dikembangkan Mahasiswa statistik bahasa Inggris pada awal abad ke-20. Pada tahun 1908, ia menemukan distribusi khusus yang memungkinkan, bahkan dengan sampel kecil, untuk mengkorelasikan t dan probabilitas kepercayaan F(t). Untuk n lebih besar dari 100, mereka memberikan hasil yang sama dengan tabel integral probabilitas Laplace, untuk 30< n < 100 различия получаются незначительные. Поэтому на практике к малым выборкам относятся выборки объемом менее 30 единиц.

Seperti diketahui, dalam statistika ada dua cara mengamati fenomena massa, tergantung dari kelengkapan cakupan objeknya: kontinu dan nonkontinu. Variasi pengamatan terputus-putus adalah pengamatan selektif.

Di bawah observasi selektif dipahami sebagai pengamatan tidak berkelanjutan, di mana unit populasi yang diteliti, dipilih secara acak, menjadi sasaran pemeriksaan statistik (observasi).

Pengamatan selektif mengatur sendiri tugas mengkarakterisasi seluruh populasi unit untuk bagian yang diperiksa, tunduk pada semua aturan dan prinsip pengamatan statistik dan pekerjaan yang diatur secara ilmiah pada pemilihan unit.

Himpunan unit yang dipilih untuk survei dalam statistik biasanya disebut populasi sampel , dan himpunan unit dari mana pemilihan dibuat disebut populasi umum . Karakteristik utama populasi umum dan sampel disajikan pada Tabel 1.

Tabel 1 - Ciri-ciri utama populasi umum dan sampel
IndeksPenunjukan atau formula
Populasi Populasi sampel
Jumlah unit N N
Jumlah unit yang memiliki fitur M M
Proporsi unit dengan fitur ini p = M/N ω = m/n
Proporsi unit yang tidak memiliki sifat ini q = 1 - hal 1 - w
Nilai rata-rata tanda
Penyebaran tanda
Dispersi fitur alternatif (dispersi saham) pq ω (1 - ω)

Saat melakukan pengamatan selektif, kesalahan sistematis dan acak terjadi. Kesalahan sistematis muncul karena pelanggaran aturan pemilihan unit dalam sampel. Dengan mengubah aturan pemilihan, kesalahan tersebut dapat dihilangkan.

Kesalahan acak muncul karena sifat survei yang terputus-putus. Kalau tidak, mereka disebut kesalahan keterwakilan (keterwakilan). Kesalahan acak dibagi menjadi kesalahan pengambilan sampel rata-rata dan marjinal, yang ditentukan baik saat menghitung fitur maupun saat menghitung bagian.

Kesalahan rata-rata dan batas terkait dengan hubungan berikut :Δ = tμ, di mana Δ adalah kesalahan pengambilan sampel marjinal, μ adalah kesalahan pengambilan sampel rata-rata, t adalah faktor kepercayaan yang ditentukan tergantung pada tingkat probabilitas. Tabel 2 menunjukkan beberapa nilai t yang diambil dari teori probabilitas.

Nilai kesalahan pengambilan sampel rata-rata dihitung secara berbeda tergantung pada metode pemilihan dan prosedur pengambilan sampel. Rumus utama untuk menghitung sampling error disajikan pada Tabel 3.

Tabel 3 - Rumus Dasar Menghitung Kesalahan Sampling Dalam Seleksi Berulang dan Tidak Berulang
IndeksPenunjukan dan formula
Populasi Populasi sampel
Berarti kesalahan fitur untuk resampling acak
Rata-rata berbagi kesalahan untuk resampling acak
Batasi kesalahan fitur jika terjadi pemilihan ulang secara acak
Kesalahan Bagian Marjinal dalam Pemilihan Ulang Acak
Kesalahan rata-rata fitur untuk pemilihan acak non-berulang
Rata-rata kesalahan pembagian dalam pemilihan acak non-berulang
Batasi kesalahan fitur dengan pemilihan acak non-berulang
Kesalahan pembagian marjinal untuk pemilihan acak non-berulang

Perhitungan kesalahan pengambilan sampel rata-rata dan marjinal memungkinkan Anda untuk menentukan batas yang mungkin di mana karakteristik populasi umum akan berada .

Misalnya, untuk rata-rata sampel, batasan tersebut ditetapkan berdasarkan hubungan berikut:

Batasan bagian sifat dalam populasi umum p.

Contoh pemecahan masalah dengan topik "Pengamatan sampel dalam statistik"

Tugas 1 . Ada informasi tentang keluaran produk (pekerjaan, layanan) yang diperoleh berdasarkan pengamatan sampel 10% dari perusahaan di wilayah tersebut:

Tentukan: 1) untuk perusahaan yang termasuk dalam sampel: a) ukuran rata-rata output per perusahaan; b) penyebaran volume produksi; c) bagian perusahaan dengan volume produksi lebih dari 400 ribu rubel; 2) untuk wilayah secara keseluruhan, dengan probabilitas 0,954, batas-batas yang dapat diperkirakan: a) volume produksi rata-rata per perusahaan; b) bagian perusahaan dengan volume produksi lebih dari 400 ribu rubel; 3) total volume output di daerah.

Larutan

Untuk mengatasi masalah tersebut, kami memperluas tabel yang diusulkan.

1) Untuk perusahaan yang termasuk dalam sampel, ukuran rata-rata output per perusahaan

110800/400 = 277 ribu rubel

Kami menghitung dispersi volume produksi dengan cara yang disederhanakan σ 2 = 35640000/400 - 277 2 = 89100 - 76229 = 12371.

Jumlah perusahaan yang volume produksinya melebihi 400 ribu rubel. sama dengan 36+12 = 48, dan bagiannya sama dengan ω = 48:400 = 0,12 = 12%.

2) Dari teori probabilitas diketahui bahwa dengan probabilitas P=0,954 faktor kepercayaan t=2. Kesalahan pengambilan sampel marjinal

2√12371:400 = 11,12 ribu rubel

Mari tentukan batas rata-rata umum: 277-11,12 ≤Xav ≤ 277+11,12; 265.88 ≤Xav ≤ 288.12

Kesalahan pengambilan sampel marjinal dari bagian perusahaan

2√0,12*0,88/400 = 0,03

Mari kita tentukan batas pembagian umum: 0,12-0,03≤ p ≤0,12+0,03; 0,09≤ p≤0,15

3) Karena kelompok usaha yang diperhitungkan adalah 10% dari total jumlah perusahaan di wilayah tersebut, maka secara keseluruhan terdapat 4.000 perusahaan di wilayah tersebut. Maka total volume output di wilayah tersebut berada dalam 265,88×4000≤Q≤288,12×4000; 1063520 ≤ Q ≤ 1152480

Tugas 2 . Menurut hasil audit pengendalian oleh otoritas pajak terhadap 400 struktur bisnis, 140 di antaranya tidak sepenuhnya mencantumkan penghasilan yang dikenai pajak dalam SPT mereka. Tentukan dalam populasi umum (untuk seluruh wilayah) pangsa struktur bisnis yang menyembunyikan sebagian dari pendapatan pajak mereka dengan probabilitas 0,954.

Larutan

Berdasarkan kondisi permasalahan, jumlah unit dalam populasi sampel adalah n=400, jumlah unit dengan fitur yang dipertimbangkan adalah m=140, probabilitasnya adalah P=0,954.

Dari teori probabilitas diketahui bahwa dengan probabilitas P=0,954 faktor kepercayaan t=2.

Proporsi unit yang memiliki atribut yang ditunjukkan ditentukan dengan rumus: p=w+∆p, di mana w = m/n=140/400=0,35=35%,
dan limit error fitur ∆p diperoleh dari rumus: ∆p= t √w(1-w)/n = 2√0.35×0.65/400 ≈ 0.5 = 5%

Maka p = 35±5%.

Menjawab : Porsi struktur bisnis yang menyembunyikan sebagian pendapatannya dari pajak dengan probabilitas 0,954 adalah 35±5%.