Ukuran sampel bagaimana menemukan rumus. Ukuran sampel - metode selektif penelitian sosiologis

Statistik tahu segalanya. Dan Ilf dan E. Petrov, "12 Kursi"

Bayangkan Anda sedang membangun sebuah pusat perbelanjaan besar dan Anda ingin mengevaluasi arus lalu lintas dari pintu masuk ke area parkir. Tidak, mari kita beri contoh lain… toh mereka tidak akan pernah melakukannya. Anda perlu mengevaluasi preferensi selera pengunjung portal Anda, untuk itu Anda perlu melakukan survei di antara mereka. Bagaimana menghubungkan jumlah data dan kemungkinan kesalahan? Tidak ada yang rumit - semakin besar sampel Anda, semakin kecil kesalahannya. Namun, ada juga nuansa di sini.

Minimum teoritis

Tidak akan berlebihan untuk menyegarkan ingatan kita, istilah-istilah ini akan berguna bagi kita nantinya.

  • populasi- Himpunan semua objek di antaranya penelitian sedang dilakukan.
  • Sampel– Subset, bagian dari objek dari seluruh populasi yang terlibat langsung dalam penelitian.
  • Kesalahan tipe I- (α) Probabilitas menolak hipotesis nol sementara hipotesis itu benar.
  • Kesalahan tipe II- () Probabilitas bukan menolak hipotesis nol ketika itu salah.
  • 1-β- Kekuatan statistik kriteria.
  • μ 0 dan 1- Nilai rata-rata di bawah hipotesis nol dan alternatif.


Sudah dalam definisi kesalahan jenis pertama dan kedua, ada ruang untuk perdebatan dan interpretasi. Bagaimana cara memutuskannya dan mana yang harus dipilih sebagai nol? Jika Anda memeriksa tingkat polusi tanah atau air, bagaimana Anda merumuskan hipotesis nol: apakah ada polusi atau tidak? Tapi dari ini ukuran sampel tergantung dari populasi umum objek.



Awal populasi, sebaik Sampel dapat memiliki distribusi apa pun, tetapi rata-rata memiliki normal atau Distribusi Gauss berkat Teorema Limit Pusat.


Mengenai parameter distribusi dan rata-rata pada khususnya, beberapa jenis inferensi dimungkinkan. Pertama diantaranya disebut selang kepercayaan. Ini menunjukkan kisaran nilai yang mungkin untuk parameter, dengan yang ditentukan faktor kepercayaan diri. Jadi misalnya 100(1-α)% interval kepercayaan untuk μ akan menjadi seperti ini (Lv. 1).




Kedua dari kesimpulan pengujian hipotesis. Bisa jadi seperti ini.

  • H 0: = h
  • H 1: > h
  • H2:< h

DARI selang kepercayaan 100(1-α) untuk μ Anda dapat membuat pilihan yang mendukung H 1 dan H 2:

  • Jika batas bawah selang kepercayaan 100(1-α)< h , то тогда tolak H 0 mendukung H2.
  • Jika batas atas selang kepercayaan 100(1-α) > j, maka tolak H 0 mendukung H1 .
  • Jika sebuah selang kepercayaan 100(1-α) termasuk h, maka kita tidak dapat menolak H 0 dan hasil seperti itu dianggap tidak pasti.

Jika kita perlu memeriksa nilainya μ untuk satu sampel dari total populasi, maka kriterianya akan berbentuk



Interval kepercayaan, kesalahan, dan ukuran sampel

Ambil persamaan pertama dan nyatakan lebarnya dari sana selang kepercayaan(Lv.2).



Dalam beberapa kasus, kita dapat mengganti t-statistik Student dengan distribusi normal standar z. Penyederhanaan lain menggantikan setengah dari w pada kesalahan pengukuran E. Maka persamaan kita akan berbentuk (Persamaan 3).



Seperti yang kita lihat errornya benar-benar berkurang seiring dengan bertambahnya jumlah data input. Dari mana mudah untuk mendapatkan apa yang Anda cari (Persamaan 4).


Latihan - hitung dengan R

Mari kita uji hipotesis bahwa nilai rata-rata sampel yang diberikan dari jumlah serangga dalam perangkap adalah 1.

  • H 0: = 1
  • H1: > 1
Serangga 0 1 2 3 4 5 6
jebakan 10 9 5 5 1 2 1

> x<- read.table("/tmp/tcounts.txt") >y = unlist(x, use.names="false") > mean(z);sd(z) 1.636364 1.654883

Perhatikan bahwa mean dan standar deviasi hampir sama, yang wajar untuk distribusi Poisson. Interval kepercayaan 95% untuk t-statistik Student dan df=32 .


> qt(.975, 32) 2.036933

dan akhirnya kita mendapatkan interval kritis untuk mean: 1.05 - 2.22 .


> =rata-rata(z) > st = qt(.975, 32) > + st * sd(z)/sqrt(33) 2.223159 > - st * sd(z)/sqrt(33) 1.049568

Akibatnya, H 0 harus ditolak dan H 1 diterima, karena dengan probabilitas 95%, μ > 1.


Dalam contoh yang sama, dengan asumsi kita mengetahui simpangan baku yang sebenarnya - σ , dan bukan perkiraannya yang diperoleh dengan menggunakan sampel acak, Anda dapat menghitung n yang diperlukan untuk kesalahan yang diberikan. Mari kita hitung untuk E=0.5 .


> za2 = qnorm(.975) > (za2*sd(z)/.5)^2 42.08144

koreksi angin

Faktanya, tidak ada alasan untuk percaya bahwa kita akan tahu σ (variasi), sedangkan μ (berarti) kami belum memperkirakan. Karena itu, persamaan 4 tidak banyak digunakan secara praktis, kecuali untuk contoh yang disempurnakan dari bidang kombinatorik, dan persamaan realistis untuk n agak lebih rumit untuk yang tidak diketahui. σ (Lv.5).



perhatikan itu σ dalam persamaan terakhir, bukan dengan cap (^), tetapi dengan tilde (~). Ini adalah konsekuensi dari fakta bahwa pada awalnya kami bahkan tidak memiliki standar deviasi yang diperkirakan dari sampel acak - , dan sebagai gantinya kami menggunakan berencana- . Di mana kita mendapatkan yang terbaru? Kita dapat mengatakan itu dari langit-langit: penilaian ahli, perkiraan kasar, pengalaman masa lalu, dll.


Dan bagaimana dengan suku kedua di ruas kanan persamaan ke-5, dari mana asalnya? Karena , diperlukan koreksi Günther.


Selain persamaan 4 dan 5, ada beberapa rumus perkiraan-evaluatif, tetapi ini sudah layak untuk posting terpisah.

Rumus di bawah untuk menghitung ukuran sampel digunakan dalam kasus di mana responden (responden) hanya ditanya satu pertanyaan, yang hanya ada dua kemungkinan jawaban. Misalnya, "Ya" dan "Tidak"; "Saya menggunakan" dan "Saya tidak menggunakan". Tentu saja, rumus ini hanya dapat diterapkan ketika melakukan studi yang paling sederhana. Jika Anda perlu menentukan ukuran sampel saat melakukan penelitian yang lebih besar, seperti kuesioner, maka rumus lain harus digunakan.

Rumus sederhana untuk menghitung ukuran sampel

di mana: n- ukuran sampel;

z adalah deviasi ternormalisasi yang ditentukan berdasarkan tingkat kepercayaan yang dipilih. Indikator ini mencirikan kemungkinan, kemungkinan mendapatkan jawaban dalam interval kepercayaan khusus. Dalam prakteknya, tingkat kepercayaan sering diambil sebagai 95% atau 99%. Maka nilai z masing-masing akan menjadi 1,96 dan 2,58;

p– variasi untuk sampel, dalam porsi. Intinya, p adalah probabilitas responden akan memilih satu atau beberapa opsi jawaban. Misalkan jika kita yakin bahwa seperempat responden akan memilih jawaban "Ya", maka p akan sama dengan 25%, yaitu, p = 0,25;

q= (1 – hal);

e– kesalahan yang diizinkan, dalam pecahan.

Contoh perhitungan ukuran sampel

Perusahaan berencana melakukan studi sosiologis untuk mengidentifikasi proporsi perokok dalam populasi kota. Untuk melakukan ini, karyawan perusahaan akan menanyakan satu pertanyaan kepada orang yang lewat: “Apakah Anda merokok?”. Jadi, hanya ada dua kemungkinan jawaban: "Ya" dan "Tidak".

Ukuran sampel dalam hal ini dihitung sebagai berikut. Tingkat kepercayaan diambil sebagai 95%, maka deviasi yang dinormalisasi z = 1,96. Kami menerima variasi sebagai 50%, yaitu, kami percaya secara kondisional bahwa setengah dari responden dapat menjawab pertanyaan apakah mereka merokok - "Ya". Kemudian p=0,5. Dari sini kita menemukan q = 1 – p = 1 – 0,5 = 0,5 . Sampling error yang dapat diterima diambil sebesar 10%, yaitu e = 0,1.

Kami mengganti data ini ke dalam rumus dan menghitung:

Mendapatkan ukuran sampel n = 96 orang.

Lingkup rumus ini

Saat melakukan penelitian sederhana, saat Anda perlu mendapatkan jawaban hanya untuk satu pertanyaan sederhana. Dalam hal ini, skala tanggapan, sebagai suatu peraturan, bersifat dikotomis. Artinya, jawaban yang ditawarkan (atau tersirat) dari jenis "Ya" - "Tidak", "Hitam" - "Putih", dll.

Fitur rumus ini untuk menghitung ukuran sampel

Galyautdinov R.R.


© Menyalin materi hanya diperbolehkan jika Anda menentukan hyperlink langsung ke

Populasi sering diadakan di antara kelompok besar orang. Seringkali keliru untuk berpikir bahwa keandalan hasil akan lebih tinggi jika pertanyaan dijawab oleh setiap anggota masyarakat. Karena waktu, uang, dan biaya tenaga kerja yang sangat besar, pemeriksaan semacam itu tidak dapat diterima. Dengan bertambahnya jumlah responden, tidak hanya biaya yang meningkat, tetapi risiko menerima data yang salah juga akan meningkat. Dari sudut pandang praktis, banyak kuesioner dan pembuat kode akan mengurangi kemungkinan kontrol yang dapat diandalkan atas tindakan mereka. Survei semacam itu disebut kontinu.

Dalam sosiologi, studi terputus-putus, atau metode selektif, paling sering digunakan. Hasilnya dapat diperluas ke sekelompok besar orang, yang disebut jenderal.

Pengertian dan Arti Metode Sampling

Metode pengambilan sampel adalah cara kuantitatif untuk memilih bagian dari satuan yang dipelajari dari total massa, sedangkan hasil survei juga akan berlaku untuk setiap individu yang tidak mengambil bagian dalam hal ini.

Metode pengambilan sampel adalah subjek penelitian ilmiah dan disiplin akademis. Ini bertindak sebagai sarana untuk memperoleh informasi yang dapat diandalkan tentang populasi umum dan membantu untuk mengevaluasi semua parameternya. Kondisi untuk memilih unit selanjutnya mempengaruhi analisis statistik hasil. Jika prosedur pengambilan sampel tidak diterapkan dengan baik, penggunaan metode yang paling andal sekalipun untuk memproses informasi yang dikumpulkan akan sia-sia.

Konsep Kunci Teori Pilihan

Mereka menyebut hubungan unit-unit, yang dengannya kesimpulan dari studi sampel dirumuskan. Itu bisa berupa penduduk satu negara, wilayah tertentu, tim kerja suatu perusahaan, dll.

Sampel (atau sampel) adalah bagian dari yang umum, yang dipilih dengan menggunakan metode dan kriteria khusus. Misalnya, kriteria statistik diperhitungkan dalam proses pembentukan.

Jumlah individu yang termasuk dalam himpunan tertentu disebut volumenya. Tetapi dapat dinyatakan tidak hanya dengan jumlah orang, tetapi juga dengan tempat pemungutan suara, pemukiman, yaitu unit-unit besar yang pasti termasuk unit pengamatan. Tapi ini sudah menjadi sampel multistage.

Unit seleksi adalah bagian-bagian penyusun populasi umum, dapat berupa unit pengamatan langsung (single stage sampling) atau formasi yang lebih besar.

Peran penting dalam memperoleh hasil penelitian yang andal dengan menggunakan metode pengambilan sampel adalah properti seperti keterwakilan seleksi. Artinya, bagian dari populasi umum yang menjadi responden harus sepenuhnya mereproduksi semua karakteristiknya. Setiap penyimpangan dianggap sebagai kesalahan.

Langkah-langkah untuk menerapkan metode pengambilan sampel

Setiap empiris terdiri dari tahapan. Jika metode pengambilan sampel diterapkan, urutannya akan diatur sebagai berikut:

  1. Pembuatan draf sampel: populasi umum ditetapkan, prosedur pemilihan, volume dicirikan.
  2. Pelaksanaan proyek: selama pengumpulan informasi sosiologis, kuesioner melakukan tugas dengan indikasi metode pemilihan responden.
  3. Identifikasi dan koreksi kesalahan keterwakilan.

Jenis-jenis sampel dalam sosiologi

Setelah menentukan populasi umum, peneliti melanjutkan ke prosedur selektif. Mereka dapat dibagi menjadi dua jenis (kriteria):

  1. Peran hukum probabilistik dalam pengambilan sampel.
  2. Banyaknya tahapan seleksi.

Jika kriteria pertama diterapkan, maka dibedakan metode random sampling dan non-random selection. Berdasarkan yang terakhir, dapat dikatakan bahwa sampel dapat berupa satu tahap dan multi-tahap.

Jenis sampel secara langsung tercermin tidak hanya dalam tahap persiapan dan pelaksanaan penelitian, tetapi juga dalam hasilnya. Sebelum memberikan preferensi pada salah satunya, Anda harus memahami isi konsepnya.

Definisi "acak" dalam penggunaan sehari-hari telah menerima arti yang sepenuhnya berlawanan daripada dalam matematika. Seleksi semacam itu dilakukan sesuai dengan aturan ketat, tidak ada penyimpangan darinya, karena penting untuk memastikan bahwa setiap unit populasi umum memiliki peluang yang sama untuk dimasukkan dalam sampel. Jika kondisi ini tidak terpenuhi, probabilitas ini akan berbeda.

Pada gilirannya, sampel acak dibagi menjadi:

  • sederhana;
  • mekanis (sistematis);
  • bersarang (serial, cluster);
  • bertingkat (tipikal atau dikategorikan).

Metode pengambilan sampel sederhana dilakukan dengan menggunakan tabel bilangan acak. Awalnya, ukuran sampel ditentukan; daftar lengkap responden bernomor yang termasuk dalam populasi umum dibuat. Tabel khusus yang terdapat dalam publikasi matematika dan statistik digunakan untuk seleksi. Selain mereka dilarang. Jika ukuran sampel adalah bilangan tiga digit, maka jumlah setiap unit sampling harus tiga digit, yaitu dari 001 hingga 790. Angka terakhir menunjukkan jumlah orang seluruhnya. Studi ini akan melibatkan orang-orang yang telah diberi nomor dalam rentang yang ditentukan, yang ditemukan dalam tabel.

Pemilihan sistematis didasarkan pada perhitungan. Daftar abjad dari semua elemen populasi umum dikompilasi terlebih dahulu, langkahnya ditetapkan, dan hanya kemudian - ukuran sampel. Rumus untuk langkah adalah sebagai berikut:

N: n, di mana N adalah populasi dan n adalah sampel.

Misalnya, 150.000: 5.000 = 30. Jadi, setiap orang ketiga puluh akan dipilih untuk berpartisipasi dalam survei.

Entitas tipe sarang

Sampel berkerumun digunakan ketika populasi orang yang diteliti terdiri dari kelompok-kelompok kecil yang alami. Dalam hal ini, perlu dicatat bahwa jumlah daftar sarang tersebut ditentukan pada langkah pertama. Dengan bantuan tabel angka acak, pemilihan dilakukan dan survei terus menerus terhadap semua responden di setiap sarang yang dipilih dilakukan. Selain itu, semakin banyak mereka mengambil bagian dalam penelitian, semakin kecil rata-rata kesalahan pengambilan sampel. Namun, dimungkinkan untuk menggunakan teknik seperti itu asalkan sarang yang dipelajari memiliki fitur yang serupa.

Inti dari pilihan bertingkat

Sampel bertingkat berbeda dari yang sebelumnya karena pada malam pemilihan, populasi umum dibagi menjadi strata, yaitu bagian homogen yang memiliki fitur umum. Misalnya tingkat pendidikan, preferensi elektoral, tingkat kepuasan terhadap berbagai aspek kehidupan. Pilihan paling sederhana adalah memisahkan subjek berdasarkan jenis kelamin dan usia. Pada prinsipnya, pemilihan harus dilakukan sedemikian rupa sehingga jumlah orang yang sebanding dengan jumlah total dipilih dari setiap strata.

Ukuran sampel dalam hal ini mungkin lebih kecil daripada dalam situasi dengan pemilihan acak, tetapi keterwakilan akan lebih tinggi. Harus diakui bahwa pengambilan sampel bertingkat akan menjadi yang paling mahal dalam hal keuangan dan informasi, dan pengambilan sampel bersarang akan menjadi yang paling bermanfaat dalam hal ini.

Pengambilan sampel kuota non-acak

Ada juga sampel kuota. Ini adalah satu-satunya jenis seleksi non-acak yang memiliki pembenaran matematis. Sampel kuota dibentuk dari unit-unit yang harus diwakili oleh proporsi dan sesuai dengan populasi umum. Dalam bentuk ini, distribusi fitur yang disengaja dilakukan. Jika pendapat dan penilaian orang termasuk di antara fitur yang dipelajari, maka jenis kelamin, usia, dan pendidikan responden seringkali menjadi kuota.

Dalam studi sosiologis, dua metode seleksi juga dibedakan: berulang dan tidak berulang. Dalam kasus pertama, unit yang dipilih setelah survei dikembalikan ke populasi umum untuk terus berpartisipasi dalam seleksi. Pada opsi kedua, responden diurutkan, yang meningkatkan kemungkinan anggota populasi yang tersisa untuk dipilih.

Sosiolog G. A. Churchill mengembangkan aturan berikut: ukuran sampel harus berusaha untuk memberikan setidaknya 100 pengamatan untuk primer dan 20-50 untuk komponen klasifikasi sekunder. Perlu diingat bahwa beberapa responden yang termasuk dalam sampel, karena berbagai alasan, tidak boleh ikut serta atau menolak sama sekali.

Metode untuk menentukan ukuran sampel

Dalam penelitian sosiologis, metode berikut dapat diterapkan:

1. Sewenang-wenang, yaitu ukuran sampel ditentukan dalam 5-10% dari komposisi populasi umum.

2. Metode penghitungan tradisional didasarkan pada survei yang dilakukan secara berkala, misalnya setahun sekali, terhadap 600, 2.000, atau 2.500 responden.

3. Statistik - adalah untuk menetapkan keandalan informasi. Statistika sebagai ilmu tidak berkembang dengan sendirinya. Subyek dan bidang penelitiannya aktif terlibat dalam bidang terkait lainnya: teknis, ekonomi dan kemanusiaan. Dengan demikian, metodenya digunakan dalam sosiologi, dalam mempersiapkan survei dan, khususnya, dalam menentukan ukuran sampel. Statistika sebagai ilmu memiliki dasar metodologis yang luas.

4. Mahal, di mana jumlah pengeluaran yang diperbolehkan untuk penelitian ditetapkan.

5. Besar sampel boleh sama dengan jumlah unit populasi umum, maka penelitian akan berlangsung terus menerus. Pendekatan ini dapat diterapkan dalam kelompok kecil. Misalnya tenaga kerja, mahasiswa, dll.

Sebelumnya, dimungkinkan untuk menetapkan bahwa sampel akan dianggap representatif ketika karakteristiknya menggambarkan sifat-sifat populasi umum dengan kesalahan minimum.

Memperkirakan ukuran sampel mendahului perhitungan akhir dari jumlah unit yang akan dipilih dari populasi umum:

n = Npqt 2: N∆ 2 p + pqt 2 , di mana N adalah jumlah unit dari populasi umum, p adalah bagian dari sifat yang diteliti (q = 1 - p), t adalah koefisien korespondensi dari probabilitas kepercayaan P (ditentukan dari tabel khusus), p - kesalahan yang diizinkan.

Ini hanyalah salah satu variasi tentang bagaimana ukuran sampel dihitung. Rumus dapat berubah tergantung pada kondisi dan kriteria studi yang dipilih (misalnya, pengambilan sampel ulang atau pengambilan sampel non-replika).

Kesalahan pengambilan sampel

Survei sosiologis populasi didasarkan pada penggunaan salah satu jenis pengambilan sampel yang telah kami pertimbangkan di atas. Namun, bagaimanapun, tugas setiap peneliti harus menilai tingkat keakuratan indikator yang diperoleh, yaitu, perlu untuk menentukan seberapa banyak indikator tersebut mencerminkan karakteristik populasi umum.

Kesalahan pengambilan sampel dapat dibagi menjadi acak dan tidak acak. Jenis pertama menyiratkan penyimpangan indikator sampel dari yang umum, yang dapat dinyatakan dengan perbedaan bagiannya (rata-rata) dan yang hanya disebabkan oleh jenis survei yang tidak berkelanjutan. Dan wajar jika indikator ini menurun dengan dilatarbelakangi peningkatan jumlah responden yang disurvei.

Kesalahan sistematis adalah penyimpangan dari indikator umum, juga ditemukan sebagai akibat dari pengurangan sampel dan bagian umum dan timbul dari ketidakkonsistenan metodologi pengambilan sampel dengan aturan yang ditetapkan.

Jenis kesalahan ini termasuk dalam kesalahan total sampling. Dalam suatu penelitian, hanya satu sampel yang dapat diambil dari populasi. Perhitungan kemungkinan penyimpangan maksimum dari indikator sampel dapat dilakukan dengan menggunakan rumus khusus. Ini disebut kesalahan sampling marginal. Ada juga yang namanya kesalahan sampling rata-rata. Ini adalah standar deviasi sampel dari bagian umum.

Ada juga jenis kesalahan a posteriori (pasca-eksperimental). Ini berarti penyimpangan indikator sampel dari pangsa umum (rata-rata). Ini dihitung dengan membandingkan indikator umum, informasi tentang yang berasal dari sumber yang dapat dipercaya, dan sampel, yang ditetapkan selama survei. Departemen personalia perusahaan, badan statistik negara sering bertindak sebagai sumber informasi yang andal.

Ada juga kesalahan apriori, yang juga merupakan penyimpangan dari sampel dan indikator umum, yang dapat dinyatakan sebagai perbedaan antara bagiannya dan dapat dihitung menggunakan rumus khusus.

Dalam penelitian pendidikan, kesalahan berikut paling sering dilakukan saat memilih responden untuk survei:

1. Kumpulan sampel dari kelompok-kelompok yang termasuk dalam populasi umum yang berbeda. Ketika mereka digunakan, kesimpulan statistik dikembangkan yang berlaku untuk seluruh sampel. Sangat jelas bahwa ini tidak dapat diterima.

2. Kemampuan organisasi dan keuangan peneliti tidak diperhitungkan ketika jenis sampel dipertimbangkan, dan salah satunya diberikan preferensi.

3. Kriteria statistik untuk struktur populasi umum tidak digunakan sepenuhnya untuk mencegah kesalahan pengambilan sampel.

4. Persyaratan keterwakilan pemilihan responden dalam studi banding tidak diperhitungkan.

5. Instruksi untuk pewawancara harus disesuaikan dengan jenis seleksi khusus yang diadopsi.

Sifat partisipasi responden dalam penelitian ini bisa terbuka atau anonim. Ini harus diperhitungkan ketika membentuk sampel, karena, setelah tidak setuju dengan persyaratan, peserta dapat pergi.

Saat merancang observasi sampel, muncul pertanyaan tentang ukuran sampel yang diperlukan. Jumlah ini dapat ditentukan atas dasar kesalahan yang diperbolehkan dalam pengambilan sampel, atas dasar probabilitas atas dasar yang besarnya kesalahan yang akan ditetapkan dapat dijamin, dan akhirnya berdasarkan metode pemilihan.

Rumus untuk ukuran sampel yang diperlukan untuk berbagai metode pengambilan sampel dapat diturunkan dari rasio yang sesuai yang digunakan dalam menghitung kesalahan pengambilan sampel marginal. Berikut adalah ekspresi praktik yang paling umum digunakan untuk ukuran sampel yang diperlukan:

pengambilan sampel acak dan mekanis yang tepat:

(pemilihan ulang)

(pilihan tidak berulang)

sampel khas:

(pemilihan ulang)

(pilihan tidak berulang)

pengambilan sampel serial:

(pemilihan ulang)

(pilihan tidak berulang)

Dalam hal ini, tergantung pada tujuan penelitian, varians dan kesalahan pengambilan sampel dapat dihitung untuk nilai rata-rata atau proporsi sifat tersebut.

Mari kita perhatikan contoh penentuan ukuran sampel yang diperlukan untuk berbagai metode pembentukan populasi sampel.

Contoh 5 Di 100 agen perjalanan kota, direncanakan untuk melakukan survei jumlah rata-rata bulanan voucher yang terjual dengan metode seleksi mekanis. Berapa ukuran sampel sehingga dengan probabilitas 0,683 kesalahan tidak melebihi 3 voucher, jika, menurut survei percontohan, variansnya adalah 225.

Larutan. Hitung ukuran sampel yang dibutuhkan:

Agensi.

Contoh 6 Untuk menentukan proporsi karyawan bank umum di wilayah yang berusia di atas 40 tahun, direncanakan untuk mengatur sampel tipikal yang sebanding dengan jumlah karyawan pria dan wanita dengan seleksi mekanis dalam kelompok. Jumlah pegawai bank tersebut berjumlah 12 ribu orang, terdiri dari 7 ribu laki-laki dan 5 ribu perempuan.

Berdasarkan survei sebelumnya, rata-rata varians dalam kelompok diketahui 1600. Tentukan ukuran sampel yang diperlukan dengan probabilitas 0,997 dan kesalahan 5%.

Larutan. Hitung ukuran total sampel tipikal:

rakyat

Sekarang mari kita hitung volume kelompok tipikal individu:

rakyat

rakyat

Dengan demikian, besar sampel yang dibutuhkan karyawan bank adalah 550 orang, termasuk. 319 pria dan 231 wanita.

Contoh 7 Perusahaan saham gabungan memiliki 200 tim pekerja. Direncanakan akan dilakukan survei sampel untuk mengetahui proporsi pekerja dengan penyakit akibat kerja. Diketahui bahwa varians antar seri dari proporsi adalah 225. Dengan probabilitas 0,954, hitung jumlah tim yang diperlukan untuk survei pekerja jika kesalahan pengambilan sampel tidak melebihi 5%.

Larutan. Jumlah brigade yang dibutuhkan akan dihitung berdasarkan rumus volume sampling non-repetitif serial:

brigade.

3. Menentukan ukuran sampel yang dibutuhkan

Sangat penting untuk menentukan ukuran sampel yang optimal, yang dengan probabilitas tertentu akan memberikan akurasi hasil pengamatan yang ditentukan. Dengan bertambahnya ukuran sampel, kesalahan pengambilan sampel berkurang. Tetapi karena unit sampel untuk survei sering dihancurkan, laju pengambilan sampel unit dalam sampel harus optimal. Ukuran sampel yang optimal dapat diperoleh dari rumus kesalahan pengambilan sampel.

Tabel 8.4

Rumus untuk menentukan ukuran sampel yang optimal

Metode pemilihan

Untuk rata-rata

Self-random berulang

Acak dan mekanis tidak dapat diulang

Tipologis tidak berulang

Serial non-repetitif dengan seri yang sama

Rumus menunjukkan bahwa dengan meningkatnya kesalahan pengambilan sampel yang diperkirakan, ukuran sampel yang dibutuhkan berkurang secara signifikan.

Untuk menghitung ukuran sampel, Anda perlu mengetahui variansnya. Ini dapat dipinjam dari survei sebelumnya dari populasi yang sama atau serupa, atau survei sampel ad hoc dengan ukuran kecil dapat dilakukan.

Contoh 2 : Di perusahaan, 100 pekerja dari 1000 diwawancarai dalam urutan sampel acak non-berulang dan data berikut diperoleh pada pendapatan mereka untuk bulan Oktober (Tabel 8.5).

Tabel 8.5

Distribusi pekerja menurut pendapatan bulanan rata-rata

Mendefinisikan:

1) pendapatan bulanan rata-rata karyawan perusahaan ini, menjamin hasil dengan probabilitas 0,997;

2) bagian pekerja perusahaan dengan penghasilan bulanan 19 ribu rubel. dan lebih tinggi, menjamin hasil dengan probabilitas 0,954;

3) ukuran sampel yang diperlukan dalam menentukan pendapatan bulanan rata-rata karyawan perusahaan, sehingga dengan probabilitas 0,954 kesalahan pengambilan sampel marjinal tidak melebihi 200 rubel.

Larutan:

1) Mari kita tentukan pendapatan bulanan rata-rata karyawan perusahaan ini, menjamin hasilnya dengan probabilitas 0,997.

n= 100 orang

N= 1000 orang

Larutan: untuk menentukan interval pendapatan bulanan rata-rata karyawan suatu perusahaan tertentu dalam populasi umum, perlu diketahui nilai kesalahan pengambilan sampel marjinal dan ukuran pendapatan bulanan rata-rata pekerja menurut sampel survei .


t dan kesalahan pengambilan sampel rata-rata .

Karena P \u003d 0,997, maka (menurut Tabel 8.2) t= 3.

Sebuah pilihan acak non-berulang dibuat, menurut tabel. 8.3 kami memilih rumus untuk menghitung kesalahan pengambilan sampel rata-rata untuk rata-rata:

, di mana
adalah varians sampel.

Besar kecilnya pendapatan bulanan rata-rata pekerja menurut sampel survei akan ditentukan dengan rumus rata-rata tertimbang aritmatika:
.

Perhitungan tambahan akan dilakukan pada tabel berikut:

pendapatan bulanan,

Jumlah pekerja, pers.

Titik tengah interval

ribu rubel.

ribu rubel.

Penuh arti t dan
Mari kita tentukan nilai kesalahan sampling marginal:

Ribu menggosok.

Maka interval pendapatan bulanan rata-rata para pekerja di perusahaan ini adalah sebagai berikut:

;

.

Jawaban: pendapatan bulanan rata-rata karyawan perusahaan ini dengan probabilitas 0,997 berada di kisaran 18,08 ribu rubel. hingga 18,92 ribu rubel.

2) Mari kita tentukan bagian pekerja perusahaan dengan penghasilan bulanan 19 ribu rubel. dan lebih tinggi, menjamin hasil dengan probabilitas 0,954.

n= 100 orang

N= 1000 orang

Larutan: untuk menentukan interval bagian pekerja dengan pendapatan bulanan 19 ribu rubel. dan di atas, perlu diketahui nilai kesalahan sampling marginal dari proporsi
dan proporsi pekerja dengan pendapatan bulanan rata-rata ini menurut sampel W.

Kesalahan pengambilan sampel marjinal ditentukan oleh rumus
. Itu tergantung pada nilai faktor kepercayaan t dan kesalahan sampling rata-rata.

Karena P \u003d 0,954, maka (menurut Tabel 8.2) t= 2.

Sebuah pilihan acak non-berulang dibuat, menurut tabel. 8.3 pilih rumus untuk menghitung kesalahan pengambilan sampel rata-rata untuk bagian:

, di mana W- bagian pekerja perusahaan dengan pendapatan bulanan rata-rata 19 ribu rubel. dan lebih tinggi dalam sampel.

Bagian sampel ditentukan oleh rasio jumlah unit yang memiliki sifat yang diteliti m dengan jumlah total unit pengambilan sampel n, atau
.

Maka rata-rata kesalahan bagian tersebut adalah

Penuh arti t dan tentukan nilai kesalahan sampling marginal untuk pecahan:

Kemudian interval bagian pekerja dengan pendapatan bulanan 19 ribu rubel. ke atas pada populasi umum adalah sebagai berikut:

.

Jawaban: bagian pekerja perusahaan dengan penghasilan bulanan 19 ribu rubel. dan lebih tinggi, dengan probabilitas 0,954 berada pada kisaran 19,4% hingga 36,6%.

    Mari kita tentukan ukuran sampel yang diperlukan saat menentukan pendapatan bulanan rata-rata karyawan perusahaan, sehingga dengan probabilitas 0,954 kesalahan pengambilan sampel marjinal tidak melebihi 200 rubel.

N= 1000 orang

Larutan: ukuran sampel yang diperlukan untuk menentukan pendapatan bulanan rata-rata ditentukan dengan rumus (menurut Tabel 8.4):

Berdasarkan kondisi soal, diketahui: dengan probabilitas P = 0,954 t\u003d 2 (lihat tabel. 8.2);

0,2 ribu rubel;
(sesuai dengan sampel sebelumnya).

rakyat

Jawaban: sehingga dengan probabilitas 0,954 kesalahan sampling marginal tidak melebihi 200 rubel, 189 orang harus diperiksa.

4.5. Penentuan ukuran sampel

Prosedur desain sampel meliputi: solusi berurutan dari tiga tugas berikut:

Pengertian objek penelitian;

Penentuan struktur sampel;

Menentukan ukuran sampel.

Biasanya, objek riset pemasaran adalah seperangkat objek pengamatan, yang dapat berupa konsumen, karyawan perusahaan, perantara, dll. Jika populasi ini sangat kecil sehingga tim peneliti memiliki kemampuan tenaga, keuangan, dan waktu yang diperlukan untuk menjalin kontak dengan masing-masing elemennya, maka cukup realistis untuk melakukan studi berkelanjutan terhadap seluruh populasi. Dalam hal ini, setelah menentukan objek penelitian, Anda dapat melanjutkan ke prosedur berikutnya (memilih metode pengumpulan data, alat penelitian, dan metode komunikasi dengan audiens).

Namun, dalam praktiknya, sangat sering tidak mungkin atau tidak tepat untuk melakukan studi berkelanjutan terhadap seluruh populasi. Mungkin ada alasan berikut untuk ini:

Ketidakmungkinan menjalin kontak dengan beberapa elemen populasi;

Tingginya biaya yang tidak wajar untuk melakukan studi secara tuntas atau adanya keterbatasan finansial yang tidak memungkinkan dilakukannya studi secara tuntas;

Waktu singkat yang dialokasikan untuk penelitian, karena hilangnya relevansi informasi dari waktu ke waktu atau alasan lain, dan yang tidak memungkinkan pengumpulan, sistematisasi, dan analisis data yang ekstensif untuk seluruh populasi.

Oleh karena itu, populasi yang besar dan tersebar sering dipelajari dengan bantuan sampel, yang seperti Anda ketahui, dipahami sebagai bagian dari populasi, yang dirancang untuk mewakili populasi secara keseluruhan.

Keakuratan sampel mencerminkan populasi secara keseluruhan bergantung pada struktur dan ukuran sampel.

Ada dua pendekatan untuk struktur sampel:- probabilistik dan deterministik.

Pendekatan probabilistik untuk struktur sampel mengasumsikan bahwa setiap elemen populasi dapat dipilih dengan probabilitas tertentu (bukan nol). Ada berbagai jenis sampel berdasarkan teori probabilitas (tipikal, bersarang, dll.). Yang paling sederhana dan paling umum dalam praktiknya adalah sampel acak sederhana, di mana setiap elemen populasi memiliki probabilitas yang sama untuk dipilih untuk penelitian.

Pengambilan sampel probabilistik lebih akurat, memungkinkan peneliti untuk menilai tingkat keandalan data yang telah dikumpulkannya, meskipun lebih rumit dan lebih mahal daripada pengambilan sampel deterministik.

Pendekatan Deterministik untuk sampel struktur mengasumsikan bahwa pemilihan elemen populasi dilakukan dengan metode baik berdasarkan pertimbangan kenyamanan, atau pada keputusan peneliti, atau pada kelompok kontingen.

untuk alasan kenyamanan, terdiri dalam memilih elemen populasi berdasarkan kemudahan menjalin kontak dengan mereka. Ketidaksempurnaan metode ini mungkin disebabkan oleh rendahnya keterwakilan sampel yang diperoleh, karena: elemen populasi yang nyaman bagi peneliti mungkin tidak cukup mewakili karakteristik populasi karena pemilihannya yang tidak acak dan tidak masuk akal.

Namun, di sisi lain, kesederhanaan, keekonomisan, dan efisiensi studi yang dilakukan dengan metode ini telah membuatnya mendapatkan distribusi yang cukup luas dalam praktik dan, di atas segalanya, dalam melakukan studi pendahuluan yang bertujuan untuk mengklarifikasi masalah utama.

Metode pengambilan sampel berdasarkan atas keputusan peneliti, terdiri dalam memilih elemen-elemen populasi, yang, menurut pendapatnya, adalah perwakilan karakteristiknya. Metode ini lebih sempurna dari yang sebelumnya, karena didasarkan pada orientasi terhadap perwakilan karakteristik dari populasi yang diteliti, meskipun mereka dipilih berdasarkan ide subjektif peneliti tentangnya.

Metode pengambilan sampel berdasarkan norma kontingen, terdiri dari pemilihan elemen-elemen karakteristik populasi sesuai dengan karakteristik populasi yang diperoleh sebelumnya secara keseluruhan. Karakteristik ini dapat diperoleh dengan melakukan studi pendahuluan dan, tidak seperti metode sebelumnya, tidak subjektif. Oleh karena itu, metode ini lebih maju, memungkinkan untuk memperoleh populasi sampel yang tidak kalah representatif dari sampel probabilitas dengan biaya yang jauh lebih rendah untuk melakukan survei.

Setelah memilih struktur sampel (pendekatan pembentukannya, jenis probabilistik atau formasi pelemparan sampel deterministik), peneliti harus menentukan volume, mis. jumlah elemen sampel.

Ukuran sampel menentukan keandalan informasi diperoleh sebagai hasil dari penelitiannya, serta biaya yang diperlukan untuk penelitian tersebut. Ukuran sampel tergantung pada tingkat keseragaman atau keragaman objek yang diteliti.

Semakin besar ukuran sampel, semakin tinggi akurasinya dan semakin besar biaya untuk melakukan surveinya. Dengan pendekatan probabilistik terhadap struktur sampel, volumenya dapat ditentukan dengan menggunakan rumus statistik yang terkenal, berdasarkan persyaratan yang ditentukan untuk akurasinya.

Dalam prakteknya, beberapa pendekatan digunakan untuk menentukan ukuran sampel:

1. Pendekatan sewenang-wenang berdasarkan penerapan "aturan praktis". Misalnya, diasumsikan tanpa bukti bahwa untuk mendapatkan hasil yang akurat, sampel harus 5% dari populasi. Pendekatan ini sederhana dan mudah diterapkan, tetapi tidak mungkin untuk menetapkan keakuratan hasil yang diperoleh. Dengan populasi yang cukup besar, itu juga bisa cukup mahal.

Ukuran sampel dapat diatur berdasarkan kondisi tertentu yang telah ditentukan sebelumnya. Misalnya, pelanggan riset pasar tahu bahwa ketika mempelajari opini publik, sampelnya biasanya 1000-1200 orang, jadi dia menyarankan agar peneliti tetap berpegang pada angka ini. Dalam hal survei tahunan dilakukan di pasar tertentu, sampel dengan ukuran yang sama digunakan setiap tahun. Berbeda dengan pendekatan pertama, di sini, ketika menentukan ukuran sampel, logika yang diketahui digunakan, yang, bagaimanapun, sangat rentan.

Misalnya, ketika melakukan studi tertentu, akurasi mungkin kurang dari studi opini publik, dan ukuran populasi mungkin berkali-kali lebih kecil daripada studi opini publik. Dengan demikian, pendekatan ini tidak memperhitungkan keadaan saat ini dan bisa sangat mahal.

Dalam beberapa kasus, biaya melakukan survei digunakan sebagai argumen utama dalam menentukan ukuran sampel. Dengan demikian, anggaran untuk riset pemasaran menyediakan biaya untuk melakukan survei tertentu, yang tidak dapat dilampaui. Jelas, nilai informasi yang diterima tidak diperhitungkan. Namun, dalam beberapa kasus bahkan sampel kecil dapat memberikan hasil yang cukup akurat.

Tampaknya masuk akal untuk mempertimbangkan biaya tidak secara mutlak, tetapi dalam kaitannya dengan kegunaan informasi yang diperoleh sebagai hasil survei. Klien dan peneliti harus mempertimbangkan ukuran sampel yang berbeda dan metode pengumpulan data, biaya, faktor lain

2. Ukuran sampel dari tingkat interval kepercayaan kesalahan yang diizinkan, yang, sebagaimana telah disebutkan, diberikan oleh akurasi yang tepat dari generalisasi akhir: dari meningkat menjadi perkiraan. Namun, di sini kita mengingat apa yang disebut kesalahan acak yang terkait dengan sifat kesalahan statistik apa pun. Merekalah yang dihitung sebagai kesalahan keterwakilan sampel probabilistik.

V. I. Paniotto memberikan perhitungan sampel representatif berikut dengan asumsi kesalahan 5 persen (Tabel 4.2).

Tabel 4.2

Perkiraan tabel sampel

Untuk populasi lebih dari 100.000, sampelnya adalah 400 unit. Namun, jika kita mengingat populasi umum 5 ribu atau lebih, maka, menurut perhitungan penulis yang sama, dimungkinkan untuk menunjukkan besarnya kesalahan pengambilan sampel yang sebenarnya tergantung pada volumenya, yang sangat penting bagi kita. , mengingat besarnya kesalahan yang diperbolehkan tergantung pada tujuan penelitian dan tidak harus mendekati tingkat 5 persen.

Tabel 4.3

tabel perhitungan

Seiring dengan kesalahan acak, kesalahan sistematis mungkin terjadi. Mereka bergantung pada organisasi sampel survei. Ini adalah berbagai bias sampel terhadap salah satu kutub parameter sampel.

3. Ukuran sampel berdasarkan analisis statistik . Pendekatan ini didasarkan pada penentuan ukuran sampel minimum berdasarkan persyaratan tertentu untuk keandalan dan keandalan hasil. Ini juga digunakan dalam analisis hasil yang diperoleh untuk subkelompok individu yang dibentuk sebagai bagian dari sampel berdasarkan jenis kelamin, usia, tingkat pendidikan, dll. Persyaratan untuk keandalan dan akurasi hasil untuk masing-masing subkelompok menentukan persyaratan tertentu untuk ukuran sampel secara keseluruhan.

Pendekatan yang paling dibenarkan secara teoritis dan benar untuk menentukan ukuran sampel didasarkan pada perhitungan interval yang dapat diandalkan. Konsep variasi mencirikan besarnya ketidaksamaan (similarity) jawaban responden terhadap suatu pertanyaan tertentu. Dalam arti yang lebih ketat, variasi nilai atribut apa pun dalam agregat adalah perbedaan nilainya di antara berbagai unit agregat yang diberikan dalam periode atau titik waktu yang sama. Hasil jawaban atas pertanyaan survei biasanya disajikan dalam bentuk kurva distribusi (Gbr. 4.1). Dengan kesamaan tanggapan yang tinggi, mereka berbicara tentang variasi kecil (kurva distribusi sempit) dan dengan kesamaan jawaban yang rendah, variasi tinggi (kurva distribusi luas).

Sebagai ukuran variasi, biasanya diambil standar deviasi, yang mencirikan jarak rata-rata dari skor rata-rata jawaban setiap responden terhadap pertanyaan tertentu.

Variasi kecil

variasi tinggi

Beras. 4.1. Kurva Variasi dan Distribusi

Karena semua keputusan pemasaran dibuat dalam kondisi ketidakpastian, disarankan untuk mempertimbangkan keadaan ini saat menentukan ukuran sampel. Karena definisi nilai yang dipelajari untuk populasi dalam skala sempit dilakukan berdasarkan statistik sampel, perlu untuk menetapkan rentang (interval kepercayaan) di mana perkiraan untuk populasi secara keseluruhan diharapkan jatuh, dan kesalahan dalam penentuannya.

Interval kepercayaan adalah rentang yang titik ekstremnya sesuai dengan persentase tertentu dari jawaban tertentu atas suatu pertanyaan. Interval kepercayaan terkait erat dengan standar deviasi dari sifat yang dipelajari dalam populasi umum: semakin besar, semakin lebar interval kepercayaan yang seharusnya untuk memasukkan persentase tertentu dari tanggapan.

Interval kepercayaan 95% atau 99% adalah standar dalam riset pemasaran. Tidak ada perusahaan yang melakukan riset pasar dengan banyak sampel. Dan statistik matematis memungkinkan untuk memperoleh beberapa informasi tentang distribusi sampel, hanya memiliki data tentang variasi sampel tunggal.

Indikator sejauh mana perkiraan yang benar untuk populasi secara keseluruhan berbeda dari perkiraan yang diharapkan untuk sampel tipikal adalah kesalahan standar. Selain itu, semakin besar ukuran sampel, semakin kecil kesalahannya. Nilai variasi yang tinggi menyebabkan nilai error yang tinggi dan sebaliknya.

Ketika pertanyaan yang diberikan hanya memiliki dua jawaban, dinyatakan sebagai persentase (ukuran persentase digunakan), ukuran sampel ditentukan oleh rumus berikut:

di mana n adalah ukuran sampel; z adalah deviasi ternormalisasi yang ditentukan berdasarkan tingkat kepercayaan yang dipilih; p adalah variasi yang ditemukan untuk sampel; g - (100-r); e adalah kesalahan yang dapat diterima.

Saat menentukan indikator variasi untuk populasi tertentu, pertama-tama disarankan untuk melakukan analisis kualitatif pendahuluan dari populasi yang diteliti, pertama-tama, untuk menetapkan kesamaan unit populasi dalam hal demografis, sosial, dan lainnya. menarik bagi peneliti. Dimungkinkan untuk melakukan studi percontohan, dengan menggunakan hasil studi serupa yang dilakukan di masa lalu. Saat menggunakan ukuran persentase variabilitas, keadaan diperhitungkan bahwa variabilitas maksimum dicapai untuk p = 50%, yang merupakan kasus terburuk. Selain itu, indikator ini tidak secara radikal mempengaruhi ukuran sampel. Pendapat pelanggan studi tentang ukuran sampel juga diperhitungkan.

Dimungkinkan untuk menentukan ukuran sampel berdasarkan penggunaan rata-rata daripada persentase.

dimana s adalah simpangan baku.

Dalam prakteknya, jika sampel dibentuk baru dan survei serupa belum dilakukan, maka s tidak diketahui. Dalam hal ini, disarankan untuk menentukan galat e dalam pecahan standar deviasi. Rumus perhitungan dikonversi dan mengambil bentuk berikut:

di mana .

Di atas, kita berbicara tentang agregat dengan ukuran yang sangat besar. Namun, dalam beberapa kasus populasinya tidak besar. Biasanya, jika sampelnya kurang dari lima persen dari populasi, maka populasi tersebut dianggap besar dan perhitungannya dilakukan menurut aturan di atas. Jika ukuran sampel melebihi 5% dari populasi, maka yang terakhir dianggap kecil dan faktor koreksi dimasukkan ke dalam rumus di atas.

Ukuran sampel dalam hal ini ditentukan sebagai berikut:

,

Kerja Praktek No. 8. “Menentukan besar sampel yang dibutuhkan”

"Menentukan ukuran sampel yang dibutuhkan"

Jenis pengamatan terputus yang paling luas adalah pengamatan selektif, di mana tidak semua unit populasi yang diteliti diperiksa, tetapi hanya sebagian tertentu dari mereka yang dipilih.

Seluruh himpunan objek (pengamatan) yang akan dipelajari disebut populasi umum. Sampel populasi atau sampel disebut bagian dari populasi umum, dipilih untuk mempelajari sifat-sifat yang memberikan keterwakilan.

Pemilihan dari populasi umum dilakukan sedemikian rupa sehingga, berdasarkan sampel, ide yang cukup akurat tentang parameter utama populasi secara keseluruhan dapat diperoleh. Dalam hal ini, kita berbicara tentang perkiraan titik, yang diambil sebagai nilai yang sesuai dari rata-rata, bagian, dll., yang diperoleh sebagai hasil dari sampel, dan perkiraan interval, mis. tentang batas-batas di mana, dengan probabilitas tertentu, nilai parameter yang diinginkan dalam populasi umum dapat. Syarat utama yang harus dipenuhi sampel adalah syarat keterwakilannya, yaitu keterwakilan.

Dalam statistik, hasil pengamatan terus menerus kadang-kadang dievaluasi sebagai karakteristik selektif. Penafsiran data yang diperoleh seperti itu terjadi dalam kasus di mana jumlah unit yang diperiksa kecil dan tidak ada keyakinan kuat bahwa karakteristik yang diteliti tidak dapat mengambil nilai lain selain yang diidentifikasi sebagai hasil pengamatan. Saat melakukan eksperimen, jumlah nilai bisa sangat besar, oleh karena itu, ketika merumuskan kesimpulan berdasarkan jumlah terbatasnya, perlu untuk mempertimbangkan data yang diperoleh sebagai karakteristik selektif.

Ketika memperluas hasil survei sampel ke populasi umum, perlu diingat bahwa mungkin ada perbedaan antara karakteristik populasi umum dan sampel, karena fakta bahwa tidak seluruh populasi yang disurvei, tetapi hanya sebagian. itu.

Kesalahan pengamatan statistik nilai penyimpangan antara nilai yang dihitung dan nilai sebenarnya dari karakteristik objek yang diteliti dipertimbangkan.

Metode pengambilan sampel memberikan penghematan yang signifikan dalam sumber daya material dan keuangan saat melakukan pengamatan statistik, yang memungkinkan untuk memperluas program survei dan meningkatkan efisiensinya. Keuntungan kedua adalah keandalan yang tinggi dari data yang diperoleh, karena dengan ukuran sampel yang relatif kecil, dimungkinkan untuk mengatur kontrol yang efektif atas kualitas informasi yang dikumpulkan. Dengan demikian, kemungkinan terjadinya kesalahan pendaftaran dan tidak terdeteksinya mereka pada tahap verifikasi informasi primer berkurang. Dan terakhir, dalam beberapa kasus, ketika pengamatan lengkap dikaitkan dengan kerusakan atau pembusukan unit yang diperiksa (misalnya, saat memeriksa kualitas produk makanan yang masuk ke pasar), hanya survei selektif yang mungkin dilakukan.

Keakuratan perkiraan yang diperoleh berdasarkan metode pengambilan sampel tidak tergantung pada proporsi unit yang disurvei, tetapi pada jumlahnya.

Tahapan utama observasi selektif;

1) penetapan tujuan, tugas dan penyusunan program observasi;

2) pengambilan sampel;

3) pengumpulan data berdasarkan program yang dikembangkan;

4) analisis hasil yang diperoleh dan perhitungan karakteristik utama sampel;

5) perhitungan kesalahan pengambilan sampel dan distribusi hasilnya kepada populasi umum.

Membedakan jenis sampel:

1) acak(sebenarnya acak);

2) mekanis(misalnya, setiap 10, 20, dst.);

3) khas (bertingkat), ketika populasi umum dibagi menjadi beberapa kelompok dan beberapa objek diperiksa dalam setiap kelompok));

4) serial (bersarang) ketika seluruh seri dipilih secara acak.

Cara paling sederhana untuk membentuk populasi sampel adalah dengan pemilihan acak yang tepat. Landasan teoretis dari metode pengambilan sampel, yang awalnya dikembangkan dalam kaitannya dengan pemilihan acak yang sebenarnya, juga digunakan untuk menentukan kesalahan pengambilan sampel dalam metode pengamatan lainnya.

Sebenarnya pemilihan acak dapat diulang dan tidak berulang. Pada ulang Dalam seleksi, setiap unit yang dipilih secara acak dari populasi umum, setelah pengamatan dikembalikan ke populasi ini, dapat diperiksa kembali. Dalam praktiknya, metode seleksi ini jarang terjadi. Jauh lebih umum sebenarnya acak tidak berulang seleksi di mana unit yang disurvei tidak dikembalikan ke populasi dan tidak dapat disurvei ulang. Dengan pemilihan berulang, probabilitas dimasukkan dalam sampel untuk setiap unit populasi umum tetap tidak berubah. Dengan pemilihan non-berulang, itu berubah, tetapi untuk semua unit yang tersisa dalam populasi umum setelah pemilihan beberapa unit darinya, probabilitas untuk dimasukkan dalam sampel adalah sama.

Akurasi - tingkat kesalahan dalam hasil survei atau ukuran interval kepercayaan.

Akurasi absolut diberikan oleh interval tertentu di mana nilai perkiraan seharusnya.

Akurasi relatif didefinisikan relatif terhadap tingkat estimasi parameter.

Keyakinan adalah tingkat keyakinan bahwa perkiraan mendekati nilai sebenarnya.

Beberapa faktor kualitatif harus dipertimbangkan ketika menentukan ukuran sampel: pentingnya keputusan yang akan dibuat, sifat penelitian, jumlah variabel, sifat analisis, ukuran sampel yang digunakan dalam penelitian tersebut, cakupan tingkat, tingkat penyelesaian, dan kendala sumber daya. Ukuran sampel yang ditentukan secara statistik adalah ukuran sampel bersih, atau final, yaitu unit populasi yang tersisa setelah mengecualikan calon responden yang tidak memenuhi kriteria yang diberikan atau belum menyelesaikan wawancara. Tergantung pada tingkat cakupan dan kelengkapan, ukuran sampel awal yang jauh lebih besar mungkin diperlukan. Dalam riset pemasaran komersial, kurangnya waktu, uang, dan orang-orang yang baik dapat menjadi penting dalam menentukan ukuran sampel. Dalam Proyek Studi Loyalitas Department Store, ukuran sampel ditentukan dengan tepat karena alasan ini.

Metode interval kepercayaan:

Penentuan ukuran sampel dengan metode interval kepercayaan didasarkan pada pembuatannya di sekitar rata-rata sampel atau fraksi sampel menggunakan rumus kesalahan standar. Sebagai contoh, misalkan seorang peneliti menggunakan pengambilan sampel acak sederhana untuk memilih sampel 300 rumah tangga untuk memperkirakan pengeluaran bulanan rumah tangga untuk berbelanja di department store dan menentukan bahwa pengeluaran rumah tangga rata-rata bulanan dalam sampel adalah $ 182. Studi sebelumnya menunjukkan bahwa RMS penyimpangan pengeluaran dalam populasi penelitian adalah $55.

Kami ingin menemukan interval di mana persentase tertentu dari rata-rata sampel akan turun. Misalkan kita ingin menentukan interval di sekitar rata-rata populasi yang mencakup 95% rata-rata sampel, berdasarkan sampel dari 300 keluarga; 95% rata-rata sampel dapat dibagi menjadi dua bagian yang sama, setengah lebih sedikit dan setengah lebih banyak dari rata-rata, seperti yang ditunjukkan pada Gambar. 1. Perhitungan selang kepercayaan meliputi penentuan luas kurang dari (XL) dan lebih besar dari (XU) nilai rata-rata (X) biaya.

Nilai z-factor yang sesuai dengan XL dan XU dapat dihitung sebagai berikut:

Oleh karena itu, nilai minimum X didefinisikan sebagai

dan nilai maksimum

Sekarang mari kita tetapkan interval kepercayaan 95% di sekitar rata-rata sampel $182. Pertama, kita akan menghitung kesalahan standar rata-rata:

95% pusat dari distribusi normal berada dalam -1,96 nilai-z; Interval kepercayaan 95% didefinisikan sebagai

Jadi, interval kepercayaan 95% meluas dari $175,77 ke $ 188,23 Ada kemungkinan 95% bahwa rata-rata sebenarnya dari populasi yang diamati adalah antara $175,77 dan $ 188,23.

Metode Rata-rata:

Metode yang digunakan untuk membuat interval kepercayaan dapat dimodifikasi untuk menentukan ukuran sampel yang diberikan interval kepercayaan yang diinginkan. Misalkan Anda ingin menghitung pengeluaran department store bulanan keluarga dengan lebih akurat sehingga hasilnya berada dalam kisaran $5,0 dari rata-rata sebenarnya dari populasi yang diteliti. Apa yang harus menjadi ukuran sampel? Tabel berisi daftar tindakan yang diperlukan yang harus Anda lakukan.


  • 1. Tentukan tingkat akurasi. Ini adalah perbedaan maksimum yang diijinkan (D) antara rata-rata sampel dan rata-rata populasi. Dalam contoh kita, D = +$5.0
  • 2. Tentukan tingkat kepercayaan. Asumsikan tingkat kepercayaan yang diinginkan adalah 95%.
  • 3. Tentukan nilai deviasi ternormalisasi z terkait dengan tingkat kepercayaan yang diberikan. Pada tingkat kepercayaan 95%, probabilitas bahwa rata-rata populasi akan berada di luar interval satu sisi adalah 0,025 (0,05/2). Nilai z yang sesuai adalah 1,96.
  • 4. Tentukan simpangan baku rata-rata populasi. Ini dapat diperoleh dari sumber sekunder atau dihitung dari studi percontohan. Selain itu, standar deviasi dapat diatur berdasarkan pendapat peneliti. Misalnya, kisaran variabel yang terdistribusi normal kira-kira enam standar deviasi (tiga ke kiri dan tiga ke kanan mean).

5. Tentukan ukuran sampel menggunakan rumus kesalahan standar mean

Dalam contoh kita

(dibulatkan ke atas ke bilangan bulat terdekat).

Hal ini dapat dilihat dari rumus ukuran sampel yang tumbuh dengan peningkatan variabilitas (dispersi) dari populasi umum, serta dengan peningkatan tingkat keandalan dan tingkat akurasi yang perhitungannya harus dilakukan. . Ukuran sampel berbanding lurus dengan Q2, sehingga semakin besar varians populasi, semakin besar ukuran sampel. Demikian pula, tingkat kepercayaan yang lebih tinggi menyiratkan nilai z yang lebih besar dan oleh karena itu ukuran sampel yang lebih besar. Variabel Q2 dan z ada di pembilangnya. Meningkatkan tingkat akurasi dicapai dengan mengurangi nilai D dan, oleh karena itu, meningkatkan ukuran sampel, karena D adalah penyebut.

6. Jika ukuran sampel 10% atau lebih dari ukuran populasi, maka penyesuaian populasi akhir (fpc) ​​diterapkan. Kemudian ukuran sampel yang dibutuhkan dihitung dengan rumus

7. Jika simpangan baku populasi o tidak diketahui dan digunakan nilai taksirannya, maka harus dihitung ulang setelah sampel diperoleh. Standar deviasi sampel s digunakan sebagai tebakan untuk Q. Interval kepercayaan yang dikoreksi kemudian harus dihitung untuk menentukan tingkat akurasi yang sebenarnya diperoleh.

Misalkan nilai 55,00 digunakan sebagai tebakan untuk a karena nilai sebenarnya tidak diketahui. Didapatkan sampel dimana n = 465. Berdasarkan data penelitian, mean X dihitung sebesar 180,00 dan simpangan baku sampel s sebesar 50,00. Maka interval kepercayaan yang dikoreksi adalah:

Perhatikan bahwa interval kepercayaan yang dihasilkan sudah diperkirakan. Ini karena standar deviasi populasi terlalu tinggi berdasarkan karakteristik sampel.

8. Kadang-kadang akurasi didefinisikan dalam istilah relatif daripada absolut. Dengan kata lain, dapat diketahui bahwa hasil perhitungan harus plus atau minus R% dari rata-rata. Dalam hal ini, ukuran sampel dapat didefinisikan sebagai:

Ukuran populasi N tidak secara langsung mempengaruhi ukuran sampel, kecuali bila faktor penyesuaian populasi akhir diterapkan. Ini mungkin tampak luar biasa, tetapi jika Anda memikirkannya, pernyataan ini masuk akal. Misalnya, jika karakteristik yang dipelajari dari semua elemen populasi adalah identik, maka sampel yang terdiri dari satu elemen cukup untuk menghitung rata-rata. Ini juga benar jika populasi terdiri dari 50, 500, 5000, atau 50.000 item. Pada saat yang sama, variabilitas karakteristik populasi secara langsung mempengaruhi ukuran sampel. Variabilitas ini diperhitungkan saat menghitung ukuran sampel menggunakan varians umum Q2 atau varians sampel s2.

Bagikan metode:

Jika statistik yang dipelajari tidak diwakili oleh rata-rata, tetapi oleh pangsa, maka pemasar menentukan ukuran sampel dengan cara yang sama. Misalkan peneliti tertarik untuk menentukan proporsi rumah tangga yang memiliki kartu kredit department store. Prosedurnya adalah sebagai berikut.

1. Tentukan tingkat akurasi. Misalkan tingkat akurasi yang diinginkan sedemikian rupa sehingga interval toleransi diatur ke

D \u003d p - l \u003d ± 0,05.

  • 2. Tentukan tingkat kepercayaan. Asumsikan bahwa tingkat kepercayaan 95% diinginkan.
  • 3. Tentukan nilai z yang terkait dengan tingkat kepercayaan yang diberikan. Seperti yang dijelaskan saat menghitung rata-rata, itu akan menjadi 1,96.
  • 4. Tentukan proporsi total n Seperti yang kami tunjukkan sebelumnya, itu dapat diperoleh dari sumber sekunder, selama studi eksperimental, atau berdasarkan pendapat peneliti. Asumsikan bahwa, berdasarkan data sekunder, peneliti membuat asumsi bahwa 64% keluarga dalam populasi yang diteliti memiliki kartu kredit department store. Oleh karena itu, l = 0,64.
  • 5. Tentukan ukuran sampel menggunakan rumus kesalahan standar proporsi:

Dalam contoh kita

  • (dibulatkan ke atas ke bilangan bulat terdekat).
  • 6. Jika ukuran sampel akhir adalah 10% atau lebih dari ukuran populasi, penyesuaian populasi akhir (fpc) ​​diterapkan. Kemudian ukuran sampel yang dibutuhkan dihitung dengan rumus

di mana n adalah ukuran sampel sebelum menerapkan koreksi akhir; nc adalah ukuran sampel setelah menerapkan koreksi akhir.

7. Jika perhitungan TC salah, maka selang kepercayaan akan lebih atau kurang akurat dari yang diperlukan. Misalkan pada akhir sampel, nilai share p dihitung sama dengan 0,55. Interval kepercayaan kemudian dihitung ulang, dengan sp digunakan untuk menghitung Qp yang tidak diketahui, sebagai berikut:

Dalam contoh kita

Interval kepercayaan kemudian 0,55 ± 1,96 (0,0264) = 0,55 + 0,052, yang berarti lebih lebar dari yang ditentukan. Hal ini dijelaskan oleh fakta bahwa simpangan baku sampel p = 0,55 ternyata lebih besar dari nilai taksiran simpangan baku populasi umum pada n = 0,64.

Jika interval yang lebih besar dari interval yang ditentukan tidak dapat diterima, ukuran sampel dapat disesuaikan untuk mencerminkan kemungkinan penyimpangan maksimum dalam populasi. Penyimpangan seperti itu terjadi ketika produk l (1 - l) mencapai nilai maksimumnya, di mana l harus sama dengan 0,5. Kesimpulan ini dapat dicapai tanpa perhitungan. Karena setengah dari populasi memiliki satu nilai karakteristik dan setengah lainnya memiliki nilai karakteristik lainnya, lebih banyak data akan diperlukan untuk menarik kesimpulan yang benar daripada ketika situasinya lebih jelas didefinisikan dan sebagian besar elemen memiliki nilai karakteristik yang sama. Dalam contoh kita, ini akan menghasilkan ukuran sampel

  • (dibulatkan ke atas ke bilangan bulat terdekat).
  • 8. Kadang-kadang akurasi didefinisikan dalam istilah relatif daripada absolut. Dengan kata lain, dapat diketahui bahwa hasil perhitungan harus plus atau minus R% dari proporsi populasi. Artinya D = Rl. Dalam hal ini, ukuran sampel dapat didefinisikan sebagai: