Tentukan m rata-rata aritmatika dengan metode momen. Perhitungan rata-rata aritmatika yang dibobot dengan metode momen

Dengan sejumlah besar pengamatan atau dengan nilai numerik yang besar, opsi yang digunakan

cara yang disederhanakan untuk menghitung mean aritmatika adalah metode momen.

M = A+ iSap

di mana M adalah mean aritmatika; A - rata-rata bersyarat; i - interval antara opsi grup;

S - tanda penjumlahan.; a - penyimpangan bersyarat dari setiap opsi dari rata-rata bersyarat;

p adalah frekuensi kemunculan varian; n adalah jumlah pengamatan.

Contoh menghitung mean aritmatika dengan metode momen (berat badan rata-rata

anak laki-laki di bawah usia 18 tahun)

V (n dalam kg) R sebuah (V-A) sebuah. R
+2 +4
+1 +3
M o \u003d 62
-1 -6
-2 -8
-3 -3
n = 25 Sar \u003d - 10 kg

Tahapan menghitung rata-rata dengan metode momen:

2) kami menentukan "a" - penyimpangan bersyarat opsi dari rata-rata bersyarat, untuk ini kami mengurangi rata-rata bersyarat dari setiap opsi: a \u003d V - A, (misalnya, a \u003d 64 - 62 \u003d + 2, dll).

3) kami mengalikan deviasi bersyarat "a" dengan frekuensi "p" dari setiap opsi dan mendapatkan produk a p;

4) tentukan jumlah Sa. p = - 10kg

5) menghitung mean aritmatika dengan metode momen:

M = A + i Getah\u003d 62 - 1 × 0,4 \u003d 61,6 kg

Dengan demikian, kita dapat menyimpulkan bahwa dalam kelompok pria muda yang dipelajari oleh kami, berat badan rata-rata

Rata-rata aritmatika dengan sendirinya tidak mengatakan apa-apa tentang deret variasi dari mana

dia diperhitungkan. Kekhasannya (keandalan) dipengaruhi oleh homogenitas yang dipertimbangkan

variabilitas material dan seri.

Contoh: dua deret variasi yang identik dalam jumlah pengamatan diberikan, di mana

menyajikan data pengukuran lingkar kepala anak usia 1 sampai 2 tahun

Memiliki jumlah pengamatan yang sama dan rata-rata aritmatika yang sama (M = 46 cm), deret tersebut

memiliki perbedaan distribusi di dalamnya. Jadi varian baris pertama secara umum menyimpang dari

rata-rata aritmatika dengan nilai lebih rendah dari opsi baris kedua, yang memberikan

kemungkinan untuk mengasumsikan bahwa rata-rata aritmatika (46 cm) lebih khas untuk yang pertama

baris daripada yang kedua.

Dalam statistik, untuk mengkarakterisasi keragaman deret variasi, mereka menggunakan rata-rata

simpangan baku(s)

Ada dua cara untuk menghitung simpangan baku: mean aritmatika

cara dan cara saat. Dengan metode perhitungan rata-rata aritmatika, rumus yang digunakan:

di mana d adalah deviasi sebenarnya dari setiap opsi dari mean sebenarnya M. Rumus ini digunakan ketika

sejumlah kecil pengamatan (n<30)

Rumus untuk menentukan s dengan metode momen:

di mana a adalah deviasi bersyarat dari opsi dari rata-rata bersyarat;

Momen derajat kedua, dan momen derajat pertama, kuadrat.

Telah dibuktikan secara teoritis dan praktis bahwa jika, dengan sejumlah besar pengamatan, ke rata-rata

aritmatika menambah dan mengurangi 1s (M ± 1s), kemudian dalam nilai yang diperoleh

68,3% dari semua varian seri variasi akan ditemukan. Jika ke mean aritmatika

tambah dan kurangi 2s (M ± 2s), maka 95,5% akan berada dalam nilai yang diperoleh

semua pilihan. M ±3s mencakup 99,7% dari semua varian seri variasi.

Berdasarkan ketentuan ini, dimungkinkan untuk memeriksa kekhasan rata-rata aritmatika untuk

seri variasi dari mana ia dihitung. Untuk ini, perlu rata-rata

tambahkan aritmatika dan kurangi tiga kali s (M ± 3s) darinya. Jika dalam batas

diberikan kecocokan deret variasi, maka rata-rata aritmatika adalah tipikal, yaitu dia adalah

mengungkapkan keteraturan dasar dari seri dan dapat digunakan.

Ketentuan ini banyak digunakan dalam pengembangan berbagai standar (pakaian,

sepatu, perabot sekolah, dll.).

Derajat keanekaragaman sifat dalam deret variasi dapat diperkirakan dengan koefisien

variasi(rasio simpangan baku dengan rata-rata aritmatika,

dikalikan 100%)

Dengan v = s x 100

Pada Cv kurang dari 10%, keragaman yang lemah dicatat, pada Cv 10-20% - rata-rata, dan pada lebih dari 20% -

keragaman sifat yang kuat.

Penilaian keandalan hasil studi statistik

Seperti yang telah kami katakan, hasil yang paling dapat diandalkan dapat diperoleh dengan menerapkan

metode kontinu yaitu ketika mempelajari populasi umum.

Sementara itu, studi tentang populasi umum dikaitkan dengan kerja keras yang signifikan.

Oleh karena itu, dalam penelitian biomedis, sebagai suatu peraturan, selektif

pengamatan. Sehingga data yang diperoleh dari penelitian populasi sampel dapat

dipindahkan ke populasi umum, perlu untuk menilai keandalannya

hasil studi statistik. Kerangka sampling mungkin tidak cukup

sepenuhnya mewakili populasi, sehingga pengamatan sampel selalu

disertai dengan kesalahan keterwakilan. Dengan ukuran kesalahan rata-rata (m), seseorang dapat menilai

bagaimana rata-rata sampel yang ditemukan berbeda dari rata-rata umum

agregat. Kesalahan kecil menunjukkan kedekatan indikator ini, kesalahan besar seperti

tidak memberikan kepercayaan.

Nilai kesalahan rata-rata dari rata-rata aritmatika dipengaruhi oleh dua keadaan berikut.

Pertama, homogenitas bahan yang dikumpulkan: semakin kecil dispersi varian di sekitarnya

meannya, semakin kecil kesalahan keterwakilan. Kedua, jumlah pengamatan:

kesalahan rata-rata akan semakin kecil, semakin besar jumlah pengamatan.

Kesalahan rata-rata dari mean aritmatika dihitung menggunakan rumus berikut:

Kesalahan rata-rata (kesalahan keterwakilan) untuk nilai relatif ditentukan oleh

rumus:

di mana m p adalah rata-rata kesalahan indikator;

p - indikator dalam% atau dalam% o

q - (100 -p), (1000 -p)

n - jumlah total pengamatan

289 pasien meninggalkan institusi medis, 12 di antaranya meninggal.

Nilai relatif (angka kematian) p = (12:289)x100 = 4,1%; q=100 -p=

100-4.1 \u003d 95.9, dari mana

m p = ±

Dengan demikian, nilai relatif pada pemeriksaan ulang akan sesuai dengan

Batas kepercayaan adalah nilai maksimum dan minimum di mana

untuk tingkat probabilitas tertentu dari perkiraan bebas kesalahan, mungkin ada relatif

indikator atau rata-rata dalam populasi umum

Batas keyakinan dari nilai relatif dalam populasi umum ditentukan oleh

Gen P = P sampel ± tm m

Batas kepercayaan rata-rata aritmatika dalam populasi umum ditentukan oleh rumus:

Gen M = M pilih ± tm m

di mana gen P dan gen M adalah nilai relatif dan rata-rata yang diperoleh untuk umum

agregat.

P vyb dan M vyb - nilai nilai relatif dan rata-rata yang diperoleh untuk populasi sampel.

m p dan m m - kesalahan keterwakilan untuk nilai rata-rata dan relatif.

t - kriteria keandalan.

Ditetapkan bahwa jika t = 1, keandalan tidak melebihi 68%; jika t=2 -95%; jika t=3- 99%

Dalam penelitian medis dan biologi, dianggap cukup jika kriteria:

keyakinan t 2 (95% keyakinan)

Untuk menemukan kriteria t untuk jumlah pengamatan £ 30, perlu menggunakan khusus

meja

Ketika ukuran kesalahan keterwakilan berkurang, batas kepercayaan berkurang.

nilai rata-rata dan relatif, yaitu hasil penelitian ditentukan, mendekati

nilai yang sesuai dari populasi umum. Jika kesalahan keterwakilan

besar, maka dapatkan batas kepercayaan yang besar, yang mungkin bertentangan

penilaian logis dari nilai yang diinginkan dalam populasi umum. Batas kepercayaan

juga tergantung pada tingkat kemungkinan ramalan bebas kesalahan yang dipilih oleh peneliti. Pada

tingkat probabilitas yang tinggi dari rentang perkiraan bebas kesalahan dari batas kepercayaan

M cf - dihitung menggunakan metode momen = 61,6 kg

Rata-rata aritmatika memiliki tiga sifat.

1. Yang tengah menempati posisi tengah dalam seri variasi . Dalam baris yang sangat simetris: M \u003d M 0 \u003d M e.

2. Rata-rata adalah nilai yang menggeneralisasi dan fluktuasi acak, perbedaan data individu tidak terlihat di belakang rata-rata, itu mengungkapkan bahwa tipikal yang menjadi ciri seluruh populasi . Rata-rata digunakan setiap kali perlu untuk mengecualikan pengaruh acak dari faktor individu, untuk mengidentifikasi fitur umum, pola yang ada, untuk mendapatkan ide yang lengkap dan mendalam tentang fitur yang paling umum dan karakteristik dari seluruh kelompok.

3. Jumlah deviasi semua opsi dari mean adalah nol : S(V-M)=0 . Hal ini dikarenakan nilai rata-rata melebihi dimensi beberapa varian dan lebih kecil dari dimensi varian lainnya.

Dengan kata lain, penyimpangan sebenarnya dari varian dari mean sebenarnya (d=v-m) bisa positif atau negatif, jadi jumlahnya S semua "+"d dan "-"d sama dengan nol.

Properti rata-rata ini digunakan saat memeriksa kebenaran perhitungan M. Jika jumlah deviasi varian dari mean adalah nol, maka kita dapat menyimpulkan bahwa mean dihitung dengan benar. Properti ini didasarkan pada metode momen untuk menentukan M. Lagi pula, jika rata-rata bersyarat TETAPI akan sama dengan benar M, maka jumlah deviasi varian dari rata-rata bersyarat akan sama dengan nol.

Peran rata-rata dalam biologi sangat besar. Di satu sisi, mereka digunakan untuk mengkarakterisasi fenomena secara keseluruhan, di sisi lain, mereka diperlukan untuk mengevaluasi kuantitas individu. Saat membandingkan nilai individu dengan rata-rata, karakteristik berharga diperoleh untuk masing-masingnya. Penggunaan rata-rata membutuhkan kepatuhan yang ketat pada prinsip homogenitas populasi. Pelanggaran prinsip ini mendistorsi gagasan tentang proses nyata.

Perhitungan rata-rata dari populasi yang heterogen secara sosial ekonomi membuat mereka fiktif, terdistorsi. Oleh karena itu, untuk menggunakan rata-rata dengan benar, seseorang harus yakin bahwa rata-rata tersebut mencirikan populasi statistik yang homogen.

KARAKTERISTIK KEANEKARAGAMAN TANDA B

STATISTIK POPULASI

Nilai fitur ini atau itu tidak sama untuk semua anggota populasi, meskipun relatif homogen. Misalnya, dalam kelompok anak-anak yang homogen dalam hal usia, jenis kelamin, dan tempat tinggal, tinggi badan setiap anak berbeda dengan tinggi badan teman sebayanya. Demikian pula tentang jumlah kunjungan individu ke poliklinik, tentang kadar protein darah pada setiap penderita rematik, tentang tingkat tekanan darah pada individu dengan hipertensi, dll. Hal ini menunjukkan keragaman, fluktuasi masuk ke populasi yang diteliti. Variabilitas dapat direpresentasikan secara menantang dengan contoh pertumbuhan dalam kelompok remaja.



Statistik memungkinkan kita untuk mengkarakterisasi ini dengan kriteria khusus yang menentukan tingkat keragaman setiap fitur dalam kelompok tertentu. Kriteria tersebut antara lain: limit (lim), amplitudo seri (Saya), simpangan baku (s) dan koefisien variasi (C v). Karena masing-masing kriteria ini memiliki nilai independennya sendiri, maka perlu untuk memikirkannya secara terpisah.

Membatasi- ditentukan oleh nilai ekstrim dari varian dalam seri variasi

Amplitudo (Saya) - perbedaan ekstrim

Batas dan amplitudo - berikan beberapa informasi tentang tingkat keragaman pertumbuhan di setiap kelompok. Namun, baik limit maupun amplitudo deret tersebut memiliki satu kelemahan yang signifikan. Mereka hanya memperhitungkan keragaman varian ekstrem dan tidak memungkinkan memperoleh informasi tentang keragaman suatu sifat dalam agregat, dengan mempertimbangkan struktur internalnya. Faktanya adalah bahwa keragaman dimanifestasikan tidak begitu banyak dalam varian ekstrem seperti dalam analisis seluruh struktur internal kelompok. Oleh karena itu, kriteria ini dapat digunakan untuk karakterisasi perkiraan keanekaragaman, terutama dengan sejumlah kecil pengamatan (n<30).

Deskripsi paling lengkap tentang keragaman suatu sifat dalam kelompok diberikan oleh apa yang disebut simpangan baku, dilambangkan dengan huruf Yunani "sigma" -s.

Ada dua cara untuk menghitung simpangan baku: rata-rata aritmatika dan metode momen.

Dengan metode penghitungan rata-rata aritmatika, rumus digunakan di mana: d- penyimpangan sebenarnya dari varian dari rata-rata yang sebenarnya (V-M).

Rumus digunakan dengan sejumlah kecil pengamatan (n<30), когда в вариационном ряду все частоты p= 1.

Pada R> 1 gunakan rumus seperti ini:

Dengan adanya teknologi komputer, rumus ini juga digunakan untuk sejumlah besar pengamatan.

Rumus ini dirancang untuk menentukan "sigma" dengan metode momen:

di mana:sebuah- penyimpangan bersyarat dari rata-rata bersyarat ( V-A); p- frekuensi kemunculan varian; n- pilihan nomor; saya- ukuran interval antar kelompok.

Metode ini digunakan dalam kasus-kasus di mana tidak ada teknologi komputer, dan deret variasi menjadi rumit baik karena banyaknya pengamatan maupun karena varian yang dinyatakan dalam bilangan multi-nilai. Dengan jumlah pengamatan sama dengan 30 atau kurang, pada saat derajat kedua P ganti untuk (P-1).

Seperti dapat dilihat dari rumus simpangan baku (4), penyebutnya adalah ( P-1), yaitu ketika jumlah pengamatan sama dengan atau kurang dari 30 (n £ 30), perlu untuk mengambil penyebut dari rumus ( P-satu). Jika, ketika menentukan mean aritmatika M memperhitungkan semua elemen deret, kemudian, menghitung sebuah, perlu untuk mengambil tidak semua kasus, tetapi satu kurang (hal-1).

Dengan banyaknya observasi (n>30), penyebut rumus adalah P, Jadi sebagai unit tidak mengubah hasil perhitungan dan karena itu secara otomatis dihilangkan.

Perlu dicatat bahwa standar deviasi adalah nilai bernama, sehingga harus memiliki sebutan yang sama untuk varian dan mean aritmatika (dimensi - kg, lihat km, dll.).

Perhitungan simpangan baku dengan metode momen dilakukan setelah dilakukan perhitungan nilai rata-rata.

Ada kriteria lain yang mencirikan tingkat keragaman nilai sifat dalam agregat, - koefisien variasi.

Koefisien variasi (Cv)- adalah ukuran relatif keragaman, karena dihitung sebagai persentase dari standar deviasi (a) untuk rata-rata aritmatika (M). Rumus untuk koefisien variasi adalah:

Untuk penilaian perkiraan tingkat keragaman suatu sifat, gradasi berikut dari koefisien variasi digunakan. Jika koefisien lebih dari 20%, maka keragaman yang kuat dicatat; pada 20-10% - rata-rata, dan jika koefisiennya kurang dari 10%, maka keragamannya dianggap lemah.

Koefisien variasi digunakan ketika membandingkan derajat keragaman fitur yang memiliki perbedaan ukuran fitur atau dimensi yang tidak sama. Misalkan Anda ingin membandingkan tingkat keragaman berat badan pada bayi baru lahir dan anak berusia 5 tahun. Jelas bahwa bayi yang baru lahir akan selalu memiliki "sigma" yang lebih sedikit daripada anak-anak berusia tujuh tahun, karena berat badan mereka masing-masing lebih sedikit. Standar deviasi akan lebih kecil dimana nilai fitur itu sendiri lebih kecil. Dalam hal ini, untuk menentukan perbedaan tingkat keragaman, perlu untuk tidak fokus pada standar deviasi, tetapi pada ukuran relatif keragaman - koefisien variasi v.

Koefisien variasi juga sangat penting untuk menilai dan membandingkan tingkat keragaman beberapa fitur dengan dimensi yang berbeda. Dengan standar deviasi masih tidak mungkin untuk menilai perbedaan tingkat keragaman karakter yang ditunjukkan. Untuk melakukan ini, Anda perlu menggunakan koefisien variasi - Cv.

Standar deviasi terkait dengan struktur rangkaian distribusi fitur. Secara skematis, ini dapat direpresentasikan sebagai berikut.

Teori statistik telah membuktikan bahwa dengan distribusi normal dalam M ± s ada 68% dari semua kasus, dalam M ± 2s - 95,5% dari semua kasus, dan dalam M ± 3s - 99,7% dari semua kasus yang membentuk populasi . Dengan demikian, M±3s mencakup hampir seluruh seri variasi.

Posisi teoritis statistik tentang keteraturan struktur deret ini sangat penting untuk aplikasi praktis dari standar deviasi. Anda dapat menggunakan aturan ini untuk memperjelas - pertanyaan tentang kekhasan rata-rata. Jika 95% dari semua varian berada dalam M ± 2s, maka rata-rata - adalah karakteristik untuk seri ini dan tidak diperlukan untuk menambah jumlah pengamatan secara agregat. Untuk menentukan kekhasan mean, distribusi aktual dibandingkan dengan distribusi teoritis dengan menghitung deviasi sigma.

Signifikansi praktis dari standar deviasi juga terletak pada kenyataan bahwa mengetahui M dan s, adalah mungkin untuk membuat deret variasi yang diperlukan untuk penggunaan praktis. Sigma ( s) juga digunakan untuk membandingkan derajat keragaman karakteristik yang homogen, misalnya ketika membandingkan fluktuasi (variabilitas) tumbuh kembang anak di perkotaan dan perdesaan. Mengetahui sigma ( s), dimungkinkan untuk menghitung koefisien variasi (Cv) yang diperlukan untuk membandingkan tingkat keragaman fitur yang dinyatakan dalam unit pengukuran yang berbeda (sentimeter, kilogram, dll.). Ini memungkinkan Anda untuk mengidentifikasi tanda-tanda yang lebih stabil (permanen) dan kurang stabil dalam agregat.

Membandingkan koefisien variasi (CV), adalah mungkin untuk menarik kesimpulan tentang fitur apa yang paling stabil dalam totalitas fitur. Standar deviasi (s) Hal ini juga digunakan untuk mengevaluasi fitur individu dari satu objek. Standar deviasi menunjukkan berapa banyak sigma ( s) dari rata-rata (M) pengukuran individu ditolak.

Standar deviasi ( s) dapat digunakan dalam biologi dan ekologi dalam pengembangan masalah norma dan patologi.

Akhirnya, standar deviasi merupakan komponen penting dari rumus t m- kesalahan rata-rata dari rata-rata aritmatika (kesalahan keterwakilan):

di mana t m- kesalahan rata-rata dari mean aritmatika (kesalahan keterwakilan), P- jumlah pengamatan.

keterwakilan. Landasan teoretis yang paling penting dari keterwakilan disorot di atas pada bagian pengambilan sampel dan populasi umum. Keterwakilan berarti keterwakilan dalam kumpulan sampel dari semua karakteristik yang dipertimbangkan (jenis kelamin, usia, profesi, masa kerja, dll.) dari unit pengamatan yang membentuk populasi umum. Keterwakilan populasi sampel ini dalam kaitannya dengan populasi umum dicapai dengan bantuan metode seleksi khusus, yang dijelaskan di bawah ini.

Penilaian reliabilitas hasil penelitian didasarkan pada landasan teori keterwakilan.

PENILAIAN KEANDALAN HASIL PENELITIAN

Keandalan indikator statistik harus dipahami sebagai tingkat kesesuaiannya dengan realitas yang dicerminkannya. Hasil yang dapat diandalkan adalah hasil yang tidak mendistorsi dan secara benar mencerminkan realitas objektif.

Untuk menilai reliabilitas hasil penelitian berarti menentukan dengan probabilitas apa yang mungkin untuk mentransfer hasil yang diperoleh dari populasi sampel ke seluruh populasi.

Dalam kebanyakan penelitian, peneliti, sebagai suatu peraturan, harus berurusan dengan sebagian dari fenomena yang diteliti, dan mentransfer kesimpulan berdasarkan hasil penelitian semacam itu ke seluruh fenomena secara keseluruhan - ke populasi umum.

Dengan demikian, penilaian reliabilitas diperlukan untuk menilai fenomena secara keseluruhan, keteraturannya, dengan bagian dari fenomena tersebut.

Penilaian reliabilitas hasil penelitian meliputi penentuan:

1) kesalahan keterwakilan (kesalahan rata-rata sarana aritmatika dan nilai relatif) - t;

2) batas kepercayaan nilai rata-rata (atau relatif);

3) keandalan perbedaan antara nilai rata-rata (atau relatif)
(sesuai dengan kriteria
t );

4) reliabilitas selisih antar kelompok yang dibandingkan menurut kriteriac 2 .

1. Penentuan kesalahan rata-rata dari nilai rata-rata (atau relatif) (kesalahan keterwakilan) - yaitu.

Kesalahan perwakilan ( m) adalah nilai statistik terpenting yang diperlukan untuk menilai keandalan hasil penelitian. Kesalahan ini terjadi dalam kasus-kasus ketika diperlukan untuk mengkarakterisasi fenomena secara keseluruhan sebagian. Kesalahan-kesalahan ini tidak bisa dihindari. Mereka berasal dari sifat pengambilan sampel; populasi umum dapat dicirikan oleh populasi sampel hanya dengan beberapa kesalahan, diukur dengan kesalahan keterwakilan.

Kesalahan keterwakilan tidak boleh disamakan dengan gagasan kesalahan yang biasa: metodologis, akurasi pengukuran, aritmatika, dll.

Besarnya kesalahan keterwakilan menentukan seberapa besar hasil yang diperoleh selama pengamatan selektif berbeda dari hasil yang dapat diperoleh dengan melakukan studi terus menerus terhadap semua elemen populasi umum tanpa kecuali.

Ini adalah satu-satunya jenis kesalahan yang dicatat oleh metode statistik, yang tidak dapat dihilangkan kecuali transisi ke studi berkelanjutan dibuat. Kesalahan keterwakilan dapat direduksi menjadi nilai yang cukup kecil, yaitu hingga nilai kesalahan yang diperbolehkan. Hal ini dilakukan dengan memasukkan jumlah pengamatan yang cukup dalam sampel. (P).

Setiap rata-rata adalah M(durasi rata-rata perawatan, tinggi rata-rata, berat badan rata-rata, tingkat protein darah rata-rata, dll.), serta masing-masing nilai relatif - R(angka kematian, morbiditas, dll.) harus disajikan dengan kesalahan rata-rata - t. Jadi, rata-rata aritmatika sampel (M) memiliki kesalahan keterwakilan, yang disebut kesalahan rata-rata rata-rata aritmatika (m m) dan ditentukan oleh rumus:

Seperti yang dapat dilihat dari rumus ini, nilai rata-rata kesalahan rata-rata aritmatika berbanding lurus dengan derajat keragaman fitur dan berbanding terbalik dengan akar kuadrat dari jumlah pengamatan. Oleh karena itu, penurunan besarnya kesalahan ini dalam menentukan derajat keanekaragaman ( s) dimungkinkan dengan meningkatkan jumlah pengamatan.

Prinsip ini menjadi dasar metode penentuan jumlah observasi yang cukup untuk suatu sampel studi.

Nilai relatif (R), yang diperoleh dalam studi sampel juga memiliki kesalahan keterwakilan sendiri, yang disebut kesalahan rata-rata dari nilai relatif dan dilambangkan m p

Untuk menentukan kesalahan rata-rata dari nilai relatif (R) rumus berikut digunakan:

di mana R- nilai relatif. Jika indikator dinyatakan dalam persentase, maka q=100-P, jika R- dalam ppm, maka q=1000-P, jika R- dalam desimal, maka q= 10000-R dll.; P- jumlah pengamatan. Bila jumlah pengamatan kurang dari 30, penyebutnya harus diambil ( P - 1 ).

Setiap rata-rata aritmatika atau nilai relatif yang diperoleh dari populasi sampel harus disajikan dengan kesalahan rata-ratanya sendiri. Hal ini memungkinkan untuk menghitung batas kepercayaan dari nilai rata-rata dan relatif, serta untuk menentukan keandalan perbedaan antara indikator yang dibandingkan (hasil penelitian).

Ada tiga jenis rata-rata: modus (M0), median (Me), rata-rata aritmatika (M).

Mereka tidak dapat saling menggantikan, dan hanya secara agregat mereka cukup lengkap dan dalam bentuk yang ringkas, mereka mewakili fitur dari seri variasi.

Mode (Mo)- yang paling sering terjadi dalam seri distribusi varian. Ini memberi gambaran tentang pusat distribusi seri variasi. Digunakan:

Untuk menentukan pusat distribusi dalam seri variasi terbuka

Untuk menentukan tingkat rata-rata dalam baris dengan distribusi asimetris tajam

median- ini adalah opsi tengah, anggota pusat dari seri peringkat. Nama median diambil dari geometri, dimana ini adalah nama garis yang membagi sisi segitiga menjadi dua bagian yang sama besar.

Median diterapkan:

Untuk menentukan tingkat rata-rata fitur dalam deret numerik dengan interval yang tidak sama dalam kelompok

Untuk menentukan tingkat rata-rata suatu fitur, ketika data sumber disajikan sebagai fitur kualitatif dan ketika satu-satunya cara untuk menunjukkan pusat gravitasi tertentu dari populasi adalah dengan menunjukkan varian (kelompok varian) yang menempati posisi sentral

Saat menghitung beberapa indikator demografis (harapan hidup rata-rata)

Saat menentukan lokasi yang paling rasional untuk fasilitas kesehatan, fasilitas umum, dll. (artinya dengan mempertimbangkan jarak optimal institusi dari semua fasilitas layanan)

Saat ini, berbagai survei (pemasaran, sosiologis, dll) sangat umum, di mana responden diminta untuk memberikan poin pada produk, politisi, dll. Kemudian, poin rata-rata dihitung dari perkiraan yang diperoleh dan dianggap sebagai nilai integral yang diberikan oleh kelompok responden. Dalam hal ini, rata-rata aritmatika biasanya digunakan untuk menentukan rata-rata. Namun, cara ini sebenarnya tidak bisa diterapkan. Dalam hal ini, masuk akal untuk menggunakan median atau modus sebagai skor rata-rata.

Untuk mengkarakterisasi tingkat rata-rata suatu sifat, mean aritmatika (M) paling sering digunakan dalam pengobatan.

Rata-rata aritmatika - ini adalah karakteristik kuantitatif umum dari fitur tertentu dari fenomena yang dipelajari, yang merupakan agregat statistik yang homogen secara kualitatif.

Bedakan antara mean aritmatika sederhana dan mean tertimbang.

Mean aritmatika sederhana dihitung untuk deret variasi yang tidak dikelompokkan dengan menjumlahkan semua opsi dan membagi jumlah ini dengan jumlah total opsi yang disertakan dalam deret variasi.

Mean aritmatika sederhana dihitung dengan rumus:

M - rata-rata tertimbang aritmatika,

Vp adalah jumlah produk dari varian dan frekuensinya,

n adalah jumlah pengamatan.

Selain metode tertentu dari perhitungan langsung rata-rata aritmatika tertimbang, ada metode lain, khususnya, metode momen di mana perhitungan aritmatika agak disederhanakan.

Perhitungan rata-rata aritmatika momen dilakukan sesuai dengan rumus:

M = A + dp
n

A - rata-rata bersyarat (paling sering, mode M0 diambil sebagai rata-rata bersyarat)

d - penyimpangan setiap opsi dari rata-rata bersyarat (V-A)

dp adalah jumlah hasil kali simpangan dan frekuensinya.

Urutan perhitungan disajikan dalam tabel (kami mengambil M0 = 76 denyut per menit sebagai rata-rata bersyarat).

denyut nadi V R d (V-A) dp
-16 -16
-14 -28
-12 -36
-10 -30
-8 -24
-6 -54
-4 -24
-2 -14
n=54 | dp=-200

dimana i adalah interval antar grup.

Urutan perhitungan disajikan dalam tabel. (untuk rata-rata bersyarat kita ambil M 0 = 73 denyut per menit, di mana i = 3)

Penentuan mean aritmatika dengan metode momen

n=54 dp=-13

M = A + dp = 73+ -13*3 \u003d 73 - 0,7 \u003d 72,3 (detak per menit
n

Dengan demikian, nilai rata-rata aritmatika yang diperoleh dengan metode momen identik dengan yang ditemukan dengan cara biasa.

Metode untuk menghitung mean aritmatika (mean aritmatika sederhana dan tertimbang, dengan metode momen)

Kami menentukan nilai rata-rata:

Mode (Mo) \u003d 11, karena varian ini paling sering terjadi pada seri variasi (p=6).

Median (Me) - nomor seri varian yang menempati posisi tengah = 23, tempat dalam seri variasi ini ditempati oleh varian yang sama dengan 11. Rata-rata aritmatika (M) memungkinkan Anda untuk sepenuhnya mengkarakterisasi tingkat rata-rata dari sifat yang sedang dipelajari. Untuk menghitung mean aritmatika, digunakan dua metode: metode mean aritmatika dan metode momen.

Jika frekuensi kemunculan setiap varian dalam deret variasi sama dengan 1, maka mean aritmatika sederhana dihitung dengan menggunakan metode mean aritmatika: M = .

Jika frekuensi kemunculan varian dalam deret variasi berbeda dari 1, maka rata-rata aritmatika tertimbang dihitung dengan menggunakan metode rata-rata aritmatika:

Menurut metode momen: A - rata-rata bersyarat,

M = A + =11 += 10,4 d=V-A, A=Mo=11

Jika jumlah opsi dalam rangkaian variasi lebih dari 30, maka rangkaian yang dikelompokkan dibangun. Membangun seri yang dikelompokkan:

1) penentuan Vmin dan Vmax Vmin=3, Vmax=20;

2) penentuan jumlah kelompok (sesuai tabel);

3) perhitungan interval antar kelompok saya = 3;

4) penentuan awal dan akhir kelompok;

5) penentuan varian frekuensi masing-masing kelompok (Tabel 2).

Meja 2

Teknik untuk membangun seri yang dikelompokkan

Durasi

pengobatan dalam beberapa hari

n=45 p=480 p=30 2 p=766

Keuntungan dari deret variasi yang dikelompokkan adalah peneliti tidak bekerja dengan setiap varian, tetapi hanya dengan varian yang rata-rata untuk setiap kelompok. Ini membuatnya lebih mudah untuk menghitung rata-rata.

Nilai fitur ini atau itu tidak sama untuk semua anggota populasi, meskipun relatif homogen. Fitur populasi statistik ini dicirikan oleh salah satu sifat kelompok dari populasi umum - keragaman sifat. Sebagai contoh, mari kita ambil sekelompok anak laki-laki berusia 12 tahun dan mengukur tinggi badan mereka. Setelah perhitungan, tingkat rata-rata sifat ini adalah 153 cm, tetapi rata-rata mencirikan ukuran umum dari sifat yang dipelajari. Di antara anak laki-laki seusia ini ada anak laki-laki yang tingginya 165 cm atau 141 cm. Semakin banyak anak laki-laki yang memiliki tinggi badan selain 153 cm, semakin besar keragaman sifat ini dalam populasi statistik.

Statistik memungkinkan kita untuk mengkarakterisasi properti ini dengan kriteria berikut:

batas (lim),

amplitudo (Amp),

simpangan baku ( y) ,

koefisien variasi (Cv).

Batas (lim) ditentukan oleh nilai ekstrim varian dalam deret variasi:

lim=Vmin /Vmax

Amplitudo (Amp) - perbedaan opsi ekstrem:

Amp=Vmax -Vmin

Nilai-nilai ini hanya memperhitungkan keragaman opsi ekstrem dan tidak memungkinkan untuk memperoleh informasi tentang keragaman sifat dalam agregat, dengan mempertimbangkan struktur internalnya. Oleh karena itu, kriteria ini dapat digunakan untuk karakterisasi perkiraan keanekaragaman, terutama dengan sejumlah kecil pengamatan (n<30).

statistik medis seri variasi

Perhitungan mean aritmatika bisa menjadi rumit jika opsi (nilai fitur) dan bobot memiliki nilai yang sangat besar atau sangat kecil dan proses perhitungan itu sendiri menjadi sulit. Kemudian, untuk memudahkan perhitungan, sejumlah sifat rata-rata aritmatika digunakan:

1) jika Anda mengurangi (meningkatkan) semua opsi dengan nomor sembarang TETAPI, maka rata-rata baru akan berkurang (naik) dengan angka yang sama TETAPI, yaitu akan berubah menjadi ± TETAPI;

2) jika kita mengurangi semua opsi (nilai fitur) dengan jumlah yang sama beberapa kali ( Ke), maka rata-rata akan berkurang dengan jumlah yang sama, dan dengan kenaikan ( Ke) kali - akan meningkat ( Ke) sekali;

3) jika kita mengurangi atau menambah bobot (frekuensi) semua varian dengan beberapa angka konstan TETAPI, maka mean aritmatika tidak akan berubah;

4) jumlah deviasi semua opsi dari total rata-rata adalah nol.

Properti rata-rata aritmatika yang terdaftar memungkinkan, jika perlu, untuk menyederhanakan perhitungan dengan mengganti frekuensi absolut dengan frekuensi relatif, untuk mengurangi opsi (nilai fitur) dengan angka apa pun TETAPI, kurangi menjadi Ke kali dan hitung rata-rata aritmatika dari versi yang dikurangi, dan kemudian lanjutkan ke rata-rata dari seri aslinya.

Metode menghitung rata-rata aritmatika menggunakan sifat-sifatnya dikenal dalam statistik sebagai "metode nol bersyarat", atau "rata-rata bersyarat", atau bagaimana "metode momen".

Secara singkat, metode ini dapat ditulis sebagai rumus

Jika varian tereduksi (nilai fitur) dilambangkan dengan , maka rumus di atas dapat ditulis ulang menjadi .

Saat menggunakan rumus untuk menyederhanakan perhitungan deret interval tertimbang rata-rata aritmatika saat menentukan nilai bilangan apa pun TETAPI menggunakan metode definisi tersebut.

Nilai TETAPI sama dengan nilai:

1) nilai pertama dari nilai rata-rata interval (kita akan melanjutkan pada contoh soal, di mana juta dolar, dan .

Perhitungan rata-rata dari opsi yang dikurangi

Interval Interval rata-rata Jumlah pabrik f Kerja
Sampai 2 1,5 0 (1,5–1,5)
2–3 2,5 1 (2,5–1,5)
3–4 3,5 2 (3,5–1,5)
4–5 4,5 3 (4,5–1,5)
5–6 5,5 4 (5,5–1,5)
Lebih dari 6 6,5 5 (6,5–1,5)
Total: 3,7

,

2) nilai TETAPI kita ambil sama dengan nilai nilai rata-rata interval dengan frekuensi pengulangan tertinggi, dalam hal ini TETAPI= 3,5 pada ( f= 30), atau nilai varian tengah, atau varian terbesar (dalam hal ini, nilai fitur terbesar X= 6,5) dan dibagi dengan ukuran interval (1 dalam contoh ini).

Perhitungan rata-rata pada TETAPI = 3,5, f = 30, Ke= 1 dalam contoh yang sama.

Perhitungan metode rata-rata momen

Interval Interval rata-rata Jumlah pabrik f Kerja
Sampai 2 1,5 (1,5 – 3,5) : 1 = –2 –20
2–3 2,5 (2,5 – 3,5) : 1 = –1 –20
3–4 3,5 (3,5 – 3,5) : 1 = 0
4–5 4,5 (4,5 – 3,5) : 1 = 1
5–6 5,5 (5,5 – 3,5) : 1 = 2
Lebih dari 6 6,5 (6,5 – 3,5) : 1 = 3
Total: 3,7

; ; ;

Metode momen, nol bersyarat atau rata-rata bersyarat adalah bahwa dengan metode pengurangan menghitung rata-rata aritmatika, kami memilih momen sedemikian rupa sehingga dalam deret baru salah satu nilai fitur , yaitu, kita samakan dan dari di sini kita pilih nilainya TETAPI dan Ke.

Harus diingat bahwa jika XTETAPI) : Ke, di mana Ke adalah nilai interval yang sama, maka varian baru yang diperoleh membentuk deret bilangan asli dengan interval yang sama (1, 2, 3, dst) positif ke bawah dan negatif ke atas dari nol. Rata-rata aritmatika dari varian baru ini disebut momen orde pertama dan dinyatakan dengan rumus

.

Untuk menentukan nilai mean aritmatika, Anda perlu mengalikan nilai momen orde pertama dengan nilai interval tersebut ( Ke), yang dengannya kami membagi semua opsi, dan menambahkan nilai opsi ke produk yang dihasilkan ( TETAPI) yang dibaca.

;

Jadi, dengan menggunakan metode momen atau kondisi nol, akan lebih mudah untuk menghitung rata-rata aritmatika dari deret variasi, jika deret tersebut memiliki interval yang sama.

Mode

Modus adalah nilai fitur (varian) yang paling sering diulang dalam populasi yang diteliti.

Untuk deret distribusi diskrit, modus akan menjadi nilai varian dengan frekuensi tertinggi.

Contoh. Saat menentukan rencana produksi sepatu pria, pabrik mempelajari permintaan konsumen berdasarkan hasil penjualan. Distribusi sepatu yang dijual ditandai dengan indikator berikut:

Sepatu ukuran 41 paling banyak diminati dan menyumbang 30% dari jumlah yang terjual. Dalam seri distribusi ini M 0 = 41.

Untuk deret distribusi interval dengan interval yang sama, modus ditentukan oleh rumus

.

Pertama-tama, perlu untuk menemukan interval di mana mode berada, yaitu, interval modal.

Dalam deret variasi dengan interval yang sama jarak modal ditentukan oleh frekuensi tertinggi, dalam seri dengan interval yang tidak sama - oleh kepadatan distribusi tertinggi, di mana: - nilai batas bawah interval yang berisi mode; adalah frekuensi interval modal; - frekuensi interval sebelum modal, yaitu premodal; - frekuensi interval mengikuti modal, yaitu pasca-modal.

Contoh menghitung mode dalam deret interval

Pengelompokan perusahaan sesuai dengan jumlah personel industri dan produksi diberikan. Temukan mode. Dalam masalah kami, jumlah perusahaan terbesar (30) memiliki grup dengan 400 hingga 500 karyawan. Oleh karena itu, interval ini adalah interval modal dari deret propagasi yang berjarak sama. Mari kita perkenalkan notasi berikut:

Substitusikan nilai-nilai ini ke dalam rumus perhitungan mode dan hitung:

Dengan demikian, kami telah menentukan nilai nilai modal atribut yang terkandung dalam interval ini (400-500), yaitu. M 0 = 467 orang

Dalam banyak kasus, ketika mengkarakterisasi populasi sebagai indikator generalisasi, preferensi diberikan kepada: mode, bukan rata-rata aritmatika. Jadi, ketika mempelajari harga di pasar, bukan harga rata-rata untuk suatu produk tertentu yang tetap dan dipelajari secara dinamis, tetapi harga modal. Ketika mempelajari permintaan penduduk untuk ukuran sepatu atau pakaian tertentu, penting untuk menentukan jumlah modal, dan bukan ukuran rata-rata, yang tidak menjadi masalah sama sekali. Jika mean aritmatika mendekati nilai modus, maka itu adalah tipikal.

TUGAS UNTUK SOLUSI

Tugas 1

Di stasiun benih varietas, ketika menentukan kualitas benih gandum, penentuan benih berikut diperoleh dengan persentase perkecambahan:

Tentukan mode.

Tugas 2

Saat mendaftarkan harga selama jam perdagangan tersibuk, penjual individu mencatat harga jual aktual berikut (USD per kg):

Kentang: 0,2; 0,12; 0,12; 0,15; 0.2; 0.2; 0.2; 0,15; 0,15; 0,15; 0,15; 0,12; 0,12; 0,12; 0.15.

Daging sapi: 2; 2.5; 2; 2; 1.8; 1.8; 2; 2.2; 2.5; 2; 2; 2; 2; 3; 3; 2.2; 2; 2; 2; 2.

Berapa harga untuk kentang dan daging sapi yang merupakan modal?

Tugas 3

Ada data gaji 16 mekanik bengkel. Temukan nilai modal upah.

Dalam dolar: 118; 120; 124; 126; 130; 130; 130; 130; 132; 135; 138; 140; 140; 140; 142; 142.

Perhitungan Median

Dalam statistik, median adalah varian yang terletak di tengah deret variasi. Jika deret distribusi diskrit memiliki jumlah anggota deret ganjil, maka median adalah varian yang terletak di tengah deret berperingkat, yaitu menambahkan 1 ke jumlah frekuensi dan membagi semuanya dengan 2 - hasilnya akan memberikan nomor urut dari median.

Jika ada jumlah opsi yang genap dalam deret variasi, maka median akan menjadi setengah jumlah dari dua opsi tengah.

Untuk mencari median dalam deret variasi interval, pertama-tama kita tentukan interval median untuk frekuensi yang terakumulasi. Interval tersebut akan menjadi interval yang kumulatif (kumulatif) frekuensinya sama dengan atau melebihi setengah jumlah frekuensi. Frekuensi yang terakumulasi dibentuk oleh penjumlahan frekuensi secara bertahap, dimulai dari interval dengan nilai atribut terendah.

Perhitungan median dalam deret variasi interval

Interval Frekuensi ( f) Frekuensi kumulatif (akumulasi)
60–70 10 (10)
70–80 40 (10+30)
80–90 90 (40+50)
90–100 15 (90+60)
100–110 295 (150+145)
110–120 405 (295+110)
120–130 485 (405+80)
130–140 500 (485+15)
Jumlah: f = 500

Setengah jumlah frekuensi yang terakumulasi dalam contoh adalah 250 (500:2). Oleh karena itu, interval median akan menjadi interval dengan nilai fitur 100-110.

Sebelum interval ini, jumlah frekuensi yang terakumulasi adalah 150. Oleh karena itu, untuk mendapatkan nilai median, perlu menambahkan 100 unit lagi (250 - 150). Saat menentukan nilai median, diasumsikan bahwa nilai fitur dalam batas-batas interval terdistribusi secara merata. Oleh karena itu, jika 145 unit dalam interval ini didistribusikan secara merata dalam interval, sama dengan 10, maka 100 unit akan sesuai dengan nilai:

10: 145 100 = 6,9.

Menambahkan nilai yang diperoleh ke batas minimum interval median, kami memperoleh nilai median yang diinginkan:

Atau median dalam deret interval variasi dapat dihitung dengan rumus:

,

di mana adalah nilai batas bawah interval median (); – nilai interval median ( =10); – jumlah frekuensi seri (jumlah seri adalah 500); adalah jumlah frekuensi yang terakumulasi dalam interval sebelum median ( = 150); adalah frekuensi interval median ( = 145).