Cara menghitung simpangan baku sampel. Parameter statistik

Salah satu alat utama analisis statistik adalah perhitungan standar deviasi. Indikator ini memungkinkan Anda untuk membuat perkiraan simpangan baku untuk sampel atau untuk populasi umum. Mari kita pelajari cara menggunakan rumus simpangan baku di Excel.

Mari kita langsung mendefinisikan apa itu standar deviasi dan seperti apa rumusnya. Nilai ini adalah akar kuadrat dari rata-rata aritmatika dari kuadrat selisih antara semua nilai deret dan rata-rata aritmatikanya. Ada nama yang identik untuk indikator ini - standar deviasi. Kedua nama itu benar-benar setara.

Tetapi, tentu saja, di Excel, pengguna tidak perlu menghitung ini, karena program melakukan segalanya untuknya. Mari kita pelajari cara menghitung simpangan baku di Excel.

Perhitungan di Excel

Anda dapat menghitung nilai yang ditentukan di Excel menggunakan dua fungsi khusus STDEV.B(sesuai sampel) dan STDEV.G(menurut masyarakat umum). Prinsip operasi mereka benar-benar sama, tetapi mereka dapat dipanggil dengan tiga cara, yang akan kita bahas di bawah ini.

Metode 1: Wizard Fungsi


Metode 2: Tab Rumus


Metode 3: Memasukkan rumus secara manual

Ada juga cara di mana Anda tidak perlu memanggil jendela argumen sama sekali. Untuk melakukan ini, masukkan rumus secara manual.


Seperti yang Anda lihat, mekanisme untuk menghitung standar deviasi di Excel sangat sederhana. Pengguna hanya perlu memasukkan angka dari populasi atau tautan ke sel yang berisi mereka. Semua perhitungan dilakukan oleh program itu sendiri. Jauh lebih sulit untuk memahami apa indikator yang dihitung dan bagaimana hasil perhitungan dapat diterapkan dalam praktik. Tetapi memahami ini sudah lebih merupakan bagian dari bidang statistik daripada mempelajari cara bekerja dengan perangkat lunak.

dari Wikipedia, ensiklopedia gratis

simpangan baku(sinonim: simpangan baku, simpangan baku, simpangan baku; istilah terkait: simpangan baku, penyebaran standar) - dalam teori dan statistik probabilitas, indikator paling umum dari penyebaran nilai-nilai variabel acak relatif terhadap harapan matematisnya. Dengan susunan nilai sampel yang terbatas, alih-alih ekspektasi matematis, rata-rata aritmatika dari populasi sampel digunakan.

Informasi dasar

Standar deviasi diukur dalam satuan variabel acak itu sendiri dan digunakan ketika menghitung kesalahan standar rata-rata aritmatika, ketika membangun interval kepercayaan, ketika menguji hipotesis secara statistik, ketika mengukur hubungan linier antara variabel acak. Didefinisikan sebagai akar kuadrat dari varians variabel acak.

Standar deviasi:

\sigma=\sqrt(\frac(1)(n)\sum_(i=1)^n\left(x_i-\bar(x)\right)^2).

Standar deviasi(perkiraan simpangan baku variabel acak x relatif terhadap ekspektasi matematisnya berdasarkan estimasi variansnya yang tidak bias) s:

s=\sqrt(\frac(n)(n-1)\sigma^2)=\sqrt(\frac(1)(n-1)\sum_(i=1)^n\left(x_i-\bar (x)\kanan)^2);

aturan tiga sigma

aturan tiga sigma (3\sigma) - hampir semua nilai variabel acak terdistribusi normal terletak pada interval \left(\bar(x)-3\sigma;\bar(x)+3\sigma\kanan). Lebih tepatnya - kira-kira dengan probabilitas 0,9973 nilai variabel acak terdistribusi normal terletak pada interval yang ditentukan (asalkan nilainya \bar(x) benar, dan tidak diperoleh sebagai hasil pengolahan sampel).

Jika nilai sebenarnya \bar(x) tidak diketahui, maka Anda harus menggunakan \sigma, sebuah s. Dengan demikian, aturan tiga sigma diubah menjadi aturan tiga s .

Interpretasi nilai simpangan baku

Nilai deviasi standar yang lebih besar menunjukkan penyebaran nilai yang lebih besar dalam himpunan yang disajikan dengan rata-rata himpunan; nilai yang lebih kecil, masing-masing, menunjukkan bahwa nilai-nilai dalam himpunan dikelompokkan di sekitar nilai rata-rata.

Misalnya, kami memiliki tiga set angka: (0, 0, 14, 14), (0, 6, 8, 14) dan (6, 6, 8, 8). Ketiga himpunan masing-masing memiliki nilai rata-rata 7 dan simpangan baku 7, 5, dan 1. Himpunan terakhir memiliki simpangan baku kecil karena nilai-nilai dalam himpunan berkerumun di sekitar rata-rata; set pertama memiliki nilai deviasi standar terbesar - nilai dalam set sangat berbeda dari nilai rata-rata.

Dalam pengertian umum, standar deviasi dapat dianggap sebagai ukuran ketidakpastian. Misalnya, dalam fisika, standar deviasi digunakan untuk menentukan kesalahan dari serangkaian pengukuran berturut-turut dari beberapa kuantitas. Nilai ini sangat penting untuk menentukan masuk akal dari fenomena yang diteliti dibandingkan dengan nilai yang diprediksi oleh teori: jika nilai rata-rata pengukuran sangat berbeda dari nilai yang diprediksi oleh teori (standar deviasi besar), maka nilai yang diperoleh atau metode untuk memperolehnya harus diperiksa ulang.

Penggunaan praktis

Dalam praktiknya, standar deviasi memungkinkan Anda untuk memperkirakan berapa banyak nilai dari suatu himpunan dapat berbeda dari nilai rata-rata.

Ekonomi dan keuangan

Standar deviasi pengembalian portofolio \sigma =\sqrt(D[X]) diidentifikasi dengan risiko portofolio.

Iklim

Misalkan ada dua kota dengan rata-rata suhu harian maksimum yang sama, tetapi satu terletak di pantai dan yang lainnya di dataran. Kota-kota pesisir diketahui memiliki banyak suhu maksimum harian yang berbeda kurang dari kota-kota pedalaman. Oleh karena itu, standar deviasi suhu harian maksimum di kota pesisir akan lebih kecil daripada di kota kedua, meskipun pada kenyataannya nilai rata-rata dari nilai ini sama untuk mereka, yang dalam praktiknya berarti bahwa probabilitas bahwa udara maksimum suhu setiap hari tertentu dalam setahun akan lebih kuat berbeda dari nilai rata-rata, lebih tinggi untuk kota yang terletak di dalam benua.

Olahraga

Mari kita asumsikan bahwa ada beberapa tim sepak bola yang diberi peringkat menurut beberapa parameter, misalnya, jumlah gol yang dicetak dan kebobolan, peluang untuk mencetak gol, dll. Kemungkinan besar tim terbaik di grup ini akan memiliki yang terbaik nilai dalam lebih banyak parameter. Semakin kecil simpangan baku tim untuk setiap parameter yang disajikan, semakin dapat diprediksi hasil tim, tim tersebut seimbang. Di sisi lain, tim dengan standar deviasi besar sulit untuk memprediksi hasilnya, yang pada gilirannya dijelaskan oleh ketidakseimbangan, misalnya, pertahanan yang kuat, tetapi serangan yang lemah.

Penggunaan standar deviasi parameter tim memungkinkan seseorang untuk memprediksi hasil pertandingan antara dua tim sampai batas tertentu, mengevaluasi kekuatan dan kelemahan tim, dan karenanya metode perjuangan yang dipilih.

Lihat juga

Tulis ulasan pada artikel "Standar deviasi"

literatur

  • Borovikov V. STATISTIK. Seni analisis data komputer: Untuk profesional / V. Borovikov. - Sankt Peterburg. : Peter, 2003. - 688 hal. - ISBN 5-272-00078-1..

Kutipan yang mencirikan simpangan baku

Dan, dengan cepat membuka pintu, dia melangkah keluar dengan langkah tegas ke balkon. Percakapan tiba-tiba berhenti, topi dan topi dilepas, dan semua mata tertuju pada hitungan yang keluar.
- Hallo teman-teman! kata hitungan dengan cepat dan keras. - Terima kasih sudah datang. Saya akan keluar untuk Anda sekarang, tapi pertama-tama kita harus berurusan dengan penjahat. Kita perlu menghukum penjahat yang membunuh Moskow. Tunggu aku! - Dan Count dengan cepat kembali ke kamar, membanting pintu dengan keras.
Gumaman persetujuan mengalir di antara kerumunan. “Dia, kalau begitu, akan mengendalikan kegunaan para penjahat! Dan Anda mengatakan seorang Prancis ... dia akan melepaskan seluruh jarak untuk Anda! kata orang-orang, seolah-olah saling mencela karena kurangnya iman mereka.
Beberapa menit kemudian seorang petugas bergegas keluar dari pintu depan, memesan sesuatu, dan para naga itu berbaring. Kerumunan bergerak dengan rakus dari balkon ke teras. Keluar di teras dengan langkah cepat marah, Rostopchin buru-buru melihat sekelilingnya, seolah mencari seseorang.
- Dimana dia? - kata hitungan, dan pada saat yang sama ketika dia mengatakan ini, dia melihat dari sudut rumah keluar di antara dua naga, seorang pria muda dengan leher panjang kurus, dengan kepala setengah dicukur dan ditumbuhi rumput. Pemuda ini mengenakan apa yang dulunya adalah mantel kulit domba rubah yang lusuh, berpakaian biru, dan dalam celana tahanan linen yang kotor, dimasukkan ke dalam sepatu bot tipis yang najis dan usang. Belenggu tergantung berat pada kaki yang kurus dan lemah, sehingga menyulitkan langkah ragu-ragu pemuda itu.
- TETAPI! - kata Rostopchin, buru-buru mengalihkan pandangannya dari pemuda berjas rubah dan menunjuk ke anak tangga terbawah teras. - Taruh di sini! - Pria muda itu, membelenggu belenggunya, melangkah dengan berat ke langkah yang ditunjukkan, memegang kerah mantel kulit domba dengan jarinya, memutar lehernya yang panjang dua kali dan, menghela nafas, melipat tangannya yang kurus dan tidak bekerja di depan perutnya dengan sikap tunduk.
Ada keheningan selama beberapa detik saat pemuda itu duduk di tangga. Hanya di barisan belakang orang-orang yang terjepit di satu tempat, erangan, erangan, goncangan, dan derap kaki yang diatur ulang terdengar.
Rostopchin, menunggunya berhenti di tempat yang ditunjukkan, dengan cemberut mengusap wajahnya dengan tangannya.
- Teman-teman! - kata Rostopchin dengan suara metalik, - pria ini, Vereshchagin, adalah bajingan yang sama yang menyebabkan Moskow meninggal.
Pria muda bermantel rubah itu berdiri dalam pose tunduk, dengan kedua tangan dirapatkan di depan perutnya dan sedikit membungkuk. Kurus, dengan ekspresi putus asa, dirusak oleh kepala yang dicukur, wajah mudanya diturunkan. Pada kata-kata pertama hitungan, dia perlahan mengangkat kepalanya dan melihat hitungan itu, seolah-olah dia ingin mengatakan sesuatu kepadanya atau setidaknya memenuhi tatapannya. Tapi Rostopchin tidak memandangnya. Di leher panjang dan kurus pemuda itu, seperti tali, pembuluh darah di belakang telinga menegang dan membiru, dan tiba-tiba wajahnya memerah.
Semua mata tertuju padanya. Dia memandang kerumunan, dan, seolah diyakinkan oleh ekspresi yang dia baca di wajah orang-orang, dia tersenyum sedih dan malu-malu, dan menundukkan kepalanya lagi, meluruskan kakinya di tangga.
“Dia mengkhianati tsar dan tanah airnya, dia menyerahkan dirinya kepada Bonaparte, dia sendiri dari semua orang Rusia yang telah mencemarkan nama orang Rusia, dan Moskow sekarat karena dia,” kata Rastopchin dengan suara yang datar dan tajam; tapi tiba-tiba dia dengan cepat melirik ke arah Vereshchagin, yang terus berdiri dengan pose tunduk yang sama. Seolah-olah tampilan ini meledakkannya, dia, mengangkat tangannya, hampir berteriak, menoleh ke orang-orang: - Hadapi dia dengan penilaian Anda! Saya memberikannya kepada Anda!
Orang-orang terdiam dan hanya saling menekan lebih keras. Saling berpelukan, menghirup kedekatan yang terinfeksi ini, tidak memiliki kekuatan untuk bergerak dan menunggu sesuatu yang tidak diketahui, tidak dapat dipahami dan mengerikan menjadi tak tertahankan. Orang-orang yang berdiri di barisan depan, yang melihat dan mendengar semua yang terjadi di depan mereka, semua dengan mata terbuka lebar ketakutan dan mulut menganga, berusaha sekuat tenaga, menahan tekanan dari yang belakang di punggung mereka.
- Kalahkan dia! .. Biarkan pengkhianat mati dan tidak mempermalukan nama Rusia! teriak Rastopchin. - Ruby! saya memesan! - Bukan mendengar kata-kata, tetapi suara marah dari suara Rostopchin, kerumunan mengerang dan bergerak maju, tetapi sekali lagi berhenti.
- Hitung! .. - Vereshchagin yang pemalu dan pada saat yang sama suara teatrikal berkata di tengah keheningan sesaat. "Hitung, satu dewa ada di atas kita ..." kata Vereshchagin, mengangkat kepalanya, dan lagi-lagi urat tebal di lehernya yang tipis dipenuhi darah, dan warnanya dengan cepat keluar dan menghilang dari wajahnya. Dia tidak menyelesaikan apa yang ingin dia katakan.
- Potong dia! Saya memesan! .. - teriak Rostopchin, tiba-tiba berubah sepucat Vereshchagin.
- Pedang keluar! teriak petugas itu kepada para naga, sambil menarik pedangnya sendiri.
Gelombang lain yang bahkan lebih kuat melonjak melalui orang-orang, dan, setelah mencapai barisan depan, gelombang ini menggerakkan yang depan, mengejutkan, membawa mereka ke tangga beranda. Seorang pria tinggi, dengan ekspresi ketakutan di wajahnya dan dengan tangan terangkat berhenti, berdiri di samping Vereshchagin.
- Ruby! hampir membisikkan seorang perwira kepada para naga, dan salah satu prajurit tiba-tiba, dengan wajah marah yang terdistorsi, memukul kepala Vereshchagin dengan pedang lebar yang tumpul.
"TETAPI!" - Vereshchagin berteriak singkat dan terkejut, melihat sekeliling dengan ketakutan dan seolah-olah tidak mengerti mengapa ini dilakukan padanya. Erangan kaget dan ngeri yang sama terdengar di antara kerumunan.
"Ya Tuhan!" - seruan sedih seseorang terdengar.
Tetapi setelah seruan keterkejutan yang keluar dari Vereshchagin, dia berteriak kesakitan, dan tangisan ini menghancurkannya. Penghalang perasaan manusia itu, yang terbentang hingga tingkat tertinggi, yang masih menahan kerumunan, menerobos seketika. Kejahatan dimulai, itu perlu untuk menyelesaikannya. Erangan celaan yang menyedihkan ditenggelamkan oleh raungan massa yang hebat dan marah. Seperti kapal pemecah gelombang ketujuh terakhir, gelombang terakhir yang tak terhentikan ini membubung dari barisan belakang, mencapai barisan depan, menjatuhkan mereka dan menelan semuanya. Naga yang telah menyerang ingin mengulangi pukulannya. Vereshchagin dengan teriakan ngeri, melindungi dirinya dengan tangannya, bergegas ke orang-orang. Pria jangkung, yang dia temui, meraih leher kurus Vereshchagin dengan tangannya, dan dengan teriakan liar, bersamanya, jatuh di bawah kaki orang-orang yang mengaum yang menumpuk.
Beberapa memukuli dan mencabik-cabik Vereshchagin, yang lain bertubuh tinggi. Dan tangisan orang-orang yang hancur dan mereka yang mencoba menyelamatkan lelaki jangkung itu hanya membangkitkan kemarahan orang banyak. Untuk waktu yang lama para naga tidak bisa membebaskan pekerja pabrik yang berdarah dan dipukuli sampai mati. Dan untuk waktu yang lama, terlepas dari semua tergesa-gesa yang digunakan orang banyak untuk menyelesaikan pekerjaan begitu dimulai, orang-orang yang memukul, mencekik, dan mencabik Vereshchagin tidak dapat membunuhnya; tetapi orang banyak menghancurkan mereka dari semua sisi, dengan mereka di tengah, seperti satu massa, bergoyang dari sisi ke sisi dan tidak memberi mereka kesempatan untuk menghabisinya atau meninggalkannya.

Nilai-nilai yang didapat dari pengalaman pasti mengandung kesalahan karena berbagai alasan. Di antara mereka, kesalahan sistematis dan acak harus dibedakan. Kesalahan sistematis disebabkan oleh penyebab yang bertindak dengan cara yang sangat spesifik, dan selalu dapat dihilangkan atau diperhitungkan dengan akurasi yang memadai. Kesalahan acak disebabkan oleh sejumlah besar penyebab individu yang tidak dapat dipertanggungjawabkan secara akurat dan bertindak berbeda dalam setiap pengukuran individu. Kesalahan ini tidak dapat sepenuhnya dikesampingkan; mereka hanya dapat diperhitungkan secara rata-rata, yang untuk itu perlu diketahui hukum-hukum yang menjadi subjek kesalahan acak.

Kami akan menunjukkan nilai terukur dengan A, dan kesalahan acak dalam pengukuran x. Karena kesalahan x dapat mengambil nilai apa pun, itu adalah variabel acak kontinu, yang sepenuhnya dicirikan oleh hukum distribusinya sendiri.

Realitas yang paling sederhana dan paling akurat mencerminkan (dalam sebagian besar kasus) adalah apa yang disebut distribusi kesalahan normal:

Hukum distribusi ini dapat diperoleh dari berbagai premis teoretis, khususnya, dari persyaratan bahwa nilai yang paling mungkin dari suatu besaran yang tidak diketahui di mana serangkaian nilai dengan tingkat akurasi yang sama diperoleh dengan pengukuran langsung adalah rata-rata aritmatika dari nilai-nilai ini. Nilai 2 disebut penyebaran dari hukum biasa ini.

Rata-rata

Penentuan dispersi menurut data percobaan. Jika untuk sembarang besaran A, n nilai ai diperoleh dengan pengukuran langsung dengan tingkat ketelitian yang sama, dan jika kesalahan dalam besaran A tunduk pada hukum distribusi normal, maka nilai A yang paling mungkin adalah rata-rata:

a - rata-rata aritmatika,

a i - nilai terukur pada langkah ke-i.

Penyimpangan nilai yang diamati (untuk setiap pengamatan) a i dari nilai A dari rata-rata aritmatika: a i - a.

Untuk menentukan dispersi dari distribusi normal kesalahan dalam kasus ini, gunakan rumus:

2 - dispersi,
a - rata-rata aritmatika,
n adalah jumlah pengukuran parameter,

simpangan baku

simpangan baku menunjukkan deviasi absolut dari nilai yang diukur dari rata-rata aritmatika. Sesuai dengan rumus untuk ukuran akurasi kombinasi linier akar rata-rata kesalahan kuadrat mean aritmatika ditentukan oleh rumus:

, di mana


a - rata-rata aritmatika,
n adalah jumlah pengukuran parameter,
a i - nilai terukur pada langkah ke-i.

Koefisien variasi

Koefisien variasi mencirikan tingkat deviasi relatif dari nilai yang diukur dari rata-rata aritmatika:

, di mana

V - koefisien variasi,
- simpangan baku,
a - rata-rata aritmatika.

Semakin besar nilainya koefisien variasi, semakin besar hamburan dan semakin rendah kemerataan nilai yang dipelajari. Jika sebuah koefisien variasi kurang dari 10%, maka variabilitas deret variasi dianggap tidak signifikan, dari 10% hingga 20% mengacu pada rata-rata, lebih dari 20% dan kurang dari 33% hingga signifikan, dan jika koefisien variasi melebihi 33%, ini menunjukkan heterogenitas informasi dan kebutuhan untuk mengecualikan nilai terbesar dan terkecil.

Deviasi linier rata-rata

Salah satu indikator jangkauan dan intensitas variasi adalah deviasi linier rata-rata(modulus deviasi rata-rata) dari mean aritmatika. Deviasi linier rata-rata dihitung dengan rumus:

, di mana

_
a - deviasi linier rata-rata,
a - rata-rata aritmatika,
n adalah jumlah pengukuran parameter,
a i - nilai terukur pada langkah ke-i.

Untuk memeriksa kesesuaian nilai yang dipelajari dengan hukum distribusi normal, hubungan digunakan indeks asimetri atas kesalahan dan sikapnya indikator kurtosis untuk kesalahannya.

indeks asimetri

indeks asimetri(A) dan kesalahannya (m a) dihitung menggunakan rumus berikut:

, di mana

A - indikator asimetri,
- simpangan baku,
a - rata-rata aritmatika,
n adalah jumlah pengukuran parameter,
a i - nilai terukur pada langkah ke-i.

Indikator Kurtosis

Indikator Kurtosis(E) dan kesalahannya (m e) dihitung menggunakan rumus berikut:

, di mana

Ciri variasi yang paling sempurna adalah simpangan baku, yang disebut standar (atau simpangan baku). Standar deviasi() sama dengan akar kuadrat dari kuadrat rata-rata dari penyimpangan nilai fitur individu dari rata-rata aritmatika:

Standar deviasinya sederhana:

Standar deviasi tertimbang diterapkan untuk data yang dikelompokkan:

Antara kuadrat rata-rata dan deviasi linier rata-rata dalam kondisi distribusi normal, hubungan berikut terjadi: ~ 1,25.

Simpangan baku, sebagai ukuran mutlak utama variasi, digunakan dalam menentukan nilai koordinat kurva distribusi normal, dalam perhitungan yang terkait dengan organisasi pengamatan sampel dan menetapkan keakuratan karakteristik sampel, serta dalam menilai batas-batas variasi suatu sifat dalam populasi homogen.

Dispersi, jenisnya, standar deviasi.

Varians dari variabel acak- ukuran penyebaran variabel acak yang diberikan, yaitu, penyimpangannya dari ekspektasi matematis. Dalam statistika, sebutan atau sering digunakan. Akar kuadrat dari varians disebut standar deviasi, standar deviasi, atau standar spread.

Varians total (2) mengukur variasi suatu sifat di seluruh populasi di bawah pengaruh semua faktor yang menyebabkan variasi ini. Pada saat yang sama, berkat metode pengelompokan, dimungkinkan untuk mengisolasi dan mengukur variasi karena fitur pengelompokan, dan variasi yang terjadi di bawah pengaruh faktor yang tidak terhitung.

Varian antargrup (2 m.gr) mencirikan variasi sistematis, yaitu, perbedaan dalam besaran sifat yang diteliti, yang timbul di bawah pengaruh sifat - faktor yang mendasari pengelompokan.

simpangan baku(sinonim: standar deviasi, standar deviasi, standar deviasi; istilah serupa: standar deviasi, penyebaran standar) - dalam teori probabilitas dan statistik, indikator paling umum dari dispersi nilai variabel acak relatif terhadap harapan matematisnya. Dengan array sampel nilai yang terbatas, alih-alih ekspektasi matematis, rata-rata aritmatika dari kumpulan sampel digunakan.

Standar deviasi diukur dalam satuan variabel acak itu sendiri dan digunakan dalam menghitung kesalahan standar rata-rata aritmatika, dalam membangun interval kepercayaan, dalam pengujian statistik hipotesis, dan dalam mengukur hubungan linier antara variabel acak. Ini didefinisikan sebagai akar kuadrat dari varians dari variabel acak.


Standar deviasi:

Standar deviasi(perkiraan simpangan baku variabel acak x relatif terhadap ekspektasi matematisnya berdasarkan estimasi variansnya yang tidak bias):

di mana dispersi; — saya-elemen sampel; - ukuran sampel; - mean aritmatika sampel:

Perlu dicatat bahwa kedua perkiraan itu bias. Dalam kasus umum, tidak mungkin untuk membuat estimasi yang tidak bias. Namun, estimasi yang didasarkan pada estimasi varians yang tidak bias adalah konsisten.

Esensi, ruang lingkup dan prosedur untuk menentukan modus dan median.

Selain rata-rata hukum daya dalam statistik, untuk karakteristik relatif dari besaran atribut yang bervariasi dan struktur internal deret distribusi, digunakan rata-rata struktural, yang terutama diwakili oleh modus dan median.

Mode- Ini adalah varian paling umum dari seri ini. Fashion digunakan, misalnya, dalam menentukan ukuran pakaian, sepatu, yang paling diminati pembeli. Modus untuk deret diskrit adalah varian dengan frekuensi tertinggi. Saat menghitung mode untuk seri variasi interval, Anda harus terlebih dahulu menentukan interval modal (dengan frekuensi maksimum), dan kemudian nilai nilai modal atribut sesuai dengan rumus:

- - nilai mode

- - batas bawah interval modal

- - nilai interval

- - frekuensi interval modal

- - frekuensi interval sebelum modal

- - frekuensi interval mengikuti modal

median - ini adalah nilai fitur yang mendasari seri peringkat dan membagi seri ini menjadi dua bagian yang sama jumlahnya.

Untuk menentukan median dalam deret diskrit dengan adanya frekuensi, jumlah setengah frekuensi pertama-tama dihitung, dan kemudian ditentukan nilai varian yang ada di atasnya. (Jika baris yang diurutkan berisi jumlah fitur ganjil, maka jumlah median dihitung dengan rumus:

M e \u003d (n (jumlah fitur dalam agregat) + 1) / 2,

dalam hal jumlah fitur genap, median akan sama dengan rata-rata dari dua fitur yang terletak di tengah rangkaian).

Saat menghitung median untuk deret variasi interval, pertama-tama tentukan interval median di mana median berada, dan kemudian nilai median sesuai dengan rumus:

- adalah median yang diinginkan

- adalah batas bawah interval yang memuat median

- - nilai interval

- - jumlah frekuensi atau jumlah anggota deret

Jumlah frekuensi akumulasi dari interval sebelum median

- adalah frekuensi interval median

Contoh. Cari modus dan median.

Keputusan:
Dalam contoh ini, interval modal berada dalam kelompok usia 25-30 tahun, karena interval ini merupakan frekuensi tertinggi (1054).

Mari kita hitung nilai modusnya:

Artinya usia modal siswa adalah 27 tahun.

Hitung mediannya. Interval median berada pada kelompok umur 25-30 tahun, karena pada interval tersebut terdapat varian yang membagi penduduk menjadi dua bagian sama besar (Σf i /2 = 3462/2 = 1731). Selanjutnya, kami mengganti data numerik yang diperlukan ke dalam rumus dan mendapatkan nilai median:

Artinya, separuh siswa berusia di bawah 27,4 tahun, dan separuhnya lagi berusia di atas 27,4 tahun.

Selain mode dan median, indikator seperti kuartil dapat digunakan, membagi seri peringkat menjadi 4 bagian yang sama, desil- 10 bagian dan persentil - per 100 bagian.

Konsep pengamatan selektif dan ruang lingkupnya.

Pengamatan selektif berlaku ketika menerapkan pengamatan terus menerus secara fisik tidak mungkin karena sejumlah besar data atau tidak praktis secara ekonomi. Ketidakmungkinan fisik terjadi, misalnya, ketika mempelajari arus penumpang, harga pasar, anggaran keluarga. Ketidakmanfaatan ekonomi terjadi ketika menilai kualitas barang yang terkait dengan kehancurannya, misalnya, mencicipi, menguji kekuatan batu bata, dll.

Unit statistik yang dipilih untuk pengamatan merupakan sampel atau sampel, dan seluruh susunannya - populasi umum (GS). Dalam hal ini, jumlah unit dalam sampel menunjukkan n, dan di seluruh HS - N. Sikap t/n disebut ukuran relatif atau proporsi sampel.

Kualitas hasil sampling tergantung pada keterwakilan sampel, yaitu seberapa representatifnya dalam HS. Untuk memastikan keterwakilan sampel, perlu diperhatikan: prinsip pemilihan unit secara acak, yang mengasumsikan bahwa penyertaan unit HS dalam sampel tidak dapat dipengaruhi oleh faktor lain selain kebetulan.

Ada 4 cara pemilihan acak untuk sampel:

  1. Sebenarnya acak seleksi atau "metode lotre", ketika nomor seri ditetapkan ke nilai statistik, dimasukkan pada objek tertentu (misalnya, tong), yang kemudian dicampur dalam wadah tertentu (misalnya, dalam tas) dan dipilih secara acak. Dalam prakteknya, metode ini dilakukan dengan menggunakan pembangkit bilangan acak atau tabel matematika bilangan acak.
  2. Mekanis seleksi, yang menurut masing-masing ( T/n)-nilai populasi umum. Misalnya, jika berisi 100.000 nilai, dan Anda ingin memilih 1.000, maka setiap 100.000 / 1000 = nilai ke-100 akan masuk ke dalam sampel. Apalagi jika mereka tidak diberi peringkat, maka yang pertama dipilih secara acak dari seratus pertama, dan jumlah yang lain akan menjadi seratus lebih. Misalnya, jika unit nomor 19 adalah yang pertama, maka nomor 119 harus menjadi yang berikutnya, kemudian nomor 219, lalu nomor 319, dan seterusnya. Jika unit populasi diberi peringkat, maka #50 dipilih terlebih dahulu, kemudian #150, lalu #250, dan seterusnya.
  3. Pemilihan nilai dari array data heterogen dilakukan bertingkat(stratified) metode, ketika populasi umum sebelumnya dibagi menjadi kelompok-kelompok homogen, yang seleksi acak atau mekanis diterapkan.
  4. Metode pengambilan sampel khusus adalah serial seleksi, di mana tidak jumlah individu dipilih secara acak atau mekanis, tetapi seri mereka (urutan dari beberapa nomor ke beberapa berturut-turut), di mana pengamatan terus menerus dilakukan.

Kualitas pengamatan sampel juga tergantung pada jenis pengambilan sampel: ulang atau tidak berulang.

Pada pemilihan ulang nilai statistik atau deretnya yang masuk ke dalam sampel dikembalikan ke populasi umum setelah digunakan, memiliki peluang untuk masuk ke sampel baru. Pada saat yang sama, semua nilai populasi umum memiliki peluang yang sama untuk dimasukkan ke dalam sampel.

Pilihan yang tidak berulang berarti bahwa nilai statistik atau deretnya yang termasuk dalam sampel tidak dikembalikan ke populasi umum setelah digunakan, dan oleh karena itu kemungkinan untuk masuk ke sampel berikutnya meningkat untuk nilai yang tersisa dari yang terakhir.

Pengambilan sampel non-repetitif memberikan hasil yang lebih akurat, sehingga lebih sering digunakan. Namun ada situasi yang tidak bisa diterapkan (studi arus penumpang, permintaan konsumen, dll) kemudian dilakukan seleksi ulang.

Kesalahan marjinal sampel pengamatan, kesalahan rata-rata sampel, urutan penghitungannya.

Mari kita perhatikan secara rinci metode pembentukan populasi sampel di atas dan kesalahan yang muncul dalam kasus ini. keterwakilan .
Sebenarnya-acak sampel didasarkan pada pemilihan unit dari populasi umum secara acak tanpa ada unsur konsistensi. Secara teknis, pemilihan acak yang tepat dilakukan dengan pengundian (misalnya, lotere) atau dengan tabel angka acak.

Sebenarnya seleksi acak "dalam bentuknya yang murni" dalam praktek pengamatan selektif jarang digunakan, tetapi ini adalah yang pertama di antara jenis seleksi lainnya, menerapkan prinsip-prinsip dasar pengamatan selektif. Mari kita pertimbangkan beberapa pertanyaan tentang teori metode pengambilan sampel dan rumus kesalahan untuk sampel acak sederhana.

Kesalahan pengambilan sampel- ini adalah perbedaan antara nilai parameter dalam populasi umum, dan nilainya dihitung dari hasil pengamatan sampel. Untuk karakteristik kuantitatif rata-rata, kesalahan pengambilan sampel ditentukan oleh:

Indikatornya disebut kesalahan sampling marginal.
Rata-rata sampel adalah variabel acak yang dapat mengambil nilai yang berbeda tergantung pada unit mana yang ada dalam sampel. Oleh karena itu, kesalahan pengambilan sampel juga merupakan variabel acak dan dapat mengambil nilai yang berbeda. Oleh karena itu, tentukan rata-rata kesalahan yang mungkin - kesalahan sampling rata-rata, yang tergantung pada:

Ukuran sampel: semakin besar angkanya, semakin kecil rata-rata kesalahannya;

Derajat perubahan sifat yang dipelajari: semakin kecil variasi sifat, dan, akibatnya, varians, semakin kecil rata-rata kesalahan pengambilan sampel.

Pada pemilihan ulang acak kesalahan rata-rata dihitung:
.
Dalam prakteknya, varians umum tidak diketahui secara pasti, tetapi dalam teori probabilitas membuktikan bahwa
.
Karena nilai n yang cukup besar mendekati 1, kita dapat mengasumsikan bahwa . Kemudian mean sampling error dapat dihitung:
.
Tetapi dalam kasus sampel kecil (untuk n<30) коэффициент необходимо учитывать, и среднюю ошибку малой выборки рассчитывать по формуле
.

Pada pengambilan sampel acak rumus yang diberikan dikoreksi oleh nilai . Maka rata-rata kesalahan non-sampling adalah:
dan .
Karena selalu lebih kecil dari , maka faktor ( ) selalu lebih kecil dari 1. Ini berarti bahwa kesalahan rata-rata dalam pemilihan non-berulang selalu lebih kecil daripada dalam pemilihan berulang.
Pengambilan sampel mekanis digunakan ketika populasi umum diurutkan dalam beberapa cara (misalnya, daftar pemilih dalam urutan abjad, nomor telepon, nomor rumah, apartemen). Pemilihan satuan dilakukan pada selang waktu tertentu, yang sama dengan kebalikan dari persentase sampel. Jadi, dengan sampel 2%, setiap 50 unit = 1 / 0,02 dipilih, dengan 5%, masing-masing 1 / 0,05 = 20 unit populasi umum.

Asal dipilih dengan cara yang berbeda: secara acak, dari tengah interval, dengan perubahan asal. Hal utama adalah untuk menghindari kesalahan sistematis. Misalnya, dengan sampel 5%, jika yang ke-13 dipilih sebagai unit pertama, maka 33, 53, 73 berikutnya, dst.

Dalam hal akurasi, pemilihan mekanis mendekati pengambilan sampel acak yang tepat. Oleh karena itu, untuk menentukan rata-rata kesalahan sampling mekanis, digunakan rumus pemilihan acak yang tepat.

Pada pilihan khas populasi yang disurvei pada awalnya dibagi menjadi kelompok tipe tunggal yang homogen. Misalnya, ketika mensurvei perusahaan, ini bisa berupa industri, sub-sektor, sambil mempelajari populasi - wilayah, sosial atau kelompok umur. Kemudian seleksi independen dibuat dari masing-masing kelompok dengan cara acak mekanis atau yang tepat.

Sampling tipikal memberikan hasil yang lebih akurat daripada metode lain. Tipifikasi populasi umum memastikan representasi setiap kelompok tipologis dalam sampel, yang memungkinkan untuk mengecualikan pengaruh varians antarkelompok pada kesalahan sampel rata-rata. Oleh karena itu, ketika menemukan kesalahan sampel tipikal menurut aturan penambahan varians (), perlu untuk memperhitungkan hanya rata-rata varians grup. Maka mean sampling errornya adalah:
dalam pemilihan ulang
,
dengan pilihan yang tidak berulang
,
di mana adalah mean dari varians intra-grup dalam sampel.

Pilihan serial (atau bersarang) digunakan ketika populasi dibagi menjadi beberapa seri atau kelompok sebelum dimulainya survei sampel. Seri ini dapat berupa paket produk jadi, kelompok siswa, tim. Seri untuk pemeriksaan dipilih secara mekanis atau acak, dan di dalam rangkaian tersebut dilakukan survei unit yang lengkap. Oleh karena itu, kesalahan pengambilan sampel rata-rata hanya bergantung pada varians antarkelompok (antarseri), yang dihitung dengan rumus:

di mana r adalah jumlah seri yang dipilih;
- rata-rata deret ke-i.

Rata-rata kesalahan pengambilan sampel serial dihitung:

ketika dipilih kembali:
,
dengan pilihan tidak berulang:
,
di mana R adalah jumlah seri.

Gabungan pilihan adalah kombinasi dari metode seleksi yang dipertimbangkan.

Rata-rata kesalahan pengambilan sampel untuk setiap metode pemilihan tergantung terutama pada ukuran mutlak sampel dan, pada tingkat lebih rendah, pada persentase sampel. Misalkan 225 pengamatan dilakukan dalam kasus pertama dari populasi 4.500 unit dan dalam kasus kedua, dari 225.000 unit. Varians dalam kedua kasus sama dengan 25. Kemudian, dalam kasus pertama, dengan pemilihan 5%, kesalahan pengambilan sampel akan menjadi:

Dalam kasus kedua, dengan pilihan 0,1%, itu akan sama dengan:


Dengan demikian, dengan penurunan persentase sampel sebanyak 50 kali, kesalahan sampel sedikit meningkat, karena ukuran sampel tidak berubah.
Asumsikan bahwa ukuran sampel ditingkatkan menjadi 625 pengamatan. Dalam hal ini, kesalahan pengambilan sampel adalah:

Peningkatan sampel sebesar 2,8 kali dengan ukuran populasi umum yang sama mengurangi ukuran kesalahan pengambilan sampel lebih dari 1,6 kali.

Metode dan cara membentuk populasi sampel.

Dalam statistik, berbagai metode pembentukan kumpulan sampel digunakan, yang ditentukan oleh tujuan studi dan tergantung pada kekhususan objek studi.

Syarat utama diadakannya survei sampel adalah untuk mencegah terjadinya kesalahan sistematis yang timbul dari pelanggaran prinsip kesempatan yang sama bagi setiap unit populasi umum untuk masuk sampel. Pencegahan kesalahan sistematis dicapai sebagai hasil dari penggunaan metode berbasis ilmiah untuk pembentukan populasi sampel.

Ada cara berikut untuk memilih unit dari populasi umum:

1) seleksi individu - unit individu dipilih dalam sampel;

2) pemilihan kelompok - kelompok atau rangkaian unit yang secara kualitatif homogen yang diteliti termasuk dalam sampel;

3) seleksi gabungan adalah kombinasi dari seleksi individu dan seleksi kelompok.
Metode pemilihan ditentukan oleh aturan untuk pembentukan populasi sampling.

Sampelnya bisa berupa:

  • acak yang tepat terdiri dari fakta bahwa sampel terbentuk sebagai hasil dari pemilihan unit individu secara acak (tidak disengaja) dari populasi umum. Dalam hal ini, jumlah unit yang dipilih dalam kumpulan sampel biasanya ditentukan berdasarkan proporsi sampel yang diterima. Bagian sampel adalah rasio jumlah unit dalam populasi sampel n dengan jumlah unit dalam populasi umum N, yaitu.
  • mekanis terdiri dari fakta bahwa pemilihan unit dalam sampel dibuat dari populasi umum, dibagi menjadi interval yang sama (kelompok). Dalam hal ini, ukuran interval dalam populasi umum sama dengan kebalikan dari proporsi sampel. Jadi, dengan sampel 2%, setiap unit ke-50 dipilih (1:0,02), dengan sampel 5%, setiap unit ke-20 (1:0,05), dst. Jadi, sesuai dengan proporsi seleksi yang diterima, populasi umum, seolah-olah, secara mekanis dibagi menjadi kelompok-kelompok yang sama. Hanya satu unit yang dipilih dari setiap kelompok dalam sampel.
  • khas - di mana populasi umum pertama-tama dibagi menjadi kelompok-kelompok tipikal yang homogen. Kemudian, dari setiap kelompok tipikal, pemilihan unit individual ke dalam sampel dibuat dengan sampel acak atau mekanis. Fitur penting dari sampel tipikal adalah memberikan hasil yang lebih akurat dibandingkan dengan metode lain untuk memilih unit dalam sampel;
  • serial- di mana populasi umum dibagi menjadi kelompok-kelompok dengan ukuran yang sama - seri. Seri dipilih dalam kumpulan sampel. Di dalam deret tersebut, dilakukan pengamatan terus menerus terhadap satuan-satuan yang termasuk ke dalam deret tersebut;
  • gabungan- pengambilan sampel bisa dua tahap. Dalam hal ini, populasi umum terlebih dahulu dibagi menjadi beberapa kelompok. Kemudian kelompok dipilih, dan di dalam yang terakhir, unit individu dipilih.

Dalam statistik, metode pemilihan unit berikut dalam sampel dibedakan::

  • panggung tunggal sampel - setiap unit yang dipilih segera menjadi subjek penelitian berdasarkan dasar tertentu (sampel sebenarnya acak dan serial);
  • bertingkat pengambilan sampel - pemilihan dibuat dari populasi umum kelompok individu, dan unit individu dipilih dari kelompok (sampel tipikal dengan metode mekanis untuk memilih unit dalam populasi sampel).

Selain itu, ada:

  • pemilihan ulang- sesuai dengan skema bola yang dikembalikan. Dalam hal ini, setiap unit atau deret yang telah masuk ke dalam sampel dikembalikan ke populasi umum dan oleh karena itu mempunyai kesempatan untuk dimasukkan kembali ke dalam sampel;
  • seleksi tidak berulang- sesuai dengan skema bola yang tidak dikembalikan. Ini memiliki hasil yang lebih akurat untuk ukuran sampel yang sama.

Penentuan jumlah sampel yang dibutuhkan (menggunakan tabel Student).

Salah satu prinsip ilmiah dalam teori sampling adalah memastikan bahwa jumlah unit yang dipilih cukup. Secara teoritis, kebutuhan untuk mematuhi prinsip ini disajikan dalam bukti teorema limit teori probabilitas, yang memungkinkan Anda untuk menetapkan berapa banyak unit yang harus dipilih dari populasi umum sehingga cukup dan memastikan keterwakilan sampel.

Penurunan kesalahan standar sampel, dan, akibatnya, peningkatan akurasi perkiraan selalu dikaitkan dengan peningkatan ukuran sampel, oleh karena itu, sudah pada tahap pengorganisasian pengamatan sampel, perlu untuk memutuskan berapa ukuran sampel yang harus diambil untuk memastikan keakuratan hasil pengamatan yang diperlukan. Perhitungan ukuran sampel yang diperlukan dibangun menggunakan rumus yang diturunkan dari rumus untuk kesalahan pengambilan sampel marginal (A), sesuai dengan satu atau lain jenis dan metode pemilihan. Jadi, untuk ukuran sampel berulang acak (n), kami memiliki:

Inti dari rumus ini adalah bahwa dengan pemilihan ulang acak dari jumlah yang diperlukan, ukuran sampel berbanding lurus dengan kuadrat koefisien kepercayaan. (t2) dan varians dari fitur variasi (?2) dan berbanding terbalik dengan kuadrat dari kesalahan sampling marginal (?2). Secara khusus, dengan menggandakan kesalahan marjinal, ukuran sampel yang diperlukan dapat dikurangi dengan faktor empat. Dari ketiga parameter tersebut, dua (t dan?) ditetapkan oleh peneliti.

Pada saat yang sama, peneliti Untuk keperluan survei sampel, pertanyaannya harus diputuskan: dalam kombinasi kuantitatif apa yang lebih baik untuk memasukkan parameter ini untuk memberikan varian yang optimal? Dalam satu kasus, dia mungkin lebih puas dengan keandalan hasil yang diperoleh (t) daripada dengan ukuran akurasi (?), di lain - sebaliknya. Lebih sulit untuk menyelesaikan masalah mengenai nilai kesalahan sampling marjinal, karena peneliti tidak memiliki indikator ini pada tahap merancang pengamatan sampel, oleh karena itu, dalam praktiknya, adalah kebiasaan untuk menetapkan kesalahan pengambilan sampel marjinal, sebagai aturan, dalam 10% dari tingkat rata-rata yang diharapkan dari sifat tersebut. Menetapkan tingkat rata-rata yang diasumsikan dapat didekati dengan cara yang berbeda: menggunakan data dari survei serupa sebelumnya, atau menggunakan data dari kerangka sampling dan mengambil sampel percontohan kecil.

Hal yang paling sulit untuk ditetapkan ketika merancang observasi sampel adalah parameter ketiga dalam rumus (5.2) - varians dari populasi sampel. Dalam hal ini, perlu untuk menggunakan semua informasi yang tersedia bagi penyidik, yang diperoleh dari survei serupa dan percontohan sebelumnya.

pertanyaan definisi Ukuran sampel yang dibutuhkan menjadi lebih rumit jika survei sampel melibatkan studi beberapa fitur unit sampling. Dalam hal ini, tingkat rata-rata dari masing-masing karakteristik dan variasinya, sebagai suatu peraturan, berbeda, dan oleh karena itu dimungkinkan untuk memutuskan dispersi mana dari karakteristik yang lebih disukai hanya dengan mempertimbangkan maksud dan tujuan dari Survei.

Saat merancang pengamatan sampel, nilai kesalahan pengambilan sampel yang diizinkan yang telah ditentukan sebelumnya diasumsikan sesuai dengan tujuan studi tertentu dan kemungkinan kesimpulan berdasarkan hasil pengamatan.

Secara umum, rumus untuk kesalahan marginal dari nilai rata-rata sampel memungkinkan Anda untuk menentukan:

Besarnya kemungkinan penyimpangan indikator populasi umum dari indikator populasi sampel;

Ukuran sampel yang diperlukan, memberikan akurasi yang diperlukan, di mana batas kesalahan yang mungkin terjadi tidak akan melebihi nilai tertentu yang ditentukan;

Probabilitas bahwa kesalahan dalam sampel akan memiliki batas tertentu.

distribusi siswa dalam teori probabilitas, itu adalah keluarga satu parameter dari distribusi yang benar-benar kontinu.

Deret dinamika (interval, momen), penutupan deret dinamika.

Serangkaian dinamika- ini adalah nilai indikator statistik yang disajikan dalam urutan kronologis tertentu.

Setiap deret waktu mengandung dua komponen:

1) indikator periode waktu (tahun, kuartal, bulan, hari atau tanggal);

2) indikator yang mencirikan objek yang diteliti untuk periode waktu atau pada tanggal yang sesuai, yang disebut level seri.

Level dari deret tersebut dinyatakan nilai absolut dan nilai rata-rata atau relatif. Bergantung pada sifat indikatornya, rangkaian dinamis dari nilai absolut, relatif dan rata-rata dibangun. Deret dinamis nilai relatif dan rata-rata dibangun atas dasar deret turunan dari nilai absolut. Ada dinamika interval dan deret momen.

Seri interval dinamis berisi nilai-nilai indikator untuk periode waktu tertentu. Dalam deret interval, level dapat diringkas, memperoleh volume fenomena untuk periode yang lebih lama, atau yang disebut total akumulasi.

Seri momen dinamis mencerminkan nilai-nilai indikator pada titik waktu tertentu (tanggal waktu). Dalam deret momen, peneliti mungkin hanya tertarik pada perbedaan fenomena, yang mencerminkan perubahan tingkat deret antara tanggal tertentu, karena jumlah tingkat di sini tidak memiliki konten nyata. Total kumulatif tidak dihitung di sini.

Kondisi terpenting untuk konstruksi deret dinamis yang benar adalah komparabilitas tingkat deret yang berkaitan dengan periode yang berbeda. Tingkatan harus disajikan dalam jumlah yang homogen, harus ada kelengkapan cakupan yang sama dari berbagai bagian fenomena.

Untuk Untuk menghindari distorsi dinamika nyata, perhitungan awal dilakukan dalam studi statistik (penutupan deret dinamika), yang mendahului analisis statistik deret dinamis. Penutupan deret waktu dipahami sebagai kombinasi dua deret atau lebih menjadi satu deret yang tingkatannya dihitung menurut metodologi yang berbeda atau tidak sesuai dengan batas wilayah, dsb. Penutupan deret dinamika juga dapat berarti pengurangan tingkat absolut dari deret dinamika menjadi basis umum, yang menghilangkan ketidaksesuaian tingkat deret dinamika.

Konsep komparabilitas deret waktu, koefisien, pertumbuhan dan tingkat pertumbuhan.

Serangkaian dinamika- ini adalah serangkaian indikator statistik yang mencirikan perkembangan fenomena alam dan sosial dalam waktu. Koleksi statistik yang diterbitkan oleh Komite Statistik Negara Rusia berisi sejumlah besar deret waktu dalam bentuk tabel. Serangkaian dinamika memungkinkan pengungkapan pola perkembangan fenomena yang dipelajari.

Deret waktu berisi dua jenis indikator. Indikator waktu(tahun, kuartal, bulan, dll.) atau titik waktu (di awal tahun, di awal setiap bulan, dll.). Indikator tingkat baris. Indikator tingkat deret waktu dapat dinyatakan dalam nilai absolut (produksi dalam ton atau rubel), nilai relatif (pangsa populasi perkotaan dalam%) dan nilai rata-rata (upah rata-rata pekerja industri per tahun, dll.). Dalam bentuk tabel, deret waktu berisi dua kolom atau dua baris.

Konstruksi deret waktu yang benar melibatkan pemenuhan sejumlah persyaratan:

  1. semua indikator dari serangkaian dinamika harus dibuktikan secara ilmiah, dapat diandalkan;
  2. indikator dari serangkaian dinamika harus sebanding dalam waktu, yaitu. harus dihitung untuk periode waktu yang sama atau pada tanggal yang sama;
  3. indikator sejumlah dinamika harus dapat dibandingkan di seluruh wilayah;
  4. indikator dari serangkaian dinamika harus sebanding dalam konten, yaitu. dihitung menurut metodologi tunggal, dengan cara yang sama;
  5. indikator dari serangkaian dinamika harus dapat dibandingkan di seluruh kisaran pertanian yang dipertimbangkan. Semua indikator dari serangkaian dinamika harus diberikan dalam satuan pengukuran yang sama.

Indikator statistik dapat mengkarakterisasi baik hasil proses yang diteliti selama periode waktu tertentu, atau keadaan fenomena yang diteliti pada titik waktu tertentu, yaitu. indikator dapat berupa interval (periodik) dan instan. Dengan demikian, awalnya rangkaian dinamika dapat berupa interval atau momen. Deret momen dinamika, pada gilirannya, dapat dengan interval waktu yang sama dan tidak sama.

Deret dinamika awal dapat diubah menjadi deret nilai rata-rata dan deret nilai relatif (rantai dan basis). Deret waktu seperti itu disebut deret waktu turunan.

Cara menghitung tingkat rata-rata dalam deret dinamika berbeda-beda, karena jenis deret dinamikanya. Dengan menggunakan contoh, pertimbangkan jenis deret waktu dan rumus untuk menghitung tingkat rata-rata.

Keuntungan mutlak (y) menunjukkan berapa banyak unit tingkat berikutnya dari seri telah berubah dibandingkan dengan yang sebelumnya (kolom 3. - kenaikan mutlak rantai) atau dibandingkan dengan tingkat awal (kolom 4. - kenaikan mutlak dasar). Rumus perhitungannya dapat ditulis sebagai berikut:

Dengan penurunan nilai absolut dari seri, akan ada "penurunan", "penurunan", masing-masing.

Indikator pertumbuhan absolut menunjukkan bahwa, misalnya, pada tahun 1998 produksi produk "A" meningkat sebesar 4.000 ton dibandingkan dengan tahun 1997, dan sebesar 34.000 ton dibandingkan dengan tahun 1994; untuk tahun-tahun lainnya, lihat tabel. 11.5 gram. 3 dan 4.

Faktor pertumbuhan menunjukkan berapa kali tingkat deret telah berubah dibandingkan dengan yang sebelumnya (kolom 5 - koefisien pertumbuhan atau penurunan rantai) atau dibandingkan dengan tingkat awal (kolom 6 - koefisien pertumbuhan atau penurunan dasar). Rumus perhitungannya dapat ditulis sebagai berikut:

Tingkat pertumbuhan menunjukkan berapa persen tingkat berikutnya dari seri dibandingkan dengan yang sebelumnya (kolom 7 - tingkat pertumbuhan rantai) atau dibandingkan dengan tingkat awal (kolom 8 - tingkat pertumbuhan dasar). Rumus perhitungannya dapat ditulis sebagai berikut:

Jadi, misalnya, pada tahun 1997, volume produksi produk "A" dibandingkan dengan tahun 1996 adalah 105,5% (

Tingkat pertumbuhan menunjukkan berapa persen tingkat periode pelaporan yang meningkat dibandingkan dengan yang sebelumnya (kolom 9 - tingkat pertumbuhan rantai) atau dibandingkan dengan tingkat awal (kolom 10 - tingkat pertumbuhan dasar). Rumus perhitungannya dapat ditulis sebagai berikut:

T pr \u003d T p - 100% atau T pr \u003d peningkatan / level absolut dari periode sebelumnya * 100%

Jadi, misalnya, pada tahun 1996, dibandingkan dengan tahun 1995, produk "A" diproduksi 3,8% lebih banyak (103,8% - 100%) atau (8:210)x100%, dan dibandingkan dengan 1994 - sebesar 9% (109% - 100%).

Jika level absolut dalam deret tersebut menurun, maka lajunya akan kurang dari 100% dan, dengan demikian, akan ada laju penurunan (laju pertumbuhan dengan tanda minus).

Nilai absolut dari kenaikan 1%(kolom 11) menunjukkan berapa banyak unit yang harus diproduksi dalam suatu periode tertentu agar tingkat periode sebelumnya meningkat sebesar 1%. Dalam contoh kami, pada tahun 1995 perlu untuk menghasilkan 2,0 ribu ton, dan pada tahun 1998 - 2,3 ribu ton, mis. jauh lebih besar.

Ada dua cara untuk menentukan besarnya nilai absolut pertumbuhan 1%:

Bagilah level periode sebelumnya dengan 100;

Bagilah tingkat pertumbuhan rantai absolut dengan tingkat pertumbuhan rantai yang sesuai.

Nilai absolut kenaikan 1% =

Dalam dinamika, terutama dalam jangka waktu yang lama, penting untuk secara bersama-sama menganalisis laju pertumbuhan dengan isi setiap persentase kenaikan atau penurunan.

Perhatikan bahwa metode yang dipertimbangkan untuk menganalisis deret waktu berlaku baik untuk deret waktu, yang levelnya dinyatakan dalam nilai absolut (t, ribu rubel, jumlah karyawan, dll.), dan untuk deret waktu, tingkat yang dinyatakan dalam indikator relatif (% scrap , % kandungan abu batubara, dll.) atau nilai rata-rata (hasil rata-rata dalam c/ha, upah rata-rata, dll.).

Seiring dengan indikator analitik yang dipertimbangkan dihitung untuk setiap tahun dibandingkan dengan tingkat sebelumnya atau awal, ketika menganalisis deret waktu, perlu untuk menghitung indikator analitik rata-rata untuk periode tersebut: tingkat rata-rata deret, peningkatan absolut rata-rata tahunan (penurunan) dan tingkat pertumbuhan tahunan rata-rata dan tingkat pertumbuhan.

Metode untuk menghitung tingkat rata-rata dari serangkaian dinamika dibahas di atas. Dalam dinamika deret interval yang sedang kita bahas, tingkat rata-rata deret tersebut dihitung dengan rumus mean aritmatika sederhana:

Output tahunan rata-rata produk untuk 1994-1998. sebesar 218,4 ribu ton.

Peningkatan absolut rata-rata tahunan juga dihitung dengan rumus mean aritmatika sederhana:

Kenaikan absolut tahunan bervariasi selama bertahun-tahun dari 4 hingga 12 ribu ton (lihat kolom 3), dan peningkatan produksi tahunan rata-rata untuk periode 1995-1998. sebesar 8,5 ribu ton.

Metode untuk menghitung tingkat pertumbuhan rata-rata dan tingkat pertumbuhan rata-rata memerlukan pertimbangan yang lebih rinci. Mari kita pertimbangkan mereka pada contoh indikator tahunan dari level seri yang diberikan dalam tabel.

Tingkat tengah rentang dinamika.

Deret dinamika (atau deret waktu)- ini adalah nilai numerik dari indikator statistik tertentu pada saat atau periode waktu yang berurutan (yaitu diatur dalam urutan kronologis).

Nilai numerik dari indikator statistik tertentu yang membentuk serangkaian dinamika disebut tingkat angka dan biasanya dilambangkan dengan huruf kamu. Anggota pertama dari seri y 1 disebut inisial atau garis dasar, dan yang terakhir y n - terakhir. Saat-saat atau periode waktu yang mengacu pada level-level tersebut dilambangkan dengan t.

Deret dinamis, sebagai suatu peraturan, disajikan dalam bentuk tabel atau grafik, dan skala waktu dibangun di sepanjang sumbu x t, dan di sepanjang ordinat - skala level deret kamu.

Indikator rata-rata dari serangkaian dinamika

Setiap rangkaian dinamika dapat dianggap sebagai himpunan tertentu n indikator waktu-bervariasi yang dapat diringkas sebagai rata-rata. Indikator umum (rata-rata) seperti itu sangat diperlukan ketika membandingkan perubahan dalam satu atau lain indikator dalam periode yang berbeda, di negara yang berbeda, dll.

Karakteristik umum dari serangkaian dinamika dapat, pertama-tama, tingkat baris rata-rata. Metode penghitungan tingkat rata-rata tergantung pada apakah itu deret momen atau deret interval (periode).

Kapan selang deret, tingkat rata-ratanya ditentukan oleh rumus rata-rata aritmatika sederhana dari tingkat deret tersebut, yaitu

=
Jika tersedia momen baris berisi n tingkat ( y1, y2, …, yn) dengan interval yang sama antara tanggal (titik waktu), maka deret tersebut dapat dengan mudah diubah menjadi deret nilai rata-rata. Pada saat yang sama, indikator (level) di awal setiap periode secara bersamaan menjadi indikator di akhir periode sebelumnya. Kemudian nilai rata-rata indikator untuk setiap periode (interval antar tanggal) dapat dihitung sebagai setengah jumlah nilai pada pada awal dan akhir periode, yaitu sebagai . Jumlah rata-rata tersebut akan . Seperti disebutkan sebelumnya, untuk seri rata-rata, tingkat rata-rata dihitung dari rata-rata aritmatika.

Oleh karena itu, kita dapat menulis:
.
Setelah pembilangnya diubah, didapat:
,

di mana Y1 dan Yn- tingkat pertama dan terakhir dari seri; Yi- tingkat menengah.

Rata-rata ini dikenal dalam statistik sebagai rata-rata kronologis untuk seri momen. Dia menerima nama ini dari kata "cronos" (waktu, lat.), karena dihitung dari indikator yang berubah seiring waktu.

Dalam kasus tidak setara interval antara tanggal, rata-rata kronologis untuk deret momen dapat dihitung sebagai rata-rata aritmatika dari nilai rata-rata level untuk setiap pasangan momen, dibobot dengan jarak (interval waktu) antara tanggal, mis.
.
Pada kasus ini diasumsikan bahwa dalam interval antara tanggal, level mengambil nilai yang berbeda, dan kami berasal dari dua yang diketahui ( yi dan y+1) kami menentukan rata-rata, dari mana kami kemudian menghitung rata-rata keseluruhan untuk seluruh periode yang dianalisis.
Jika diasumsikan bahwa setiap nilai yi tetap tidak berubah sampai berikutnya (aku+ 1)- momen ke-, yaitu tanggal pasti perubahan level diketahui, maka perhitungan dapat dilakukan dengan menggunakan rumus rata-rata aritmatika berbobot:
,

di mana adalah waktu di mana tingkat tetap tidak berubah.

Selain tingkat rata-rata dalam rangkaian dinamika, indikator rata-rata lainnya juga dihitung - rata-rata perubahan tingkat rangkaian (dengan metode dasar dan rantai), tingkat perubahan rata-rata.

Baseline berarti perubahan mutlak adalah hasil bagi dari perubahan mutlak dasar terakhir dibagi dengan jumlah perubahan. Yaitu

Rantai berarti perubahan mutlak tingkat deret tersebut adalah hasil bagi membagi jumlah semua perubahan absolut rantai dengan jumlah perubahan, mis.

Dengan tanda perubahan absolut rata-rata, sifat perubahan fenomena juga dinilai rata-rata: pertumbuhan, penurunan atau stabilitas.

Dari aturan untuk mengendalikan perubahan mutlak dasar dan rantai, maka perubahan rata-rata dasar dan rantai harus sama.

Bersamaan dengan rata-rata perubahan mutlak, rata-rata relatif juga dihitung dengan menggunakan metode dasar dan rantai.

Perubahan Relatif Rata-Rata Dasar ditentukan dengan rumus:

Rantai berarti perubahan relatif ditentukan dengan rumus:

Secara alami, perubahan relatif rata-rata dasar dan rantai harus sama, dan dengan membandingkannya dengan nilai kriteria 1, kesimpulan dibuat tentang sifat perubahan fenomena rata-rata: pertumbuhan, penurunan atau stabilitas.
Dengan mengurangkan 1 dari basis atau rantai rata-rata perubahan relatif, yang sesuai tingkat perubahan rata-rata, dengan tanda yang juga dapat menilai sifat perubahan fenomena yang diteliti, tercermin dari rangkaian dinamika ini.

Fluktuasi musiman dan indeks musiman.

Fluktuasi musiman adalah fluktuasi intra-tahunan yang stabil.

Prinsip dasar pengelolaan untuk memperoleh efek yang maksimal adalah maksimalisasi pendapatan dan minimalisasi biaya. Dengan mempelajari fluktuasi musiman, masalah persamaan maksimum di setiap tingkat tahun diselesaikan.

Saat mempelajari fluktuasi musiman, dua tugas yang saling terkait diselesaikan:

1. Identifikasi kekhususan perkembangan fenomena dalam dinamika intra-tahunan;

2. Pengukuran fluktuasi musiman dengan konstruksi model gelombang musiman;

Kalkun musiman biasanya dihitung untuk mengukur musim. Secara umum, mereka ditentukan oleh rasio persamaan asli dari serangkaian dinamika dengan persamaan teoritis yang menjadi dasar perbandingan.

Karena penyimpangan acak ditumpangkan pada fluktuasi musiman, indeks musiman dirata-ratakan untuk menghilangkannya.

Dalam hal ini, untuk setiap periode siklus tahunan, indikator umum ditentukan dalam bentuk indeks musiman rata-rata:

Indeks rata-rata fluktuasi musiman bebas dari pengaruh penyimpangan acak dari tren perkembangan utama.

Bergantung pada sifat tren, rumus untuk indeks musiman rata-rata dapat mengambil bentuk berikut:

1.Untuk rangkaian dinamika intra-tahunan dengan tren perkembangan utama yang menonjol:

2. Untuk rangkaian dinamika intra-tahunan di mana tidak ada tren naik atau turun, atau tidak signifikan:

Dimana rata-rata umum;

Metode untuk menganalisis tren utama.

Perkembangan fenomena dari waktu ke waktu dipengaruhi oleh faktor-faktor yang berbeda sifat dan kekuatan pengaruhnya. Beberapa dari mereka bersifat acak, yang lain memiliki efek yang hampir konstan dan membentuk tren perkembangan tertentu dalam rangkaian dinamika.

Tugas penting statistik adalah mengidentifikasi tren dalam rangkaian dinamika, yang dibebaskan dari aksi berbagai faktor acak. Untuk tujuan ini, deret waktu diproses dengan metode pembesaran interval, rata-rata bergerak dan perataan analitis, dll.

Metode pengkasaran interval didasarkan pada perluasan periode waktu, yang meliputi tingkatan-tingkatan rangkaian dinamika, yaitu adalah penggantian data yang berhubungan dengan periode waktu yang kecil dengan data dari periode yang lebih besar. Ini sangat efektif ketika level awal dari seri adalah untuk periode waktu yang singkat. Misalnya, rangkaian indikator yang terkait dengan peristiwa harian diganti dengan rangkaian yang terkait dengan mingguan, bulanan, dll. Ini akan lebih jelas menunjukkan "Sumbu Perkembangan Fenomena". Rata-rata, dihitung berdasarkan interval yang diperbesar, memungkinkan untuk mengidentifikasi arah dan karakter (percepatan atau perlambatan pertumbuhan) dari tren pembangunan utama.

metode rata-rata bergerak mirip dengan yang sebelumnya, tetapi dalam kasus ini, level aktual diganti dengan level rata-rata yang dihitung untuk interval yang diperbesar secara berurutan bergerak (meluncur) yang meliputi m tingkat baris.

Misalnya jika diterima m=3, kemudian, pertama, rata-rata dari tiga level pertama dari seri dihitung, kemudian - dari jumlah level yang sama, tetapi mulai dari yang kedua berturut-turut, lalu - mulai dari yang ketiga, dll. Jadi, rata-rata, seolah-olah, "meluncur" di sepanjang rangkaian dinamika, bergerak selama satu periode. Dihitung dari m anggota rata-rata bergerak mengacu pada tengah (tengah) setiap interval.

Metode ini hanya menghilangkan fluktuasi acak. Jika deret tersebut memiliki gelombang musiman, maka akan tetap setelah dihaluskan dengan metode rata-rata bergerak.

Penjajaran analitis. Untuk menghilangkan fluktuasi acak dan mengidentifikasi tren, level rangkaian disejajarkan menurut rumus analitis (atau penyelarasan analitis). Esensinya adalah untuk menggantikan level empiris (aktual) dengan level teoretis, yang dihitung menurut persamaan tertentu, yang diambil sebagai model matematika dari tren, di mana level teoretis dianggap sebagai fungsi waktu: . Dalam hal ini, setiap level aktual dianggap sebagai jumlah dari dua komponen: , Dimana adalah komponen sistematis dan dinyatakan oleh persamaan tertentu, dan merupakan variabel acak yang menyebabkan fluktuasi di sekitar tren.

Tugas keselarasan analitis adalah sebagai berikut:

1. Menentukan, berdasarkan data aktual, jenis fungsi hipotetis yang paling dapat mencerminkan tren perkembangan indikator yang diteliti.

2. Menemukan parameter fungsi yang ditentukan (persamaan) dari data empiris

3. Perhitungan sesuai dengan persamaan tingkat teoritis (bertingkat) yang ditemukan.

Pilihan fungsi tertentu dilakukan, sebagai suatu peraturan, berdasarkan representasi grafis dari data empiris.

Modelnya adalah persamaan regresi, yang parameternya dihitung dengan metode kuadrat terkecil

Di bawah ini adalah persamaan regresi yang paling umum digunakan untuk meratakan deret waktu, yang menunjukkan tren perkembangan mana yang paling sesuai untuk dicerminkan.

Untuk menemukan parameter persamaan di atas, ada algoritma khusus dan program komputer. Secara khusus, untuk menemukan parameter persamaan garis lurus, algoritma berikut dapat digunakan:

Jika periode atau momen waktu dinomori sehingga diperoleh St = 0, maka algoritma di atas akan disederhanakan secara signifikan dan berubah menjadi

Level yang disejajarkan pada grafik akan ditempatkan pada satu garis lurus yang melewati jarak terdekat dari level aktual dari rangkaian dinamis ini. Jumlah deviasi kuadrat adalah cerminan dari pengaruh faktor acak.

Dengan bantuannya, kami menghitung kesalahan rata-rata (standar) dari persamaan:

Di sini n adalah jumlah pengamatan, dan m adalah jumlah parameter dalam persamaan (kami memiliki dua di antaranya - b 1 dan b 0).

Tren utama (tren) menunjukkan bagaimana faktor sistematis mempengaruhi level deret waktu, dan fluktuasi level di sekitar tren () berfungsi sebagai ukuran dampak faktor residual.

Untuk menilai kualitas model deret waktu yang digunakan juga digunakan uji F Fisher. Ini adalah rasio dua varians, yaitu rasio varians yang disebabkan oleh regresi, yaitu. faktor yang dipelajari, hingga dispersi yang disebabkan oleh penyebab acak, yaitu varians sisa:

Dalam bentuk yang diperluas, rumus untuk kriteria ini dapat direpresentasikan sebagai berikut:

di mana n adalah jumlah pengamatan, mis. jumlah tingkat baris,

m adalah jumlah parameter dalam persamaan, y adalah tingkat sebenarnya dari seri,

Tingkat rata baris, - tingkat rata-rata baris.

Lebih berhasil daripada yang lain, model mungkin tidak selalu cukup memuaskan. Ini dapat dikenali hanya jika kriteria F untuknya melintasi batas kritis tertentu. Batas ini ditetapkan menggunakan tabel distribusi F.

Esensi dan klasifikasi indeks.

Indeks dalam statistik dipahami sebagai indikator relatif yang mencirikan perubahan besaran suatu fenomena dalam waktu, ruang, atau dibandingkan dengan standar apa pun.

Elemen utama dari hubungan indeks adalah nilai yang diindeks. Nilai berindeks dipahami sebagai nilai tanda populasi statistik, yang perubahannya menjadi objek studi.

Indeks melayani tiga tujuan utama:

1) penilaian perubahan fenomena yang kompleks;

2) penentuan pengaruh faktor individu terhadap perubahan fenomena yang kompleks;

3) perbandingan besarnya suatu fenomena dengan besarnya periode yang lalu, besarnya wilayah lain, serta dengan standar, rencana, prakiraan.

Indeks diklasifikasikan menurut 3 kriteria:

2) menurut tingkat cakupan elemen populasi;

3) dengan metode penghitungan indeks umum.

Berdasarkan konten Dari nilai indeks, indeks dibagi menjadi indeks indikator kuantitatif (volumetrik) dan indeks indikator kualitatif. Indeks indikator kuantitatif - indeks volume fisik produksi industri, volume fisik penjualan, jumlah, dll. Indeks indikator kualitatif - indeks harga, biaya, produktivitas tenaga kerja, upah rata-rata, dll.

Menurut tingkat cakupan unit populasi, indeks dibagi menjadi dua kelas: individu dan umum. Untuk mengkarakterisasinya, kami memperkenalkan konvensi berikut yang diadopsi dalam praktik penerapan metode indeks:

q- kuantitas (volume) produk apa pun dalam bentuk barang ; R- harga satuan produksi; z- biaya satuan produksi; t- waktu yang dihabiskan untuk produksi satu unit output (intensitas tenaga kerja) ; w- hasil produksi dalam hal nilai per unit waktu; v- keluaran dalam bentuk fisik per satuan waktu; T- total waktu yang dihabiskan atau jumlah karyawan.

Untuk membedakan periode atau objek mana yang memiliki nilai yang diindeks, biasanya menempatkan subskrip setelah simbol yang sesuai di kanan bawah. Jadi, misalnya, dalam indeks dinamika, sebagai aturan, untuk periode yang dibandingkan (saat ini, pelaporan), subskrip 1 digunakan dan untuk periode yang dengannya perbandingan dibuat,

indeks individu berfungsi untuk mengkarakterisasi perubahan elemen individu dari fenomena kompleks (misalnya, perubahan volume output dari satu jenis produk). Mereka mewakili nilai relatif dari dinamika, pemenuhan kewajiban, perbandingan nilai yang diindeks.

Indeks individu dari volume fisik produksi ditentukan

Dari sudut pandang analitis, indeks dinamika individu yang diberikan mirip dengan koefisien (tingkat) pertumbuhan dan mencirikan perubahan nilai indeks pada periode saat ini dibandingkan dengan basis, yaitu menunjukkan berapa kali itu telah meningkat (menurun). ) atau berapa persen pertumbuhan (penurunan). Nilai indeks dinyatakan dalam koefisien atau persentase.

Indeks umum (gabungan) mencerminkan perubahan semua elemen dari fenomena yang kompleks.

indeks agregat adalah bentuk dasar dari indeks. Disebut agregat karena pembilang dan penyebutnya merupakan himpunan "agregat"

Indeks rata-rata, definisinya.

Selain indeks agregat, bentuk lain dari mereka digunakan dalam statistik - indeks rata-rata tertimbang. Perhitungan mereka terpaksa ketika informasi yang tersedia tidak memungkinkan menghitung indeks agregat umum. Jadi, jika tidak ada data harga, tetapi ada informasi tentang harga pokok produk pada periode berjalan dan indeks harga individu untuk setiap produk diketahui, maka indeks harga umum tidak dapat ditentukan secara agregat, tetapi dimungkinkan. untuk menghitungnya sebagai rata-rata individu. Dengan cara yang sama, jika jumlah masing-masing produk yang dihasilkan tidak diketahui, tetapi indeks individu dan biaya produksi pada periode dasar diketahui, maka indeks keseluruhan volume fisik produksi dapat ditentukan sebagai rata-rata tertimbang.

Indeks rata-rata - Ini indeks dihitung sebagai rata-rata indeks individu. Indeks agregat merupakan bentuk dasar dari indeks umum, sehingga indeks rata-rata harus identik dengan indeks agregat. Saat menghitung indeks rata-rata, dua bentuk rata-rata digunakan: aritmatika dan harmonik.

Indeks rata-rata aritmatika identik dengan indeks agregat jika bobot indeks individu adalah suku penyebut indeks agregat. Hanya dalam hal ini nilai indeks yang dihitung dengan rumus rata-rata aritmatika akan sama dengan indeks agregat.

Ketika pengujian statistik hipotesis, ketika mengukur hubungan linier antara variabel acak.

Standar deviasi:

Standar deviasi(perkiraan standar deviasi dari variabel acak Lantai, dinding di sekitar kita dan langit-langit, x relatif terhadap ekspektasi matematisnya berdasarkan estimasi variansnya yang tidak bias):

di mana - varians; - Lantai, dinding di sekitar kita dan langit-langit, saya-elemen sampel; - ukuran sampel; - mean aritmatika sampel:

Perlu dicatat bahwa kedua perkiraan itu bias. Dalam kasus umum, tidak mungkin untuk membuat estimasi yang tidak bias. Namun, estimasi yang didasarkan pada estimasi varians yang tidak bias adalah konsisten.

aturan tiga sigma

aturan tiga sigma() - hampir semua nilai variabel acak terdistribusi normal terletak pada interval . Lebih tepatnya - dengan kepastian tidak kurang dari 99,7%, nilai variabel acak terdistribusi normal terletak pada interval yang ditentukan (asalkan nilainya benar, dan tidak diperoleh sebagai hasil dari pemrosesan sampel).

Jika nilai sebenarnya tidak diketahui, maka Anda tidak boleh menggunakan, tetapi lantai, dinding di sekitar kita dan langit-langit, s. Dengan demikian, aturan tiga sigma diterjemahkan ke dalam aturan tiga Lantai, dinding di sekitar kita dan langit-langit, s .

Interpretasi nilai simpangan baku

Nilai standar deviasi yang besar menunjukkan penyebaran nilai yang besar dalam himpunan yang disajikan dengan nilai rata-rata himpunan; nilai kecil, masing-masing, menunjukkan bahwa nilai-nilai dalam himpunan dikelompokkan di sekitar nilai rata-rata.

Misalnya, kami memiliki tiga set angka: (0, 0, 14, 14), (0, 6, 8, 14) dan (6, 6, 8, 8). Ketiga himpunan masing-masing memiliki nilai rata-rata 7 dan simpangan baku 7, 5, dan 1. Himpunan terakhir memiliki simpangan baku kecil karena nilai-nilai dalam himpunan berkerumun di sekitar rata-rata; set pertama memiliki nilai deviasi standar terbesar - nilai dalam set sangat berbeda dari nilai rata-rata.

Dalam pengertian umum, standar deviasi dapat dianggap sebagai ukuran ketidakpastian. Misalnya, dalam fisika, standar deviasi digunakan untuk menentukan kesalahan dari serangkaian pengukuran berturut-turut dari beberapa kuantitas. Nilai ini sangat penting untuk menentukan masuk akal dari fenomena yang diteliti dibandingkan dengan nilai yang diprediksi oleh teori: jika nilai rata-rata pengukuran sangat berbeda dari nilai yang diprediksi oleh teori (standar deviasi besar), maka nilai yang diperoleh atau metode untuk memperolehnya harus diperiksa ulang.

Penggunaan praktis

Dalam praktiknya, standar deviasi memungkinkan Anda untuk menentukan seberapa besar nilai dalam himpunan dapat berbeda dari nilai rata-rata.

Iklim

Misalkan ada dua kota dengan suhu maksimum harian rata-rata yang sama, tetapi satu terletak di pantai dan yang lainnya di pedalaman. Kota-kota pesisir diketahui memiliki banyak suhu maksimum harian yang berbeda kurang dari kota-kota pedalaman. Oleh karena itu, standar deviasi suhu harian maksimum di kota pesisir akan lebih kecil daripada di kota kedua, meskipun pada kenyataannya nilai rata-rata dari nilai ini sama untuk mereka, yang dalam praktiknya berarti bahwa probabilitas bahwa udara maksimum suhu setiap hari tertentu dalam setahun akan lebih kuat berbeda dari nilai rata-rata, lebih tinggi untuk kota yang terletak di dalam benua.

Olahraga

Mari kita asumsikan bahwa ada beberapa tim sepak bola yang diberi peringkat menurut beberapa parameter, misalnya, jumlah gol yang dicetak dan kebobolan, peluang untuk mencetak gol, dll. Kemungkinan besar tim terbaik di grup ini akan memiliki yang terbaik nilai dalam lebih banyak parameter. Semakin kecil simpangan baku tim untuk setiap parameter yang disajikan, semakin dapat diprediksi hasil tim, tim tersebut seimbang. Di sisi lain, tim dengan standar deviasi besar sulit untuk memprediksi hasilnya, yang pada gilirannya dijelaskan oleh ketidakseimbangan, misalnya, pertahanan yang kuat, tetapi serangan yang lemah.

Penggunaan standar deviasi parameter tim memungkinkan seseorang untuk memprediksi hasil pertandingan antara dua tim sampai batas tertentu, mengevaluasi kekuatan dan kelemahan tim, dan karenanya metode perjuangan yang dipilih.

Analisis teknis

Lihat juga

literatur

* Borovikov, V. STATISTIK. Seni analisis data komputer: Untuk profesional / V. Borovikov. - Sankt Peterburg. : Peter, 2003. - 688 hal. - ISBN 5-272-00078-1.