Rasio simpangan baku dengan rata-rata. Standar deviasi

Penyebaran. Standar deviasi

Penyebaran adalah rata-rata aritmatika dari deviasi kuadrat dari setiap nilai fitur dari rata-rata total. Bergantung pada sumber data, varians dapat tidak berbobot (sederhana) atau berbobot.

Dispersi dihitung menggunakan rumus berikut:

untuk data yang tidak dikelompokkan

untuk data yang dikelompokkan

Prosedur untuk menghitung varians tertimbang:

1. tentukan rata-rata tertimbang aritmatika

2. Penyimpangan varian dari mean ditentukan

3. kuadratkan deviasi setiap opsi dari mean

4. kalikan deviasi kuadrat dengan bobot (frekuensi)

5. merangkum karya yang diterima

6. jumlah yang dihasilkan dibagi dengan jumlah bobot

Rumus untuk menentukan varians dapat diubah menjadi rumus berikut:

- sederhana

Prosedur untuk menghitung varians sederhana:

1. tentukan mean aritmatika

2. kuadratkan mean aritmatika

3. kuadratkan setiap opsi baris

4. temukan opsi jumlah kuadrat

5. bagi jumlah kuadrat opsi dengan nomornya, mis. tentukan kuadrat rata-rata

6. tentukan perbedaan antara kuadrat rata-rata fitur dan kuadrat rata-rata

Juga rumus untuk menentukan varians tertimbang dapat dikonversi ke rumus berikut:

itu. variansnya sama dengan selisih antara rerata kuadrat nilai fitur dan kuadrat rerata aritmatika. Saat menggunakan rumus yang dikonversi, prosedur tambahan untuk menghitung penyimpangan nilai individual atribut dari x dikecualikan dan kesalahan dalam perhitungan yang terkait dengan pembulatan penyimpangan dikecualikan

Dispersi memiliki sejumlah properti, beberapa di antaranya membuatnya lebih mudah untuk dihitung:

1) dispersi nilai konstanta adalah nol;

2) jika semua varian dari nilai atribut dikurangi dengan jumlah yang sama, maka varians tidak akan berkurang;

3) jika semua varian dari nilai atribut dikurangi dengan jumlah yang sama kali (kali), maka varians akan berkurang dengan faktor

Simpangan baku S- adalah akar kuadrat dari varians:

Untuk data yang tidak dikelompokkan:

;

Untuk seri variasi:

Rentang variasi, deviasi linier rata-rata dan deviasi kuadrat rata-rata dinamakan besaran. Mereka memiliki satuan ukuran yang sama dengan nilai karakteristik individu.

Dispersi dan standar deviasi adalah ukuran variasi yang paling banyak digunakan. Ini dijelaskan oleh fakta bahwa mereka termasuk dalam sebagian besar teorema teori probabilitas, yang berfungsi sebagai dasar statistik matematika. Selain itu, varians dapat didekomposisi menjadi elemen-elemen penyusunnya, memungkinkan untuk menilai pengaruh berbagai faktor yang menyebabkan variasi suatu sifat.

Perhitungan variasi indikator untuk bank yang dikelompokkan berdasarkan keuntungan ditunjukkan pada tabel.

Untung, juta rubel Jumlah bank indikator yang dihitung
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Total: 121,70 17,640 23,126

Rerata deviasi linier dan deviasi kuadrat rata-rata menunjukkan seberapa besar nilai atribut berfluktuasi secara rata-rata untuk unit dan populasi yang diteliti. Jadi, dalam hal ini, nilai rata-rata fluktuasi jumlah keuntungan adalah: menurut deviasi linier rata-rata, 0,882 juta rubel; menurut standar deviasi - 1,075 juta rubel. Simpangan baku selalu lebih besar dari simpangan linier rata-rata. Jika distribusi sifat mendekati normal, maka ada hubungan antara S dan d: S=1.25d, atau d=0.8S. Standar deviasi menunjukkan bagaimana sebagian besar unit populasi terletak relatif terhadap mean aritmatika. Terlepas dari bentuk distribusinya, 75 nilai atribut termasuk dalam interval x 2S, dan setidaknya 89 dari semua nilai termasuk dalam interval x 3S (teorema P.L. Chebyshev).

Untuk menghitung mean geometrik sederhana, digunakan rumus:

tertimbang geometris

Untuk menentukan rata-rata tertimbang geometrik, digunakan rumus:

Diameter rata-rata roda, pipa, sisi rata-rata kotak ditentukan menggunakan akar rata-rata kuadrat.

Nilai RMS digunakan untuk menghitung beberapa indikator, seperti koefisien variasi, yang mencirikan ritme keluaran. Di sini, standar deviasi dari output yang direncanakan untuk periode tertentu ditentukan oleh rumus berikut:

Nilai-nilai ini secara akurat mencirikan perubahan indikator ekonomi dibandingkan dengan nilai dasarnya, diambil dalam nilai rata-ratanya.

kuadrat sederhana

Rata-rata kuadrat sederhana dihitung dengan rumus:

berbobot kuadrat

Kuadrat rata-rata akar tertimbang adalah:

22. Ukuran mutlak variasi meliputi:

berbagai variasi

deviasi linier rata-rata

penyebaran

simpangan baku

Rentang variasi (r)

Variasi rentang adalah perbedaan antara nilai maksimum dan minimum dari atribut

Ini menunjukkan batas-batas di mana nilai atribut berubah dalam populasi yang diteliti.

Pengalaman kerja lima pelamar pada pekerjaan sebelumnya adalah: 2,3,4,7 dan 9 tahun. Solusi: rentang variasi = 9 - 2 = 7 tahun.

Untuk karakteristik umum dari perbedaan nilai atribut, indikator variasi rata-rata dihitung berdasarkan penyisihan penyimpangan dari rata-rata aritmatika. Selisihnya diambil sebagai penyimpangan dari rata-rata.

Pada saat yang sama, untuk menghindari berubah menjadi nol jumlah deviasi opsi sifat dari mean (properti nol dari mean), kita harus mengabaikan tanda-tanda deviasi, yaitu, ambil jumlah modulo ini , atau kuadratkan nilai simpangannya

Rata-rata deviasi linier dan kuadrat

Deviasi linier rata-rata adalah rata-rata aritmatika dari penyimpangan absolut dari nilai individu atribut dari rata-rata.

Deviasi linier rata-rata sederhana:

Pengalaman kerja lima pelamar pada pekerjaan sebelumnya adalah: 2,3,4,7 dan 9 tahun.

Dalam contoh kita: tahun;

Jawab: 2,4 tahun.

Rata-rata deviasi linier tertimbang berlaku untuk data yang dikelompokkan:

Penyimpangan linier rata-rata, karena persyaratannya, relatif jarang digunakan dalam praktik (khususnya, untuk mencirikan pemenuhan kewajiban kontrak dalam hal keseragaman pengiriman; dalam analisis kualitas produk, dengan mempertimbangkan fitur teknologi produksi ).

Standar deviasi

Ciri variasi yang paling sempurna adalah simpangan baku, yang disebut standar (atau simpangan baku). Standar deviasi() sama dengan akar kuadrat dari kuadrat rata-rata penyimpangan nilai individual fitur dari mean aritmatika:

Standar deviasinya sederhana:

Standar deviasi tertimbang diterapkan untuk data yang dikelompokkan:

Antara kuadrat rata-rata dan deviasi linier rata-rata dalam kondisi distribusi normal, hubungan berikut terjadi: ~ 1,25.

Simpangan baku, sebagai ukuran mutlak utama variasi, digunakan dalam menentukan nilai koordinat kurva distribusi normal, dalam perhitungan yang terkait dengan organisasi pengamatan sampel dan menetapkan keakuratan karakteristik sampel, serta dalam menilai batas-batas variasi suatu sifat dalam populasi homogen.

Standar deviasi adalah salah satu istilah statistik di dunia korporat yang mengangkat profil orang-orang yang berhasil mengacaukannya dalam percakapan atau presentasi, dan meninggalkan kesalahpahaman yang samar bagi mereka yang tidak tahu apa itu tetapi malu untuk melakukannya. bertanya. Faktanya, sebagian besar manajer tidak memahami konsep deviasi standar, dan jika Anda salah satunya, inilah saatnya bagi Anda untuk berhenti hidup dalam kebohongan. Dalam artikel hari ini, saya akan menunjukkan kepada Anda bagaimana statistik yang diremehkan ini dapat membantu Anda lebih memahami data yang sedang Anda kerjakan.

Apa yang diukur dengan standar deviasi?

Bayangkan Anda adalah pemilik dua toko. Dan untuk menghindari kerugian, penting adanya kontrol yang jelas atas saldo saham. Dalam upaya untuk mengetahui siapa manajer saham terbaik, Anda memutuskan untuk menganalisis saham dari enam minggu terakhir. Biaya mingguan rata-rata stok kedua toko kira-kira sama dan sekitar 32 unit konvensional. Sepintas, nilai rata-rata saham menunjukkan bahwa kedua manajer bekerja dengan cara yang sama.

Tetapi jika Anda melihat lebih dekat pada aktivitas toko kedua, Anda dapat melihat bahwa meskipun nilai rata-ratanya benar, variabilitas stoknya sangat tinggi (dari 10 hingga 58 USD). Dengan demikian, dapat disimpulkan bahwa mean tidak selalu benar memperkirakan data. Di sinilah standar deviasi masuk.

Simpangan baku menunjukkan bagaimana nilai-nilai didistribusikan relatif terhadap rata-rata dalam . Dengan kata lain, Anda dapat memahami seberapa besar limpasan dari minggu ke minggu.

Dalam contoh kami, kami menggunakan fungsi Excel STDEV untuk menghitung standar deviasi bersama dengan mean.

Dalam kasus manajer pertama, simpangan bakunya adalah 2. Ini memberitahu kita bahwa setiap nilai dalam sampel menyimpang rata-rata sebesar 2 dari rata-rata. Apakah itu baik? Mari kita lihat pertanyaan dari sudut yang berbeda - standar deviasi 0 memberi tahu kita bahwa setiap nilai dalam sampel sama dengan nilai rata-ratanya (dalam kasus kita, 32,2). Misalnya, standar deviasi 2 tidak jauh berbeda dengan 0, menunjukkan bahwa sebagian besar nilai mendekati rata-rata. Semakin dekat standar deviasi ke 0, semakin dapat diandalkan mean. Selain itu, standar deviasi mendekati 0 menunjukkan sedikit variabilitas dalam data. Artinya, nilai tenggelam dengan standar deviasi 2 menunjukkan konsistensi yang luar biasa dari manajer pertama.

Dalam kasus toko kedua, standar deviasi adalah 18,9. Artinya, biaya limpasan menyimpang rata-rata sebesar 18,9 dari nilai rata-rata dari minggu ke minggu. Penyebaran gila! Semakin jauh standar deviasi dari 0, semakin tidak akurat rata-ratanya. Dalam kasus kami, angka 18,9 menunjukkan bahwa nilai rata-rata ($32,8 per minggu) tidak dapat dipercaya. Ini juga memberitahu kita bahwa limpasan mingguan sangat bervariasi.

Ini adalah konsep simpangan baku secara singkat. Meskipun tidak memberikan wawasan tentang pengukuran statistik penting lainnya (Mode, Median ...), pada kenyataannya, standar deviasi memainkan peran penting dalam sebagian besar perhitungan statistik. Memahami prinsip-prinsip deviasi standar akan menjelaskan esensi dari banyak proses dalam aktivitas Anda.

Bagaimana cara menghitung simpangan baku?

Jadi, sekarang kita tahu apa yang dikatakan angka standar deviasi. Mari kita lihat bagaimana hitungannya.

Pertimbangkan kumpulan data dari 10 hingga 70 dengan penambahan 10. Seperti yang Anda lihat, saya telah menghitung simpangan bakunya menggunakan fungsi STDEV di sel H2 (oranye).

Di bawah ini adalah langkah-langkah yang dilakukan Excel untuk sampai pada 21.6.

Harap dicatat bahwa semua perhitungan divisualisasikan untuk pemahaman yang lebih baik. Faktanya, di Excel, perhitungannya seketika, meninggalkan semua langkah di belakang layar.

Excel pertama-tama menemukan rata-rata sampel. Dalam kasus kami, rata-ratanya ternyata 40, yang dikurangkan dari setiap nilai sampel pada langkah berikutnya. Setiap perbedaan yang dihasilkan dikuadratkan dan dijumlahkan. Kami mendapatkan jumlah yang sama dengan 2800, yang harus dibagi dengan jumlah elemen sampel dikurangi 1. Karena kami memiliki 7 elemen, ternyata kami harus membagi 2800 dengan 6. Dari hasil kami menemukan akar kuadrat, angka ini akan menjadi standar deviasi.

Bagi mereka yang tidak sepenuhnya jelas tentang prinsip menghitung standar deviasi menggunakan visualisasi, saya memberikan interpretasi matematis untuk menemukan nilai ini.

Fungsi perhitungan deviasi standar di Excel

Ada beberapa jenis rumus standar deviasi di Excel. Anda hanya perlu mengetik =STDEV dan Anda akan melihatnya sendiri.

Perlu dicatat bahwa fungsi STDEV.V dan STDEV.G (fungsi pertama dan kedua dalam daftar) menduplikasi fungsi STDEV dan STDEV (fungsi kelima dan keenam dalam daftar), masing-masing, yang dipertahankan untuk kompatibilitas dengan sebelumnya versi Excel.

Pada umumnya perbedaan pada akhiran .in dan .g function menunjukkan prinsip penghitungan simpangan baku suatu sampel atau populasi. Saya sudah menjelaskan perbedaan antara dua array ini di yang sebelumnya.

Fitur fungsi STDEV dan STDEVPA (fungsi ketiga dan keempat dalam daftar) adalah bahwa ketika menghitung standar deviasi array, nilai logis dan teks diperhitungkan. Teks dan boolean benar adalah 1, dan boolean palsu adalah 0. Sulit bagi saya untuk membayangkan situasi di mana saya akan membutuhkan dua fungsi ini, jadi saya pikir mereka dapat diabaikan.

Nilai-nilai yang didapat dari pengalaman pasti mengandung kesalahan karena berbagai alasan. Di antara mereka, kesalahan sistematis dan acak harus dibedakan. Kesalahan sistematis disebabkan oleh penyebab yang bertindak dengan cara yang sangat spesifik, dan selalu dapat dihilangkan atau diperhitungkan dengan akurasi yang memadai. Kesalahan acak disebabkan oleh sejumlah besar penyebab individu yang tidak dapat dipertanggungjawabkan secara akurat dan bertindak berbeda dalam setiap pengukuran individu. Kesalahan ini tidak dapat sepenuhnya dikesampingkan; mereka hanya dapat diperhitungkan secara rata-rata, yang untuk itu perlu diketahui hukum-hukum yang menjadi subjek kesalahan acak.

Kami akan menunjukkan nilai terukur dengan A, dan kesalahan acak dalam pengukuran x. Karena kesalahan x dapat mengambil nilai apa pun, itu adalah variabel acak kontinu, yang sepenuhnya dicirikan oleh hukum distribusinya sendiri.

Realitas yang paling sederhana dan paling akurat mencerminkan (dalam sebagian besar kasus) adalah apa yang disebut distribusi kesalahan normal:

Hukum distribusi ini dapat diperoleh dari berbagai premis teoretis, khususnya, dari persyaratan bahwa nilai yang paling mungkin dari suatu besaran yang tidak diketahui di mana serangkaian nilai dengan tingkat akurasi yang sama diperoleh dengan pengukuran langsung adalah rata-rata aritmatika dari nilai-nilai ini. Nilai 2 disebut penyebaran dari hukum biasa ini.

Rata-rata

Penentuan dispersi menurut data percobaan. Jika untuk sembarang besaran A, n nilai ai diperoleh dengan pengukuran langsung dengan tingkat ketelitian yang sama, dan jika kesalahan dalam besaran A tunduk pada hukum distribusi normal, maka nilai A yang paling mungkin adalah rata-rata:

a - rata-rata aritmatika,

a i - nilai terukur pada langkah ke-i.

Penyimpangan nilai yang diamati (untuk setiap pengamatan) a i dari nilai A dari rata-rata aritmatika: a i - a.

Untuk menentukan dispersi dari distribusi normal kesalahan dalam kasus ini, gunakan rumus:

2 - dispersi,
a - rata-rata aritmatika,
n adalah jumlah pengukuran parameter,

simpangan baku

simpangan baku menunjukkan deviasi absolut dari nilai yang diukur dari rata-rata aritmatika. Sesuai dengan rumus untuk ukuran akurasi kombinasi linier akar rata-rata kesalahan kuadrat mean aritmatika ditentukan oleh rumus:

, di mana


a - rata-rata aritmatika,
n adalah jumlah pengukuran parameter,
a i - nilai terukur pada langkah ke-i.

Koefisien variasi

Koefisien variasi mencirikan tingkat deviasi relatif dari nilai yang diukur dari rata-rata aritmatika:

, di mana

V - koefisien variasi,
- simpangan baku,
a - rata-rata aritmatika.

Semakin besar nilainya koefisien variasi, semakin besar hamburan dan semakin kecil keseragaman nilai yang dipelajari. Jika sebuah koefisien variasi kurang dari 10%, maka variabilitas deret variasi dianggap tidak signifikan, dari 10% hingga 20% mengacu pada rata-rata, lebih dari 20% dan kurang dari 33% hingga signifikan, dan jika koefisien variasi melebihi 33%, ini menunjukkan heterogenitas informasi dan kebutuhan untuk mengecualikan nilai terbesar dan terkecil.

Deviasi linier rata-rata

Salah satu indikator jangkauan dan intensitas variasi adalah deviasi linier rata-rata(modulus deviasi rata-rata) dari mean aritmatika. Deviasi linier rata-rata dihitung dengan rumus:

, di mana

_
a - deviasi linier rata-rata,
a - rata-rata aritmatika,
n adalah jumlah pengukuran parameter,
a i - nilai terukur pada langkah ke-i.

Untuk memeriksa kesesuaian nilai yang dipelajari dengan hukum distribusi normal, hubungan digunakan indeks asimetri atas kesalahan dan sikapnya indikator kurtosis untuk kesalahannya.

indeks asimetri

indeks asimetri(A) dan kesalahannya (m a) dihitung menggunakan rumus berikut:

, di mana

A - indikator asimetri,
- simpangan baku,
a - rata-rata aritmatika,
n adalah jumlah pengukuran parameter,
a i - nilai terukur pada langkah ke-i.

Indikator Kurtosis

Indikator Kurtosis(E) dan kesalahannya (m e) dihitung menggunakan rumus berikut:

, di mana

Standar deviasi adalah indikator klasik variabilitas dari statistik deskriptif.

Standar deviasi, standar deviasi, RMS, sampel standar deviasi (Standar deviasi bahasa Inggris, STD, STDev) adalah ukuran dispersi yang sangat umum dalam statistik deskriptif. Tapi karena analisis teknis mirip dengan statistik, indikator ini dapat (dan harus) digunakan dalam analisis teknis untuk mendeteksi tingkat penyebaran harga instrumen yang dianalisis dari waktu ke waktu. Dilambangkan dengan simbol Yunani Sigma "σ".

Terima kasih kepada Karl Gauss dan Pearson untuk fakta bahwa kami memiliki kesempatan untuk menggunakan standar deviasi.

Menggunakan standar deviasi dalam analisis teknis, kita putar ini "indeks hamburan"" di "indikator volatilitas“Menjaga makna tetapi mengubah istilah.

Apa itu Standar Deviasi

Tetapi selain perhitungan bantu menengah, standar deviasi cukup dapat diterima untuk perhitungan sendiri dan aplikasi dalam analisis teknis. Seperti yang dicatat oleh pembaca aktif burdock majalah kami, “ Saya masih tidak mengerti mengapa RMS tidak termasuk dalam kumpulan indikator standar pusat dealing domestik«.

Betulkah, standar deviasi dapat dengan cara klasik dan "murni" mengukur variabilitas instrumen. Namun sayangnya, indikator ini tidak begitu umum dalam analisis sekuritas.

Menerapkan Standar Deviasi

Menghitung standar deviasi secara manual tidak terlalu menarik. tapi berguna untuk pengalaman. Simpangan baku dapat dinyatakan rumus STD=√[(∑(x-x ) 2)/n] , yang terdengar seperti jumlah akar dari perbedaan kuadrat antara item sampel dan rata-rata, dibagi dengan jumlah item dalam sampel.

Jika jumlah elemen dalam sampel melebihi 30, maka penyebut pecahan di bawah akar mengambil nilai n-1. Jika tidak, n digunakan.

selangkah demi selangkah perhitungan simpangan baku:

  1. hitung rata-rata aritmatika dari sampel data
  2. kurangi rata-rata ini dari setiap elemen sampel
  3. semua perbedaan yang dihasilkan dikuadratkan
  4. jumlahkan semua kuadrat yang dihasilkan
  5. bagi jumlah yang dihasilkan dengan jumlah elemen dalam sampel (atau dengan n-1 jika n>30)
  6. hitung akar kuadrat dari hasil bagi yang dihasilkan (disebut penyebaran)