Kecepatan baris. Deviasi linier rata-rata

Ekspektasi dan varians matematis

Mari kita mengukur variabel acak N kali, misalnya, kami mengukur kecepatan angin sepuluh kali dan ingin mencari nilai rata-rata. Bagaimana hubungan nilai rata-rata dengan fungsi distribusi?

Kami akan melempar dadu berkali-kali. Jumlah poin yang akan jatuh pada dadu selama setiap lemparan adalah variabel acak dan dapat mengambil nilai natural dari 1 hingga 6. N itu cenderung ke angka yang sangat spesifik - ekspektasi matematis M x. Pada kasus ini M x = 3,5.

Bagaimana nilai ini muncul? Biarkan masuk N Tes sekali putus 1 poin, sekali - 2 poin dan seterusnya. Kemudian N→ jumlah hasil di mana satu poin jatuh, Demikian pula, Dari sini

Model 4.5. Dadu

Mari kita asumsikan bahwa kita mengetahui hukum distribusi variabel acak x, yaitu, kita tahu bahwa variabel acak x dapat mengambil nilai x 1 , x 2 , ..., x k dengan probabilitas p 1 , p 2 , ..., p k.

Nilai yang diharapkan M x variabel acak x sama dengan:

Menjawab. 2,8.

Ekspektasi matematis tidak selalu merupakan estimasi yang masuk akal dari beberapa variabel acak. Jadi, untuk memperkirakan upah rata-rata, lebih masuk akal untuk menggunakan konsep median, yaitu nilai sedemikian rupa sehingga jumlah orang yang menerima kurang dari gaji rata-rata dan lebih, adalah sama.

median peubah acak disebut bilangan x 1/2 sedemikian sehingga p (x < x 1/2) = 1/2.

Dengan kata lain, probabilitas p 1 bahwa variabel acak x akan lebih sedikit x 1/2 , dan peluang p 2 bahwa variabel acak x akan lebih besar x 1/2 sama dan sama dengan 1/2. Median tidak ditentukan secara unik untuk semua distribusi.

Kembali ke variabel acak x, yang dapat mengambil nilai x 1 , x 2 , ..., x k dengan probabilitas p 1 , p 2 , ..., p k.

penyebaran variabel acak x adalah nilai rata-rata deviasi kuadrat dari variabel acak dari ekspektasi matematisnya:

Contoh 2

Di bawah kondisi contoh sebelumnya, hitung varians dan standar deviasi dari variabel acak x.

Menjawab. 0,16, 0,4.

Model 4.6. target tembak

Contoh 3

Tentukan distribusi peluang banyaknya angka yang dilempar pada dadu dari lemparan pertama, median, ekspektasi matematis, varians dan simpangan baku.

Menjatuhkan wajah apa pun sama kemungkinannya, sehingga distribusinya akan terlihat seperti ini:

Standar deviasi Dapat dilihat bahwa penyimpangan nilai dari nilai rata-rata sangat besar.

Sifat-sifat ekspektasi matematis:

  • Ekspektasi matematis dari jumlah variabel acak independen sama dengan jumlah ekspektasi matematisnya:

Contoh 4

Temukan harapan matematis dari jumlah dan produk dari titik-titik yang dilempar pada dua dadu.

Dalam contoh 3, kami menemukan bahwa untuk satu kubus M (x) = 3,5. Jadi untuk dua kubus

Sifat dispersi:

  • Varians jumlah variabel acak independen sama dengan jumlah varians:

Dx + kamu = Dx + hari.

Biarkan untuk N gulungan dadu kamu poin. Kemudian

Hasil ini tidak hanya berlaku untuk lemparan dadu. Dalam banyak kasus, ini menentukan keakuratan pengukuran ekspektasi matematis secara empiris. Dapat dilihat bahwa dengan bertambahnya jumlah pengukuran N penyebaran nilai di sekitar mean, yaitu standar deviasi, berkurang secara proporsional

Varians variabel acak terkait dengan ekspektasi matematis dari kuadrat variabel acak ini dengan hubungan berikut:

Mari kita temukan ekspektasi matematis dari kedua bagian persamaan ini. A-prioritas,

Ekspektasi matematis dari sisi kanan persamaan, menurut sifat ekspektasi matematis, sama dengan

Standar deviasi

simpangan baku sama dengan akar kuadrat dari varians:
Saat menentukan deviasi standar untuk volume yang cukup besar dari populasi yang diteliti (n> 30), rumus berikut digunakan:

Informasi serupa.


Menurut survei sampel, deposan dikelompokkan sesuai dengan ukuran setoran di Sberbank kota:

Mendefinisikan:

1) rentang variasi;

2) jumlah setoran rata-rata;

3) deviasi linier rata-rata;

4) dispersi;

5) standar deviasi;

6) koefisien variasi kontribusi.

Keputusan:

Deret distribusi ini berisi interval terbuka. Dalam deret demikian, nilai interval grup pertama secara konvensional diasumsikan sama dengan nilai interval grup berikutnya, dan nilai interval grup terakhir sama dengan nilai interval grup sebelumnya. satu.

Nilai interval grup kedua adalah 200, oleh karena itu, nilai grup pertama juga 200. Nilai interval grup kedua dari belakang adalah 200, yang berarti bahwa interval terakhir juga akan memiliki nilai sama dengan 200.

1) Tentukan rentang variasi sebagai selisih antara nilai terbesar dan terkecil dari atribut:

Kisaran variasi dalam ukuran kontribusi adalah 1000 rubel.

2) Besarnya rata-rata kontribusi ditentukan dengan rumus rata-rata tertimbang aritmatika.

Mari kita tentukan terlebih dahulu nilai diskrit atribut di setiap interval. Untuk melakukan ini, menggunakan rumus rata-rata aritmatika sederhana, kami menemukan titik tengah interval.

Nilai rata-rata interval pertama akan sama dengan:

yang kedua - 500, dll.

Mari kita masukkan hasil perhitungan ke dalam tabel:

Jumlah setoran, gosok.Jumlah kontributor, fTengah interval, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Total 400 - 312000

Setoran rata-rata di Sberbank kota adalah 780 rubel:

3) Deviasi linier rata-rata adalah rata-rata aritmatika dari deviasi absolut nilai individu atribut dari rata-rata total:

Prosedur untuk menghitung deviasi linier rata-rata pada deret distribusi interval adalah sebagai berikut:

1. Rata-rata tertimbang aritmatika dihitung, seperti yang ditunjukkan pada paragraf 2).

2. Deviasi absolut varian dari mean ditentukan:

3. Penyimpangan yang diperoleh dikalikan dengan frekuensi:

4. Jumlah deviasi tertimbang ditemukan tanpa memperhitungkan tanda:

5. Jumlah deviasi tertimbang dibagi dengan jumlah frekuensi:

Lebih mudah menggunakan tabel data yang dihitung:

Jumlah setoran, gosok.Jumlah kontributor, fTengah interval, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Total 400 - - - 81280

Deviasi linier rata-rata dari ukuran setoran klien Sberbank adalah 203,2 rubel.

4) Dispersi adalah mean aritmatika dari kuadrat deviasi setiap nilai fitur dari mean aritmatika.

Perhitungan varians dalam deret distribusi interval dilakukan sesuai dengan rumus:

Prosedur untuk menghitung varians dalam hal ini adalah sebagai berikut:

1. Tentukan rata-rata tertimbang aritmatika, seperti yang ditunjukkan pada paragraf 2).

2. Temukan penyimpangan dari mean:

3. Mengkuadratkan deviasi setiap opsi dari mean:

4. Kalikan deviasi kuadrat dengan bobot (frekuensi):

5. Meringkas karya yang diterima:

6. Jumlah yang dihasilkan dibagi dengan jumlah bobot (frekuensi):

Mari kita masukkan perhitungan ke dalam tabel:

Jumlah setoran, gosok.Jumlah kontributor, fTengah interval, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Total 400 - - - 23040000

Ketika pengujian statistik hipotesis, ketika mengukur hubungan linier antara variabel acak.

Standar deviasi:

Standar deviasi(perkiraan standar deviasi dari variabel acak Lantai, dinding di sekitar kita dan langit-langit, x relatif terhadap ekspektasi matematisnya berdasarkan estimasi variansnya yang tidak bias):

di mana - varians; - Lantai, dinding di sekitar kita dan langit-langit, saya-elemen sampel; - ukuran sampel; - mean aritmatika sampel:

Perlu dicatat bahwa kedua perkiraan itu bias. Dalam kasus umum, tidak mungkin untuk membuat estimasi yang tidak bias. Namun, estimasi yang didasarkan pada estimasi varians yang tidak bias adalah konsisten.

aturan tiga sigma

aturan tiga sigma() - hampir semua nilai variabel acak terdistribusi normal terletak pada interval . Lebih tepatnya - dengan kepastian tidak kurang dari 99,7%, nilai variabel acak terdistribusi normal terletak pada interval yang ditentukan (asalkan nilainya benar, dan tidak diperoleh sebagai hasil dari pemrosesan sampel).

Jika nilai sebenarnya tidak diketahui, maka Anda tidak boleh menggunakan, tetapi lantai, dinding di sekitar kita dan langit-langit, s. Dengan demikian, aturan tiga sigma diterjemahkan ke dalam aturan tiga Lantai, dinding di sekitar kita dan langit-langit, s .

Interpretasi nilai simpangan baku

Nilai standar deviasi yang besar menunjukkan penyebaran nilai yang besar dalam himpunan yang disajikan dengan nilai rata-rata himpunan; nilai kecil, masing-masing, menunjukkan bahwa nilai-nilai dalam himpunan dikelompokkan di sekitar nilai rata-rata.

Misalnya, kami memiliki tiga set angka: (0, 0, 14, 14), (0, 6, 8, 14) dan (6, 6, 8, 8). Ketiga himpunan masing-masing memiliki nilai rata-rata 7 dan simpangan baku 7, 5, dan 1. Himpunan terakhir memiliki simpangan baku kecil karena nilai-nilai dalam himpunan berkerumun di sekitar rata-rata; set pertama memiliki nilai deviasi standar terbesar - nilai dalam set sangat berbeda dari nilai rata-rata.

Dalam pengertian umum, standar deviasi dapat dianggap sebagai ukuran ketidakpastian. Misalnya, dalam fisika, standar deviasi digunakan untuk menentukan kesalahan dari serangkaian pengukuran berturut-turut dari beberapa kuantitas. Nilai ini sangat penting untuk menentukan masuk akal dari fenomena yang diteliti dibandingkan dengan nilai yang diprediksi oleh teori: jika nilai rata-rata pengukuran sangat berbeda dari nilai yang diprediksi oleh teori (standar deviasi besar), maka nilai yang diperoleh atau metode untuk memperolehnya harus diperiksa ulang.

Penggunaan praktis

Dalam praktiknya, standar deviasi memungkinkan Anda untuk menentukan seberapa besar nilai dalam himpunan dapat berbeda dari nilai rata-rata.

Iklim

Misalkan ada dua kota dengan suhu maksimum harian rata-rata yang sama, tetapi satu terletak di pantai dan yang lainnya di pedalaman. Kota-kota pesisir diketahui memiliki banyak suhu maksimum harian yang berbeda kurang dari kota-kota pedalaman. Oleh karena itu, standar deviasi suhu harian maksimum di kota pesisir akan lebih kecil daripada di kota kedua, meskipun pada kenyataannya nilai rata-rata dari nilai ini sama untuk mereka, yang dalam praktiknya berarti bahwa probabilitas bahwa udara maksimum suhu setiap hari tertentu dalam setahun akan lebih kuat berbeda dari nilai rata-rata, lebih tinggi untuk kota yang terletak di dalam benua.

Olahraga

Mari kita asumsikan bahwa ada beberapa tim sepak bola yang diberi peringkat menurut beberapa parameter, misalnya, jumlah gol yang dicetak dan kebobolan, peluang untuk mencetak gol, dll. Kemungkinan besar tim terbaik di grup ini akan memiliki yang terbaik nilai dalam lebih banyak parameter. Semakin kecil simpangan baku tim untuk setiap parameter yang disajikan, semakin dapat diprediksi hasil tim, tim tersebut seimbang. Di sisi lain, tim dengan standar deviasi besar sulit untuk memprediksi hasilnya, yang pada gilirannya dijelaskan oleh ketidakseimbangan, misalnya, pertahanan yang kuat, tetapi serangan yang lemah.

Penggunaan standar deviasi parameter tim memungkinkan seseorang untuk memprediksi hasil pertandingan antara dua tim sampai batas tertentu, mengevaluasi kekuatan dan kelemahan tim, dan karenanya metode perjuangan yang dipilih.

Analisis teknis

Lihat juga

literatur

* Borovikov, V. STATISTIK. Seni analisis data komputer: Untuk profesional / V. Borovikov. - Sankt Peterburg. : Peter, 2003. - 688 hal. - ISBN 5-272-00078-1.

Penyebaran. Standar deviasi

Penyebaran adalah rata-rata aritmatika dari deviasi kuadrat dari setiap nilai fitur dari rata-rata total. Bergantung pada sumber data, varians dapat tidak berbobot (sederhana) atau berbobot.

Dispersi dihitung menggunakan rumus berikut:

untuk data yang tidak dikelompokkan

untuk data yang dikelompokkan

Prosedur untuk menghitung varians tertimbang:

1. tentukan rata-rata tertimbang aritmatika

2. Penyimpangan varian dari mean ditentukan

3. kuadratkan deviasi setiap opsi dari mean

4. kalikan deviasi kuadrat dengan bobot (frekuensi)

5. merangkum karya yang diterima

6. jumlah yang dihasilkan dibagi dengan jumlah bobot

Rumus untuk menentukan varians dapat diubah menjadi rumus berikut:

- sederhana

Prosedur untuk menghitung varians sederhana:

1. tentukan mean aritmatika

2. kuadratkan mean aritmatika

3. kuadratkan setiap opsi baris

4. temukan opsi jumlah kuadrat

5. bagi jumlah kuadrat opsi dengan nomornya, mis. tentukan kuadrat rata-rata

6. tentukan perbedaan antara kuadrat rata-rata fitur dan kuadrat rata-rata

Juga rumus untuk menentukan varians tertimbang dapat dikonversi ke rumus berikut:

itu. varians sama dengan selisih antara rerata kuadrat nilai fitur dan kuadrat rerata aritmatika. Saat menggunakan rumus yang dikonversi, prosedur tambahan untuk menghitung penyimpangan nilai individual atribut dari x dikecualikan dan kesalahan dalam perhitungan yang terkait dengan pembulatan penyimpangan dikecualikan

Dispersi memiliki sejumlah properti, beberapa di antaranya membuatnya lebih mudah untuk dihitung:

1) dispersi nilai konstanta adalah nol;

2) jika semua varian dari nilai atribut dikurangi dengan jumlah yang sama, maka varians tidak akan berkurang;

3) jika semua varian dari nilai atribut dikurangi dengan jumlah yang sama kali (kali), maka varians akan berkurang dengan faktor

Simpangan baku S- adalah akar kuadrat dari varians:

Untuk data yang tidak dikelompokkan:

;

Untuk seri variasi:

Rentang variasi, deviasi linier rata-rata dan deviasi kuadrat rata-rata dinamakan besaran. Mereka memiliki satuan ukuran yang sama dengan nilai karakteristik individu.

Dispersi dan standar deviasi adalah ukuran variasi yang paling banyak digunakan. Ini dijelaskan oleh fakta bahwa mereka termasuk dalam sebagian besar teorema teori probabilitas, yang berfungsi sebagai dasar statistik matematika. Selain itu, varians dapat diuraikan menjadi elemen-elemen penyusunnya, memungkinkan untuk menilai pengaruh berbagai faktor yang menyebabkan variasi suatu sifat.

Perhitungan variasi indikator untuk bank yang dikelompokkan berdasarkan keuntungan ditunjukkan pada tabel.

Untung, juta rubel Jumlah bank indikator yang dihitung
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Total: 121,70 17,640 23,126

Rata-rata deviasi linier dan rata-rata kuadrat menunjukkan seberapa besar nilai atribut berfluktuasi secara rata-rata untuk unit dan populasi yang diteliti. Jadi, dalam hal ini, nilai rata-rata fluktuasi jumlah keuntungan adalah: menurut deviasi linier rata-rata, 0,882 juta rubel; menurut standar deviasi - 1,075 juta rubel. Simpangan baku selalu lebih besar dari simpangan linier rata-rata. Jika distribusi sifat mendekati normal, maka ada hubungan antara S dan d: S=1.25d, atau d=0.8S. Standar deviasi menunjukkan bagaimana sebagian besar unit populasi terletak relatif terhadap mean aritmatika. Terlepas dari bentuk distribusinya, 75 nilai atribut termasuk dalam interval x 2S, dan setidaknya 89 dari semua nilai termasuk dalam interval x 3S (teorema P.L. Chebyshev).

Pada artikel kali ini saya akan membahas tentang cara mencari simpangan baku. Materi ini sangat penting untuk pemahaman matematika yang utuh, sehingga seorang tutor matematika harus mencurahkan satu pelajaran atau bahkan beberapa pelajaran untuk mempelajarinya. Dalam artikel ini, Anda akan menemukan tautan ke video tutorial terperinci dan dapat dipahami yang menjelaskan apa itu simpangan baku dan bagaimana menemukannya.

simpangan baku memungkinkan untuk memperkirakan penyebaran nilai yang diperoleh sebagai hasil pengukuran parameter tertentu. Ini dilambangkan dengan simbol (huruf Yunani "sigma").

Rumus untuk perhitungannya cukup sederhana. Untuk menemukan simpangan baku, Anda perlu mengambil akar kuadrat dari varians. Jadi sekarang Anda harus bertanya, “Apa itu varians?”

Apa itu dispersi?

Definisi varians adalah sebagai berikut. Dispersi adalah mean aritmatika dari kuadrat deviasi nilai dari mean.

Untuk menemukan varians, lakukan perhitungan berikut secara berurutan:

  • Tentukan mean (rata-rata aritmatika sederhana dari serangkaian nilai).
  • Kemudian kurangi rata-rata dari masing-masing nilai dan kuadratkan perbedaan yang dihasilkan (kita dapatkan selisih kuadrat).
  • Langkah selanjutnya adalah menghitung rata-rata aritmatika kuadrat dari selisih yang diperoleh (Anda dapat mengetahui mengapa kuadrat persis di bawah).

Mari kita lihat sebuah contoh. Katakanlah Anda dan teman Anda memutuskan untuk mengukur tinggi anjing Anda (dalam milimeter). Sebagai hasil pengukuran, Anda menerima pengukuran tinggi berikut (pada layu): 600 mm, 470 mm, 170 mm, 430 mm, dan 300 mm.

Mari kita hitung mean, varians dan standar deviasi.

Mari kita cari rata-ratanya dulu. Seperti yang sudah Anda ketahui, untuk ini Anda perlu menambahkan semua nilai terukur dan membaginya dengan jumlah pengukuran. Kemajuan perhitungan:

Rata-rata mm.

Jadi, rata-rata (rata-rata aritmatika) adalah 394 mm.

Sekarang kita perlu mendefinisikan penyimpangan tinggi masing-masing anjing dari rata-rata:

Akhirnya, untuk menghitung varians, masing-masing perbedaan yang diperoleh dikuadratkan, dan kemudian kita menemukan rata-rata aritmatika dari hasil yang diperoleh:

Dispersi mm 2 .

Jadi, dispersinya adalah 21704 mm 2 .

Bagaimana mencari simpangan baku

Jadi bagaimana sekarang menghitung deviasi standar, mengetahui variansnya? Seperti yang kita ingat, ambil akar kuadratnya. Artinya, simpangan bakunya adalah:

mm (dibulatkan ke bilangan bulat terdekat dalam mm).

Dengan menggunakan metode ini, kami menemukan bahwa beberapa anjing (misalnya Rottweiler) adalah anjing yang sangat besar. Tetapi ada juga anjing yang sangat kecil (misalnya, dachshund, tetapi Anda tidak boleh memberi tahu mereka tentang ini).

Hal yang paling menarik adalah bahwa standar deviasi membawa informasi yang berguna. Sekarang kita dapat menunjukkan hasil pengukuran pertumbuhan yang mana yang berada dalam interval yang kita peroleh jika kita menyisihkan rata-rata (di kedua sisinya) standar deviasi.

Artinya, dengan bantuan deviasi standar, kami mendapatkan metode "standar" yang memungkinkan Anda mengetahui nilai mana yang normal (rata-rata statistik), dan mana yang luar biasa besar atau, sebaliknya, kecil.

Apa itu Standar Deviasi

Tapi ... semuanya akan sedikit berbeda jika kita menganalisis contoh data. Dalam contoh kami, kami mempertimbangkan populasi umum. Artinya, 5 anjing kami adalah satu-satunya anjing di dunia yang menarik minat kami.

Namun jika data tersebut merupakan sampel (nilai yang dipilih dari populasi yang besar), maka perhitungannya perlu dilakukan secara berbeda.

Jika ada nilai, maka:

Semua perhitungan lainnya dilakukan dengan cara yang sama, termasuk penentuan rata-rata.

Misalnya, jika lima anjing kita hanyalah sampel dari populasi anjing (semua anjing di planet ini), kita harus membaginya dengan 4 bukannya 5 yaitu:

Varians sampel = mm2.

Dalam hal ini, standar deviasi untuk sampel sama dengan mm (dibulatkan ke bilangan bulat terdekat).

Kami dapat mengatakan bahwa kami membuat beberapa "koreksi" jika nilai kami hanyalah sampel kecil.

Catatan. Mengapa tepatnya kuadrat dari perbedaan?

Tapi mengapa kita mengambil kuadrat dari perbedaan saat menghitung varians? Mari kita akui pada pengukuran beberapa parameter, Anda menerima set nilai berikut: 4; 4; -4; -4. Jika kita hanya menambahkan deviasi absolut dari mean (selisih) satu sama lain ... nilai negatif dibatalkan dengan yang positif:

.

Ternyata opsi ini tidak berguna. Maka mungkin ada baiknya mencoba nilai absolut dari penyimpangan (yaitu, modul dari nilai-nilai ini)?

Sepintas, ternyata tidak buruk (nilai yang dihasilkan, omong-omong, disebut deviasi absolut rata-rata), tetapi tidak dalam semua kasus. Mari kita coba contoh lain. Biarkan hasil pengukuran dalam himpunan nilai-nilai berikut: 7; satu; -6; -2. Maka simpangan mutlak rata-rata adalah:

Astaga! Kami kembali mendapatkan hasil 4, meskipun perbedaannya memiliki spread yang jauh lebih besar.

Sekarang mari kita lihat apa yang terjadi jika kita kuadratkan perbedaannya (lalu ambil akar kuadrat dari jumlah mereka).

Untuk contoh pertama, Anda mendapatkan:

.

Untuk contoh kedua, Anda mendapatkan:

Sekarang ini masalah yang sama sekali berbeda! Deviasi root-mean-square semakin besar, semakin besar penyebaran perbedaan ... itulah yang kami perjuangkan.

Sebenarnya metode ini menggunakan ide yang sama seperti saat menghitung jarak antar titik, hanya saja diterapkan dengan cara yang berbeda.

Dan dari sudut pandang matematika, penggunaan kuadrat dan akar kuadrat lebih berguna daripada yang bisa kita peroleh berdasarkan nilai absolut dari deviasi, yang karenanya deviasi standar berlaku untuk masalah matematika lainnya.

Sergey Valerievich memberi tahu Anda cara menemukan simpangan baku