Velocidade da linha. Desvio linear médio

Expectativa matemática e variância

Vamos medir uma variável aleatória N vezes, por exemplo, medimos a velocidade do vento dez vezes e queremos encontrar o valor médio. Como o valor médio está relacionado à função de distribuição?

Jogaremos os dados um grande número de vezes. O número de pontos que cairão no dado durante cada lançamento é uma variável aleatória e pode assumir quaisquer valores naturais de 1 a 6. N tende a um número muito específico - a expectativa matemática M x. Nesse caso M x = 3,5.

Como surgiu esse valor? Deixe entrar N Testes uma vez caiu 1 ponto, uma vez - 2 pontos e assim por diante. Então N→ ∞ o número de resultados em que um ponto caiu, Da mesma forma, A partir daqui

Modelo 4.5. Dados

Suponhamos agora que conhecemos a lei de distribuição da variável aleatória x, ou seja, sabemos que a variável aleatória x pode receber valores x 1 , x 2 , ..., xk com probabilidades p 1 , p 2 , ..., pk.

Valor esperado M x variável aleatória xé igual a:

Responda. 2,8.

A expectativa matemática nem sempre é uma estimativa razoável de alguma variável aleatória. Assim, para estimar o salário médio, é mais razoável utilizar o conceito de mediana, ou seja, um valor tal que o número de pessoas que recebem menos do que o salário mediano e mais, sejam iguais.

mediana uma variável aleatória é chamada de número x 1/2 tal que p (x < x 1/2) = 1/2.

Em outras palavras, a probabilidade p 1 que a variável aleatória x será menos x 1/2 e a probabilidade p 2 que uma variável aleatória x será maior x 1/2 são iguais e iguais a 1/2. A mediana não é determinada exclusivamente para todas as distribuições.

De volta à variável aleatória x, que pode assumir os valores x 1 , x 2 , ..., xk com probabilidades p 1 , p 2 , ..., pk.

dispersão variável aleatória xé o valor médio do desvio quadrado de uma variável aleatória de sua expectativa matemática:

Exemplo 2

Nas condições do exemplo anterior, calcule a variância e o desvio padrão de uma variável aleatória x.

Responda. 0,16, 0,4.

Modelo 4.6. alvo de tiro

Exemplo 3

Encontre a distribuição de probabilidade do número de pontos lançados no dado desde o primeiro lançamento, a mediana, a expectativa matemática, a variância e o desvio padrão.

Soltar qualquer face é igualmente provável, então a distribuição ficará assim:

Desvio padrão Pode-se observar que o desvio do valor em relação ao valor médio é muito grande.

Propriedades da esperança matemática:

  • A expectativa matemática da soma de variáveis ​​aleatórias independentes é igual à soma de suas expectativas matemáticas:

Exemplo 4

Encontre a esperança matemática da soma e o produto dos pontos rolados em dois dados.

No exemplo 3, descobrimos que para um cubo M (x) = 3,5. Então para dois cubos

Propriedades de dispersão:

  • A variância da soma das variáveis ​​aleatórias independentes é igual à soma das variâncias:

Dx + y = Dx + Dy.

Deixe por N rolagens de dados y pontos. Então

Este resultado não é verdadeiro apenas para rolagens de dados. Em muitos casos, determina a precisão de medir a expectativa matemática empiricamente. Pode-se observar que com o aumento do número de medidas N a dispersão dos valores em torno da média, ou seja, o desvio padrão, diminui proporcionalmente

A variância de uma variável aleatória está relacionada com a esperança matemática do quadrado dessa variável aleatória pela seguinte relação:

Vamos encontrar as expectativas matemáticas de ambas as partes desta igualdade. A-prior,

A esperança matemática do lado direito da igualdade, de acordo com a propriedade das expectativas matemáticas, é igual a

Desvio padrão

desvio padrãoé igual à raiz quadrada da variância:
Ao determinar o desvio padrão para um volume suficientemente grande da população estudada (n> 30), as seguintes fórmulas são usadas:

Informações semelhantes.


De acordo com a pesquisa amostral, os depositantes foram agrupados de acordo com o tamanho do depósito no Sberbank da cidade:

Definir:

1) faixa de variação;

2) valor médio do depósito;

3) desvio linear médio;

4) dispersão;

5) desvio padrão;

6) coeficiente de variação das contribuições.

Decisão:

Esta série de distribuição contém intervalos abertos. Nessa série, o valor do intervalo do primeiro grupo é convencionalmente assumido como igual ao valor do intervalo do próximo, e o valor do intervalo do último grupo é igual ao valor do intervalo do anterior. 1.

O valor do intervalo do segundo grupo é 200, portanto, o valor do primeiro grupo também é 200. O valor do intervalo do penúltimo grupo é 200, o que significa que o último intervalo também terá um valor igual a 200.

1) Defina a faixa de variação como a diferença entre o maior e o menor valor do recurso:

A faixa de variação no tamanho da contribuição é de 1000 rublos.

2) O tamanho médio da contribuição é determinado pela fórmula da média aritmética ponderada.

Vamos determinar preliminarmente o valor discreto do atributo em cada intervalo. Para fazer isso, usando a fórmula da média aritmética simples, encontramos os pontos médios dos intervalos.

O valor médio do primeiro intervalo será igual a:

o segundo - 500, etc.

Vamos colocar os resultados dos cálculos na tabela:

Valor do depósito, esfregue.Número de colaboradores, fNo meio do intervalo, xxf
200-400 32 300 9600
400-600 56 500 28000
600-800 120 700 84000
800-1000 104 900 93600
1000-1200 88 1100 96800
Total 400 - 312000

O depósito médio no Sberbank da cidade será de 780 rublos:

3) O desvio linear médio é a média aritmética dos desvios absolutos dos valores individuais do atributo da média total:

O procedimento para calcular o desvio linear médio na série de distribuição de intervalos é o seguinte:

1. Calcula-se a média aritmética ponderada, conforme indicado no n.º 2).

2. Os desvios absolutos da variante da média são determinados:

3. Os desvios obtidos são multiplicados pelas frequências:

4. A soma dos desvios ponderados é encontrada sem levar em consideração o sinal:

5. A soma dos desvios ponderados é dividida pela soma das frequências:

É conveniente usar a tabela de dados calculados:

Valor do depósito, esfregue.Número de colaboradores, fNo meio do intervalo, x
200-400 32 300 -480 480 15360
400-600 56 500 -280 280 15680
600-800 120 700 -80 80 9600
800-1000 104 900 120 120 12480
1000-1200 88 1100 320 320 28160
Total 400 - - - 81280

O desvio linear médio do tamanho do depósito dos clientes do Sberbank é de 203,2 rublos.

4) A dispersão é a média aritmética dos desvios quadrados de cada valor de característica da média aritmética.

O cálculo da variância na série de distribuição de intervalos é realizado de acordo com a fórmula:

O procedimento para calcular a variância neste caso é o seguinte:

1. Determinar a média aritmética ponderada, conforme indicado no parágrafo 2).

2. Encontre desvios da média:

3. Quadrando o desvio de cada opção da média:

4. Multiplique os desvios ao quadrado por pesos (frequências):

5. Resuma os trabalhos recebidos:

6. O valor resultante é dividido pela soma dos pesos (frequências):

Vamos colocar os cálculos em uma tabela:

Valor do depósito, esfregue.Número de colaboradores, fNo meio do intervalo, x
200-400 32 300 -480 230400 7372800
400-600 56 500 -280 78400 4390400
600-800 120 700 -80 6400 768000
800-1000 104 900 120 14400 1497600
1000-1200 88 1100 320 102400 9011200
Total 400 - - - 23040000

Ao testar estatísticas de hipóteses, ao medir uma relação linear entre variáveis ​​aleatórias.

Desvio padrão:

Desvio padrão(uma estimativa do desvio padrão da variável aleatória Piso, paredes ao nosso redor e teto, x em relação à sua expectativa matemática com base em uma estimativa imparcial de sua variância):

onde - variância; - O chão, as paredes à nossa volta e o teto, eu-ésimo elemento de amostra; - tamanho da amostra; - média aritmética da amostra:

Deve-se notar que ambas as estimativas são tendenciosas. No caso geral, é impossível construir uma estimativa imparcial. No entanto, uma estimativa baseada em uma estimativa de variância imparcial é consistente.

regra de três sigma

regra de três sigma() - quase todos os valores de uma variável aleatória normalmente distribuída estão no intervalo. Mais estritamente - com não menos de 99,7% de certeza, o valor de uma variável aleatória normalmente distribuída está no intervalo especificado (desde que o valor seja verdadeiro e não obtido como resultado do processamento da amostra).

Se o verdadeiro valor é desconhecido, então você não deve usar, mas o chão, as paredes ao nosso redor e o teto, s. Assim, a regra de três sigma se traduz na regra de três Piso, paredes ao nosso redor e o teto, s .

Interpretação do valor do desvio padrão

Um grande valor do desvio padrão mostra uma grande dispersão de valores no conjunto apresentado com o valor médio do conjunto; um valor pequeno, respectivamente, indica que os valores do conjunto estão agrupados em torno do valor médio.

Por exemplo, temos três conjuntos de números: (0, 0, 14, 14), (0, 6, 8, 14) e (6, 6, 8, 8). Todos os três conjuntos têm valores médios de 7 e desvios padrão de 7, 5 e 1, respectivamente. O último conjunto tem um pequeno desvio padrão porque os valores do conjunto estão agrupados em torno da média; o primeiro conjunto tem o maior valor do desvio padrão - os valores dentro do conjunto divergem fortemente do valor médio.

Em um sentido geral, o desvio padrão pode ser considerado uma medida de incerteza. Por exemplo, em física, o desvio padrão é usado para determinar o erro de uma série de medidas sucessivas de alguma quantidade. Este valor é muito importante para determinar a plausibilidade do fenômeno em estudo em comparação com o valor previsto pela teoria: se o valor médio das medições difere muito dos valores previstos pela teoria (grande desvio padrão), então o valores obtidos ou o método de obtê-los deve ser verificado novamente.

Uso pratico

Na prática, o desvio padrão permite determinar o quanto os valores no conjunto podem diferir do valor médio.

Clima

Suponha que existam duas cidades com a mesma temperatura máxima média diária, mas uma localizada no litoral e a outra no interior. As cidades costeiras são conhecidas por terem muitas temperaturas máximas diárias menores do que as cidades do interior. Portanto, o desvio padrão das temperaturas máximas diárias na cidade litorânea será menor do que na segunda cidade, apesar de o valor médio desse valor ser o mesmo para elas, o que na prática significa que a probabilidade de que a temperatura máxima do ar temperatura de cada dia particular do ano será mais forte diferente do valor médio, maior para uma cidade localizada dentro do continente.

Esporte

Vamos supor que existam vários times de futebol que são classificados de acordo com algum conjunto de parâmetros, por exemplo, o número de gols marcados e sofridos, chances de gol, etc. É mais provável que o melhor time deste grupo tenha o melhor valores em mais parâmetros. Quanto menor o desvio padrão da equipe para cada um dos parâmetros apresentados, mais previsível é o resultado da equipe, tais equipes são equilibradas. Por outro lado, uma equipe com grande desvio padrão tem dificuldade em prever o resultado, que por sua vez se explica por um desequilíbrio, por exemplo, uma defesa forte, mas um ataque fraco.

A utilização do desvio padrão dos parâmetros da equipe permite prever até certo ponto o resultado da partida entre duas equipes, avaliando os pontos fortes e fracos das equipes e, consequentemente, os métodos de luta escolhidos.

Análise técnica

Veja também

Literatura

* Borovikov, V. ESTATISTICAS. A arte da análise de dados de computador: Para profissionais / V. Borovikov. - São Petersburgo. : Pedro, 2003. - 688 p. - ISBN 5-272-00078-1.

Dispersão. Desvio padrão

Dispersãoé a média aritmética dos desvios quadrados de cada valor de característica da média total. Dependendo dos dados de origem, a variação pode ser não ponderada (simples) ou ponderada.

A dispersão é calculada usando as seguintes fórmulas:

para dados desagrupados

para dados agrupados

O procedimento para calcular a variância ponderada:

1. determinar a média aritmética ponderada

2. Os desvios variantes da média são determinados

3. eleve ao quadrado o desvio de cada opção da média

4. multiplique os desvios ao quadrado por pesos (frequências)

5. resumir os trabalhos recebidos

6. o valor resultante é dividido pela soma dos pesos

A fórmula para determinar a variância pode ser convertida para a seguinte fórmula:

- simples

O procedimento para calcular a variância é simples:

1. determinar a média aritmética

2. quadrado da média aritmética

3. quadrado cada opção de linha

4. encontre a opção da soma dos quadrados

5. divida a soma dos quadrados da opção pelo seu número, ou seja, determine o quadrado médio

6. determinar a diferença entre o quadrado médio do recurso e o quadrado da média

Além disso, a fórmula para determinar a variância ponderada pode ser convertida para a seguinte fórmula:

Essa. a variância é igual à diferença entre a média dos quadrados dos valores das características e o quadrado da média aritmética. Ao usar a fórmula convertida, um procedimento adicional para calcular os desvios dos valores individuais do atributo de x é excluído e o erro no cálculo associado ao arredondamento dos desvios é excluído

A dispersão tem várias propriedades, algumas das quais facilitam o cálculo:

1) a dispersão de um valor constante é zero;

2) se todas as variantes dos valores do atributo forem reduzidas pelo mesmo número, a variação não diminuirá;

3) se todas as variantes dos valores do atributo forem reduzidas pelo mesmo número de vezes (vezes), a variância diminuirá por um fator de

Desvio padrão- é a raiz quadrada da variância:

Para dados desagrupados:

;

Para uma série de variação:

A faixa de variação, o desvio médio linear e o desvio quadrado médio são denominados quantidades. Eles têm as mesmas unidades de medida que os valores de características individuais.

A dispersão e o desvio padrão são as medidas de variação mais utilizadas. Isso se explica pelo fato de estarem incluídos na maioria dos teoremas da teoria das probabilidades, que serve como fundamento da estatística matemática. Além disso, a variância pode ser decomposta em seus elementos constituintes, permitindo avaliar a influência de diversos fatores que causam a variação de uma característica.

O cálculo dos indicadores de variação dos bancos agrupados por lucro é apresentado na tabela.

Lucro, milhões de rublos Número de bancos indicadores calculados
3,7 - 4,6 (-) 4,15 8,30 -1,935 3,870 7,489
4,6 - 5,5 5,05 20,20 - 1,035 4,140 4,285
5,5 - 6,4 5,95 35,70 - 0,135 0,810 0,109
6,4 - 7,3 6,85 34,25 +0,765 3,825 2,926
7,3 - 8,2 7,75 23,25 +1,665 4,995 8,317
Total: 121,70 17,640 23,126

A média linear e o desvio médio quadrado mostram o quanto o valor do atributo oscila em média para as unidades e a população em estudo. Portanto, neste caso, o valor médio da flutuação no valor do lucro é: de acordo com o desvio linear médio, 0,882 milhão de rublos; de acordo com o desvio padrão - 1,075 milhão de rublos. O desvio padrão é sempre maior que o desvio linear médio. Se a distribuição do traço estiver próxima do normal, então existe uma relação entre S e d: S=1,25d, ou d=0,8S. O desvio padrão mostra como a maior parte das unidades populacionais está localizada em relação à média aritmética. Independentemente da forma de distribuição, 75 valores de atributos estão dentro do intervalo x 2S, e pelo menos 89 de todos os valores estão dentro do intervalo x 3S (teorema de P.L. Chebyshev).

Neste artigo, falarei sobre como encontrar o desvio padrão. Este material é extremamente importante para uma compreensão completa da matemática, portanto, um tutor de matemática deve dedicar uma aula separada ou mesmo várias para estudá-la. Neste artigo, você encontrará um link para um tutorial em vídeo detalhado e compreensível que explica o que é o desvio padrão e como encontrá-lo.

desvio padrão possibilita estimar o spread de valores obtidos como resultado da medição de um determinado parâmetro. É denotado por um símbolo (letra grega "sigma").

A fórmula para o cálculo é bastante simples. Para encontrar o desvio padrão, você precisa tirar a raiz quadrada da variância. Então agora você tem que perguntar: “O que é variância?”

O que é dispersão

A definição de variância é a seguinte. A dispersão é a média aritmética dos desvios quadrados dos valores da média.

Para encontrar a variação, execute os seguintes cálculos sequencialmente:

  • Determine a média (média aritmética simples de uma série de valores).
  • Em seguida, subtraia a média de cada um dos valores e eleve ao quadrado a diferença resultante (temos diferença ao quadrado).
  • O próximo passo é calcular a média aritmética dos quadrados das diferenças obtidas (você pode descobrir por que exatamente os quadrados estão abaixo).

Vejamos um exemplo. Digamos que você e seus amigos decidam medir a altura de seus cães (em milímetros). Como resultado das medições, você recebeu as seguintes medidas de altura (na cernelha): 600 mm, 470 mm, 170 mm, 430 mm e 300 mm.

Vamos calcular a média, variância e desvio padrão.

Vamos encontrar a média primeiro. Como você já sabe, para isso você precisa adicionar todos os valores medidos e dividir pelo número de medições. Progresso do cálculo:

Média mm.

Assim, a média (média aritmética) é 394 mm.

Agora precisamos definir desvio da altura de cada um dos cães da média:

Finalmente, para calcular a variância, cada uma das diferenças obtidas é elevada ao quadrado, e então encontramos a média aritmética dos resultados obtidos:

Dispersão mm 2 .

Assim, a dispersão é de 21704 mm2.

Como encontrar o desvio padrão

Então, como agora calcular o desvio padrão, sabendo a variância? Como lembramos, tire a raiz quadrada disso. Ou seja, o desvio padrão é:

mm (arredondado para o número inteiro mais próximo em mm).

Usando este método, descobrimos que alguns cães (por exemplo, Rottweilers) são cães muito grandes. Mas também existem cães muito pequenos (por exemplo, dachshunds, mas você não deve dizer isso a eles).

O mais interessante é que o desvio padrão traz informações úteis. Agora podemos mostrar quais dos resultados obtidos da medição do crescimento estão dentro do intervalo que obtemos se separarmos da média (em ambos os lados) o desvio padrão.

Ou seja, usando o desvio padrão, obtemos um método “padrão” que permite descobrir qual dos valores é normal (média estatística) e qual é extraordinariamente grande ou, inversamente, pequeno.

O que é desvio padrão

Mas... as coisas serão um pouco diferentes se analisarmos amostragem dados. Em nosso exemplo, consideramos a população em geral. Ou seja, nossos 5 cães eram os únicos cães do mundo que nos interessavam.

Mas se os dados forem uma amostra (valores escolhidos de uma grande população), os cálculos precisam ser feitos de forma diferente.

Se houver valores, então:

Todos os outros cálculos são feitos da mesma forma, incluindo a determinação da média.

Por exemplo, se nossos cinco cães são apenas uma amostra de uma população de cães (todos os cães do planeta), devemos dividir por 4 em vez de 5 nomeadamente:

Variação da amostra = mm2.

Neste caso, o desvio padrão para a amostra é igual a mm (arredondado para o número inteiro mais próximo).

Podemos dizer que fizemos alguma “correção” no caso em que nossos valores são apenas uma pequena amostra.

Observação. Por que exatamente os quadrados das diferenças?

Mas por que tomamos os quadrados das diferenças ao calcular a variância? Vamos admitir que na medição de algum parâmetro, você recebeu o seguinte conjunto de valores: 4; 4; -4; -4. Se apenas somarmos os desvios absolutos da média (diferença) entre si... os valores negativos se cancelam com os positivos:

.

Acontece que esta opção é inútil. Então talvez valha a pena tentar os valores absolutos dos desvios (ou seja, os módulos desses valores)?

À primeira vista, não é ruim (o valor resultante, a propósito, é chamado de desvio absoluto médio), mas não em todos os casos. Vamos tentar outro exemplo. Deixe a medição resultar no seguinte conjunto de valores: 7; 1; -6; -2. Então o desvio absoluto médio é:

Caramba! Novamente obtivemos o resultado 4, embora as diferenças tenham um spread muito maior.

Agora vamos ver o que acontece se elevarmos ao quadrado as diferenças (e depois tirarmos a raiz quadrada de sua soma).

Para o primeiro exemplo, você obtém:

.

Para o segundo exemplo, você obtém:

Agora é uma questão completamente diferente! O desvio quadrático médio é tanto maior quanto maior a dispersão das diferenças... que é o que estávamos buscando.

Na verdade, este método usa a mesma ideia de calcular a distância entre pontos, só que aplicada de forma diferente.

E do ponto de vista matemático, o uso de quadrados e raízes quadradas é mais útil do que poderíamos obter com base nos valores absolutos dos desvios, devido aos quais o desvio padrão é aplicável a outros problemas matemáticos.

Sergey Valerievich disse a você como encontrar o desvio padrão