Como é calculada a média aritmética? Resumo: Valores médios usados ​​nas estatísticas

Este termo tem outros significados, veja o significado médio.

Média(em matemática e estatística) conjuntos de números - a soma de todos os números dividida pelo seu número. É uma das medidas mais comuns de tendência central.

Foi proposto (junto com a média geométrica e a média harmônica) pelos pitagóricos.

Casos especiais da média aritmética são a média (da população geral) e a média amostral (das amostras).

Introdução

Denote o conjunto de dados X = (x 1 , x 2 , …, x n), então a média da amostra é geralmente denotada por uma barra horizontal sobre a variável (x ¯ (\displaystyle (\bar (x))) , pronunciada " x com um traço").

A letra grega μ é usada para denotar a média aritmética de toda a população. Para uma variável aleatória para a qual um valor médio é definido, μ é probabilidade média ou a expectativa matemática de uma variável aleatória. Se o conjunto Xé um conjunto de números aleatórios com uma probabilidade média μ, então para qualquer amostra x eu desta coleção μ = E( x eu) é a expectativa desta amostra.

Na prática, a diferença entre μ e x ¯ (\displaystyle (\bar (x))) é que μ é uma variável genérica porque você pode ver a amostra em vez de toda a população. Portanto, se a amostra é representada aleatoriamente (em termos de teoria da probabilidade), então x ¯ (\displaystyle (\bar (x))) (mas não μ) pode ser tratado como uma variável aleatória com uma distribuição de probabilidade na amostra ( distribuição de probabilidade da média).

Ambas as quantidades são calculadas da mesma maneira:

X ¯ = 1 n ∑ i = 1 n x i = 1 n (x 1 + ⋯ + x n). (\displaystyle (\bar (x))=(\frac (1)(n))\sum _(i=1)^(n)x_(i)=(\frac (1)(n))(x_ (1)+\cdots +x_(n)).)

Se um Xé uma variável aleatória, então a expectativa matemática X pode ser considerado como a média aritmética dos valores em medições repetidas da quantidade X. Esta é uma manifestação da lei dos grandes números. Portanto, a média amostral é usada para estimar a expectativa matemática desconhecida.

Em álgebra elementar, está provado que a média n+ 1 números acima da média n números se e somente se o novo número for maior que a média antiga, menor se e somente se o novo número for menor que a média, e não muda se e somente se o novo número for igual à média. O mais n, menor será a diferença entre as médias novas e antigas.

Observe que existem várias outras "médias" disponíveis, incluindo média de lei de potência, média de Kolmogorov, média harmônica, média aritmético-geométrica e várias médias ponderadas (por exemplo, média aritmética ponderada, média ponderada geométrica, média ponderada harmônica) .

Exemplos

  • Para três números, você precisa somá-los e dividir por 3:
x 1 + x 2 + x 3 3 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3))(3)).)
  • Para quatro números, você precisa adicioná-los e dividir por 4:
x 1 + x 2 + x 3 + x 4 4 . (\displaystyle (\frac (x_(1)+x_(2)+x_(3)+x_(4))(4)).)

Ou mais fácil 5+5=10, 10:2. Porque adicionamos 2 números, o que significa que quantos números somamos, dividimos por isso.

Variável aleatória contínua

Para um valor distribuído continuamente f (x) (\displaystyle f(x)) a média aritmética no intervalo [ a ; b ] (\displaystyle ) é definido por meio de uma integral definida:

F(x) ¯ [ a ; b ] = 1 b − a ∫ a b f (x) d x (\displaystyle (\overline (f(x))))_()=(\frac (1)(b-a))\int _(a)^(b) f(x)dx)

Alguns problemas de usar a média

Falta de robustez

Artigo principal: Robustez nas estatísticas

Embora a média aritmética seja frequentemente usada como média ou tendência central, esse conceito não se aplica a estatísticas robustas, o que significa que a média aritmética é fortemente influenciada por "grandes desvios". Vale ressaltar que para distribuições com grande assimetria, a média aritmética pode não corresponder ao conceito de “média”, e os valores da média de estatísticas robustas (por exemplo, a mediana) podem descrever melhor a tendência central.

O exemplo clássico é o cálculo da renda média. A média aritmética pode ser mal interpretada como mediana, o que pode levar à conclusão de que há mais pessoas com mais renda do que realmente há. A renda "média" é interpretada de tal forma que a renda da maioria das pessoas se aproxima desse número. Essa renda "média" (no sentido da média aritmética) é superior à renda da maioria das pessoas, pois uma renda alta com grande desvio da média torna a média aritmética fortemente enviesada (em contraste, a renda mediana "resiste" tal torção). No entanto, essa renda "média" não diz nada sobre o número de pessoas próximas à renda mediana (e não diz nada sobre o número de pessoas próximas à renda modal). No entanto, se os conceitos de "média" e "maioria" forem tomados de ânimo leve, pode-se concluir incorretamente que a maioria das pessoas tem renda maior do que realmente é. Por exemplo, um relatório sobre o lucro líquido "médio" em Medina, Washington, calculado como a média aritmética de todos os rendimentos líquidos anuais dos residentes, dará um número surpreendentemente alto devido a Bill Gates. Considere a amostra (1, 2, 2, 2, 3, 9). A média aritmética é 3,17, mas cinco dos seis valores estão abaixo dessa média.

Juros compostos

Artigo principal: ROI

Se os números multiplicar, mas não dobrar, você precisa usar a média geométrica, não a média aritmética. Na maioria das vezes, esse incidente acontece ao calcular o retorno do investimento em finanças.

Por exemplo, se as ações caíram 10% no primeiro ano e subiram 30% no segundo ano, então é incorreto calcular o aumento "médio" ao longo desses dois anos como a média aritmética (−10% + 30%) / 2 = 10%; a média correta neste caso é dada pela taxa de crescimento anual composta, da qual o crescimento anual é apenas cerca de 8,16653826392% ≈ 8,2%.

A razão para isso é que as porcentagens têm um novo ponto de partida a cada vez: 30% é 30% a partir de um número inferior ao preço no início do primeiro ano: se a ação começou em $ 30 e caiu 10%, vale $ 27 no início do segundo ano. Se a ação subir 30%, ela valerá $ 35,1 no final do segundo ano. A média aritmética desse crescimento é de 10%, mas como a ação cresceu apenas $ 5,1 em 2 anos, um aumento médio de 8,2% dá um resultado final de $ 35,1:

[US$ 30 (1 - 0,1) (1 + 0,3) = US$ 30 (1 + 0,082) (1 + 0,082) = US$ 35,1]. Se usarmos a média aritmética de 10% da mesma forma, não obteremos o valor real: [$30 (1 + 0,1) (1 + 0,1) = $ 36,3].

Juros compostos no final do ano 2: 90% * 130% = 117% , ou seja, um aumento total de 17%, e os juros compostos médios anuais são 117% ≈ 108,2% (\displaystyle (\sqrt (117\%)) \approx 108,2\%) , ou seja, um aumento médio anual de 8,2%.

instruções

Artigo principal: Estatísticas de destino

Ao calcular a média aritmética de alguma variável que muda ciclicamente (por exemplo, fase ou ângulo), cuidados especiais devem ser tomados. Por exemplo, a média de 1° e 359° seria 1 ∘ + 359 ∘ 2 = (\displaystyle (\frac (1^(\circ )+359^(\circ ))(2))=) 180°. Este número está incorreto por dois motivos.

  • Primeiramente, as medidas angulares são definidas apenas para a faixa de 0° a 360° (ou de 0 a 2π quando medida em radianos). Assim, o mesmo par de números pode ser escrito como (1° e -1°) ou como (1° e 719°). As médias de cada par serão diferentes: 1 ∘ + (− 1 ∘) 2 = 0 ∘ (\displaystyle (\frac (1^(\circ )+(-1^(\circ )))(2))= 0 ^(\circ )) , 1 ∘ + 719 ∘ 2 = 360 ∘ (\displaystyle (\frac (1^(\circ )+719^(\circ ))(2))=360^(\circ )) .
  • Segundo, neste caso, um valor de 0° (equivalente a 360°) seria a melhor média geométrica, pois os números se desviam menos de 0° do que de qualquer outro valor (o valor 0° tem a menor variância). Comparar:
    • o número 1° se desvia de 0° em apenas 1°;
    • o número 1° desvia da média calculada de 180° por 179°.

O valor médio de uma variável cíclica, calculado de acordo com a fórmula acima, será deslocado artificialmente em relação à média real para o meio da faixa numérica. Por isso, a média é calculada de forma diferente, ou seja, o número com a menor variância (o ponto central) é escolhido como valor médio. Além disso, em vez de subtrair, a distância do módulo (ou seja, a distância circunferencial) é usada. Por exemplo, a distância modular entre 1° e 359° é 2°, não 358° (em um círculo entre 359° e 360°==0° - um grau, entre 0° e 1° - também 1°, no total - 2°).

Tipos de valores médios e métodos para seu cálculo

Na fase de processamento estatístico, uma variedade de tarefas de pesquisa pode ser definida, para cuja solução é necessário escolher a média apropriada. Nesse caso, é necessário se guiar pela seguinte regra: os valores que representam o numerador e o denominador da média devem estar logicamente relacionados entre si.

  • médias de potência;
  • médias estruturais.

Vamos introduzir a seguinte notação:

Os valores para os quais a média é calculada;

Média, onde a linha acima indica que ocorre a média dos valores individuais;

Frequência (repetibilidade de valores de características individuais).

Várias médias são derivadas da fórmula geral de média de potência:

(5.1)

para k = 1 - média aritmética; k = -1 - média harmônica; k = 0 - média geométrica; k = -2 - raiz quadrada média.

As médias são simples ou ponderadas. médias ponderadas são chamadas de quantidades que levam em consideração que algumas variantes dos valores do atributo podem ter números diferentes e, portanto, cada variante deve ser multiplicada por esse número. Em outras palavras, os "pesos" são os números de unidades populacionais em diferentes grupos, ou seja, cada opção é "ponderada" por sua frequência. A frequência f é chamada peso estatístico ou média de peso.

Média aritmética- o tipo mais comum de meio. É usado quando o cálculo é realizado em dados estatísticos desagrupados, onde se deseja obter a soma média. A média aritmética é um valor médio de um recurso, após o recebimento do qual o volume total do recurso na população permanece inalterado.

A fórmula da média aritmética ( simples) tem a forma

onde n é o tamanho da população.

Por exemplo, o salário médio dos funcionários de uma empresa é calculado como a média aritmética:

Os indicadores determinantes aqui são os salários de cada funcionário e o número de funcionários da empresa. Ao calcular a média, o valor total dos salários permaneceu o mesmo, mas distribuído, por assim dizer, igualmente entre todos os trabalhadores. Por exemplo, é necessário calcular o salário médio dos funcionários de uma pequena empresa onde 8 pessoas estão empregadas:

Ao calcular médias, os valores individuais do atributo cuja média é calculada podem ser repetidos, de modo que a média é calculada usando dados agrupados. Neste caso, estamos falando de usar média aritmética ponderada, que parece

(5.3)

Então, precisamos calcular o preço médio das ações de uma sociedade anônima na bolsa de valores. Sabe-se que as transações foram realizadas no prazo de 5 dias (5 transações), o número de ações vendidas à taxa de venda foi distribuído da seguinte forma:

1 - 800 ac. - 1010 rublos

2 - 650 ac. - 990 esfregar.

3 - 700 ak. - 1015 rublos.

4 - 550 ac. - 900 rublos.

5 - 850 ak. - 1150 rublos.

A relação inicial para determinar o preço médio das ações é a relação entre a quantidade total de transações (TCA) e o número de ações vendidas (KPA):

OSS = 1010 800+990 650+1015 700+900 550+1150 850= 3 634 500;

CPA = 800+650+700+550+850=3550.

Neste caso, o preço médio das ações foi igual a

É necessário conhecer as propriedades da média aritmética, que é muito importante tanto para seu uso quanto para seu cálculo. Existem três propriedades principais que, acima de tudo, levaram ao uso generalizado da média aritmética em cálculos estatísticos e econômicos.

Propriedade um (zero): a soma dos desvios positivos dos valores individuais de uma característica de seu valor médio é igual à soma dos desvios negativos. Esta é uma propriedade muito importante, pois mostra que quaisquer desvios (com + e com -) devido a causas aleatórias serão mutuamente cancelados.

Prova:

Propriedade dois (mínimo): a soma dos desvios quadrados dos valores individuais da característica da média aritmética é menor do que de qualquer outro número (a), ou seja, é o número mínimo.

Prova.

Componha a soma dos desvios quadrados da variável a:

(5.4)

Para encontrar o extremo desta função, é necessário igualar sua derivada em relação a a a zero:

A partir daqui obtemos:

(5.5)

Portanto, o extremo da soma dos desvios quadrados é alcançado em . Este extremo é o mínimo, pois a função não pode ter um máximo.

Propriedade três: a média aritmética de uma constante é igual a esta constante: em a = const.

Além dessas três propriedades mais importantes da média aritmética, existem as chamadas propriedades do projeto, que aos poucos perdem importância devido ao uso de computadores eletrônicos:

  • se o valor individual do sinal de cada unidade for multiplicado ou dividido por um número constante, a média aritmética aumentará ou diminuirá na mesma quantidade;
  • a média aritmética não mudará se o peso (frequência) de cada valor de característica for dividido por um número constante;
  • se os valores individuais do atributo de cada unidade forem reduzidos ou aumentados na mesma quantidade, a média aritmética diminuirá ou aumentará na mesma quantidade.

Média harmônica. Essa média é chamada de média aritmética recíproca, pois esse valor é usado quando k = -1.

média harmônica simplesé usado quando os pesos dos valores característicos são os mesmos. Sua fórmula pode ser derivada da fórmula base substituindo k = -1:

Por exemplo, precisamos calcular a velocidade média de dois carros que percorreram o mesmo caminho, mas com velocidades diferentes: o primeiro a 100 km/h, o segundo a 90 km/h. Usando o método da média harmônica, calculamos a velocidade média:

Na prática estatística, o peso harmônico é mais usado, cuja fórmula tem a forma

Esta fórmula é usada nos casos em que os pesos (ou volumes dos fenômenos) para cada atributo não são iguais. Na razão original, o numerador é conhecido por calcular a média, mas o denominador é desconhecido.

Por exemplo, ao calcular o preço médio, devemos usar a razão entre a quantidade vendida e o número de unidades vendidas. Não sabemos o número de unidades vendidas (estamos falando de produtos diferentes), mas sabemos as somas das vendas desses diferentes produtos. Suponha que você queira descobrir o preço médio das mercadorias vendidas:

Nós temos

Média geométrica. Na maioria das vezes, a média geométrica encontra sua aplicação na determinação da taxa média de crescimento (taxas médias de crescimento), quando os valores individuais da característica são apresentados como valores relativos. Também é usado se for necessário encontrar a média entre os valores mínimo e máximo de uma característica (por exemplo, entre 100 e 1000000). Existem fórmulas para média geométrica simples e ponderada.

Para uma média geométrica simples

Para a média geométrica ponderada

RMS. O principal escopo de sua aplicação é a medição da variação de uma característica na população (cálculo do desvio padrão).

Fórmula de raiz quadrada média simples

Fórmula Raiz Média Quadrada Ponderada

(5.11)

Como resultado, podemos dizer que a solução bem sucedida dos problemas de pesquisa estatística depende da escolha correta do tipo de valor médio em cada caso específico. A escolha da média assume a seguinte sequência:

a) o estabelecimento de um indicador generalizador da população;

b) determinação de uma razão matemática de valores para um determinado indicador generalizador;

c) substituição de valores individuais por valores médios;

d) cálculo da média usando a equação correspondente.

Valores médios e variação

valor médio- este é um indicador generalizante que caracteriza uma população qualitativamente homogênea de acordo com um determinado atributo quantitativo. Por exemplo, a idade média das pessoas condenadas por roubo.

Nas estatísticas judiciais, as médias são usadas para caracterizar:

Prazos médios de consideração dos casos desta categoria;

Reivindicação de tamanho médio;

O número médio de réus por caso;

Quantidade média de danos;

Carga horária média dos juízes, etc.

O valor médio é sempre nomeado e tem a mesma dimensão que o atributo de uma unidade separada da população. Cada valor médio caracteriza a população estudada de acordo com qualquer atributo variável, portanto, por trás de qualquer média, há uma série de distribuição de unidades dessa população de acordo com o atributo estudado. A escolha do tipo de média é determinada pelo conteúdo do indicador e pelos dados iniciais para cálculo da média.

Todos os tipos de médias usadas em estudos estatísticos se enquadram em duas categorias:

1) médias de potência;

2) médias estruturais.

A primeira categoria de médias inclui: média aritmética, média harmônica, média geométrica e raiz quadrada média . A segunda categoria é moda e mediana. Além disso, cada um dos tipos listados de médias de potência pode ter duas formas: simples e pesada . A forma simples da média é utilizada para obter o valor médio da característica em estudo quando o cálculo é baseado em estatísticas não agrupadas, ou quando cada variante ocorre apenas uma vez na população. As médias ponderadas são valores que levam em consideração que as opções para os valores de um recurso podem ter números diferentes e, portanto, cada opção deve ser multiplicada pela frequência correspondente. Em outras palavras, cada opção é "pesada" por sua frequência. A frequência é chamada de peso estatístico.

média aritmética simples- o tipo mais comum de meio. É igual à soma dos valores característicos individuais divididos pelo número total desses valores:

,

Onde x 1 ,x 2 , … ,x N são os valores individuais da variável característica (opções), e N é o número de unidades populacionais.

Média ponderada aritmética usado quando os dados são apresentados na forma de séries de distribuição ou agrupamentos. É calculado como a soma dos produtos das opções e suas frequências correspondentes, dividida pela soma das frequências de todas as opções:

Onde XI- significado eu–th variantes do recurso; fi- frequência eu-th opções.

Assim, cada valor de variante é ponderado por sua frequência, razão pela qual as frequências são às vezes chamadas de pesos estatísticos.

Comente. Quando se trata da média aritmética sem especificar seu tipo, entende-se a média aritmética simples.

Tabela 12

Decisão. Para o cálculo, usamos a fórmula da média aritmética ponderada:

Assim, em média, há dois réus por processo criminal.

Se o cálculo do valor médio for realizado de acordo com os dados agrupados na forma de séries de distribuição de intervalos, primeiro você precisará determinar os valores medianos de cada intervalo x "i, depois calcular o valor médio usando o valor ponderado fórmula de média aritmética, na qual x" i é substituído em vez de x i.

Exemplo. Os dados sobre a idade dos criminosos condenados por roubo são apresentados na tabela:

Tabela 13

Determinar a idade média dos criminosos condenados por roubo.

Decisão. Para determinar a idade média dos criminosos com base na série de variação do intervalo, você deve primeiro encontrar os valores medianos dos intervalos. Como é fornecida uma série de intervalos com primeiros e últimos intervalos abertos, os valores desses intervalos são considerados iguais aos valores dos intervalos fechados adjacentes. No nosso caso, o valor do primeiro e do último intervalo é 10.

Agora encontramos a idade média dos criminosos usando a fórmula da média aritmética ponderada:

Assim, a idade média dos infratores condenados por furto é de aproximadamente 27 anos.

Média harmônica simples é o recíproco da média aritmética dos valores recíprocos do recurso:

onde 1/ XI são os valores recíprocos das variantes, e N é o número de unidades populacionais.

Exemplo. Para determinar a carga de trabalho média anual dos juízes de um tribunal distrital ao considerar processos criminais, foi realizado um levantamento sobre a carga de trabalho de 5 juízes deste tribunal. O tempo médio gasto em um caso criminal para cada um dos juízes pesquisados ​​acabou sendo igual (em dias): 6, 0, 5, 6, 6, 3, 4, 9, 5, 4. Encontre os custos médios para um processo criminal e a carga de trabalho média anual dos juízes deste tribunal distrital ao considerar os processos criminais.

Decisão. Para determinar o tempo médio gasto em um caso criminal, usamos a fórmula simples harmônica:

Para simplificar os cálculos no exemplo, vamos pegar o número de dias em um ano igual a 365, incluindo fins de semana (isso não afeta o método de cálculo e, ao calcular um indicador semelhante na prática, é necessário substituir o número de dias de trabalho dias em um determinado ano em vez de 365 dias). Então a carga de trabalho média anual para os juízes deste tribunal distrital ao considerar casos criminais será: 365 (dias): 5,56 ≈ 65,6 (casos).

Se usássemos a fórmula da média aritmética simples para determinar o tempo médio gasto em um caso criminal, obteríamos:

365 (dias): 5,64 ≈ 64,7 (casos), ou seja a carga média de trabalho dos juízes foi menor.

Vamos verificar a validade desta abordagem. Para fazer isso, usamos dados sobre o tempo gasto em um processo criminal para cada juiz e calculamos o número de processos criminais considerados por cada um deles por ano.

Obtemos em conformidade:

365(dias): 6 ≈ 61 (caso), 365(dias): 5,6 ≈ 65,2 (caso), 365(dias): 6,3 ≈ 58 (caso),

365(dias): 4,9 ≈ 74,5 (casos), 365(dias): 5,4 ≈ 68 (casos).

Agora calculamos a carga de trabalho média anual para os juízes deste tribunal distrital ao considerar casos criminais:

Aqueles. a carga média anual é a mesma de quando se usa a média harmônica.

Assim, o uso da média aritmética neste caso é ilegal.

Nos casos em que as variantes de um recurso são conhecidas, seus valores volumétricos (o produto das variantes pela frequência), mas as próprias frequências são desconhecidas, aplica-se a fórmula da média ponderada harmônica:

,

Onde XI são os valores das variantes de traço, e w i são os valores volumétricos das variantes ( w i = x i f i).

Exemplo. Os dados sobre o preço de uma unidade do mesmo tipo de bens produzidos por várias instituições do sistema penitenciário e sobre o volume de sua implementação são fornecidos na tabela 14.

Tabela 14

Encontre o preço médio de venda do produto.

Decisão. Ao calcular o preço médio, devemos usar a razão entre a quantidade vendida e o número de unidades vendidas. Não sabemos o número de unidades vendidas, mas sabemos a quantidade de vendas de mercadorias. Portanto, para encontrar o preço médio das mercadorias vendidas, usamos a fórmula da média ponderada harmônica. Nós temos

Se você usar a fórmula da média aritmética aqui, poderá obter um preço médio que não será realista:

Média geométricaé calculado extraindo a raiz do grau N do produto de todos os valores das variantes de recurso:

Onde x 1 ,x 2 , … ,x N são os valores individuais da variável característica (opções), e

Né o número de unidades populacionais.

Esse tipo de média é usado para calcular as taxas médias de crescimento das séries temporais.

raiz quadrada médiaé usado para calcular o desvio padrão, que é um indicador de variação, e será discutido a seguir.

Para determinar a estrutura da população, são utilizadas médias especiais, que incluem mediana e moda , ou as chamadas médias estruturais. Se a média aritmética for calculada com base no uso de todas as variantes dos valores dos atributos, então a mediana e a moda caracterizam o valor da variante que ocupa uma determinada posição média na série ordenada (ordenada). A ordenação das unidades da população estatística pode ser feita em ordem crescente ou decrescente das variantes da característica em estudo.

Mediano (eu)é o valor que corresponde à variante no meio da série classificada. Assim, a mediana é aquela variante da série ordenada, em ambos os lados da qual nesta série deve haver um número igual de unidades populacionais.

Para encontrar a mediana, primeiro você precisa determinar seu número de série na série classificada usando a fórmula:

onde N é o volume da série (o número de unidades populacionais).

Se a série consiste em um número ímpar de membros, então a mediana é igual à variante com o número N Me . Se a série consiste em um número par de membros, então a mediana é definida como a média aritmética de duas opções adjacentes localizadas no meio.

Exemplo. Dada uma série classificada 1, 2, 3, 3, 6, 7, 9, 9, 10. O volume da série é N = 9, o que significa N Me = (9 + 1) / 2 = 5. Portanto, Me = 6, ou seja. quinta opção. Se uma linha é dada 1, 5, 7, 9, 11, 14, 15, 16, ou seja, série com um número par de membros (N = 8), então N Me = (8 + 1) / 2 = 4,5. Assim, a mediana é igual à metade da soma da quarta e quinta opções, ou seja, Eu = (9 + 11) / 2 = 10.

Em uma série de variação discreta, a mediana é determinada pelas frequências acumuladas. As frequências variantes, começando pela primeira, são somadas até que o número mediano seja excedido. O valor das últimas opções somadas será a mediana.

Exemplo. Encontre o número médio de réus por caso criminal usando os dados da Tabela 12.

Decisão. Neste caso, o volume da série de variação é N = 154, portanto, N Me = (154 + 1) / 2 = 77,5. Somando as frequências da primeira e segunda opções, obtemos: 75 + 43 = 118, ou seja, ultrapassamos o número mediano. Então Eu = 2.

Na série de variação intervalar da distribuição, primeiro indique o intervalo em que a mediana estará localizada. Ele é chamado mediana . Este é o primeiro intervalo cuja frequência acumulada excede a metade do volume da série de variação do intervalo. Então o valor numérico da mediana é determinado pela fórmula:

Onde x Eué o limite inferior do intervalo mediano; i é o valor do intervalo mediano; S Me-1é a frequência acumulada do intervalo que precede a mediana; f Eué a frequência do intervalo mediano.

Exemplo. Encontre a idade média dos infratores condenados por roubo, com base nas estatísticas apresentadas na Tabela 13.

Decisão. Os dados estatísticos são representados por uma série de variação de intervalo, o que significa que primeiro determinamos o intervalo mediano. O volume da população N = 162, portanto, o intervalo mediano é o intervalo 18-28, porque este é o primeiro intervalo, cuja frequência acumulada (15 + 90 = 105) excede metade do volume (162: 2 = 81) da série de variação do intervalo. Agora o valor numérico da mediana é determinado pela fórmula acima:

Assim, metade dos condenados por furto tem menos de 25 anos.

Moda (Mo) nomeie o valor do atributo, que é mais frequentemente encontrado em unidades da população. A moda é usada para identificar o valor do traço que tem a maior distribuição. Para uma série discreta, a moda será a variante com maior frequência. Por exemplo, para uma série discreta apresentada na Tabela 3 Mo= 1, pois este valor das opções corresponde à frequência mais alta - 75. Para determinar a moda da série intervalar, primeiro determine modal intervalo (intervalo com a frequência mais alta). Então, dentro desse intervalo, encontra-se o valor do recurso, que pode ser uma moda.

Seu valor é encontrado pela fórmula:

Onde x mêsé o limite inferior do intervalo modal; i é o valor do intervalo modal; f Moé a frequência do intervalo modal; f Mo-1é a frequência do intervalo anterior ao modal; f Mo+1é a frequência do intervalo que segue o modal.

Exemplo. Encontre a faixa etária dos criminosos condenados por furto, cujos dados são apresentados na tabela 13.

Decisão. A maior frequência corresponde ao intervalo 18-28, portanto, a moda deve estar neste intervalo. Seu valor é determinado pela fórmula acima:

Assim, o maior número de criminosos condenados por roubo tem 24 anos.

O valor médio dá uma característica generalizante da totalidade do fenômeno em estudo. No entanto, duas populações com os mesmos valores médios podem diferir significativamente uma da outra em termos do grau de flutuação (variação) no valor da característica estudada. Por exemplo, em um tribunal foram atribuídas as seguintes penas de prisão: 3, 3, 3, 4, 5, 5, 5, 12, 12, 15 anos e em outro - 5, 5, 6, 6, 7, 7 , 7, 8, 8, 8 anos. Em ambos os casos, a média aritmética é de 6,7 anos. No entanto, esses agregados diferem significativamente entre si na distribuição dos valores individuais da pena de prisão atribuída em relação ao valor médio.

E para o primeiro tribunal, onde essa variação é bastante grande, a pena média de prisão não reflete bem toda a população. Assim, se os valores individuais do atributo diferem pouco uns dos outros, a média aritmética será uma característica bastante indicativa das propriedades dessa população. Caso contrário, a média aritmética será uma característica pouco confiável dessa população e sua aplicação na prática é ineficaz. Portanto, é necessário levar em consideração a variação nos valores da característica estudada.

Variação- são diferenças nos valores de uma característica em diferentes unidades de uma determinada população no mesmo período ou ponto no tempo. O termo "variação" é de origem latina - variatio, que significa diferença, mudança, flutuação. Surge como resultado do fato de que os valores individuais do atributo são formados sob a influência combinada de vários fatores (condições), que são combinados de maneiras diferentes em cada caso individual. Para medir a variação de uma característica, vários indicadores absolutos e relativos são usados.

Os principais indicadores de variação incluem o seguinte:

1) faixa de variação;

2) desvio linear médio;

3) dispersão;

4) desvio padrão;

5) coeficiente de variação.

Vamos nos debruçar brevemente sobre cada um deles.

Variação do intervalo R é o indicador absoluto mais acessível em termos de facilidade de cálculo, que é definido como a diferença entre o maior e o menor valor do atributo para unidades dessa população:

A faixa de variação (faixa de flutuações) é um indicador importante da variabilidade de uma característica, mas permite ver apenas desvios extremos, o que limita seu escopo. Para uma caracterização mais precisa da variação de uma característica com base em sua flutuação, outros indicadores são utilizados.

Desvio linear médio representa a média aritmética dos valores absolutos dos desvios dos valores individuais da característica da média e é determinada pelas fórmulas:

1) por dados desagrupados

2) por série de variação

No entanto, a medida de variação mais utilizada é dispersão . Caracteriza a medida da dispersão dos valores do traço estudado em relação ao seu valor médio. A variância é definida como a média dos desvios ao quadrado.

variação simples para dados desagrupados:

.

Variação ponderada para a série de variação:

Comente. Na prática, é melhor usar as seguintes fórmulas para calcular a variância:

Para uma variação simples

.

Para variação ponderada

Desvio padrãoé a raiz quadrada da variância:

O desvio padrão é uma medida da confiabilidade da média. Quanto menor o desvio padrão, mais homogênea a população e melhor a média aritmética reflete toda a população.

As medidas de dispersão consideradas acima (faixa de variação, variância, desvio padrão) são indicadores absolutos, pelos quais nem sempre é possível julgar o grau de flutuação de uma característica. Em alguns problemas, é necessário usar índices de espalhamento relativo, um dos quais é o coeficiente de variação.

O coeficiente de variação- expresso como uma porcentagem da razão do desvio padrão para a média aritmética:

O coeficiente de variação é utilizado não apenas para uma avaliação comparativa da variação de diferentes características ou da mesma característica em diferentes populações, mas também para caracterizar a homogeneidade da população. A população estatística é considerada quantitativamente homogênea se o coeficiente de variação não exceder 33% (para distribuições próximas à distribuição normal).

Exemplo. Há os seguintes dados sobre as penas de prisão de 50 condenados entregues para cumprir a pena imposta pelo tribunal em uma instituição correcional do sistema penitenciário: 5, 4, 2, 1, 6, 3, 4, 3, 2, 2 , 5, 6, 4, 3 , 10, 5, 4, 1, 2, 3, 3, 4, 1, 6, 5, 3, 4, 3, 5, 12, 4, 3, 2, 4, 6 , 4, 4, 3, 1, 5, 4, 3, 12, 6, 7, 3, 4, 5, 5, 3.

1. Construir uma série de distribuição por penas de prisão.

2. Encontre a média, variância e desvio padrão.

3. Calcule o coeficiente de variação e tire uma conclusão sobre a homogeneidade ou heterogeneidade da população estudada.

Decisão. Para construir uma série de distribuição discreta, é necessário determinar as variantes e frequências. A opção neste problema é a pena de prisão, e a frequência é o número de opções individuais. Tendo calculado as frequências, obtemos a seguinte série de distribuição discreta:

Encontre a média e a variância. Como os dados estatísticos são representados por uma série variacional discreta, usaremos as fórmulas da média ponderada aritmética e da variância para calculá-los. Nós temos:

= = 4,1;

= 5,21.

Agora calculamos o desvio padrão:

Encontramos o coeficiente de variação:

Consequentemente, a população estatística é quantitativamente heterogênea.

média aritmética simples

Valores médios

Os valores médios são amplamente utilizados em estatísticas.

valor médio- este é um indicador generalizante no qual se encontra a expressão da ação das condições gerais, padrões de desenvolvimento do fenômeno em estudo.

As médias estatísticas são calculadas com base nos dados de massa de uma observação corretamente organizada estatisticamente (contínua e amostral). No entanto, a média estatística será objetiva e típica se for calculada a partir de dados de massa para uma população qualitativamente homogênea (fenômenos de massa). Por exemplo, se calcularmos o salário médio em sociedades anônimas e estatais, e estendermos o resultado para toda a população, então a média é fictícia, pois é calculada sobre uma população heterogênea, e tal média perde todos os significado.

Com a ajuda da média, há, por assim dizer, uma suavização das diferenças na magnitude da característica que surgem por uma razão ou outra em unidades individuais de observação.

Por exemplo, a produção média de um vendedor individual depende de muitos fatores: qualificações, tempo de serviço, idade, forma de serviço, saúde e assim por diante. A produção média reflete as características gerais de toda a população.

O valor médio é medido nas mesmas unidades que o próprio recurso.

Cada valor médio caracteriza a população estudada de acordo com qualquer atributo. Para obter uma imagem completa e abrangente da população em estudo em termos de uma série de características essenciais, é necessário ter um sistema de valores médios que possa descrever o fenômeno de diferentes ângulos.

Existem vários tipos de médias:

    média aritmética;

    harmônico médio;

    média geométrica;

    raiz quadrada média;

    cúbico médio.

As médias de todos os tipos listados acima, por sua vez, são divididas em simples (não ponderadas) e ponderadas.

Considere os tipos de médias que são usadas em estatísticas.

A média aritmética simples (não ponderada) é igual à soma dos valores individuais da característica, dividida pelo número desses valores.

Valores separados de um recurso são chamados de variantes e são denotados por х i (
); o número de unidades populacionais é denotado por n, o valor médio da característica - por . Portanto, a média aritmética simples é:

ou

Exemplo 1 tabela 1

Dados sobre a produção de produtos A por trabalhadores por turno

Neste exemplo, o atributo variável é a liberação de produtos por turno.

Os valores numéricos do atributo (16, 17, etc.) são chamados de variantes. Vamos determinar a produção média de produtos pelos trabalhadores deste grupo:

PCS.

Uma média aritmética simples é usada nos casos em que existem valores individuais de uma característica, ou seja, os dados não são agrupados. Se os dados forem apresentados na forma de séries de distribuição ou agrupamentos, a média será calculada de forma diferente.

Média ponderada aritmética

A média aritmética ponderada é igual à soma dos produtos de cada valor individual do atributo (opção) pela frequência correspondente, dividida pela soma de todas as frequências.

O número de valores de características idênticos na série de distribuição é chamado de frequência ou peso e é denotado por f i .

De acordo com isso, a média ponderada aritmética fica assim:

ou

Pode-se ver pela fórmula que a média depende não apenas dos valores do atributo, mas também de suas frequências, ou seja, na composição da população, na sua estrutura.

Exemplo 2 mesa 2

Dados do salário do trabalhador

De acordo com os dados da série de distribuição discreta, pode-se observar que os mesmos valores do atributo (opções) se repetem várias vezes. Assim, a variante x 1 ocorre no agregado 2 vezes e a variante x 2 - 6 vezes, etc.

Calcule o salário médio por trabalhador:

O fundo salarial para cada grupo de trabalhadores é igual ao produto de opções e frequência (
), e a soma desses produtos dá o fundo salarial total de todos os trabalhadores (
).

Se o cálculo fosse realizado usando a fórmula da média aritmética simples, o salário médio seria de 3.000 rublos. (). Comparando o resultado obtido com os dados iniciais, é óbvio que o salário médio deve ser significativamente maior (mais da metade dos trabalhadores recebe salários acima de 3.000 rublos). Portanto, o cálculo da média aritmética simples nesses casos será errôneo.

O material estatístico como resultado do processamento pode ser apresentado não apenas na forma de séries de distribuição discreta, mas também na forma de séries de variação intervalar com intervalos fechados ou abertos.

Considere o cálculo da média aritmética para tais séries.

A média é:

Quer dizer

Quer dizer- característica numérica de um conjunto de números ou funções; - algum número entre o menor e o maior de seus valores.

  • 1 Informações básicas
  • 2 Hierarquia de meios em matemática
  • 3 Na teoria da probabilidade e estatística
  • 4 Veja também
  • 5 Notas

Informação básica

O ponto de partida para a formação da teoria das médias foi o estudo das proporções pela escola de Pitágoras. Ao mesmo tempo, nenhuma distinção estrita foi feita entre os conceitos de média e proporção. Um impulso significativo para o desenvolvimento da teoria das proporções do ponto de vista aritmético foi dado pelos matemáticos gregos - Nicômaco de Geras (final do I - início do século II dC) e Pappus de Alexandria (século III dC). A primeira etapa no desenvolvimento do conceito de média é a etapa em que a média passou a ser considerada o membro central de uma proporção contínua. Mas o conceito de média como valor central da progressão não permite derivar o conceito de média em relação a uma sequência de n termos, independentemente da ordem em que eles se seguem. Para isso é necessário recorrer a uma generalização formal das médias. O próximo estágio é a transição de proporções contínuas para progressões - aritméticas, geométricas e harmônicas.

Na história da estatística, pela primeira vez, o uso generalizado de médias está associado ao nome do cientista inglês W. Petty. W. Petty foi um dos primeiros a tentar dar um significado estatístico ao valor médio, relacionando-o com categorias econômicas. Mas Petty não apresentou uma descrição do conceito de valor médio, sua alocação. A. Quetelet é considerado o fundador da teoria dos valores médios. Ele foi um dos primeiros a desenvolver consistentemente a teoria das médias, tentando trazer uma base matemática para ela. A. Quetelet destacou dois tipos de médias - médias reais e médias aritméticas. As médias apropriadamente representam uma coisa, um número, realmente existente. Na verdade, as médias ou médias estatísticas devem ser derivadas de fenômenos da mesma qualidade, idênticos em sua significância interna. As médias aritméticas são números que dão a ideia mais próxima possível de muitos números, diferentes, ainda que homogêneos.

Cada tipo de média pode ser uma média simples ou uma média ponderada. O acerto da escolha da forma média decorre da natureza material do objeto de estudo. Fórmulas médias simples são usadas se os valores individuais do recurso médio não se repetirem. Quando em estudos práticos os valores individuais do traço em estudo ocorrem várias vezes nas unidades da população em estudo, então a frequência de repetição dos valores do traço individual está presente nas fórmulas de cálculo das médias de poder. Nesse caso, elas são chamadas de fórmulas de média ponderada.

Fundação Wikimedia. 2010.


O valor médio é um indicador generalizante que caracteriza o nível típico do fenômeno. Expressa o valor do atributo, relacionado à unidade da população.

O valor médio é:

1) o valor mais típico do atributo para a população;

2) o volume do sinal da população, distribuído igualmente entre as unidades da população.

A característica para a qual o valor médio é calculado é chamada de “média” em estatística.

A média sempre generaliza a variação quantitativa da característica, ou seja, em médias, as diferenças individuais nas unidades da população devido a circunstâncias aleatórias são canceladas. Ao contrário da média, o valor absoluto que caracteriza o nível de uma característica de uma unidade individual da população não permite comparar os valores da característica para unidades pertencentes a diferentes populações. Portanto, se você precisar comparar os níveis de remuneração dos trabalhadores de duas empresas, não poderá comparar dois funcionários de empresas diferentes nessa base. Os salários dos trabalhadores selecionados para comparação podem não ser típicos para essas empresas. Se compararmos o tamanho dos fundos salariais nas empresas em consideração, o número de funcionários não é levado em consideração e, portanto, é impossível determinar onde o nível de salários é mais alto. Em última análise, apenas as médias podem ser comparadas, ou seja, Quanto ganha um trabalhador em média em cada empresa? Assim, há a necessidade de calcular o valor médio como característica generalizante da população.

É importante observar que no processo de cálculo da média, o valor agregado dos níveis de atributo ou seu valor final (no caso de cálculo de níveis médios em uma série temporal) deve permanecer inalterado. Em outras palavras, ao calcular o valor médio, o volume da característica em estudo não deve ser distorcido, e as expressões feitas no cálculo da média devem necessariamente fazer sentido.

Calcular a média é uma técnica comum de generalização; o indicador médio nega o geral que é típico (típico) para todas as unidades da população estudada, ao mesmo tempo que ignora as diferenças entre as unidades individuais. Em todo fenômeno e em seu desenvolvimento há uma combinação de acaso e necessidade. Ao calcular médias, devido à operação da lei dos grandes números, a aleatoriedade se cancela, se equilibra, para que você possa abstrair as características insignificantes do fenômeno, dos valores quantitativos do atributo em cada caso específico. Na capacidade de abstrair da aleatoriedade dos valores individuais, das flutuações, reside o valor científico das médias como características generalizantes dos agregados.

Para que a média seja realmente tipificante, ela deve ser calculada levando-se em conta alguns princípios.

Detenhamo-nos em alguns princípios gerais para a aplicação de médias.

1. A média deve ser determinada para populações constituídas por unidades qualitativamente homogêneas.

2. A média deve ser calculada para uma população composta por um número suficientemente grande de unidades.

3. A média deve ser calculada para a população, cujas unidades estão em estado normal e natural.

4. A média deve ser calculada levando em consideração o conteúdo econômico do indicador em estudo.

5.2. Tipos de médias e métodos para calculá-las

Vamos agora considerar os tipos de médias, as características de seu cálculo e áreas de aplicação. Os valores médios são divididos em duas grandes classes: médias de potência, médias estruturais.

As médias da lei de potência incluem os tipos mais conhecidos e comumente usados, como média geométrica, média aritmética e média quadrada.

A moda e a mediana são consideradas como médias estruturais.

Vamos nos debruçar sobre as médias de potência. As médias de potência, dependendo da apresentação dos dados iniciais, podem ser simples e ponderadas. média simplesé calculado a partir de dados desagrupados e tem a seguinte forma geral:

,

onde X i é a variante (valor) da característica média;

n é o número de opções.

Média ponderadaé calculado por dados agrupados e tem uma forma geral

,

onde X i é a variante (valor) da característica média ou o valor médio do intervalo em que a variante é medida;

m é o expoente da média;

f i - frequência que mostra quantas vezes ocorre o valor de i-e da característica média.

Se calcularmos todos os tipos de médias para os mesmos dados iniciais, seus valores não serão os mesmos. Aqui se aplica a regra da maioria das médias: com um aumento no expoente m, o valor médio correspondente também aumenta:

Na prática estatística, mais frequentemente do que outros tipos de médias ponderadas, são usadas médias ponderadas aritméticas e harmônicas.

Tipos de meios de energia

Tipo de poder
meio

Indicador
graus (m)

Fórmula de cálculo

Simples

pesada

harmônico

Geométrico

Aritmética

quadrático

cúbico

A média harmônica tem uma estrutura mais complexa que a média aritmética. A média harmônica é usada para cálculos quando os pesos não são as unidades da população - os portadores da característica, mas os produtos dessas unidades e os valores da característica (ou seja, m = Xf). O tempo médio de paralisação harmônica deve ser usado nos casos de determinação, por exemplo, dos custos médios de mão de obra, tempo, materiais por unidade de produção, por peça para duas (três, quatro, etc.) empresas, trabalhadores envolvidos na fabricação do mesmo tipo de produto, a mesma peça, produto.

O principal requisito para a fórmula de cálculo do valor médio é que todas as etapas do cálculo tenham uma justificativa real e significativa; o valor médio resultante deve substituir os valores individuais do atributo para cada objeto sem quebrar a conexão entre os indicadores individuais e resumidos. Em outras palavras, o valor médio deve ser calculado de tal forma que, quando cada valor individual do indicador médio for substituído por seu valor médio, algum indicador resumido final conectado de uma forma ou de outra com o indicador médio permaneça inalterado. Esse resultado é chamado determinando já que a natureza de sua relação com os valores individuais determina a fórmula específica para calcular o valor médio. Vamos mostrar essa regra no exemplo da média geométrica.

Fórmula média geométrica

mais frequentemente usado ao calcular o valor médio de valores relativos individuais da dinâmica.

A média geométrica é usada se for dada uma sequência de valores relativos da dinâmica da cadeia, indicando, por exemplo, um aumento na produção em relação ao nível do ano anterior: i 1 , i 2 , i 3 ,…, i n . Obviamente, o volume de produção no último ano é determinado pelo seu nível inicial (q 0) e crescimento subsequente ao longo dos anos:

q n =q 0 × i 1 × i 2 ×…×i n .

Tomando q n como indicador definidor e substituindo os valores individuais dos indicadores dinâmicos por valores médios, chegamos à relação

Daqui



Um tipo especial de valores médios - médias estruturais - é usado para estudar a estrutura interna da série de distribuição de valores de atributos, bem como para estimar o valor médio (tipo de potência), se, de acordo com os dados estatísticos disponíveis, seu cálculo não pode ser realizado (por exemplo, se não houver dados no exemplo considerado) e no volume de produção e no valor dos custos por grupos de empresas).

Os indicadores são mais frequentemente usados ​​como médias estruturais. moda - o valor do recurso repetido com mais frequência - e mediana - o valor de um recurso que divide a sequência ordenada de seus valores em duas partes iguais em número. Como resultado, em metade das unidades populacionais, o valor do atributo não excede o nível mediano e na outra metade não é inferior a ele.

Se o recurso em estudo tiver valores discretos, não haverá dificuldades particulares no cálculo da moda e da mediana. Se os dados sobre os valores do atributo X forem apresentados na forma de intervalos ordenados de sua mudança (série de intervalos), o cálculo da moda e da mediana se torna um pouco mais complicado. Como o valor da mediana divide toda a população em duas partes iguais em número, ela acaba em um dos intervalos do traço X. Usando a interpolação, o valor da mediana é encontrado neste intervalo da mediana:

,

onde X Me é o limite inferior do intervalo mediano;

h Me é o seu valor;

(Soma m) / 2 - metade do número total de observações ou metade do volume do indicador que serve de ponderação nas fórmulas de cálculo do valor médio (em termos absolutos ou relativos);

S Me-1 é a soma das observações (ou o volume da característica de ponderação) acumuladas antes do início do intervalo mediano;

m Me é o número de observações ou o volume do recurso de ponderação no intervalo mediano (também em termos absolutos ou relativos).

Ao calcular o valor modal de um recurso de acordo com os dados da série de intervalos, é necessário prestar atenção ao fato de que os intervalos são os mesmos, pois o indicador da frequência dos valores de recursos X depende disso. Para uma série intervalar com intervalos iguais, o valor da moda é determinado como

,

onde X Mo é o menor valor do intervalo modal;

m Mo é o número de observações ou o volume do recurso de ponderação no intervalo modal (em termos absolutos ou relativos);

m Mo-1 - o mesmo para o intervalo anterior ao modal;

m Mo+1 - o mesmo para o intervalo seguinte ao modal;

h é o valor do intervalo de mudança da característica em grupos.

TAREFA 1

Os seguintes dados estão disponíveis para o grupo de empresas industriais para o ano de referência


empreendimentos

Volume de produção, milhões de rublos

Número médio de funcionários, pers.

Lucro, mil rublos

197,7

10,0

13,5

22,8

1500

136,2

465,5

18,4

1412

97,6

296,2

12,6

1200

44,4

584,1

22,0

1485

146,0

480,0

119,0

1420

110,4

57805

21,6

1390

138,7

204,7

30,6

466,8

19,4

1375

111,8

292,2

113,6

1200

49,6

423,1

17,6

1365

105,8

192,6

30,7

360,5

14,0

1290

64,8

280,3

10,2

33,3

É obrigatória a realização de agrupamento de empresas para troca de produtos, respeitando os seguintes intervalos:

    até 200 milhões de rublos

    de 200 a 400 milhões de rublos

  1. de 400 a 600 milhões de rublos

    Para cada grupo e para todos juntos, determine o número de empresas, o volume de produção, o número médio de funcionários, a produção média por funcionário. Os resultados do agrupamento devem ser apresentados na forma de uma tabela estatística. Formule uma conclusão.

    DECISÃO

    Vamos fazer um agrupamento de empresas para a troca de produtos, o cálculo do número de empresas, o volume de produção, o número médio de funcionários de acordo com a fórmula de uma média simples. Os resultados do agrupamento e dos cálculos são resumidos em uma tabela.

    Agrupamentos por volume de produção


    empreendimentos

    Volume de produção, milhões de rublos

    Custo médio anual de ativos fixos, milhões de rublos

    sono médio

    número suculento de funcionários, pers.

    Lucro, mil rublos

    Produção média por trabalhador

    1 grupo

    até 200 milhões de rublos

    1,8,12

    197,7

    204,7

    192,6

    10,0

    9,4

    8,8

    900

    817

    13,5

    30,6

    30,7

    28,2

    2567

    74,8

    0,23

    Nível médio

    198,3

    24,9

    2 grupo

    de 200 a 400 milhões de rublos

    4,10,13,14

    196,2

    292,2

    360,5

    280,3

    12,6

    113,6

    14,0

    10,2

    1200

    1200

    1290

    44,4

    49,6

    64,8

    33,3

    1129,2

    150,4

    4590

    192,1

    0,25

    Nível médio

    282,3

    37,6

    1530

    64,0

    3 grupo

    de 400 a

    600 milhões

    2,3,5,6,7,9,11

    592

    465,5

    584,1

    480,0

    578,5

    466,8

    423,1

    22,8

    18,4

    22,0

    119,0

    21,6

    19,4

    17,6

    1500

    1412

    1485

    1420

    1390

    1375

    1365

    136,2

    97,6

    146,0

    110,4

    138,7

    111,8

    105,8

    3590

    240,8

    9974

    846,5

    0,36

    Nível médio

    512,9

    34,4

    1421

    120,9

    Total no agregado

    5314,2

    419,4

    17131

    1113,4

    0,31

    Média agregada

    379,6

    59,9

    1223,6

    79,5

    Conclusão. Assim, no agregado considerado, o maior número de empresas em termos de produção caiu no terceiro grupo – sete, ou metade das empresas. O valor do valor médio anual dos ativos fixos também está neste grupo, assim como o grande valor do número médio de funcionários - 9974 pessoas, as empresas do primeiro grupo são as menos lucrativas.

    TAREFA 2

    Temos os seguintes dados sobre as empresas da empresa

    Número da empresa pertencente à empresa

    eu quarto

    II trimestre

    Saída, mil rublos

    Trabalhado por dias de trabalho

    Produção média por trabalhador por dia, esfregue.

    59390,13

Principalmente na eq. Na prática, deve-se usar a média aritmética, que pode ser calculada como a média aritmética simples e ponderada.

Média aritmética (CA)-n o tipo mais comum de meio. É usado nos casos em que o volume de um atributo variável para toda a população é a soma dos valores dos atributos de suas unidades individuais. Os fenômenos sociais são caracterizados pela aditividade (somatória) dos volumes do atributo variável, o que determina o alcance da SA e explica sua prevalência como indicador generalizante, por exemplo: o fundo salarial geral é a soma do salário de todos os funcionários.

Para calcular SA, você precisa dividir a soma de todos os valores dos recursos pelo número deles. SA é usado em 2 formas.

Considere primeiro a média aritmética simples.

1-CA simples (forma inicial, definidora) é igual à soma simples dos valores individuais do recurso médio, dividido pelo número total desses valores (usado quando há valores de índice desagrupados do recurso):

Os cálculos feitos podem ser resumidos na seguinte fórmula:

(1)

Onde - o valor médio do atributo variável, ou seja, a média aritmética simples;

significa soma, ou seja, a adição de características individuais;

x- valores individuais de um atributo variável, que são chamados de variantes;

n - número de unidades populacionais

Exemplo 1,é necessário encontrar a produção média de um trabalhador (serralheiro), se souber quantas peças cada um dos 15 trabalhadores produziu, ou seja, dado um número de ind. valores de características, unid.: 21; 20; 20; dezenove; 21; dezenove; dezoito; 22; dezenove; 20; 21; 20; dezoito; dezenove; 20.

SA simples é calculado pela fórmula (1), pcs.:

Exemplo2. Vamos calcular SA com base em dados condicionais para 20 lojas que fazem parte de uma trading company (Tabela 1). tabela 1

Distribuição de lojas da empresa comercial "Vesna" por área comercial, sq. M

número da loja

número da loja

Para calcular a área média da loja ( ) é necessário somar as áreas de todas as lojas e dividir o resultado pelo número de lojas:

Assim, a área média de loja para este grupo de empreendimentos comerciais é de 71 m2.

Portanto, para que a determinação do SA seja simples, é necessário dividir a soma de todos os valores de um determinado atributo pelo número de unidades que possuem esse atributo.

2

Onde f 1 , f 2 , … ,f n peso (frequência de repetição das mesmas características);

é a soma dos produtos da magnitude das feições e suas frequências;

é o número total de unidades populacionais.

- SA ponderado - com no meio das opções, que são repetidas um número diferente de vezes, ou dizem que têm pesos diferentes. Os pesos são os números de unidades em diferentes grupos populacionais (o grupo combina as mesmas opções). SA ponderado média de valores agrupados x 1 , x 2 , .., x n calculado: (2)

Onde X- opções;

f- frequência (peso).

SA ponderada é o quociente da divisão da soma dos produtos das variantes e suas frequências correspondentes pela soma de todas as frequências. Frequências ( f) que aparecem na fórmula SA são geralmente chamados balança, pelo que o SA calculado tendo em conta os pesos é denominado SA ponderado.

Ilustraremos a técnica de cálculo do SA ponderado usando o exemplo 1 considerado acima, para isso, agrupamos os dados iniciais e os colocamos na Tabela.

A média dos dados agrupados é determinada da seguinte forma: primeiro, as opções são multiplicadas pelas frequências, depois os produtos são somados e a soma resultante é dividida pela soma das frequências.

De acordo com a fórmula (2), o SA ponderado é, pcs.:

A distribuição de trabalhadores para o desenvolvimento de peças

P

os dados fornecidos no exemplo anterior 2 podem ser combinados em grupos homogêneos, que são apresentados na tabela. Tabela

Distribuição das lojas Vesna por espaço de varejo, sq. m

Assim, o resultado é o mesmo. No entanto, esta já será a média aritmética ponderada.

No exemplo anterior, calculamos a média aritmética, desde que as frequências absolutas (número de lojas) sejam conhecidas. No entanto, em alguns casos não existem frequências absolutas, mas as frequências relativas são conhecidas, ou, como são comumente chamadas, frequências que mostram a proporção ou a proporção de frequências em toda a população.

Ao calcular o uso ponderado SA frequências permite simplificar os cálculos quando a frequência é expressa em números grandes de vários dígitos. O cálculo é feito da mesma forma, porém, como o valor médio é aumentado em 100 vezes, o resultado deve ser dividido por 100.

Em seguida, a fórmula para a média ponderada aritmética será semelhante a:

Onde d- frequência, ou seja a participação de cada frequência na soma total de todas as frequências.

(3)

Em nosso exemplo 2, primeiro determinamos a participação de lojas por grupos no número total de lojas da empresa "Primavera". Assim, para o primeiro grupo, a gravidade específica corresponde a 10%
. Obtemos os seguintes dados Tabela 3

Os sinais de unidades de agregados estatísticos são diferentes em seu significado, por exemplo, os salários dos trabalhadores de uma profissão de uma empresa não são os mesmos para o mesmo período de tempo, os preços de mercado para os mesmos produtos são diferentes, os rendimentos das colheitas nas fazendas da região etc Portanto, para determinar o valor de um recurso característico de toda a população de unidades em estudo, são calculados valores médios.
valor médioé uma característica generalizante do conjunto de valores individuais de algum traço quantitativo.

A população estudada por um atributo quantitativo consiste em valores individuais; eles são influenciados tanto por causas gerais quanto por condições individuais. No valor médio, os desvios característicos dos valores individuais são cancelados. A média, sendo função de um conjunto de valores individuais, representa todo o conjunto com um valor e reflete o comum inerente a todas as suas unidades.

A média calculada para populações compostas por unidades qualitativamente homogêneas é chamada média típica. Por exemplo, você pode calcular o salário médio mensal de um funcionário de um ou outro grupo profissional (mineiro, médico, bibliotecário). É claro que os níveis de salários mensais dos mineiros, devido à diferença em suas qualificações, tempo de serviço, horas trabalhadas por mês e muitos outros fatores, diferem uns dos outros e do nível de salários médios. No entanto, o nível médio reflete os principais fatores que afetam o nível de remuneração, e compensam mutuamente as diferenças que surgem devido às características individuais do empregado. O salário médio reflete o nível típico de salários para esse tipo de trabalhador. A obtenção de uma média típica deve ser precedida de uma análise de como essa população é qualitativamente homogênea. Se a população for composta por partes separadas, deve ser dividida em grupos típicos (temperatura média no hospital).

Os valores médios usados ​​como características para populações heterogêneas são chamados médias do sistema. Por exemplo, o valor médio do produto interno bruto (PIB) per capita, o consumo médio de vários grupos de bens por pessoa e outros valores semelhantes que representam as características gerais do estado como um único sistema econômico.

A média deve ser calculada para populações constituídas por um número suficientemente grande de unidades. O cumprimento desta condição é necessário para que a lei dos grandes números entre em vigor, como resultado de que os desvios aleatórios de quantidades individuais da tendência geral se cancelam.

Tipos de médias e métodos para calculá-las

A escolha do tipo de média é determinada pelo conteúdo econômico de um determinado indicador e pelos dados iniciais. No entanto, qualquer valor médio deve ser calculado de forma que, ao substituir cada variante do traço médio, o final, generalizante ou, como é comumente chamado, não seja alterado. indicador de definição, que está relacionado com a média. Por exemplo, ao substituir as velocidades reais em trechos separados do caminho, sua velocidade média não deve alterar a distância total percorrida pelo veículo no mesmo tempo; ao substituir os salários reais de funcionários individuais da empresa pelo salário médio, o fundo salarial não deve mudar. Consequentemente, em cada caso específico, dependendo da natureza dos dados disponíveis, existe apenas um valor médio verdadeiro do indicador que seja adequado às propriedades e essência do fenômeno socioeconômico em estudo.
As mais utilizadas são a média aritmética, média harmônica, média geométrica, média quadrada e média cúbica.
As médias listadas pertencem à classe potência média e são combinados pela fórmula geral:
,
onde é o valor médio da característica estudada;
m é o expoente da média;
– valor atual (variante) do recurso de média;
n é o número de recursos.
Dependendo do valor do expoente m, os seguintes tipos de médias de potência são distinguidos:
em m = -1 – média harmônica;
em m = 0 – média geométrica;
em m = 1 – média aritmética;
em m = 2 – raiz quadrada média;
em m = 3 - cúbico médio.
Ao usar os mesmos dados iniciais, quanto maior o expoente m na fórmula acima, maior o valor do valor médio:
.
Esta propriedade da lei de potência significa aumentar com um aumento no expoente da função definidora é chamada a regra da majoração dos meios.
Cada uma das médias marcadas pode assumir duas formas: simples e pesada.
A forma simples do meio aplica-se quando a média é calculada em dados primários (não agrupados). forma ponderada– ao calcular a média para dados secundários (agrupados).

Média aritmética

A média aritmética é usada quando o volume da população é a soma de todos os valores individuais do atributo variável. Deve-se notar que se o tipo de média não for indicado, a média aritmética é assumida. Sua fórmula lógica é:

média aritmética simples calculado por dados desagrupados de acordo com a fórmula:
ou ,
onde estão os valores individuais do atributo;
j é o número de série da unidade de observação, que se caracteriza pelo valor ;
N é o número de unidades de observação (tamanho do conjunto).
Exemplo. Na palestra “Resumo e agrupamento de dados estatísticos”, foram considerados os resultados da observação da experiência de trabalho de uma equipe de 10 pessoas. Calcule a experiência média de trabalho dos trabalhadores da brigada. 5, 3, 5, 4, 3, 4, 5, 4, 2, 4.

De acordo com a fórmula da média aritmética simples, calcula-se também médias cronológicas, se os intervalos de tempo para os quais os valores característicos são apresentados forem iguais.
Exemplo. O volume de produtos vendidos no primeiro trimestre foi de 47 den. unidades, para o segundo 54, para o terceiro 65 e para o quarto 58 den. unidades O faturamento médio trimestral é (47+54+65+58)/4 = 56 den. unidades
Se os indicadores momentâneos forem fornecidos na série cronológica, ao calcular a média, eles serão substituídos por meias somas de valores no início e no final do período.
Se houver mais de dois momentos e os intervalos entre eles forem iguais, a média é calculada usando a fórmula da média cronológica

,
onde n é o número de pontos de tempo
Quando os dados são agrupados por valores de atributo (ou seja, uma série de distribuição variacional discreta é construída) com média aritmética ponderadaé calculado usando frequências ou frequências de observação de valores específicos do recurso, cujo número (k) é significativamente menor que o número de observações (N).
,
,
onde k é o número de grupos da série de variação,
i é o número do grupo da série de variação.
Como , e , obtemos as fórmulas usadas para cálculos práticos:
e
Exemplo. Vamos calcular o tempo médio de serviço das equipes de trabalho para as séries agrupadas.
a) usando frequências:

b) usando frequências:

Quando os dados são agrupados por intervalos , ou seja são apresentados na forma de séries de distribuição intervalar; no cálculo da média aritmética, toma-se como valor da característica o meio do intervalo, partindo do pressuposto de uma distribuição uniforme das unidades populacionais neste intervalo. O cálculo é feito de acordo com as fórmulas:
e
onde é o meio do intervalo: ,
onde e são os limites inferior e superior dos intervalos (desde que o limite superior desse intervalo coincida com o limite inferior do próximo intervalo).

Exemplo. Calculemos a média aritmética da série de variação intervalar construída a partir dos resultados de um estudo dos salários anuais de 30 trabalhadores (veja a palestra "Resumo e agrupamento de dados estatísticos").
Tabela 1 - Série de distribuição da variação do intervalo.

Intervalos, UAH

Frequência, pess.

frequência,

O meio do intervalo

600-700
700-800
800-900
900-1000
1000-1100
1100-1200

3
6
8
9
3
1

0,10
0,20
0,267
0,30
0,10
0,033

(600+700):2=650
(700+800):2=750
850
950
1050
1150

1950
4500
6800
8550
3150
1150

65
150
226,95
285
105
37,95

UAH ou UAH
As médias aritméticas calculadas com base nos dados iniciais e séries de variação de intervalo podem não coincidir devido à distribuição desigual dos valores dos atributos dentro dos intervalos. Nesse caso, para um cálculo mais preciso da média aritmética ponderada, deve-se usar não o meio dos intervalos, mas as médias aritméticas simples calculadas para cada grupo ( médias do grupo). A média calculada a partir das médias do grupo usando uma fórmula de cálculo ponderada é chamada média geral.
A média aritmética tem várias propriedades.
1. A soma dos desvios da variante da média é zero:
.
2. Se todos os valores da opção aumentarem ou diminuirem no valor A, o valor médio aumentará ou diminuirá no mesmo valor A:

3. Se cada opção for aumentada ou diminuída em B vezes, o valor médio também aumentará ou diminuirá o mesmo número de vezes:
ou
4. A soma dos produtos da variante pelas frequências é igual ao produto do valor médio pela soma das frequências:

5. Se todas as frequências forem divididas ou multiplicadas por qualquer número, a média aritmética não mudará:

6) se em todos os intervalos as frequências são iguais entre si, então a média aritmética ponderada é igual à média aritmética simples:
,
onde k é o número de grupos na série de variação.

O uso das propriedades da média permite simplificar seu cálculo.
Suponha que todas as opções (x) sejam primeiro reduzidas pelo mesmo número A e depois reduzidas por um fator B. A maior simplificação é alcançada quando o valor do meio do intervalo com a maior frequência é escolhido como A, e o valor do intervalo como B (para linhas com os mesmos intervalos). A quantidade A é chamada de origem, então esse método de calcular a média é chamado maneira b referência de ohm do zero condicional ou modo de momentos.
Após tal transformação, obtemos uma nova série de distribuição variacional, cujas variantes são iguais a . Sua média aritmética, chamada momento de primeira ordem,é expresso pela fórmula e de acordo com a segunda e terceira propriedades, a média aritmética é igual à média da versão original, reduzida primeiro por A e depois por B vezes, ou seja .
Receber média real(meio da linha original) você precisa multiplicar o momento da primeira ordem por B e adicionar A:

O cálculo da média aritmética pelo método dos momentos é ilustrado pelos dados da Tabela. 2.
Tabela 2 - Distribuição dos funcionários da loja da empresa por tempo de serviço


Experiência profissional, anos

Quantidade de trabalhadores

Ponto médio do intervalo

0 – 5
5 – 10
10 – 15
15 – 20
20 – 25
25 – 30

12
16
23
28
17
14

2,5
7,5
12,7
17,5
22,5
27,5

15
-10
-5
0
5
10

3
-2
-1
0
1
2

36
-32
-23
0
17
28

Encontrando o momento da primeira ordem . Então, sabendo que A = 17,5 e B = 5, calculamos a experiência média de trabalho dos trabalhadores da loja:
anos

Média harmônica
Como mostrado acima, a média aritmética é usada para calcular o valor médio de uma característica nos casos em que suas variantes x e suas frequências f são conhecidas.
Se a informação estatística não contiver frequências f para opções individuais x da população, mas for apresentada como seu produto , aplica-se a fórmula média harmônica ponderada. Para calcular a média, denote , de onde . Substituindo essas expressões na fórmula da média aritmética ponderada, obtemos a fórmula da média harmônica ponderada:
,
onde é o volume (peso) dos valores dos atributos do indicador no intervalo com o número i (i=1,2, …, k).

Assim, a média harmônica é utilizada nos casos em que não são as próprias opções que estão sujeitas à soma, mas suas recíprocas: .
Nos casos em que o peso de cada opção é igual a um, ou seja, valores individuais do recurso inverso ocorrem uma vez, aplique média harmônica simples:
,
onde são variantes individuais do traço inverso que ocorrem uma vez;
N é o número de opções.
Se houver médias harmônicas para duas partes da população com um número de e, a média total para toda a população é calculada pela fórmula:

e chamou média harmônica ponderada das médias do grupo.

Exemplo. Três negócios foram feitos durante a primeira hora de negociação na casa de câmbio. Os dados sobre a quantidade de vendas de hryvnia e a taxa de câmbio do hryvnia em relação ao dólar americano são fornecidos na Tabela. 3 (colunas 2 e 3). Determine a taxa de câmbio média do hryvnia em relação ao dólar americano na primeira hora de negociação.
Tabela 3 - Dados sobre o andamento das negociações na casa de câmbio

A taxa de câmbio média do dólar é determinada pela relação entre a quantidade de hryvnias vendidas no curso de todas as transações e a quantidade de dólares adquiridos como resultado das mesmas transações. O valor total da venda de hryvnia é conhecido na coluna 2 da tabela, e a quantidade de dólares comprada em cada transação é determinada dividindo-se o valor da venda de hryvnia por sua taxa de câmbio (coluna 4). Um total de US$ 22 milhões foi comprado durante três transações. Isso significa que a taxa de câmbio média do hryvnia para um dólar foi
.
O valor resultante é real, porque sua substituição das taxas de câmbio reais do hryvnia nas transações não alterará o valor total das vendas do hryvnia, que atua como indicador de definição: milhões UAH
Se a média aritmética foi usada para o cálculo, ou seja, hryvnia, então à taxa de câmbio para a compra de 22 milhões de dólares. 110,66 milhões de UAH teriam que ser gastos, o que não é verdade.

Média geométrica
A média geométrica é usada para analisar a dinâmica dos fenômenos e permite determinar a taxa média de crescimento. Ao calcular a média geométrica, os valores individuais do atributo são indicadores relativos da dinâmica, construídos na forma de valores em cadeia, como a razão de cada nível para o anterior.
A média geométrica simples é calculada pela fórmula:
,
onde está o sinal do produto,
N é o número de valores médios.
Exemplo. O número de crimes registrados ao longo de 4 anos aumentou 1,57 vezes, incluindo para o 1º - 1,08 vezes, para o 2º - 1,1 vezes, para o 3º - 1,18 e para o 4º - 1,12 vezes. Então a taxa média de crescimento anual do número de crimes é: , ou seja, O número de crimes registrados tem crescido em média 12% ao ano.

1,8
-0,8
0,2
1,0
1,4

1
3
4
1
1

3,24
0,64
0,04
1
1,96

3,24
1,92
0,16
1
1,96

Para calcular o quadrado médio ponderado, determinamos e entramos na tabela e. Então o valor médio dos desvios do comprimento dos produtos de uma dada norma é igual a:

A média aritmética neste caso seria inadequada, porque como resultado, obteríamos desvio zero.
O uso da raiz quadrada média será discutido mais adiante nos expoentes de variação.

No processo de estudar matemática, os alunos se familiarizam com o conceito de média aritmética. No futuro, na estatística e em algumas outras ciências, os alunos se deparam com o cálculo dos outros. O que podem ser e como diferem uns dos outros?

significado e diferença

Nem sempre indicadores precisos dão uma compreensão da situação. Para avaliar esta ou aquela situação, às vezes é necessário analisar um grande número de números. E então as médias vêm em socorro. Eles permitem que você avalie a situação em geral.

Desde os tempos de escola, muitos adultos se lembram da existência da média aritmética. É muito fácil de calcular - a soma de uma sequência de n termos é divisível por n. Ou seja, se você precisar calcular a média aritmética na sequência de valores 27, 22, 34 e 37, precisará resolver a expressão (27 + 22 + 34 + 37) / 4, pois 4 valores \u200b\u200são usados ​​nos cálculos. Neste caso, o valor desejado será igual a 30.

Muitas vezes, como parte do curso escolar, a média geométrica também é estudada. O cálculo deste valor baseia-se na extração da raiz do enésimo grau do produto de n termos. Se pegarmos os mesmos números: 27, 22, 34 e 37, o resultado dos cálculos será 29,4.

A média harmônica em uma escola de ensino geral geralmente não é objeto de estudo. No entanto, é usado com bastante frequência. Este valor é o recíproco da média aritmética e é calculado como um quociente de n - o número de valores e a soma 1/a 1 +1/a 2 +...+1/a n . Se tomarmos novamente o mesmo para cálculo, o harmônico será 29,6.

Média ponderada: recursos

No entanto, todos os valores acima não podem ser usados ​​em todos os lugares. Por exemplo, em estatística, ao calcular alguns, o "peso" de cada número usado nos cálculos desempenha um papel importante. Os resultados são mais reveladores e corretos porque levam em conta mais informações. Este grupo de valores é referido coletivamente como a "média ponderada". Eles não são aprovados na escola, por isso vale a pena se debruçar sobre eles com mais detalhes.

Antes de mais nada, vale explicar o que se entende por “peso” de um determinado valor. A maneira mais fácil de explicar isso é com um exemplo concreto. A temperatura corporal de cada paciente é medida duas vezes por dia no hospital. Dos 100 pacientes em diferentes departamentos do hospital, 44 terão temperatura normal - 36,6 graus. Outros 30 terão um valor aumentado - 37,2, 14 - 38, 7 - 38,5, 3 - 39 e os dois restantes - 40. E se tomarmos a média aritmética, esse valor em geral para o hospital será superior a 38 graus ! Mas quase metade dos pacientes tem absolutamente E aqui seria mais correto usar a média ponderada, e o “peso” de cada valor será o número de pessoas. Nesse caso, o resultado do cálculo será de 37,25 graus. A diferença é óbvia.

No caso de cálculos de média ponderada, o “peso” pode ser considerado como o número de embarques, o número de pessoas trabalhando em um determinado dia, em geral, qualquer coisa que possa ser medida e afetar o resultado final.

Variedades

A média ponderada corresponde à média aritmética discutida no início do artigo. No entanto, o primeiro valor, como já mencionado, também leva em consideração o peso de cada número utilizado nos cálculos. Além disso, também existem valores geométricos e harmônicos ponderados.

Há outra variedade interessante usada em séries de números. Esta é uma média móvel ponderada. É com base nisso que as tendências são calculadas. Além dos valores em si e seu peso, a periodicidade também é usada lá. E ao calcular o valor médio em algum momento, os valores de períodos anteriores também são levados em consideração.

Calcular todos esses valores não é tão difícil, mas na prática costuma-se usar apenas a média ponderada usual.

Métodos de cálculo

Na era da informatização, não há necessidade de calcular manualmente a média ponderada. No entanto, seria útil conhecer a fórmula de cálculo para poder verificar e, se necessário, corrigir os resultados obtidos.

Será mais fácil considerar o cálculo em um exemplo específico.

É necessário descobrir qual é o salário médio nesta empresa, levando em consideração o número de trabalhadores que recebem um determinado salário.

Assim, o cálculo da média ponderada é realizado usando a seguinte fórmula:

x = (a 1 *w 1 +a 2 *w 2 +...+a n *w n)/(w 1 +w 2 +...+w n)

Por exemplo, o cálculo seria:

x = (32*20+33*35+34*14+40*6)/(20+35+14+6) = (640+1155+476+240)/75 = 33,48

Obviamente, não há nenhuma dificuldade particular em calcular manualmente a média ponderada. A fórmula para calcular esse valor em um dos aplicativos mais populares com fórmulas - Excel - se parece com a função SUMPRODUCT (série de números; série de pesos) / SUM (série de pesos).