Crie uma série de exemplos. Série de variação

  • aula introdutória é grátis;
  • Um grande número de professores experientes (nativos e de língua russa);
  • Cursos NÃO por um período específico (mês, seis meses, ano), mas por um número específico de aulas (5, 10, 20, 50);
  • Mais de 10.000 clientes satisfeitos.
  • O custo de uma aula com um professor de língua russa - de 600 rublos, com um falante nativo - a partir de 1500 rublos

O conceito de uma série de variação. O primeiro passo para sistematizar os materiais de observação estatística é contar o número de unidades que possuem uma ou outra característica. Dispondo as unidades em ordem crescente ou decrescente de seu atributo quantitativo e contando o número de unidades com um valor de atributo específico, obtemos uma série de variação. A série de variação caracteriza a distribuição de unidades de uma determinada população estatística de acordo com algum atributo quantitativo.

A série de variação é composta por duas colunas, a coluna da esquerda contém os valores do atributo variável, denominados variantes e denotados por (x), e a coluna da direita contém números absolutos mostrando quantas vezes cada variante ocorre. Os valores nesta coluna são chamados de frequências e são denotados por (f).

Esquematicamente, a série de variação pode ser representada na forma da Tabela 5.1:

Tabela 5.1

Tipo de série de variação

Opções (x)

Frequências (f)

Na coluna da direita, indicadores relativos que caracterizam a proporção da frequência de variantes individuais na quantidade total de frequências também podem ser usados. Esses indicadores relativos são chamados de frequências e são convencionalmente denotados por , ou seja, . A soma de todas as frequências é igual a um. As frequências também podem ser expressas em porcentagem, e então sua soma será igual a 100%.

Os sinais variáveis ​​podem ser de natureza diferente. Variantes de alguns sinais são expressas em números inteiros, por exemplo, o número de quartos em um apartamento, o número de livros publicados etc. Esses sinais são chamados descontínuos ou discretos. Variantes de outros recursos podem assumir quaisquer valores dentro de certos limites, como o cumprimento de metas planejadas, salários, etc. Esses recursos são chamados de contínuos.

Série de variação discreta. Se as variantes da série variacional são expressas como valores discretos, então tal série variacional é chamada de discreta, sua aparência é apresentada na Tabela. 5.2:

Tabela 5.2

Distribuição dos alunos por notas obtidas no exame

Classificações (x)

Número de alunos (f)

Em % do total ()

A natureza da distribuição em séries discretas é representada graficamente como um polígono de distribuição, Fig.5.1.

Arroz. 5.1. Distribuição dos alunos por notas obtidas no exame.

Série de variação de intervalo. Para características contínuas, as séries de variação são construídas como séries de intervalo, ou seja, os valores dos recursos neles são expressos como intervalos "de e para". Nesse caso, o valor mínimo de um recurso em tal intervalo é chamado de limite inferior do intervalo e o valor máximo é chamado de limite superior do intervalo.

As séries variacionais intervalares são construídas tanto para características descontínuas (discretas) quanto para aquelas que variam em uma grande faixa. As linhas de intervalo podem ter intervalos iguais e desiguais. Na prática econômica, na maioria das vezes, são utilizados intervalos desiguais, aumentando ou diminuindo progressivamente. Tal necessidade surge especialmente nos casos em que a flutuação do sinal é realizada de forma desigual e dentro de grandes limites.

Considere o tipo de série intervalar com intervalos iguais, Tabela. 5.3:

Tabela 5.3

Distribuição de trabalhadores por produção

Saída, tr. (X)

Número de trabalhadores (f)

Frequência acumulada (f')

A série de distribuição de intervalos é representada graficamente como um histograma, Fig.5.2.

Fig.5.2. Distribuição de trabalhadores por produção

Frequência acumulada (cumulativa). Na prática, é necessário converter as séries de distribuição em linhas cumulativas, construído sobre as frequências acumuladas. Eles podem ser usados ​​para definir médias estruturais que facilitam a análise de dados de séries de distribuição.

As frequências acumuladas são determinadas somando-se sequencialmente às frequências (ou frequências) do primeiro grupo desses indicadores dos grupos subsequentes da série de distribuição. Cumulados e ogivas são usados ​​para ilustrar a série de distribuição. Para construí-los, os valores de uma característica discreta (ou as extremidades dos intervalos) são marcados no eixo das abcissas, e os totais crescentes de frequências (cumulados) são marcados no eixo das ordenadas, Fig.5.3.

Arroz. 5.3. A distribuição cumulativa de trabalhadores por desenvolvimento

Se as escalas de frequências e variantes forem trocadas, ou seja, refletem as frequências acumuladas no eixo das abcissas e os valores das opções no eixo das ordenadas, então a curva que caracteriza a mudança nas frequências de grupo para grupo será chamada de ogiva de distribuição, Fig. 5.4.

Arroz. 5.4. Ogiva distribuição de trabalhadores para produção

As séries de variação com intervalos iguais fornecem um dos requisitos mais importantes para as séries de distribuição estatística, garantindo sua comparabilidade no tempo e no espaço.

Densidade de distribuição. No entanto, as frequências de intervalos desiguais individuais nestas séries não são diretamente comparáveis. Nesses casos, para garantir a necessária comparabilidade, é calculada a densidade de distribuição, ou seja, determinar quantas unidades em cada grupo são por unidade de valor de intervalo.

Ao construir um gráfico da distribuição de uma série variacional com intervalos desiguais, a altura dos retângulos é determinada em proporção não às frequências, mas aos indicadores da densidade de distribuição dos valores do traço estudado nos intervalos correspondentes .

A elaboração de uma série variacional e sua representação gráfica é o primeiro passo no processamento dos dados iniciais e o primeiro passo na análise da população em estudo. O próximo passo na análise de séries variacionais é a determinação dos principais indicadores generalizadores, chamados de características da série. Essas características devem dar uma ideia do valor médio do atributo nas unidades da população.

valor médio. O valor médio é uma característica generalizada do traço estudado na população estudada, refletindo seu nível típico por unidade populacional em condições específicas de lugar e tempo.

O valor médio é sempre nomeado, tem a mesma dimensão que o atributo das unidades individuais da população.

Antes de calcular os valores médios, é necessário agrupar as unidades da população estudada, destacando os grupos qualitativamente homogêneos.

A média calculada para a população como um todo é chamada de média geral e para cada grupo - médias de grupo.

Existem dois tipos de médias: potência (média aritmética, média harmônica, média geométrica, média quadrática); estrutural (moda, mediana, quartis, decis).

A escolha da média para o cálculo depende da finalidade.

Tipos de médias de potência e métodos para o seu cálculo. Na prática do processamento estatístico do material coletado, surgem vários problemas, para a solução dos quais são necessárias diferentes médias.

Estatísticas matemáticas derivam vários meios de fórmulas de média de potência:

onde é o valor médio; x - opções individuais (valores de recursos); z - expoente (em z = 1 - média aritmética, z = 0 média geométrica, z = - 1 - média harmônica, z = 2 - média quadrática).

No entanto, a questão de que tipo de média deve ser aplicada em cada caso individual é resolvida por uma análise específica da população em estudo.

O tipo mais comum de média em estatística é média aritmética. É calculado nos casos em que o volume do atributo médio é formado como a soma de seus valores para unidades individuais da população estatística estudada.

Dependendo da natureza dos dados iniciais, a média aritmética é determinada de várias maneiras:

Se os dados forem desagrupados, o cálculo será realizado de acordo com a fórmula de um valor médio simples

Cálculo da média aritmética em uma série discreta ocorre de acordo com a fórmula 3.4.

Cálculo da média aritmética na série intervalar. Em uma série de variação de intervalo, onde o meio do intervalo é tomado condicionalmente como o valor de uma característica em cada grupo, a média aritmética pode diferir da média calculada a partir de dados desagrupados. Além disso, quanto maior o intervalo nos grupos, maiores são os possíveis desvios da média calculada a partir de dados agrupados da média calculada a partir de dados desagrupados.

Ao calcular a média para uma série de variação intervalar, para realizar os cálculos necessários, passa-se dos intervalos para seus pontos médios. E então calcule o valor médio pela fórmula da média aritmética ponderada.

Propriedades da média aritmética. A média aritmética tem algumas propriedades que nos permitem simplificar os cálculos, vamos considerá-las.

1. A média aritmética dos números constantes é igual a este número constante.

Se x = a. Então .

2. Se os pesos de todas as opções forem alterados proporcionalmente, ou seja, aumentar ou diminuir o mesmo número de vezes, então a média aritmética da nova série não mudará a partir disso.

Se todos os pesos f forem reduzidos em k vezes, então .

3. A soma dos desvios positivos e negativos das opções individuais da média, multiplicada pelos pesos, é igual a zero, ou seja,

Se então . Daqui.

Se todas as opções forem reduzidas ou aumentadas em algum número, a média aritmética da nova série diminuirá ou aumentará na mesma quantidade.

Reduza todas as opções x no uma, ou seja x´ = xuma.

Então

A média aritmética da série inicial pode ser obtida adicionando à média reduzida o número previamente subtraído das variantes uma, ou seja .

5. Se todas as opções forem reduzidas ou aumentadas em k vezes, então a média aritmética da nova série diminuirá ou aumentará na mesma quantidade, ou seja, dentro k uma vez.

Vamos então .

Portanto, ou seja, para obter a média da série original, a média aritmética da nova série (com opções reduzidas) deve ser aumentada por k uma vez.

harmônico médio. A média harmônica é a recíproca da média aritmética. É usado quando a informação estatística não contém frequências para opções individuais da população, mas é apresentada como seu produto (M = xf). A média harmônica será calculada usando a fórmula 3.5

A aplicação prática da média harmônica é calcular alguns índices, em especial, o índice de preços.

Média geométrica. Ao usar a média geométrica, os valores individuais do atributo são, via de regra, valores relativos da dinâmica, construídos na forma de valores em cadeia, em relação ao nível anterior de cada nível na série dinâmica . A média caracteriza assim a taxa média de crescimento.

A média geométrica também é utilizada para determinar o valor equidistante dos valores máximo e mínimo do atributo. Por exemplo, uma companhia de seguros celebra contratos para a prestação de serviços de seguro automóvel. Dependendo do evento segurado específico, o pagamento do seguro pode variar de 10.000 a 100.000 dólares por ano. O pagamento médio do seguro é de US$.

A média geométrica é o valor utilizado como média das razões ou na série de distribuição, apresentado como uma progressão geométrica, quando z = 0. Esta média é conveniente quando se presta atenção não às diferenças absolutas, mas às razões de dois números.

As fórmulas para cálculo são as seguintes

onde são variantes do recurso médio; - o produto das opções; f– frequência das opções.

A média geométrica é utilizada no cálculo das taxas médias de crescimento anual.

Quadrado médio. A fórmula da raiz quadrada média é usada para medir o grau de flutuação dos valores individuais de uma característica em torno da média aritmética na série de distribuição. Assim, ao calcular os indicadores de variação, a média é calculada a partir dos quadrados dos desvios dos valores individuais da característica da média aritmética.

O valor quadrado médio é calculado pela fórmula

Na pesquisa econômica, a forma modificada da raiz quadrada média é amplamente utilizada no cálculo de indicadores da variação de uma característica, como variância, desvio padrão.

Regra da maioria. Existe a seguinte relação entre as médias da lei de potência - quanto maior o expoente, maior o valor da média, Tabela 5.4:

Tabela 5.4

Relação entre médias

valor z

A razão entre as médias

Essa relação é chamada de regra de majorância.

Médias estruturais. Para caracterizar a estrutura da população, são utilizados indicadores especiais, que podem ser chamados de médias estruturais. Essas medidas incluem moda, mediana, quartis e decis.

Moda. Moda (Mo) é o valor que ocorre com mais frequência de uma característica em unidades populacionais. Moda é o valor do atributo que corresponde ao ponto máximo da curva de distribuição teórica.

A moda é amplamente utilizada na prática comercial no estudo da demanda do consumidor (ao determinar o tamanho de roupas e sapatos que estão em grande demanda), registro de preços. Pode haver vários mods no total.

Cálculo de moda em uma série discreta. Em uma série discreta, a moda é a variante com maior frequência. Considere encontrar um modo em uma série discreta.

Cálculo de moda em uma série intervalar. Na série de variação de intervalo, a variante central do intervalo modal é aproximadamente considerada uma moda, ou seja, o intervalo que tem a maior frequência (frequência). Dentro do intervalo, é necessário encontrar o valor do atributo, que é a moda. Para uma série intervalar, a moda será determinada pela fórmula

onde é o limite inferior do intervalo modal; é o valor do intervalo modal; é a frequência correspondente ao intervalo modal; é a frequência que precede o intervalo modal; é a frequência do intervalo que segue o modal.

Mediana. A mediana () é o valor do recurso na unidade do meio da série classificada. Uma série classificada é uma série em que os valores característicos são escritos em ordem crescente ou decrescente. Ou a mediana é um valor que divide o número de uma série variacional ordenada em duas partes iguais: uma parte tem um valor de uma característica variável que é menor que a variante média e a outra é grande.

Para encontrar a mediana, primeiro é determinado seu número de série. Para fazer isso, com um número ímpar de unidades, um é adicionado à soma de todas as frequências e tudo é dividido por dois. Com um número par de unidades, a mediana é encontrada como o valor do atributo da unidade, cujo número de série é determinado pela soma total das frequências dividida por dois. Conhecendo o número ordinal da mediana, é fácil encontrar seu valor a partir das frequências acumuladas.

Cálculo da mediana em uma série discreta. De acordo com o levantamento amostral, foram obtidos dados sobre a distribuição das famílias pelo número de filhos, Tabela. 5.5. Para determinar a mediana, primeiro determine seu número ordinal

=

Então construímos uma série de frequências acumuladas (, pelo número de série e pela frequência acumulada encontramos a mediana. A frequência acumulada de 33 mostra que em 33 famílias o número de filhos não ultrapassa 1 filho, mas como o número mediano é 50 , a mediana ficará na faixa de 34 a 55 famílias.

Tabela 5.5

Distribuição do número de famílias pelo número de filhos

Número de filhos na família

O número de famílias, é o valor do intervalo mediano;

Todas as formas consideradas da média de potência têm uma propriedade importante (em contraste com as médias estruturais) - a fórmula para determinar a média inclui todos os valores da série, ou seja, o tamanho da média é influenciado pelo valor de cada opção.

Por um lado, esta é uma propriedade muito positiva. neste caso, considera-se o efeito de todas as causas que afetam todas as unidades da população em estudo. Por outro lado, mesmo uma observação que foi acidentalmente incluída nos dados iniciais pode distorcer significativamente a ideia do nível de desenvolvimento do traço estudado na população em consideração (especialmente em séries curtas).

Quartis e decis. Por analogia com encontrar a mediana em séries variacionais, pode-se encontrar o valor de uma característica em qualquer unidade de série classificada em ordem. Assim, em particular, pode-se encontrar o valor de um recurso para unidades dividindo a série em 4 partes iguais, em 10, etc.

Quartis. As variantes que dividem a série classificada em quatro partes iguais são chamadas de quartis.

Ao mesmo tempo, distinguem-se: o quartil inferior (ou primeiro) (Q1) - o valor da característica da unidade da série classificada, dividindo a população na proporção de ¼ para ¾ e o superior (ou terceiro ) quartil (Q3) - o valor do traço da unidade da série ordenada, dividindo a população na razão ¾ para ¼.

O segundo quartil é a mediana Q2 = Me. Os quartis inferior e superior da série intervalar são calculados usando a fórmula semelhante à mediana.

onde é o limite inferior do intervalo contendo os quartis inferior e superior, respectivamente;

é a frequência acumulada do intervalo anterior ao intervalo que contém o quartil inferior ou superior;

– frequências de intervalos quartis (inferior e superior)

Os intervalos contendo Q1 e Q3 são determinados a partir das frequências (ou frequências) acumuladas.

Decis. Além dos quartis, são calculados os decis - opções que dividem a série classificada em 10 partes iguais.

Eles são denotados por D, o primeiro decil D1 divide a série na proporção de 1/10 e 9/10, o segundo D2 - 2/10 e 8/10, etc. Eles são calculados da mesma forma que a mediana e os quartis.

Tanto a mediana, quanto os quartis e os decis pertencem à chamada estatística ordinal, que é entendida como uma variante que ocupa um certo lugar ordinal em uma série ordenada.

O método de agrupamento também permite medir variação(variabilidade, flutuação) de sinais. Com um número relativamente pequeno de unidades populacionais, a variação é medida com base em uma série ordenada de unidades que compõem a população. A linha é chamada classificado se as unidades estiverem dispostas em característica ascendente (descendente).

No entanto, as séries classificadas são bastante indicativas quando é necessária uma característica comparativa de variação. Além disso, em muitos casos é preciso lidar com agregados estatísticos constituídos por um grande número de unidades, que são praticamente difíceis de representar na forma de uma série específica. Nesse sentido, para o conhecimento geral inicial dos dados estatísticos e principalmente para facilitar o estudo da variação dos sinais, os fenômenos e processos estudados são geralmente combinados em grupos, e os resultados do agrupamento são elaborados na forma de tabelas de grupos. .

Se houver apenas duas colunas na tabela de grupos - grupos de acordo com o recurso selecionado (opções) e o número de grupos (frequências ou frequências), é chamado próximo à distribuição.

Faixa de distribuição - o tipo mais simples de agrupamento estrutural de acordo com um atributo, exibido em uma tabela de grupos com duas colunas contendo variantes e frequências do atributo. Em muitos casos, com tal agrupamento estrutural, ou seja, com a compilação das séries de distribuição, inicia-se o estudo do material estatístico inicial.

Um agrupamento estrutural na forma de uma série de distribuição pode se transformar em um verdadeiro agrupamento estrutural se os grupos selecionados forem caracterizados não apenas por frequências, mas também por outros indicadores estatísticos. O principal objetivo das séries de distribuição é estudar a variação das características. A teoria das séries de distribuição é desenvolvida em detalhes pela estatística matemática.

As séries de distribuição são divididas em atributivo(agrupamento por características atributivas, por exemplo, a divisão da população por sexo, nacionalidade, estado civil, etc.) e variacional(agrupamento por características quantitativas).

Série de variaçãoé uma tabela de grupo que contém duas colunas: um agrupamento de unidades de acordo com um atributo quantitativo e o número de unidades em cada grupo. Os intervalos na série de variação são geralmente formados iguais e fechados. A série de variação é o seguinte agrupamento da população russa em termos de renda monetária per capita média (Tabela 3.10).

Tabela 3.10

Distribuição da população da Rússia por renda per capita média em 2004-2009

Grupos populacionais por renda média em dinheiro per capita, rub./mês

População do grupo, em % do total

8 000,1-10 000,0

10 000,1-15 000,0

15 000,1-25 000,0

Mais de 25.000,0

Toda a população

As séries variacionais, por sua vez, são divididas em discretas e intervalares. Discreto As séries de variação combinam variantes de recursos discretos que variam dentro de limites estreitos. Um exemplo de série de variação discreta é a distribuição das famílias russas de acordo com o número de filhos que têm.

Intervalo As séries variacionais combinam variantes de recursos contínuos ou discretos que mudam em uma ampla faixa. A série intervalar é a série variacional da distribuição da população russa em termos de renda monetária per capita média.

Séries variacionais discretas não são usadas com muita frequência na prática. Entretanto, compilá-los não é difícil, pois a composição dos grupos é determinada pelas variantes específicas que as características dos agrupamentos estudados realmente possuem.

As séries variacionais intervalares são mais difundidas. Ao compilá-los, surge a difícil questão do número de grupos, bem como o tamanho dos intervalos que devem ser estabelecidos.

Os princípios para a resolução desta questão são apresentados no capítulo sobre a metodologia de construção de agrupamentos estatísticos (ver ponto 3.3).

As séries de variação são um meio de recolher ou comprimir diversas informações em uma forma compacta; elas podem ser usadas para fazer um julgamento bastante claro sobre a natureza da variação, para estudar as diferenças nos sinais dos fenômenos incluídos no conjunto em estudo. Mas o significado mais importante da série variacional é que, com base nelas, são calculadas as características generalizantes especiais da variação (ver Capítulo 7).

Série de variação: definição, tipos, principais características. Método de cálculo
moda, mediana, média aritmética em estudos médicos e estatísticos
(Mostrar em um exemplo condicional).

Uma série variacional é uma série de valores numéricos da característica em estudo, que diferem entre si em sua magnitude e estão dispostos em uma determinada sequência (em ordem crescente ou decrescente). Cada valor numérico da série é chamado de variante (V), e os números que mostram a frequência com que essa ou aquela variante ocorre na composição dessa série é chamado de frequência (p).

O número total de casos de observações, dos quais consiste a série de variação, é indicado pela letra n. A diferença no significado das características estudadas é chamada de variação. Se o sinal da variável não tiver uma medida quantitativa, a variação é chamada de qualitativa e a série de distribuição é chamada de atributo (por exemplo, distribuição por desfecho de doença, estado de saúde, etc.).

Se um sinal de variável tem uma expressão quantitativa, tal variação é chamada de quantitativa e a série de distribuição é chamada de variacional.

As séries variacionais são divididas em descontínuas e contínuas - de acordo com a natureza do traço quantitativo, simples e ponderadas - de acordo com a frequência de ocorrência da variante.

Em uma série variacional simples, cada variante ocorre apenas uma vez (p=1), em uma ponderada, a mesma variante ocorre várias vezes (p>1). Exemplos de tais séries serão discutidos mais adiante no texto. Se o atributo quantitativo for contínuo, ou seja, entre valores inteiros existem valores fracionários intermediários, a série variacional é chamada de contínua.

Por exemplo: 10,0 - 11,9

14,0 - 15,9, etc.

Se o sinal quantitativo for descontínuo, ou seja, seus valores individuais (opções) diferem entre si por um número inteiro e não possuem valores fracionários intermediários, a série de variação é chamada de descontínua ou discreta.

Usando os dados do exemplo anterior sobre a frequência cardíaca

para 21 alunos, construiremos uma série de variações (Tabela 1).

tabela 1

Distribuição dos estudantes de medicina por frequência de pulso (bpm)

Assim, construir uma série variacional significa sistematizar, racionalizar os valores numéricos existentes (opções), ou seja, organizar em uma certa sequência (em ordem crescente ou decrescente) com suas frequências correspondentes. No exemplo em consideração, as opções são organizadas em ordem crescente e são expressas como inteiros descontínuos (discretos), cada opção ocorre várias vezes, ou seja, estamos lidando com uma série variacional ponderada, descontínua ou discreta.

Como regra, se o número de observações na população estatística que estamos estudando não exceder 30, basta organizar todos os valores da característica em estudo em uma série variacional em ordem crescente, como na Tabela. 1, ou em ordem decrescente.

Com um grande número de observações (n>30), o número de variantes ocorrendo pode ser muito grande, neste caso é compilado um intervalo ou série variacional agrupada, na qual, para simplificar o processamento posterior e esclarecer a natureza da distribuição, o variantes são combinadas em grupos.

Normalmente, o número de opções de grupo varia de 8 a 15.

Deve haver pelo menos 5 deles, porque. caso contrário, será muito áspero, alargamento excessivo, o que distorce o quadro geral de variação e afeta muito a precisão dos valores médios. Quando o número de opções de grupo é superior a 20-25, a precisão do cálculo dos valores médios aumenta, mas os recursos da variação de recursos são significativamente distorcidos e o processamento matemático se torna mais complicado.

Ao compilar uma série agrupada, é necessário levar em consideração

− os grupos de variantes devem ser colocados em uma ordem específica (crescente ou decrescente);

- os intervalos nos grupos de variantes devem ser os mesmos;

− os valores dos limites dos intervalos não devem coincidir, pois não ficará claro em quais grupos atribuir opções individuais;

- é necessário levar em consideração as características qualitativas do material coletado ao definir os limites dos intervalos (por exemplo, ao estudar o peso de adultos, um intervalo de 3-4 kg é aceitável e para crianças nos primeiros meses de vida não deve exceder 100 g.)

Vamos construir uma série agrupada (intervalo) que caracterize os dados da pulsação (número de batimentos por minuto) para 55 estudantes de medicina antes do exame: 64, 66, 60, 62,

64, 68, 70, 66, 70, 68, 62, 68, 70, 72, 60, 70, 74, 62, 70, 72, 72,

64, 70, 72, 76, 76, 68, 70, 58, 76, 74, 76, 76, 82, 76, 72, 76, 74,

79, 78, 74, 78, 74, 78, 74, 74, 78, 76, 78, 76, 80, 80, 80, 78, 78.

Para construir uma série agrupada, você precisa:

1. Determine o valor do intervalo;

2. Determinar o meio, início e fim dos grupos da variante da série de variação.

● O valor do intervalo (i) é determinado pelo número de grupos esperados (r), cujo número é definido dependendo do número de observações (n) de acordo com uma tabela especial

Número de grupos dependendo do número de observações:

No nosso caso, para 55 alunos, é possível formar de 8 a 10 grupos.

O valor do intervalo (i) é determinado pela seguinte fórmula -

i = Vmax-Vmin/r

Em nosso exemplo, o valor do intervalo é 82-58/8= 3.

Se o valor do intervalo for um número fracionário, o resultado deverá ser arredondado para um número inteiro.

Existem vários tipos de médias:

● média aritmética,

● média geométrica,

● média harmônica,

● raiz quadrada média,

● médio progressivo,

● mediana

Em estatísticas médicas, as médias aritméticas são mais frequentemente usadas.

A média aritmética (M) é um valor generalizante que determina o valor típico que é característico de toda a população. Os principais métodos de cálculo de M são: o método da média aritmética e o método dos momentos (desvios condicionais).

O método da média aritmética é usado para calcular a média aritmética simples e a média aritmética ponderada. A escolha do método de cálculo da média aritmética depende do tipo de série de variação. No caso de uma série variacional simples, em que cada variante ocorre apenas uma vez, a média aritmética simples é determinada pela fórmula:

onde: М – valor da média aritmética;

V é o valor da variável feature (opções);

Σ - indica a ação - somatória;

n é o número total de observações.

Um exemplo de cálculo da média aritmética é simples. Frequência respiratória (número de respirações por minuto) em 9 homens com 35 anos: 20, 22, 19, 15, 16, 21, 17, 23, 18.

Para determinar o nível médio de frequência respiratória em homens de 35 anos, é necessário:

1. Construir uma série variacional, colocando todas as opções em ordem crescente ou decrescente. Obtivemos uma série variacional simples, porque os valores variantes ocorrem apenas uma vez.

M = ∑V/n = 171/9 = 19 respirações por minuto

Conclusão. A frequência respiratória em homens com 35 anos é, em média, 19 respirações por minuto.

Se os valores individuais da variante forem repetidos, não há necessidade de escrever cada variante em uma linha, basta listar as dimensões da variante que ocorrem (V) e, em seguida, indicar o número de suas repetições ( p). tal série variacional, na qual as variantes são, por assim dizer, ponderadas de acordo com o número de frequências que lhes correspondem, é chamada de série variacional ponderada, e o valor médio calculado é a média aritmética ponderada.

A média aritmética ponderada é determinada pela fórmula: M= ∑Vp/n

onde n é o número de observações igual à soma das frequências - Σр.

Um exemplo de cálculo da média ponderada aritmética.

A duração da incapacidade (em dias) em 35 pacientes com doenças respiratórias agudas (IRA) atendidos por um médico local durante o primeiro trimestre do ano atual foi: 6, 7, 5, 3, 9, 8, 7, 5, 6 , 4, 9, 8, 7, 6, 6, 9, 6, 5, 10, 8, 7, 11, 13, 5, 6, 7, 12, 4, 3, 5, 2, 5, 6, 6 , 7 dias.

A metodologia para determinar a duração média da incapacidade em pacientes com infecções respiratórias agudas é a seguinte:

1. Vamos construir uma série variacional ponderada, porque valores de variantes individuais são repetidos várias vezes. Para fazer isso, você pode organizar todas as opções em ordem crescente ou decrescente com suas frequências correspondentes.

No nosso caso, as opções estão em ordem crescente.

2. Calcule a média ponderada aritmética usando a fórmula: M = ∑Vp/n = 233/35 = 6,7 dias

Distribuição de pacientes com infecções respiratórias agudas por duração da incapacidade:

Duração da incapacidade para o trabalho (V) Número de pacientes (p) vp
∑p = n = 35 ∑Vp = 233

Conclusão. A duração da incapacidade em pacientes com doenças respiratórias agudas foi em média 6,7 ​​dias.

A Moda (Mo) é a variante mais comum na série de variação. Para a distribuição apresentada na tabela, a moda corresponde à variante igual a 10, ocorre com mais frequência que outras - 6 vezes.

Distribuição dos pacientes por tempo de permanência em leito hospitalar (em dias)

V
p

Às vezes é difícil determinar o valor exato da moda, pois pode haver várias observações nos dados em estudo que ocorrem “com mais frequência”.

A mediana (Me) é um indicador não paramétrico que divide a série de variação em duas metades iguais: o mesmo número de opções está localizado em ambos os lados da mediana.

Por exemplo, para a distribuição mostrada na tabela, a mediana é 10 porque em ambos os lados deste valor está localizado na 14ª opção, ou seja, o número 10 ocupa uma posição central nesta série e é sua mediana.

Dado que o número de observações neste exemplo é par (n=34), a mediana pode ser determinada da seguinte forma:

Eu = 2+3+4+5+6+5+4+3+2/2 = 34/2 = 17

Isso significa que o meio da série recai na décima sétima opção, que corresponde a uma mediana de 10. Para a distribuição apresentada na tabela, a média aritmética é:

M = ∑Vp/n = 334/34 = 10,1

Assim, para 34 observações da Tabela. 8, temos: Mo=10, Me=10, média aritmética (M) é 10,1. Em nosso exemplo, todos os três indicadores se mostraram iguais ou próximos uns dos outros, embora sejam completamente diferentes.

A média aritmética é a soma resultante de todas as influências; todas as opções, sem exceção, participam de sua formação, inclusive as extremas, muitas vezes atípicas para um determinado fenômeno ou conjunto.

A moda e a mediana, em contraste com a média aritmética, não dependem do valor de todos os valores individuais do atributo variável (os valores das variantes extremas e o grau de dispersão da série). A média aritmética caracteriza toda a massa de observações, a moda e a mediana caracterizam a massa

Série de distribuição estatística- esta é uma distribuição ordenada de unidades populacionais em grupos de acordo com um determinado atributo variável.
Dependendo da característica subjacente à formação de uma série de distribuição, existem série de distribuição de atributos e variações.

A presença de uma característica comum é a base para a formação de uma população estatística, que é o resultado de uma descrição ou medição de características comuns dos objetos de estudo.

O assunto de estudo em estatística está mudando (variando) características ou características estatísticas.

Tipos de recursos estatísticos.

As séries de distribuição são chamadas de séries de atributos. construído em bases de qualidade. Atributivo- este é um sinal que tem um nome (por exemplo, uma profissão: costureira, professora, etc.).
É costume organizar as séries de distribuição na forma de tabelas. Na tabela. 2.8 mostra uma série de atributos de distribuição.
Tabela 2.8 - Distribuição dos tipos de assistência jurídica prestada por advogados a cidadãos de uma das regiões da Federação Russa.

Série de variação são valores de recursos (ou intervalos de valores) e suas frequências.
As séries de variação são séries de distribuição construído em uma base quantitativa. Qualquer série variacional consiste em dois elementos: variantes e frequências.
Variantes são valores individuais de um recurso que leva em uma série de variação.
As frequências são os números de variantes individuais ou cada grupo da série de variação, ou seja, estes são números que mostram a frequência com que certas opções ocorrem em uma série de distribuição. A soma de todas as frequências determina o tamanho de toda a população, seu volume.
As frequências são chamadas de frequências, expressas em frações de uma unidade ou como porcentagem do total. Assim, a soma das frequências é igual a 1 ou 100%. A série variacional nos permite avaliar a forma da lei de distribuição com base em dados reais.

Dependendo da natureza da variação do traço, existem séries de variação discreta e intervalar.
Um exemplo de uma série variacional discreta é dado na Tabela. 2.9.
Tabela 2.9 - Distribuição das famílias pelo número de quartos ocupados em apartamentos individuais em 1989 na Federação Russa.

A primeira coluna da tabela apresenta as variantes de uma série variacional discreta, a segunda coluna contém as frequências da série variacional e a terceira coluna contém os indicadores de frequência.

Série de variação

Na população geral, uma certa característica quantitativa está sendo investigada. Uma amostra de volume é extraída aleatoriamente dele n, ou seja, o número de elementos na amostra é n. Na primeira fase do processamento estatístico, variando amostras, ou seja ordenação de números x 1 , x 2 , …, x n Ascendente. Cada valor observado XI chamado opção. Frequência eué o número de observações do valor XI na amostra. Frequência relativa (frequência) eué a razão de frequência eu ao tamanho da amostra n: .
Ao estudar uma série variacional, os conceitos de frequência acumulada e frequência acumulada também são usados. Deixar x algum número. Então o número de opções , cujos valores são menores x, é chamada de frequência acumulada: para x i né chamada de frequência acumulada w i max .
Um atributo é chamado de variável discreta se seus valores individuais (variantes) diferem uns dos outros por alguma quantidade finita (geralmente um número inteiro). Uma série variacional de tal característica é chamada de série variacional discreta.

Tabela 1. Visão geral da série variacional discreta de frequências

Valores de recursosXI x 1 x2 xn
Frequênciaseu m 1 m2 m n

Um atributo é chamado de variação contínua se seus valores diferem um do outro por uma quantidade arbitrariamente pequena, ou seja, o sinal pode assumir qualquer valor em um determinado intervalo. Uma série de variação contínua para tal característica é chamada de série intervalar.

Tabela 2. Visão geral da série de variação intervalar de frequências

Tabela 3. Imagens gráficas da série de variação

FileiraPolígono ou histogramaFunção de distribuição empírica
Discreto
intervalo
Observando os resultados das observações, determina-se quantos valores das variantes caíram em cada intervalo específico. Supõe-se que cada intervalo pertença a uma de suas extremidades: ou em todos os casos à esquerda (mais frequentemente), ou em todos os casos à direita, e as frequências ou frequências mostram o número de opções contidas nos limites indicados. Diferenças ai – ai +1 são chamados de intervalos parciais. Para simplificar os cálculos subsequentes, a série de variação do intervalo pode ser substituída por uma condicionalmente discreta. Neste caso, o valor médio eu-th intervalo é tomado como uma opção XI, e a frequência de intervalo correspondente eu- para a frequência deste intervalo.
Para representação gráfica de séries variacionais, polígono, histograma, curva cumulativa e função de distribuição empírica são os mais utilizados.

Na tabela. 2.3 (Agrupamento da população da Rússia de acordo com o tamanho da renda média per capita em abril de 1994) é apresentado série de variação de intervalo.
É conveniente analisar a série de distribuição usando uma representação gráfica, que também permite julgar a forma da distribuição. Uma representação visual da natureza da mudança nas frequências da série variacional é dada por polígono e histograma.
O polígono é usado ao exibir séries variacionais discretas.
Representemos, por exemplo, graficamente a distribuição do parque habitacional por tipologia de apartamentos (Tabela 2.10).
Tabela 2.10 - Distribuição do parque habitacional da área urbana por tipologia de apartamentos (valores condicionais).


Arroz. Polígono de distribuição de habitação


No eixo y, não apenas os valores das frequências, mas também as frequências da série de variação podem ser plotadas.
O histograma é usado para exibir a série de variação do intervalo. Ao construir um histograma, os valores dos intervalos são plotados no eixo das abcissas e as frequências são representadas por retângulos construídos nos intervalos correspondentes. A altura das colunas no caso de intervalos iguais deve ser proporcional às frequências. Um histograma é um gráfico no qual uma série é mostrada como barras adjacentes umas às outras.
Vamos representar graficamente a série de distribuição de intervalos dada na Tabela. 2.11.
Tabela 2.11 - Distribuição das famílias por tamanho do espaço habitacional por pessoa (valores condicionais).
N p / p Grupos de famílias pelo tamanho do espaço vital por pessoa Número de famílias com um determinado tamanho de espaço vital Número acumulado de famílias
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TOTAL 115 ----


Arroz. 2.2. Histograma da distribuição das famílias pelo tamanho do espaço vital por pessoa


Usando os dados da série acumulada (Tabela 2.11), construímos distribuição cumulativa.


Arroz. 2.3. A distribuição cumulativa de famílias pelo tamanho do espaço vital por pessoa


A representação de uma série variacional na forma de cumulado é especialmente eficaz para séries variacionais, cujas frequências são expressas como frações ou porcentagens da soma das frequências da série.
Se alterarmos os eixos na representação gráfica da série variacional na forma de um cumulado, obteremos ogivu. Na fig. 2.4 mostra uma ogiva construída com base nos dados da Tabela. 2.11.
Um histograma pode ser convertido em um polígono de distribuição encontrando os pontos médios dos lados dos retângulos e conectando esses pontos com linhas retas. O polígono de distribuição resultante é mostrado na fig. 2.2 linha pontilhada.
Ao construir um histograma da distribuição de uma série variacional com intervalos desiguais, ao longo do eixo das ordenadas, não são plotadas as frequências, mas a densidade de distribuição do recurso nos intervalos correspondentes.
A densidade de distribuição é a frequência calculada por largura de intervalo de unidade, ou seja, quantas unidades em cada grupo são por valor de intervalo de unidade. Um exemplo de cálculo da densidade de distribuição é apresentado na Tabela. 2.12.
Tabela 2.12 - Distribuição das empresas por número de trabalhadores (os valores são condicionais)
N p / p Grupos de empresas por número de empregados, pers. Número de empresas Tamanho do intervalo, pers. Densidade de distribuição
MAS 1 2 3=1/2
1 até 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TOTAL 147 ---- ----

Para uma representação gráfica de séries de variação também pode ser usado curva cumulativa. Com a ajuda do cumulate (a curva das somas), uma série de frequências acumuladas é exibida. As frequências acumuladas são determinadas somando sucessivamente as frequências por grupos e mostram quantas unidades da população possuem valores de características não superiores ao valor considerado.


Arroz. 2.4. Distribuição Ogiva das famílias de acordo com o tamanho do espaço vital por pessoa

Ao construir o cumulado de uma série de variação intervalar, as variantes da série são plotadas ao longo do eixo das abcissas e as frequências acumuladas ao longo do eixo das ordenadas.

Série de variação contínua

Uma série variacional contínua é uma série construída com base em um sinal estatístico quantitativo. Exemplo. A duração média das doenças dos condenados (dias por pessoa) no período outono-inverno do ano atual foi:
7,0 6,0 5,9 9,4 6,5 7,3 7,6 9,3 5,8 7,2
7,1 8,3 7,5 6,8 7,1 9,2 6,1 8,5 7,4 7,8
10,2 9,4 8,8 8,3 7,9 9,2 8,9 9,0 8,7 8,5

variacional chamadas séries de distribuição construídas em base quantitativa. Os valores das características quantitativas para unidades individuais da população não são constantes, diferem mais ou menos uns dos outros.

Variação- flutuação, variabilidade do valor do atributo em unidades da população. Valores numéricos separados da característica que ocorrem na população estudada são chamados opções valores. A insuficiência do valor médio para uma caracterização completa da população torna necessário complementar os valores médios com indicadores que possibilitem avaliar a tipicidade dessas médias medindo a flutuação (variação) da característica em estudo.

A presença de variação se deve à influência de um grande número de fatores na formação do nível do traço. Esses fatores atuam com força desigual e em direções diferentes. Os indicadores de variação são usados ​​para descrever a medida da variabilidade das características.

Tarefas do estudo estatístico da variação:

  • 1) o estudo da natureza e grau de variação dos sinais em unidades individuais da população;
  • 2) determinação do papel de fatores individuais ou de seus grupos na variação de certas características da população.

Na estatística, são usados ​​métodos especiais para estudar a variação, baseados no uso de um sistema de indicadores, Com pelo qual a variação é medida.

O estudo da variação é essencial. A medição de variações é necessária ao realizar a observação da amostra, análise de correlação e variância, etc. Ermolaev O.Yu. Estatísticas matemáticas para psicólogos: Textbook [Texto] / O.Yu. Ermolaev. - M.: Editora Flint do Instituto Psicológico e Social de Moscou, 2012. - 335p.

Pelo grau de variação, pode-se julgar a homogeneidade da população, a estabilidade dos valores individuais das características e a tipicidade da média. Com base neles, são desenvolvidos indicadores da proximidade da relação entre os sinais, indicadores para avaliar a precisão da observação seletiva.

Há variação no espaço e variação no tempo.

A variação no espaço é entendida como a flutuação dos valores de uma característica em unidades da população que representam territórios separados. Sob a variação no tempo entende-se a mudança nos valores do atributo em diferentes períodos de tempo.

Para estudar a variação na série de distribuição, todas as variantes dos valores dos atributos são organizadas em ordem crescente ou decrescente. Esse processo é chamado de classificação de séries.

Os sinais mais simples de variação são mínimo e máximo- o menor e o maior valor do atributo no agregado. O número de repetições de variantes individuais de valores de recursos é chamado de frequência de repetição (fi). É conveniente substituir frequências por frequências - wi. Frequência - um indicador relativo de frequência, que pode ser expresso em frações de uma unidade ou porcentagem e permite comparar séries de variação com um número diferente de observações. Expresso pela fórmula:

onde Xmax, Xmin - os valores máximo e mínimo do atributo no agregado; n é o número de grupos.

Para medir a variação de uma característica, vários indicadores absolutos e relativos são usados. Os indicadores absolutos de variação incluem a faixa de variação, o desvio linear médio, variância, desvio padrão. Os indicadores relativos de flutuação incluem o coeficiente de oscilação, o desvio linear relativo, o coeficiente de variação.

Um exemplo de encontrar uma série de variação

Exercício. Para esta amostra:

  • a) Encontre uma série de variação;
  • b) Construir a função de distribuição;

Nº = 42. Itens de amostra:

1 5 1 8 1 3 9 4 7 3 7 8 7 3 2 3 5 3 8 3 5 2 8 3 7 9 5 8 8 1 2 2 5 1 6 1 7 6 7 7 6 2

Solução.

  • a) construção de uma série variacional classificada:
    • 1 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 4 5 5 5 5 5 6 6 6 7 7 7 7 7 7 7 8 8 8 8 8 8 9 9
  • b) construção de uma série variacional discreta.

Vamos calcular o número de grupos na série de variação usando a fórmula de Sturgess:

Vamos tomar o número de grupos igual a 7.

Conhecendo o número de grupos, calculamos o valor do intervalo:

Para a conveniência de construir a tabela, tomaremos o número de grupos igual a 8, o intervalo será 1.

Arroz. 1 O volume de vendas de mercadorias pela loja por um determinado período de tempo