Qualquer série variacional consiste em. Série de Variações

As linhas construídas por quantidade, são chamados variacional.

A série de distribuição consiste em opções(valores característicos) e frequências(número de grupos). Frequências expressas como valores relativos(ações, por cento) são chamados frequências. A soma de todas as frequências é chamada de volume da série de distribuição.

Por tipo, as séries de distribuição são divididas em discreto(construído em valores descontínuos do recurso) e intervalo(construído em valores contínuos sinal).

Série de variação representa duas colunas (ou linhas); um dos quais fornece valores individuais do atributo variável, chamados de variantes e denotados por X; e no outro - números absolutos, mostrando quantas vezes (com que frequência) cada opção ocorre. Os indicadores da segunda coluna são chamados de frequências e são convencionalmente denotados por f. Observe novamente que a segunda coluna também pode usar desempenho relativo caracterizando a proporção da frequência de variantes individuais em montante total frequências. Esses indicadores relativos são chamados de frequências e convencionalmente denotados por ω A soma de todas as frequências neste caso é igual a um. No entanto, as frequências também podem ser expressas como uma porcentagem e, em seguida, a soma de todas as frequências dá 100%.

Se as variantes da série variacional são expressas como valores discretos, então tal série variacional é chamada discreto.

Para recursos contínuos, as séries de variação são construídas como intervalo, ou seja, os valores do atributo neles são expressos “de ... a ...”. Nesse caso, os valores mínimos do atributo em tal intervalo são chamados de limite inferior do intervalo e o máximo - limite superior.

As séries variacionais de intervalo também são construídas para recursos discretos que variam em uma ampla faixa. A série intervalar pode ser igual e desigual intervalos.

Considere como o valor de intervalos iguais é determinado. Vamos introduzir a seguinte notação:

eu– valor do intervalo;

- valor máximo um sinal em unidades da população;

- o valor mínimo do atributo para unidades da população;

n- o número de grupos alocados.

se n é conhecido.

Se o número de grupos alocados for difícil de determinar com antecedência, a fórmula proposta por Sturgess em 1926 pode ser recomendada para calcular o tamanho ideal do intervalo com um tamanho populacional suficiente:

n = 1+ 3,322 log N, onde N é o número de unidades na população.

O valor dos intervalos desiguais é determinado em cada caso individual, levando em consideração as características do objeto de estudo.

A distribuição estatística da amostra chame a lista de opções e suas frequências correspondentes (ou frequências relativas).

A distribuição estatística da amostra pode ser especificada na forma de uma tabela, na primeira coluna da qual existem opções e na segunda - as frequências correspondentes a essas opções. não, ou frequências relativas Pi .

Distribuição estatística da amostra

As séries de intervalo são chamadas de séries de variação nas quais os valores das características subjacentes à sua formação são expressos dentro de certos limites (intervalos). As frequências neste caso não se referem a valores individuais do atributo, mas a todo o intervalo.

As séries de distribuição intervalar são construídas de acordo com características quantitativas contínuas, bem como de acordo com características discretas, variando dentro de uma faixa significativa.

A série intervalar pode ser representada pela distribuição estatística da amostra, indicando os intervalos e suas frequências correspondentes. Nesse caso, a soma das frequências da variante que caiu nesse intervalo é tomada como a frequência do intervalo.

Ao agrupar por características contínuas quantitativas, é importante determinar o tamanho do intervalo.

Além da média amostral e da variância amostral, também são utilizadas outras características da série de variação.

Moda nomeie a variante que tem a maior frequência.

Nome do parâmetro Significado
Assunto do artigo: Série de variação
Rubrica (categoria temática) Produção

Valores observados variável aleatória X 1 , X 2 , …, xk chamado opções.

Frequência opções X eu sou chamado de número eu (eu=1,…,k) mostrando quantas vezes essa variante ocorre na amostra.

Frequência(frequência relativa, ações) opções XI (eu=1,…,k) é geralmente chamado de razão de sua frequência eu ao tamanho da amostra n.

Frequências e frequências são chamadas balança.

Frequência acumuladaé costume chamar o número de opções, cujos valores são menores que um determinado X:

Frequência acumuladaÉ costume chamar a razão entre a frequência acumulada e o tamanho da amostra:

série de variação(série estatística) - costuma-se chamar uma sequência de opções escritas em ordem crescente e seus pesos correspondentes.

A série de variação deve ser discreto(amostra de valores de uma variável aleatória discreta) e contínuo (intervalo)(seleção de valores de uma variável aleatória contínua).

A série variacional discreta tem a forma:

Quando o número de opções é grande ou o recurso é contínuo (uma variável aleatória pode assumir qualquer valor em um determinado intervalo), elas são intervalo série de variação.

Para construir uma série de variação de intervalo, execute agrupamento opção - eles são divididos em intervalos separados:

O número de intervalos às vezes é determinado usando Fórmulas de Sturges:

Em seguida, o número de variantes que se enquadram em cada intervalo é calculado - frequências eu(ou frequência eu/n). Se a variante estiver na borda do intervalo, ela será anexada ao intervalo certo.

A série variacional intervalar tem a forma:

Opções
Frequências

Função de distribuição empírica (estatística)é costume chamar uma função cujo valor no ponto Xé igual a frequência relativa o fato de que a variante terá um valor menor que X(frequência cumulativa para X):

Polígono de freqüênciaé chamada de polilinha cujos segmentos conectam pontos com coordenadas ( X 1 ; n 1), (X 2 ; n 2), …, (xk; nk). o polígono de freqüência, que é um análogo estatístico do polígono de distribuições.

Vale dizer que para uma série variacional contínua, um polígono pode ser construído se os valores X 1 , X 2 , …, xk tomar os pontos médios dos intervalos.

Uma série de variação de intervalo é geralmente representada graficamente usando histogramas.

gráfico de barras- uma figura escalonada que consiste em retângulos cujas bases são intervalos de comprimento parcial h= XI +1 – XI, eu= 0,…,k-1, e as alturas são iguais às frequências (ou frequências) dos intervalos eu (eu).

Acumular(curva cumulativa) - curva de frequências acumuladas (frequências). Por série discreta o cumulado é uma linha quebrada que liga os pontos ou , . Por série de intervalo cumulado começa a partir de um ponto, cuja abcissa é igual ao início do primeiro intervalo, e a ordenada é a frequência acumulada (frequência), zero. Outros pontos desta linha tracejada correspondem às extremidades dos intervalos.

Série de variação - conceito e tipos. Classificação e características da categoria "Série de variações" 2017, 2018.

  • - Série de variação de distribuição

    Distribuição do faturamento do varejo Federação Russa em 1995 por tipo de propriedade, milhões de rublos Tipos de séries de distribuição Aula VIII. Séries de distribuição Como resultado do processamento e sistematização de dados estatísticos primários, eles obtêm ....


  • - Série de variações

    A transformação mais simples de dados estatísticos é sua ordenação por magnitude. Volume de amostra de população, ordenados em ordem não decrescente de elementos, ou seja, , é chamado série variacional: . No caso em que o volume de observações ... .


  • - Tarefa 2. Série de variação de intervalo

    1. Com base em uma determinada amostra correspondente à variante da tarefa, construa uma série de variação de intervalo; construa um histograma e cumule (use dois métodos: inserindo um gráfico do Excel e o modo "Histograma" do pacote "Análise de Dados"). 2. Analise o histograma resultante. ... .


  • - Compilar uma série de variação da variabilidade da característica de sementes ou folhas de feijão de qualquer planta da mesma idade. Revelar padrões de variabilidade de características.

    População - unidade estrutural Gentil. O número de populações. Causas das flutuações populacionais. A relação de indivíduos em populações e entre diferentes populações da mesma espécie e de espécies diferentes. 1. Uma característica importante de uma espécie é sua distribuição em grupos, populações em ...

  • (definição de uma série variacional; componentes de uma série variacional; três formas de uma série variacional; conveniência de construir uma série intervalar; conclusões que podem ser tiradas da série construída)

    Uma série variacional é uma sequência de todos os elementos de uma amostra dispostos em ordem não decrescente. Elementos idênticos são repetidos

    Variacional - são séries construídas em uma base quantitativa.

    Série de Variações distribuições consistem em dois elementos: variantes e frequências:

    As opções são valores numéricos traço quantitativo na série de distribuição variacional. Eles podem ser positivos ou negativos, absolutos ou relativos. Assim, ao agrupar as empresas de acordo com os resultados atividade econômica opções positivas são lucro, e números negativosé uma perda.

    As frequências são os números de variantes individuais ou cada grupo da série de variação, ou seja, estes são números que mostram a frequência com que certas opções ocorrem em uma série de distribuição. A soma de todas as frequências é chamada de volume da população e é determinada pelo número de elementos de toda a população.

    Frequências são frequências expressas como valores relativos (frações de unidades ou porcentagens). A soma das frequências é igual a um ou 100%. Substituir frequências por frequências permite comparar a série variacional com número diferente observações.

    Existem três formas de série de variação: séries classificadas, séries discretas e série de intervalo.

    Uma série classificada é a distribuição de unidades individuais da população em ordem crescente ou decrescente da característica em estudo. A classificação facilita a divisão de dados quantitativos em grupos, detecta imediatamente os menores e maior valor recurso, destaque os valores que são repetidos com mais frequência.

    Outras formas da série de variação são tabelas de grupo compiladas de acordo com a natureza da variação nos valores da característica em estudo. Pela natureza da variação, distinguem-se sinais discretos (descontínuos) e contínuos.

    Série discreta- esta é uma série tão variacional, cuja construção é baseada em signos com uma mudança descontínua (sinais discretos). Estes últimos incluem a categoria tarifária, o número de filhos na família, o número de funcionários na empresa, etc. Esses sinais podem assumir apenas um número finito de certos valores.

    Uma série variacional discreta é uma tabela que consiste em duas colunas. A primeira coluna indica o valor específico do atributo e a segunda - o número de unidades populacionais com determinado valor sinal.

    Se um signo tem uma mudança contínua (o valor da renda, experiência de trabalho, o custo dos ativos fixos de uma empresa, etc., que pode assumir qualquer valor dentro de certos limites), então uma série de variação de intervalo deve ser construída para este signo.



    A tabela de grupo aqui também tem duas colunas. O primeiro indica o valor do recurso no intervalo "de - até" (opções), o segundo - o número de unidades incluídas no intervalo (frequência).

    Frequência (frequência de repetição) - o número de repetições de uma determinada variante dos valores do atributo, denotado fi , e a soma das frequências igual ao volume da população estudada, denotado

    Onde k é o número de opções de valor de atributo

    Muitas vezes, a tabela é complementada com uma coluna na qual são calculadas as frequências acumuladas S, que mostram quantas unidades da população têm um valor de característica não superior a dado valor.

    Uma série de distribuição variacional discreta é uma série em que os grupos são compostos de acordo com uma característica que varia discretamente e recebe apenas valores inteiros.

    A série de distribuição de variação de intervalo é uma série em que o atributo de agrupamento, que forma a base do agrupamento, pode assumir quaisquer valores em um determinado intervalo, inclusive fracionários.

    Uma série variacional de intervalo é um conjunto ordenado de intervalos de variação dos valores de uma variável aleatória com as frequências ou frequências correspondentes dos valores da quantidade que cai em cada um deles.

    É conveniente construir uma série de distribuição intervalar, em primeiro lugar, com uma variação contínua de um traço, e também se uma variação discreta se manifestar em uma ampla faixa, ou seja, o número de opções para um recurso discreto é bastante grande.

    Várias conclusões já podem ser tiradas desta série. Por exemplo, o elemento médio de uma série de variação (mediana) pode ser uma estimativa do resultado mais provável de uma medição. O primeiro e o último elemento da série variacional (ou seja, o elemento mínimo e máximo da amostra) mostra a dispersão dos elementos da amostra. Às vezes, se o primeiro ou o último elemento for muito diferente do restante da amostra, eles serão excluídos dos resultados da medição, considerando que esses valores foram obtidos como resultado de algum tipo de falha grosseira, por exemplo, tecnologia.

    Prática 1

    SÉRIE VARIATIVA DE DISTRIBUIÇÃO

    série de variação ou perto da distribuição chamou a distribuição ordenada de unidades populacionais de acordo com valores crescentes (mais frequentemente) ou decrescentes (menos frequentemente) do atributo e contando o número de unidades com um ou outro valor do atributo.

    Existem 3 Gentil faixa de distribuição:

    1) linha classificada- esta é uma lista de unidades individuais da população em ordem crescente da característica estudada; se o número de unidades populacionais for grande o suficiente, a série ranqueada torna-se incômoda e, nesses casos, a série de distribuição é construída agrupando as unidades populacionais de acordo com os valores da característica em estudo (se a característica tomar um número pequeno de valores, então uma série discreta é construída e, caso contrário, uma série intervalar);

    2) série discreta- esta é uma tabela composta por duas colunas (linhas) - valores específicos de um atributo variável X eu e o número de unidades populacionais com o valor dado da característica f eu- frequências; o número de grupos em uma série discreta é determinado pelo número de valores realmente existentes do atributo variável;

    3) série de intervalo- esta é uma tabela composta por duas colunas (linhas) - intervalos de um sinal variável X eu e o número de unidades populacionais dentro de um determinado intervalo (frequências), ou a proporção desse número no número total de populações (frequências).

    Os números que mostram quantas vezes as opções individuais ocorrem em uma determinada população são chamados frequências ou balança opção e estão marcados minúsculas alfabeto latino f. A soma total das frequências da série variacional é igual ao volume dessa população, ou seja,

    Onde k– número de grupos, nnúmero total observações ou tamanho da população.

    As frequências (pesos) são expressas não apenas em números absolutos, mas também em números relativos - em frações de uma unidade ou como porcentagem do número total de variantes que compõem esse conjunto. Nesses casos, os pesos são chamados frequências relativas ou frequências. A soma total dos particulares é igual a um

    ou
    ,

    se as frequências forem expressas como uma porcentagem do número total de observações P. A substituição de frequências por frequências não é obrigatória, mas às vezes se mostra útil e até necessária naqueles casos em que é necessário comparar entre si séries variacionais que diferem muito em seus volumes.

    Dependendo de como o atributo varia - discreta ou continuamente, em uma faixa ampla ou estreita - a população estatística é distribuída em sem intervalo ou intervalo linhas de variação. No primeiro caso, as frequências referem-se diretamente aos valores ranqueados do recurso, que adquirem a posição grupos individuais ou classes da série variacional, na segunda - são calculadas as frequências relacionadas a intervalos individuais ou intervalos (de - a), em que a variação geral do traço é dividida dentro do intervalo das variantes mínimas às máximas dessa população . Esses espaços, ou espaços de classe, podem ou não ser iguais em largura. A partir daqui eles distinguem séries variacionais de intervalos iguais e desiguais. Em séries de intervalos desiguais, a natureza da distribuição de frequência muda à medida que a largura dos intervalos de classe muda. O agrupamento de intervalos desiguais em biologia é usado relativamente raramente. Via de regra, os dados biométricos são distribuídos em séries de intervalos iguais, o que permite não apenas identificar o padrão de variação, mas também facilita o cálculo dos dados resumidos. características numéricas séries de variação, comparação de séries de distribuição entre si.

    Ao começar a construir uma série variacional de igual intervalo, é importante delinear corretamente a largura do intervalo de classe. O fato é que um agrupamento grosseiro (quando são definidos intervalos de classe muito amplos) distorce as características típicas de variação e leva a uma diminuição na precisão das características numéricas da série. Ao escolher intervalos excessivamente estreitos, a precisão das características numéricas generalizantes aumenta, mas a série acaba sendo muito extensa e não fornece uma imagem clara da variação.

    Para obter uma série variacional bem definida e Para garantir precisão suficiente das características numéricas calculadas a partir dele, é necessário dividir a variação do traço (no intervalo das opções mínimas às máximas) em um número de grupos ou classes que satisfaça ambos os requisitos. Este problema é resolvido dividindo o intervalo de variação de um recurso pelo número de grupos ou classes que são planejados ao construir uma série de variação:

    ,

    Onde h– valor do intervalo; X m a xi X min é o máximo e valor mínimo No total; ké o número de grupos.

    Ao construir uma série de distribuição de intervalos, é necessário escolher o número ideal de grupos (intervalos de caracteres) e definir o comprimento (intervalo) do intervalo. Como a análise da série de distribuição compara as frequências em intervalos diferentes, é necessário que o comprimento dos intervalos seja constante. Se você tiver que lidar com uma série de intervalos de distribuição com intervalos desiguais, então para comparabilidade você precisa trazer a frequência ou frequência para a unidade do intervalo, o valor resultante é chamado densidade ρ , ou seja
    .

    O número ideal de grupos é escolhido para que a variedade de valores do atributo no agregado seja refletida de forma suficiente e, ao mesmo tempo, a regularidade da distribuição, sua forma não seja distorcida por flutuações aleatórias de frequência. Se houver poucos grupos, não haverá padrão de variação; se houver muitos grupos, saltos aleatórios de frequência distorcerão a forma da distribuição.

    Na maioria das vezes, o número de grupos em uma série de distribuição é determinado pela fórmula de Sturgess:

    Onde n- o tamanho da população.

    Uma representação gráfica fornece assistência essencial na análise de uma série de distribuição e suas propriedades. A série intervalar é representada por um gráfico de barras, no qual as bases das barras, localizadas ao longo do eixo das abcissas, são os intervalos de valores do atributo variável, e as alturas das barras são as frequências correspondentes à escala ao longo o eixo das ordenadas. Esse tipo de diagrama é chamado histograma.

    Se houver uma série de distribuição discreta ou os intervalos médios forem usados, então a representação gráfica de tal série é chamada polígono, que é obtido ligando pontos retos com coordenadas X eu e f eu .

    Se os valores da classe são plotados ao longo do eixo das abcissas, e as frequências acumuladas são plotadas ao longo do eixo das ordenadas, seguidas de conectar os pontos com linhas retas, obtém-se um gráfico chamado cumulativo. As frequências acumuladas são encontradas por somas sucessivas, ou acumulação freqüências na direção da primeira classe até o final da série de variação.

    Exemplo. Existem dados sobre a produção de ovos de 50 galinhas poedeiras por 1 ano mantidas em uma granja (Tabela 1.1).

    Tabela 1.1

    galinhas poedeiras

    N.º de galinhas poedeiras

    Produção de ovos, unid.

    N.º de galinhas poedeiras

    Produção de ovos, unid.

    N.º de galinhas poedeiras

    Produção de ovos, unid.

    N.º de galinhas poedeiras

    Produção de ovos, unid.

    N.º de galinhas poedeiras

    Produção de ovos, unid.

    É necessário construir uma série de distribuição de intervalos e exibi-la graficamente na forma de um histograma, polígono e cumulado.

    Pode-se observar que a característica varia de 212 a 245 ovos obtidos de uma galinha poedeira em 1 ano.

    Em nosso exemplo, usando a fórmula de Sturgess, determinamos o número de grupos:

    k = 1 + 3,322lg 50 = 6,643 ≈ 7.

    Calcule o comprimento (intervalo) do intervalo usando a fórmula:

    .

    Vamos construir uma série intervalar com 7 grupos e um intervalo de 5 peças. ovos (Tabela 1.2). Para construir gráficos na tabela, calculamos o meio dos intervalos e a frequência acumulada.

    Tabela 1.2

    Série de intervalo de distribuição da produção de ovos

    Grupo de galinhas poedeiras de acordo com o tamanho da produção de ovos

    X eu

    Número de galinhas poedeiras

    f eu

    Ponto médio do intervalo

    X eu

    Frequência acumulada

    f eu

    Vamos construir um histograma da distribuição da produção de ovos (Fig. 1.1).

    Arroz. 1.1. Histograma de distribuição da produção de ovos

    Esses histogramas mostram a forma de distribuição característica de muitos traços: os valores dos intervalos médios do traço são mais comuns, menos frequentemente os valores extremos (pequenos e grandes) do traço. A forma dessa distribuição se aproxima da lei da distribuição normal, que é formada se uma variável variável é influenciada por um grande número de fatores, nenhum dos quais tem valor predominante.

    O polígono e o cumulado da distribuição da produção de ovos têm a forma (Fig. 1.2 e 1.3).

    Arroz. 1.2. Polígono de distribuição de ovos

    Arroz. 1.3. Distribuição cumulativa da produção de ovos

    Tecnologia de resolução de problemas em processador de planilhas Microsoft sobressair Next.

    1. Insira os dados iniciais de acordo com a fig. 1.4.

    2. Classifique a linha.

    2.1. Selecione as células A2:A51.

    2.2. Clique com o botão esquerdo na barra de ferramentas no botão<Сортировка по возрастанию > .

    3. Determine o tamanho do intervalo para construir a série intervalar da distribuição.

    3.1. Copie a célula A2 para a célula E53.

    3.2. Copie a célula A51 para a célula E54.

    3.3. Calcule o intervalo de variação. Para fazer isso, insira a fórmula na célula E55 =E54-E53.

    3.4. Calcule o número de grupos de variação. Para fazer isso, insira a fórmula na célula E56 =1+3,322*LOG10(50).

    3.5. Digite na célula E57 o número arredondado de grupos.

    3.6. Calcule a duração do intervalo. Para fazer isso, insira a fórmula na célula E58 =E55/E57.

    3.7. Digite na célula E59 o comprimento arredondado do intervalo.

    4. Construa uma série de intervalos.

    4.1. Copie a célula E53 para a célula B64.

    4.2. Digite a fórmula na célula B65 =B64+$E$59.

    4.3. Copie a célula B65 para as células B66:B70.

    4.4. Digite a fórmula na célula C64 =B65.

    4.5. Digite a fórmula na célula C65 =C64+$E$59.

    4.6. Copie a célula C65 para as células C66:C70.

    Os resultados da solução são exibidos na tela de exibição na seguinte forma (Fig. 1.5).

    5. Calcule a frequência do intervalo.

    5.1. Execute o comando Serviço,Análise de dados clicando alternadamente com o botão esquerdo do mouse.

    5.2. Na caixa de diálogo Análise de dados definido com o botão esquerdo do mouse: Ferramentas de Análise <Гистограмма>(Fig. 1.6).

    5.3. Clique com o botão esquerdo no botão<ОК>.

    5.4. Na guia gráfico de barras ajuste os parâmetros de acordo com a fig. 1.7.

    5.5. Clique com o botão esquerdo no botão<ОК>.

    Os resultados da solução são exibidos na tela de exibição na seguinte forma (Fig. 1.8).

    6. Preencha a tabela "Série de intervalo de distribuição".

    6.1. Copie as células B74:B80 para as células D64:D70.

    6.2. Calcule a soma das frequências. Para fazer isso, selecione as células D64:D70 e clique com o botão esquerdo do mouse no botão na barra de ferramentas<Автосумма > .

    6.3. Calcule o meio dos intervalos. Para fazer isso, insira a fórmula na célula E64 =(B64+C64)/2 e copie para as células E65:E70.

    6.4. Calcule as frequências acumuladas. Para fazer isso, copie a célula D64 para a célula F64. Na célula F65, insira a fórmula =F64+D65 e copie-a para as células F66:F70.

    Os resultados da solução são exibidos na tela de exibição na seguinte forma (Fig. 1.9).

    7. Edite o histograma.

    7.1. Clique com o botão direito do mouse no diagrama sobre o nome "pocket" e na guia que aparece, clique no botão<Очистить>.

    7.2. Clique com o botão direito do mouse no gráfico e na guia que aparece, clique no botão<Исходные данные>.

    7.3. Na caixa de diálogo Dados iniciais altere os rótulos do eixo X. Para fazer isso, selecione as células B64:C70 (Fig. 1.10).

    7.5. pressione a tecla .

    Os resultados são exibidos na tela em seguinte formulário(Fig. 1.11).

    8. Construa um polígono de distribuição de ovos.

    8.1. Clique com o botão esquerdo na barra de ferramentas no botão<Мастер диаграмм > .

    8.2. Na caixa de diálogo Assistente de gráfico (etapa 1 de 4) use o botão esquerdo do mouse para definir: Padrão <График>(Fig. 1.12).

    8.3. Clique com o botão esquerdo no botão<Далее>.

    8.4. Na caixa de diálogo Assistente de gráfico (etapa 2 de 4) ajuste os parâmetros de acordo com a fig. 1.13.

    8.5. Clique com o botão esquerdo no botão<Далее>.

    8.6. Na caixa de diálogo Assistente de gráfico (etapa 3 de 4) digite os nomes do gráfico e do eixo Y (Fig. 1.14).

    8.7. Clique com o botão esquerdo no botão<Далее>.

    8.8. Na caixa de diálogo Assistente de gráfico (etapa 4 de 4) ajuste os parâmetros de acordo com a fig. 1.15.

    8.9. Clique com o botão esquerdo no botão<Готово>.

    Os resultados são exibidos na tela de exibição da seguinte forma (Fig. 1.16).

    9. Insira rótulos de dados no gráfico.

    9.1. Clique com o botão direito do mouse no gráfico e na guia que aparece, clique no botão<Исходные данные>.

    9.2. Na caixa de diálogo Dados iniciais altere os rótulos do eixo X. Para fazer isso, selecione as células E64:E70 (Fig. 1.17).

    9.3. pressione a tecla .

    Os resultados são exibidos na tela de exibição da seguinte forma (Fig. 1.18).

    O acumulado de distribuição é construído de forma semelhante ao polígono de distribuição com base nas frequências acumuladas.

    Eles são apresentados na forma de séries de distribuição e são formatados como .

    Uma série de distribuição é um tipo de agrupamento.

    Faixa de distribuição- representa uma distribuição ordenada de unidades da população estudada em grupos de acordo com um determinado atributo variável.

    Dependendo da característica subjacente à formação de uma série de distribuição, existem atributiva e variacional níveis de distribuição:

    • atributivo- chamar a série de distribuição construída em bases qualitativas.
    • As séries de distribuição construídas em ordem crescente ou decrescente de valores de um atributo quantitativo são chamadas variacional.
    A série de variação da distribuição consiste em duas colunas:

    A primeira coluna contém valores quantitativos característica variável, que são chamados de opções e estão marcados. Variante discreta - expressa como um número inteiro. A opção de intervalo está no intervalo de e para. Dependendo do tipo de variantes, é possível construir uma série variacional discreta ou intervalar.
    A segunda coluna contém resultar opção específica , expresso em termos de frequências ou frequências:

    Frequências- estes são números absolutos que mostram quantas vezes no agregado ocorre o valor dado do recurso, que denotam . A soma de todas as frequências deve ser igual ao número de unidades de toda a população.

    Frequências() são as frequências expressas em percentagem do total. A soma de todas as frequências expressas em porcentagem deve ser igual a 100% em frações de um.

    Representação gráfica de séries de distribuição

    As séries de distribuição são visualizadas por meio de imagens gráficas.

    As séries de distribuição são exibidas como:
    • Polígono
    • Histogramas
    • Acumula
    • ogivas

    Polígono

    Ao construir um polígono no eixo horizontal (eixo das abcissas), os valores do atributo variável são plotados e, em eixo vertical(eixo y) - frequências ou frequências.

    O polígono da fig. 6.1 foi construído de acordo com o microcenso da população da Rússia em 1994.

    6.1. Distribuição das famílias por tamanho

    Doença: Dados sobre a distribuição de 25 funcionários de uma das empresas por categorias tarifárias:
    4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
    Tarefa: Construir uma série de variação discreta e exibi-la graficamente como um polígono de distribuição.
    Decisão:
    NO este exemplo opções é a categoria salarial do empregado. Para determinar as frequências, é necessário calcular o número de funcionários com a categoria salarial adequada.

    O polígono é usado para séries de variação discreta.

    Para construir um polígono de distribuição (Fig. 1), ao longo da abscissa (X), traçamos os valores quantitativos do traço variável - variantes e ao longo da ordenada - frequências ou frequências.

    Se os valores característicos são expressos como intervalos, essa série é chamada de série de intervalos.
    série de intervalo as distribuições são mostradas graficamente como um histograma, cumulado ou ogiva.

    Tabela estatística

    Doença: Dados sobre o tamanho dos depósitos 20 são fornecidos indivíduos em um banco (mil rublos) 60; 25; 12; dez; 68; 35; 2; 17; 51; nove; 3; 130; 24; 85; 100; 152; 6; dezoito; 7; 42.
    Tarefa: Construir uma série de variação de intervalo com intervalos iguais.
    Decisão:

    1. A população inicial é composta por 20 unidades (N = 20).
    2. Usando a fórmula de Sturgess, definimos quantidade necessária grupos usados: n=1+3,322*lg20=5
    3. Vamos calcular o valor do intervalo igual: i=(152 - 2) /5 = 30 mil rublos
    4. Dividimos a população inicial em 5 grupos com um intervalo de 30 mil rublos.
    5. Os resultados do agrupamento são apresentados na tabela:

    Com tal gravação de uma característica contínua, quando o mesmo valor ocorre duas vezes (como limite superior de um intervalo e limite inferior de outro intervalo), esse valor pertence ao grupo em que esse valor atua como limite superior.

    gráfico de barras

    Para construir um histograma ao longo da abscissa, indique os valores dos limites dos intervalos e, com base neles, construa retângulos cuja altura seja proporcional às frequências (ou frequências).

    Na fig. 6.2. o histograma da distribuição da população da Rússia em 1997 por grupos de idade mostra-se.

    Arroz. 6.2. Distribuição da população da Rússia por faixas etárias

    Doença: A distribuição de 30 funcionários da empresa de acordo com o tamanho do salário mensal é dada

    Tarefa: Exibe a série de variação de intervalo graficamente como um histograma e acumula.
    Decisão:

    1. A borda desconhecida do intervalo aberto (primeiro) é determinada pelo valor do segundo intervalo: 7.000 - 5.000 = 2.000 rublos. Com o mesmo valor encontramos limite inferior o primeiro intervalo: 5000 - 2000 = 3000 rublos.
    2. Para construir um histograma em um sistema de coordenadas retangulares, ao longo do eixo das abcissas, separamos segmentos cujos valores correspondem aos intervalos da linha variante.
      Esses segmentos servem como base inferior, e a frequência correspondente (frequência) serve como altura dos retângulos formados.
    3. Vamos construir um histograma:

    Para construir o cumulado, é necessário calcular as frequências acumuladas (frequências). Eles são determinados pela soma sucessiva das frequências (frequências) dos intervalos anteriores e são denotados por S. As frequências acumuladas mostram quantas unidades da população têm um valor de característica não maior que o considerado.

    Acumular

    A distribuição de uma característica em uma série variacional de acordo com as frequências acumuladas (frequências) é representada usando o cumulado.

    Acumular ou a curva cumulativa, em contraste com o polígono, é construída sobre as frequências ou frequências acumuladas. Ao mesmo tempo, os valores do recurso são colocados no eixo das abcissas e as frequências ou frequências acumuladas são colocadas no eixo das ordenadas (Fig. 6.3).

    Arroz. 6.3. Distribuição cumulativa de domicílios por tamanho

    4. Calcule as frequências acumuladas:
    A frequência do joelho do primeiro intervalo é calculada da seguinte forma: 0 + 4 = 4, para o segundo: 4 + 12 = 16; para o terceiro: 4 + 12 + 8 = 24, etc.

    Ao construir o cumulado, a frequência acumulada (frequência) do intervalo correspondente é atribuída ao seu limite superior:

    Ogiva

    Ogivaé construído de forma semelhante ao cumulado, com a única diferença de que as frequências acumuladas são colocadas no eixo das abcissas e os valores dos recursos são colocados no eixo das ordenadas.

    Uma variação do acumulado é a curva de concentração ou gráfico de Lorenz. Para traçar a curva de concentração em ambos os eixos sistema retangular Nas coordenadas, é aplicada uma escala de escala em porcentagem de 0 a 100. Nesse caso, as abcissas indicam as frequências acumuladas, e as ordenadas mostram os valores acumulados da parcela (em porcentagem) pelo volume do recurso.

    A distribuição uniforme do sinal corresponde à diagonal do quadrado no gráfico (Fig. 6.4). Com distribuição desigual, o gráfico é uma curva côncava dependendo do nível de concentração da característica.

    6.4. curva de concentração