Critérios de adequação em tecnologias de inovação estatística. Teste de ajuste de Pearson

Nesta seção, consideraremos uma das questões relacionadas ao teste de verossimilhança de hipóteses, a saber, a questão da consistência entre as distribuições teóricas e estatísticas.

Suponha que uma dada distribuição estatística seja achatada por alguma curva teórica f(x)(Fig. 7.6.1). Por melhor que seja a escolha da curva teórica, algumas discrepâncias são inevitáveis ​​entre ela e a distribuição estatística. A questão surge naturalmente: essas discrepâncias são devidas apenas a circunstâncias aleatórias associadas a um número limitado de observações, ou são significativas e estão relacionadas ao fato de a curva que escolhemos não equalizar adequadamente essa distribuição estatística. Para responder a esta pergunta, são utilizados os chamados "critérios de consentimento".

LEIS DE DISTRIBUIÇÃO DE VARIÁVEIS ALEATÓRIAS



A ideia por trás da aplicação dos critérios de adequação é a seguinte.

Com base neste material estatístico, temos que testar a hipótese H, consistindo no fato de que a variável aleatória X obedece a alguma lei de distribuição definida. Esta lei pode ser dada de uma forma ou de outra: por exemplo, na forma de uma função de distribuição F(x) ou na forma de densidade de distribuição f(x), ou na forma de um conjunto de probabilidades p, Onde pt- a probabilidade de que o valor X vai cair dentro eu algo descarga.

Uma vez que a partir dessas formas a função de distribuição F(x)é o mais geral e determina qualquer outro, formularemos a hipótese H, como consistindo no fato de que o valor X tem uma função de distribuição ^(d:).

Aceitar ou rejeitar uma hipótese H, considere alguma quantidade você, caracterizando o grau de discrepância entre as distribuições teóricas e estatísticas. Valor você pode ser selecionado de várias maneiras; por exemplo, como você pode-se tomar a soma dos desvios quadrados das probabilidades teóricas pt das frequências correspondentes R* ou a soma dos mesmos quadrados com alguns coeficientes (“pesos”), ou o desvio máximo da função de distribuição estatística F*(x) de teórico F(x) etc. Vamos supor que a quantidade você escolhido de uma forma ou de outra. Obviamente, existe algum valor aleatório. A lei de distribuição desta variável aleatória depende da lei de distribuição da variável aleatória x, em que experimentos foram realizados, e do número de experimentos P. Se a hipótese H for verdadeira, então a lei de distribuição da quantidade você determinado pela lei de distribuição da quantidade X(função F(x)) e número P.

Suponhamos que esta lei de distribuição nos seja conhecida. Como resultado desta série de experimentos, verificou-se que a medida que escolhemos



CRITÉRIOS DE CONSENTIMENTO


discrepâncias você assumiu algum valor uma. A questão é se isso pode ser explicado por causas aleatórias, ou se essa discrepância é muito grande e indica a presença de uma diferença significativa entre as distribuições teórica e estatística e, portanto, a inadequação da hipótese H? Para responder a essa pergunta, suponha que a hipótese H está correto, e sob esta suposição calculamos a probabilidade de que, devido a causas aleatórias associadas a uma quantidade insuficiente de material experimental, a medida de discrepância você não será menor que o valor observado por nós no experimento e, ou seja, calculamos a probabilidade de um evento:

Se esta probabilidade for muito pequena, então a hipótese H deve ser rejeitado como pouco plausível; se esta probabilidade for significativa, deve-se reconhecer que os dados experimentais não contradizem a hipótese N.

Surge a questão, de que forma deve ser escolhida a medida de discrepância £/? Acontece que para algumas maneiras de escolhê-lo, a lei de distribuição da quantidade você tem propriedades muito simples e, para grandes P praticamente independente da função F(x). São precisamente essas medidas de discrepância que são usadas na estatística matemática como critério de concordância.

Vamos considerar um dos critérios de concordância mais usados ​​- o chamado "critério no?" Pearson.

Suponha que existam ha experimentos independentes, em cada um dos quais a variável aleatória X assumiu um determinado valor. Os resultados dos experimentos estão resumidos em k dígitos e são apresentados na forma de uma série estatística.

Nulo(básico) chame a hipótese apresentada sobre a forma da distribuição desconhecida, ou sobre os parâmetros de distribuições conhecidas. competindo (alternativo) chamada de hipótese que contradiz o nulo.

Por exemplo, se a hipótese nula é assumir que a variável aleatória Xé distribuído de acordo com a lei , então a hipótese concorrente pode consistir na suposição de que a variável aleatória X distribuídos de acordo com uma lei diferente.

Critério estatístico(ou simplesmente critério) é chamado de alguma variável aleatória Para, que serve para testar a hipótese nula.

Depois de escolher um determinado critério, por exemplo critério , o conjunto de todos os seus valores possíveis é dividido em dois subconjuntos não sobrepostos: um deles contém os valores do critério sob o qual a hipótese nula é rejeitada e o outro - sob que é aceito.

Área críticaé o conjunto de valores de teste para o qual a hipótese nula é rejeitada. Área de aceitação da hipótese chamado de conjunto de valores do critério sob o qual a hipótese é aceita. Pontos críticos os pontos que separam a região crítica da área de aceitação da hipótese nula são chamados.

Para o nosso exemplo, com um valor de , o valor calculado da amostra corresponde à área de aceitação da hipótese: a variável aleatória é distribuída de acordo com a lei . Se o valor calculado , então ele cai na região crítica, ou seja, a hipótese sobre a distribuição de uma variável aleatória de acordo com a lei é rejeitada.

No caso de uma distribuição, a região crítica é determinada pela desigualdade , a área de aceitação da hipótese nula é determinada pela desigualdade .

2.6.3. Critérios de Bondade Pearson.

Uma das tarefas da zootecnia e da genética veterinária é a criação de novas raças e espécies com as características exigidas. Por exemplo, aumento da imunidade, resistência a doenças ou mudança na cor da pele.

Na prática, ao analisar os resultados, muitas vezes verifica-se que os resultados reais correspondem mais ou menos a alguma lei teórica de distribuição. É necessário avaliar o grau de correspondência entre os dados reais (empíricos) e os dados teóricos (hipotéticos). Para isso, apresente uma hipótese nula: a população resultante é distribuída de acordo com a lei "A". A verificação da hipótese sobre a lei de distribuição proposta é realizada usando uma variável aleatória especialmente selecionada - o critério de adequação.

Critério de concordância chamado de critério para testar a hipótese da suposta lei da distribuição desconhecida.

Existem vários critérios de adequação: Pearson, Kolmogorov, Smirnov, etc. O teste de ajuste de Pearson é o mais comumente usado.

Considere a aplicação do critério de Pearson no exemplo de testar a hipótese da lei de distribuição normal da população geral. Para tanto, compararemos as frequências empíricas e teóricas (calculadas na continuação da distribuição normal).

Geralmente há alguma diferença entre as frequências teóricas e empíricas. Por exemplo:

Frequências empíricas 7 15 41 93 113 84 25 13 5

Frequências teóricas 5 13 36 89 114 91 29 14 6

Considere dois casos:

A discrepância entre as frequências teóricas e empíricas é aleatória (insignificante), ou seja, é possível fazer uma proposta sobre a distribuição de frequências empíricas de acordo com a lei normal;

A discrepância entre as frequências teóricas e empíricas não é acidental (significativa), ou seja, as frequências teóricas são calculadas com base na hipótese errada sobre a distribuição normal da população geral.

Com a ajuda do critério de ajuste de Pearson, é possível determinar por acaso ou não a discrepância entre as frequências teóricas e empíricas, ou seja, com uma dada probabilidade de confiança para determinar se a população geral é distribuída de acordo com a lei normal ou não.

Então, vamos obter a distribuição empírica para uma amostra de tamanho n:

Opções……

Frequências empíricas…….

Vamos supor que, sob a hipótese de uma distribuição normal, as frequências teóricas sejam calculadas. No nível de significância, é necessário testar a hipótese nula: a população é normalmente distribuída.

Como critério para testar a hipótese nula, tomamos uma variável aleatória

(*)

Este valor é aleatório, pois em diferentes experimentos assume valores diferentes e previamente desconhecidos. É claro que quanto menos as frequências empíricas e teóricas diferem, menor o valor do critério e, consequentemente, caracteriza em certa medida a proximidade das distribuições empíricas e teóricas.

Prova-se que em , a lei de distribuição da variável aleatória (*), independente de qual lei de distribuição a população geral esteja sujeita, tende à lei de distribuição com graus de liberdade. Portanto, a variável aleatória (*) é denotada por , e o próprio critério é chamado de teste de ajuste “qui-quadrado”.

Vamos denotar o valor do critério calculado a partir dos dados observacionais como . Os valores críticos tabulados do critério para um determinado nível de significância e o número de graus de liberdade denotam . Neste caso, o número de graus de liberdade é determinado a partir da igualdade , onde o número de grupos (intervalos parciais) da amostra ou classes; - o número de parâmetros da distribuição proposta. A distribuição normal tem dois parâmetros - a expectativa matemática e o desvio padrão. Portanto, o número de graus de liberdade para uma distribuição normal é encontrado a partir da igualdade

Se o valor calculado e o valor da tabela satisfazem a desigualdade , aceita-se a hipótese nula sobre a distribuição normal da população geral. Se , a hipótese nula é rejeitada e a hipótese alternativa a ela é aceita (a população geral não é distribuída de acordo com a lei normal).

Comente. Ao usar o teste de ajuste de Pearson, o tamanho da amostra deve ser de pelo menos 30. Cada grupo deve conter pelo menos 5 opções. Se houver menos de 5 frequências nos grupos, elas serão combinadas com grupos vizinhos.

Em geral, o número de graus de liberdade para uma distribuição qui-quadrado é definido como o número total de valores a partir dos quais as medidas correspondentes são calculadas, menos o número dessas condições que ligam esses valores, ou seja, reduzir a possibilidade de variação entre eles. Nos casos mais simples, ao calcular, o número de graus de liberdade será igual ao número de classes, reduzido em um. Assim, por exemplo, com a divisão diíbrida, são obtidas 4 classes, mas apenas a primeira classe é obtida não relacionada, as subsequentes já estão associadas às anteriores. Portanto, para divisão diíbrida, o número de graus de liberdade é .

Exemplo 1 Determinar o grau de correspondência entre a distribuição real dos grupos em termos do número de vacas com tuberculose e a teoricamente esperada, calculada considerando a distribuição normal. Os dados iniciais estão resumidos na tabela:

Solução.

Pelo nível de significância e o número de graus de liberdade da tabela de pontos críticos de distribuição (ver Apêndice 4), encontramos o valor . Porque o , podemos concluir que a diferença entre as frequências teóricas e reais é aleatória. Assim, a distribuição real dos grupos de acordo com o número de vacas com tuberculose corresponde ao teoricamente esperado.

Exemplo 2 A distribuição teórica por fenótipo de indivíduos obtidos na segunda geração por cruzamento diíbrido de coelhos de acordo com a lei de Mendel é 9:3:3:1. É necessário calcular a correspondência da distribuição empírica de coelhos do cruzamento de indivíduos pretos com pêlo normal com animais fofos - albinos. Ao cruzar na segunda geração, foram obtidos 120 filhotes, incluindo 45 coelhos pretos de pelo curto, 30 pretos felpudos, 25 brancos de pelo curto, 20 coelhos brancos felpudos.

Solução. A segregação teoricamente esperada na descendência deve corresponder a uma proporção de quatro fenótipos (9:3:3:1). Calcule as frequências teóricas (número de gols) para cada aula:

9+3+3+1=16, então podemos esperar que os cabelos curtos pretos sejam ; penugem preta - ; cabelo curto branco ; felpudo branco -.

A distribuição fenotípica empírica (real) foi a seguinte 45; trinta; 25; vinte.

Vamos resumir todos esses dados na tabela a seguir:

Usando o teste de ajuste de Pearson, calculamos o valor de:

O número de graus de liberdade em um cruzamento diíbrido. Para nível de significância encontrar valor . Porque o , podemos concluir que a diferença entre as frequências teóricas e reais não é acidental. Consequentemente, o grupo resultante de coelhos se desvia em termos de distribuição de fenótipos da lei de Mendel durante o cruzamento diíbrido e reflete a influência de certos fatores que alteram o tipo de divisão no fenótipo na segunda geração de híbridos.

O teste de ajuste qui-quadrado de Pearson também pode ser usado para comparar duas distribuições empíricas homogêneas entre si, ou seja, aqueles que têm os mesmos limites de classe. A hipótese nula é a hipótese de que duas funções de distribuição desconhecidas são iguais. O teste do qui-quadrado nesses casos é determinado pela fórmula

(**)

onde e são os volumes das distribuições comparadas; e são as frequências das classes correspondentes.

Considere uma comparação de duas distribuições empíricas usando o exemplo a seguir.

Exemplo 3 O comprimento dos ovos de cuco foi medido em duas zonas territoriais. Na primeira zona foi examinada uma amostra de 76 ovos () e na segunda de 54 (). Os seguintes resultados são obtidos:

Comprimento (mm)
Frequências
Frequências - - -

No nível de significância, é necessário testar a hipótese nula de que ambas as amostras de ovos pertencem à mesma população de cucos.

Introdução

A relevância deste tópico é que durante o estudo dos fundamentos da bioestatística, assumimos que a lei de distribuição da população geral é conhecida. Mas e se a lei de distribuição for desconhecida, mas houver razão para supor que ela tenha uma certa forma (vamos chamá-la de A), então a hipótese nula é verificada: a população geral é distribuída de acordo com a lei A. Essa hipótese é testada usando uma variável aleatória especialmente selecionada - o critério de concordância.

Os testes de adequação são critérios para testar hipóteses sobre a correspondência da distribuição empírica com a distribuição de probabilidade teórica. Esses critérios se dividem em duas categorias:

  • III Critérios gerais de adequação se aplicam à formulação mais geral de uma hipótese, ou seja, a hipótese de que os resultados observados concordam com qualquer distribuição de probabilidade assumida a priori.
  • III Testes especiais de bondade de ajuste implicam hipóteses nulas especiais que formulam concordância com uma certa forma de distribuição de probabilidade.

Critérios de Bondade

Os testes de ajuste mais comuns são ômega-quadrado, qui-quadrado, Kolmogorov e Kolmogorov-Smirnov.

Testes não paramétricos de concordância Kolmogorov, Smirnov, quadrado ômega são amplamente utilizados. No entanto, eles também estão associados a erros generalizados na aplicação de métodos estatísticos.

O fato é que os critérios listados foram desenvolvidos para testar a concordância com uma distribuição teórica totalmente conhecida. Fórmulas de cálculo, tabelas de distribuições e valores críticos são amplamente utilizadas. A ideia principal do Kolmogorov, quadrado ômega e critérios semelhantes é medir a distância entre a função de distribuição empírica e a função de distribuição teórica. Esses critérios diferem na forma das distâncias no espaço das funções de distribuição.

Testes de bondade de ajuste p2 de Pearson para uma hipótese simples

O teorema de K. Pearson refere-se a tentativas independentes com um número finito de resultados, ou seja. aos julgamentos de Bernoulli (em um sentido um tanto estendido). Permite julgar se as observações em um grande número de tentativas da frequência desses resultados são consistentes com suas probabilidades estimadas.

Em muitos problemas práticos, a lei de distribuição exata é desconhecida. Portanto, é levantada uma hipótese sobre a correspondência da lei empírica existente, construída a partir de observações, a alguma lei teórica. Esta hipótese requer testes estatísticos, cujos resultados serão confirmados ou refutados.

Seja X a variável aleatória em estudo. É necessário testar a hipótese H0 de que esta variável aleatória obedece à lei de distribuição F(x). Para fazer isso, é necessário fazer uma amostra de n observações independentes e construir uma lei de distribuição empírica F"(x) a partir dela. mais popular é a bondade de ajuste do qui-quadrado de K. Pearson. Nela, a estatística do qui-quadrado é calculada:

onde N é o número de intervalos segundo o qual a lei de distribuição empírica foi construída (o número de colunas do histograma correspondente), i é o número do intervalo, pt i é a probabilidade de que o valor da variável aleatória caia em o intervalo i-ésimo para a lei de distribuição teórica, pe i é a probabilidade de que o valor da variável aleatória caia no intervalo i para a lei de distribuição empírica. Deve obedecer à distribuição qui-quadrado.

Se o valor calculado da estatística exceder o quantil de distribuição qui-quadrado com k-p-1 graus de liberdade para um determinado nível de significância, então a hipótese H0 é rejeitada. Caso contrário, é aceito no nível de significância dado. Aqui k é o número de observações, p é o número de parâmetros estimados da lei de distribuição.

Vejamos as estatísticas:

A estatística p2 é chamada de estatística qui-quadrado de Pearson para a hipótese simples.

É claro que p2 é o quadrado de alguma distância entre dois vetores r-dimensionais: o vetor de frequência relativa (mi /n, …, mr /n) e o vetor de probabilidade (pi , …, pr). Essa distância difere da distância euclidiana apenas porque diferentes coordenadas entram nela com pesos diferentes.

Vamos discutir o comportamento da estatística h2 no caso em que a hipótese H é verdadeira e no caso em que H é falsa. Se H for verdadeiro, então o comportamento assintótico de ch2 para n > ? indica o teorema de K. Pearson. Para entender o que acontece com (2.2) quando H é falso, observe que, de acordo com a lei dos grandes números, mi /n > pi para n > ?, para i = 1, …, r. Portanto, para n > ?:

Este valor é igual a 0. Portanto, se H estiver incorreto, então h2 >? (quando n > ?).

Segue-se do que foi dito que H deve ser rejeitado se o valor de h2 obtido no experimento for muito grande. Aqui, como sempre, as palavras "muito grande" significam que o valor observado de n2 excede o valor crítico, que neste caso pode ser obtido das tabelas de distribuição qui-quadrado. Em outras palavras, a probabilidade P(p2 npi p2) é um valor pequeno e, portanto, é improvável que acidentalmente obtenha o mesmo que no experimento, ou uma discrepância ainda maior entre o vetor de frequência e o vetor de probabilidade.

A natureza assintótica do teorema de K. Pearson, que fundamenta esta regra, requer cautela em seu uso prático. Só pode ser invocado para grandes n. Para julgar se n é grande o suficiente, é necessário levar em conta as probabilidades pi , ..., pr . Portanto, não se pode dizer, por exemplo, que cem observações serão suficientes, pois não apenas n deve ser grande, mas também os produtos npi , ..., npr (frequências esperadas) também não devem ser pequenos. Portanto, o problema de aproximar ch2 (distribuição contínua) à estatística ch2, cuja distribuição é discreta, mostrou-se difícil. Uma combinação de argumentos teóricos e experimentais levou à crença de que esta aproximação é aplicável se todas as frequências esperadas forem npi>10. se o número r (o número de resultados diferentes) aumenta, o limite para é reduzido (para 5 ou até 3 se r for da ordem de várias dezenas). Para atender a esses requisitos, na prática, às vezes é necessário combinar vários resultados, ou seja, vá para o esquema de Bernoulli com r menor.

O método descrito para verificar a concordância pode ser aplicado não apenas aos testes de Bernoulli, mas também a amostras aleatórias. Suas observações devem primeiro ser convertidas em testes de Bernoulli por agrupamento. Eles fazem assim: o espaço de observação é dividido em um número finito de regiões não sobrepostas, e então a frequência observada e a probabilidade hipotética são calculadas para cada região.

Nesse caso, às dificuldades de aproximação listadas anteriormente, mais uma é adicionada - a escolha de uma partição razoável do espaço original. Ao mesmo tempo, deve-se tomar cuidado para que, em geral, a regra para testar a hipótese sobre a distribuição inicial da amostra seja suficientemente sensível às alternativas possíveis. Por fim, observo que os critérios estatísticos baseados na redução ao esquema de Bernoulli, via de regra, não são válidos para todas as alternativas. Portanto, esse método de verificação de consentimento tem valor limitado.

O teste de adequação de Kolmogorov-Smirnov em sua forma clássica é mais poderoso que o teste h2 e pode ser usado para testar a hipótese de que a distribuição empírica corresponde a qualquer distribuição teórica contínua F(x) com parâmetros conhecidos. Esta última circunstância impõe restrições à possibilidade de uma ampla aplicação prática deste critério na análise dos resultados de ensaios mecânicos, uma vez que os parâmetros da função distribuição das características das propriedades mecânicas, via de regra, são estimados a partir dos dados de a própria amostra.

O critério Kolmogorov-Smirnov é usado para dados desagrupados ou para dados agrupados no caso de uma pequena largura de intervalo (por exemplo, igual à divisão de escala de um medidor de força, contador de ciclos de carga, etc.). Seja o resultado do teste de uma série de n amostras uma série de variação das características das propriedades mecânicas

x1? x2? ...? XI? ...? xn. (3,93)

É necessário testar a hipótese nula de que a distribuição amostral (3,93) pertence à lei teórica F(x).

O critério de Kolmogorov-Smirnov é baseado na distribuição do desvio máximo do particular acumulado do valor da função de distribuição. Ao usá-lo, as estatísticas são calculadas

que é uma estatística do teste de Kolmogorov. Se a desigualdade

Dnvn? testa (3,97)

para tamanhos de amostra grandes (n > 35) ou

Dn(vn + 0,12 + 0,11/vn) ? testa (3,98)

para n? 35, a hipótese nula não é rejeitada.

Se as desigualdades (3,97) e (3,98) não forem satisfeitas, aceita-se a hipótese alternativa de que a amostra (3,93) pertence a uma distribuição desconhecida.

Os valores críticos de lb são: л0,1 = 1,22; 10,05 = 1,36; 10,01 = 1,63.

Se os parâmetros da função F(x) não são conhecidos antecipadamente, mas são estimados a partir dos dados da amostra, o critério de Kolmogorov-Smirnov perde sua universalidade e só pode ser usado para verificar a conformidade dos dados experimentais com apenas alguma distribuição específica funções.

Quando usado como uma hipótese nula, se os dados experimentais pertencem a uma distribuição normal ou log-normal, as estatísticas são calculadas:

onde Ö(zi) é o valor da função de Laplace para

Ц(zi) = (xi - xср)/s O critério de Kolmogorov-Smirnov para qualquer tamanho de amostra n é escrito como

Os valores críticos de lb neste caso são: л0,1 = 0,82; 10,05 = 0,89; 10,01 = 1,04.

Se for verificada a hipótese sobre a conformidade da amostra com a distribuição exponencial ***, cujo parâmetro é estimado a partir de dados experimentais, são calculadas estatísticas semelhantes:

critério probabilidade empírica

e compõem o critério de Kolmogorov-Smirnov.

Os valores críticos de lb para este caso são: λ0,1 = 0,99; 10,05 = 1,09; 10,01 = 1,31.

Para testar a hipótese sobre a correspondência da distribuição empírica com a lei teórica da distribuição, são utilizados indicadores estatísticos especiais - critérios de adequação (ou critérios de conformidade). Estes incluem os critérios de Pearson, Kolmogorov, Romanovsky, Yastremsky, etc. A maior parte dos critérios de bondade de ajuste são baseados no uso de desvios de frequências empíricas das teóricas. Obviamente, quanto menores esses desvios, melhor a distribuição teórica corresponde (ou descreve) a empírica.

Critérios de consentimento- estes são os critérios para testar hipóteses sobre a correspondência da distribuição empírica com a distribuição de probabilidade teórica. Tais critérios são divididos em duas classes: gerais e especiais. Os critérios gerais de adequação se aplicam à formulação mais geral de uma hipótese, ou seja, à hipótese de que os resultados observados concordam com qualquer distribuição de probabilidade assumida a priori. Testes especiais de bondade de ajuste implicam hipóteses nulas especiais que formulam concordância com uma certa forma de distribuição de probabilidade.

Os critérios de concordância, baseados na lei de distribuição estabelecida, permitem estabelecer quando as discrepâncias entre frequências teóricas e empíricas devem ser reconhecidas como insignificantes (aleatórias) e quando - significativas (não aleatórias). Segue-se daí que os critérios de bondade de ajuste permitem rejeitar ou confirmar a exatidão da hipótese apresentada ao nivelar as séries sobre a natureza da distribuição na série empírica e responder se é possível aceitar uma modelo expresso por alguma lei teórica de distribuição para uma dada distribuição empírica.

Teste de ajuste de Pearson c 2 (qui-quadrado) é um dos principais critérios de qualidade de ajuste. Proposto pelo matemático inglês Karl Pearson (1857-1936) para avaliar a aleatoriedade (significância) das discrepâncias entre as frequências das distribuições empíricas e teóricas:

O esquema para aplicar o critério c 2 para avaliar a consistência das distribuições teóricas e empíricas é o seguinte:

1. A medida calculada de discrepância é determinada.

2. O número de graus de liberdade é determinado.

3. O número de graus de liberdade n é determinado usando uma tabela especial.

4. Se , então para um dado nível de significância α e o número de graus de liberdade n, a hipótese de discrepâncias insignificantes (aleatórias) é rejeitada. Caso contrário, a hipótese pode ser reconhecida como não contradizendo os dados experimentais obtidos, e com uma probabilidade (1 – α) pode-se argumentar que as discrepâncias entre as frequências teóricas e empíricas são aleatórias.

Nível de significânciaé a probabilidade de rejeição errônea da hipótese apresentada, ou seja, a probabilidade de que a hipótese correta seja rejeitada. Em estudos estatísticos, dependendo da importância e responsabilidade das tarefas a serem resolvidas, são utilizados os seguintes três níveis de significância:

1) a = 0,1, então R = 0,9;

2) a = 0,05, então R = 0,95;

3) a = 0,01, então R = 0,99.

Usando o critério de ajuste c 2 , as seguintes condições devem ser observadas:

1. O volume da população estudada deve ser grande o suficiente ( N≥ 50), enquanto a frequência ou tamanho do grupo deve ser de pelo menos 5. Se esta condição for violada, é necessário primeiro mesclar frequências pequenas (menos de 5).

2. A distribuição empírica deve consistir em dados obtidos como resultado de seleção aleatória, ou seja, devem ser independentes.

A desvantagem do critério de ajuste de Pearson é a perda de algumas das informações iniciais associadas à necessidade de agrupar os resultados da observação em intervalos e combinar intervalos individuais com um pequeno número de observações. A este respeito, recomenda-se complementar a verificação da correspondência das distribuições de acordo com o critério com 2 outros critérios. Isso é especialmente necessário quando o tamanho da amostra é relativamente pequeno ( n ≈ 100).

Nas estatísticas Teste de ajuste de Kolmogorov(também conhecido como teste de adequação de Kolmogorov-Smirnov) é usado para determinar se duas distribuições empíricas obedecem à mesma lei, ou para determinar se a distribuição resultante obedece ao modelo proposto. O critério de Kolmogorov baseia-se na determinação da diferença máxima entre as frequências acumuladas ou as frequências de distribuições empíricas ou teóricas. O critério de Kolmogorov é calculado de acordo com as seguintes fórmulas:

Onde D e d- respectivamente, a diferença máxima entre as frequências acumuladas ( ff¢) e entre frequências acumuladas ( pp¢) séries empíricas e teóricas de distribuições; N- o número de unidades na população.

Tendo calculado o valor de λ, uma tabela especial determina a probabilidade com que se pode argumentar que os desvios das frequências empíricas das teóricas são aleatórios. Se o sinal assumir valores de até 0,3, isso significa que há uma coincidência completa de frequências. Com um grande número de observações, o teste de Kolmogorov é capaz de detectar qualquer desvio da hipótese. Isso significa que qualquer diferença entre a distribuição da amostra e a teórica será detectada com sua ajuda se houver muitas observações. O significado prático desta propriedade não é significativo, pois na maioria dos casos é difícil contar com a obtenção de um grande número de observações em condições constantes, a ideia teórica da lei de distribuição a que a amostra deve obedecer é sempre aproximada, e a precisão das verificações estatísticas não deve exceder a precisão do modelo escolhido.

Critério de ajuste de Romanovsky com base no uso do critério de Pearson, ou seja, valores já encontrados c 2 , e o número de graus de liberdade:

onde n é o número de graus de liberdade de variação.

O critério de Romanovsky é conveniente na ausência de tabelas para . Se um< 3, то расхождения распределений случайны, если же >3, então eles não são aleatórios e a distribuição teórica não pode servir de modelo para a distribuição empírica em estudo.

B. S. Yastremsky usou no critério de bondade de ajuste não o número de graus de liberdade, mas o número de grupos ( k), um valor especial q dependendo do número de grupos e um valor qui-quadrado. Critério de concordância de Yastremsky tem o mesmo significado que o critério de Romanovsky e é expresso pela fórmula

onde c 2 - critério de concordância de Pearson; - número de grupos; q - coeficiente, para o número de grupos menor que 20 igual a 0,6.

Se um eu fato > 3, as discrepâncias entre as distribuições teóricas e empíricas não são aleatórias, ou seja, a distribuição empírica não atende aos requisitos de uma distribuição normal. Se um eu facto< 3, расхождения между эмпирическим и теоретическим распределениями считаются случайными.

Ao processar medidas independentes da variável aleatória ξ, podemos construir uma função de distribuição estatística F*(x). Pela forma desta função, pode-se aceitar a hipótese de que a verdadeira função de distribuição teórica é F(x). As próprias medidas independentes (x 1 , x 2 ,…,x n) que formam a amostra podem ser consideradas como variáveis ​​aleatórias identicamente distribuídas com uma função de distribuição hipotética F(x).

Obviamente, haverá algumas discrepâncias entre as funções F * (x) e F (x). A questão surge se essas discrepâncias são consequência do tamanho limitado da amostra ou estão relacionadas ao fato de nossa hipótese não estar correta, ou seja, a função de distribuição real não é F(x), mas alguma outra. Para resolver esse problema, são usados ​​os critérios de consentimento, cuja essência é a seguinte. Um certo valor Δ(F, F *) é escolhido, o que caracteriza o grau de discrepância entre as funções F * (x) e F(x). Por exemplo, Δ(F, F *)=Sup|F(x)-F * (x)|, ou seja o limite superior em x do módulo da diferença.

Supondo que a hipótese esteja correta, ou seja, conhecendo a função de distribuição F(x), pode-se encontrar a lei de distribuição da variável aleatória Δ(F, F *) (não tocaremos na questão de como fazer isso). Vamos definir o número p 0 tão pequeno que a realização do evento (Δ(F, F *)>Δ 0 ) com essa probabilidade será considerada praticamente impossível. Da condição

encontre o valor Δ 0 . Aqui f(x) é a densidade de distribuição Δ(F,F *).

Vamos agora calcular o valor Δ(F, F *)= Δ 1 a partir dos resultados

amostras, ou seja encontre um dos possíveis valores da variável aleatória Δ(F, F *). Se Δ 1 ≥Δ 0 , isso significa que ocorreu um evento quase impossível. Isso pode ser explicado pelo fato de que nossa hipótese não está correta. Então, se Δ 1 ≥Δ 0, então a hipótese é rejeitada, e quando Δ 1<Δ 0 , гипотеза может оказаться неверной, но вероятность этого мала.

Como medida da discrepância Δ(F, F *) pode-se tomar vários valores. Dependendo disso, são obtidos diferentes critérios de concordância. Por exemplo, o teste de adequação de Kolmogorov, Mises, Pearson ou o teste do qui-quadrado.

Deixe que os resultados de n medições sejam apresentados como uma série estatística agrupada com k dígitos.

DESCARGA (x 0 ,x 1) (na verdade, assumimos que os erros de medição são distribuídos uniformemente em um determinado segmento). Então a probabilidade de acertar cada um dos sete dígitos será igual a . Usando as séries agrupadas de §11, calculamos Δ(F, F *)= Δ 1 =pela fórmula (1). Nesse caso .

Como a lei de distribuição hipotética inclui dois parâmetros desconhecidos, α e β - o início e o fim do segmento, o número de graus de liberdade será 7-1-2=4. De acordo com a tabela de distribuição qui-quadrado com a probabilidade selecionada p 0 =10 -3 encontramos Δ 0 =18. Porque Δ 1 >Δ 0 , então a hipótese de uma distribuição uniforme do erro de medição terá que ser descartada.