Intervalo de confiança padrão. Métodos de Análise Quantitativa: Estimando Intervalos de Confiança

E outros, todos são estimativas de suas contrapartes teóricas, que poderiam ser obtidas se não houvesse uma amostra, mas a população em geral. Mas, infelizmente, a população em geral é muito cara e muitas vezes indisponível.

O conceito de estimativa de intervalo

Qualquer estimativa amostral tem alguma dispersão, porque é uma variável aleatória dependendo dos valores em uma determinada amostra. Portanto, para inferências estatísticas mais confiáveis, deve-se conhecer não apenas a estimativa pontual, mas também o intervalo, que com alta probabilidade γ (gama) cobre o indicador estimado θ (teta).

Formalmente, esses são dois desses valores (estatísticas) T1(X) e T2(X), que T1< T 2 , para o qual em um determinado nível de probabilidade γ condição for atendida:

Em suma, é provável γ ou mais o valor verdadeiro está entre os pontos T1(X) e T2(X), que são chamados de limites inferior e superior intervalo de confiança.

Uma das condições para construir intervalos de confiança é sua estreiteza máxima, ou seja, deve ser o mais curto possível. O desejo é bastante natural, porque. o pesquisador tenta localizar com mais precisão a descoberta do parâmetro desejado.

Segue-se que o intervalo de confiança deve cobrir as probabilidades máximas da distribuição. e a pontuação em si estar no centro.

Ou seja, a probabilidade de desvio (do indicador verdadeiro da estimativa) para cima é igual à probabilidade de desvio para baixo. Deve-se notar também que para distribuições assimétricas, o intervalo à direita não é igual ao intervalo à esquerda.

A figura acima mostra claramente que quanto maior o nível de confiança, maior o intervalo - uma relação direta.

Esta foi uma pequena introdução à teoria da estimativa de intervalo de parâmetros desconhecidos. Vamos prosseguir para encontrar limites de confiança para a expectativa matemática.

Intervalo de confiança para expectativa matemática

Se os dados originais forem distribuídos por , a média será um valor normal. Isso decorre da regra de que uma combinação linear de valores normais também possui uma distribuição normal. Portanto, para calcular as probabilidades, poderíamos usar o aparato matemático da lei da distribuição normal.

No entanto, isso exigirá o conhecimento de dois parâmetros - o valor esperado e a variância, que geralmente não são conhecidos. Você pode, é claro, usar estimativas em vez de parâmetros (média aritmética e ), mas a distribuição da média não será totalmente normal, será ligeiramente achatada. O cidadão William Gosset, da Irlanda, notou habilmente esse fato quando publicou sua descoberta na edição de março de 1908 da Biometrica. Para fins de sigilo, Gosset assinou com Student. Foi assim que surgiu a distribuição t de Student.

No entanto, a distribuição normal dos dados, usada por K. Gauss na análise de erros em observações astronômicas, é extremamente rara na vida terrestre e é bastante difícil estabelecer isso (para alta precisão, são necessárias cerca de 2 mil observações). Portanto, é melhor abandonar a suposição de normalidade e usar métodos que não dependam da distribuição dos dados originais.

Surge a pergunta: qual é a distribuição da média aritmética se for calculada a partir dos dados de uma distribuição desconhecida? A resposta é dada pelo bem conhecido na teoria da probabilidade Teorema do limite central(CPT). Em matemática, existem várias versões dela (as formulações foram refinadas ao longo dos anos), mas todas elas, grosso modo, se resumem à afirmação de que a soma de um grande número de variáveis aleatórias independentes obedece à lei da distribuição normal.

Ao calcular a média aritmética, é utilizada a soma das variáveis aleatórias. A partir disso, verifica-se que a média aritmética tem uma distribuição normal, na qual o valor esperado é o valor esperado dos dados iniciais e a variância é .

Pessoas inteligentes sabem como provar a CLT, mas vamos verificar isso com a ajuda de um experimento realizado no Excel. Vamos simular uma amostra de 50 variáveis aleatórias uniformemente distribuídas (usando a função do Excel RANDOMBETWEEN). Em seguida, faremos 1.000 dessas amostras e calcularemos a média aritmética para cada uma. Vejamos sua distribuição.

Pode-se observar que a distribuição da média está próxima da lei normal. Se o volume de amostras e seu número forem ainda maiores, a semelhança será ainda melhor.

Agora que vimos por nós mesmos a validade do CLT, podemos, usando , calcular os intervalos de confiança para a média aritmética, que cobrem a média verdadeira ou expectativa matemática com uma dada probabilidade.

Para estabelecer os limites superior e inferior, é necessário conhecer os parâmetros da distribuição normal. Como regra, eles não são, portanto, as estimativas são usadas: média aritmética e variação da amostra. Novamente, este método fornece uma boa aproximação apenas para amostras grandes. Quando as amostras são pequenas, geralmente é recomendado usar a distribuição de Student. Não acredite! A distribuição de Student para a média ocorre apenas quando os dados originais têm distribuição normal, ou seja, quase nunca. Portanto, é melhor definir imediatamente a barra mínima para a quantidade de dados necessários e usar métodos assintoticamente corretos. Dizem que 30 observações são suficientes. Take 50 - você não pode errar.

T 1.2 são os limites inferior e superior do intervalo de confiança

– média aritmética da amostra

s0– desvio padrão da amostra (sem viés)

n – tamanho da amostra

γ – nível de confiança (geralmente igual a 0,9, 0,95 ou 0,99)

c γ =Φ -1 ((1+γ)/2)é o recíproco da função de distribuição normal padrão. Em termos simples, este é o número de erros padrão da média aritmética para o limite inferior ou superior (as três probabilidades indicadas correspondem aos valores de 1,64, 1,96 e 2,58).

A essência da fórmula é que a média aritmética é tomada e, em seguida, uma certa quantidade é separada dela ( com γ) erros padrão ( s 0 /√n). Tudo é conhecido, pegue e conte.

Antes do uso em massa dos PCs, para obter os valores da função de distribuição normal e sua inversa, eles usavam . Eles ainda são usados, mas é mais eficiente recorrer a fórmulas prontas do Excel. Todos os elementos da fórmula acima ( , e ) podem ser facilmente calculados no Excel. Mas também existe uma fórmula pronta para calcular o intervalo de confiança - NORMA DE CONFIANÇA. Sua sintaxe é a seguinte.

NORMA DE CONFIANÇA(alfa, padrão_dev, tamanho)

alfa– nível de significância ou nível de confiança, que na notação acima é igual a 1-γ, ou seja, a probabilidade de que a matemáticaa expectativa estará fora do intervalo de confiança. Com um nível de confiança de 0,95, alfa é 0,05 e assim por diante.

padrão_desligadoé o desvio padrão dos dados da amostra. Você não precisa calcular o erro padrão, o Excel dividirá pela raiz de n.

o tamanho– tamanho da amostra (n).

O resultado da função CONFIDENCE.NORM é o segundo termo da fórmula para calcular o intervalo de confiança, ou seja, meio intervalo. Assim, os pontos inferior e superior são a média ± o valor obtido.

Assim, é possível construir um algoritmo universal para calcular intervalos de confiança para a média aritmética, que independe da distribuição dos dados iniciais. O preço da universalidade é sua natureza assintótica, ou seja, a necessidade de usar amostras relativamente grandes. No entanto, na era da tecnologia moderna, geralmente não é difícil coletar a quantidade certa de dados.

Testando hipóteses estatísticas usando um intervalo de confiança

(módulo 111)

Um dos principais problemas resolvidos em estatística é. Em poucas palavras, sua essência é essa. Assume-se, por exemplo, que a expectativa da população geral é igual a algum valor. Em seguida, é construída a distribuição das médias amostrais, que pode ser observada com uma determinada expectativa. Em seguida, veremos onde nesta distribuição condicional está localizada a média real. Se ultrapassar os limites permitidos, o aparecimento de tal média é muito improvável e, com uma única repetição do experimento, é quase impossível, o que contradiz a hipótese apresentada, que é rejeitada com sucesso. Se a média não ultrapassar o nível crítico, a hipótese não é rejeitada (mas também não é provada!).

Então, com a ajuda de intervalos de confiança, no nosso caso para a expectativa, você também pode testar algumas hipóteses. É muito fácil de fazer. Suponha que a média aritmética para alguma amostra seja 100. Está sendo testada a hipótese de que o valor esperado é, digamos, 90. Ou seja, se colocarmos a questão de forma primitiva, soa assim: será que com o valor verdadeiro da média igual a 90, a média observada foi de 100?

Para responder a esta pergunta, serão necessárias informações adicionais sobre o desvio padrão e o tamanho da amostra. Digamos que o desvio padrão seja 30 e o número de observações seja 64 (para extrair facilmente a raiz). Então o erro padrão da média é 30/8 ou 3,75. Para calcular o intervalo de confiança de 95%, você precisará separar dois erros padrão em ambos os lados da média (mais precisamente, 1,96). O intervalo de confiança será de aproximadamente 100 ± 7,5, ou de 92,5 a 107,5.

O raciocínio adicional é o seguinte. Se o valor testado estiver dentro do intervalo de confiança, então não contradiz a hipótese, uma vez que enquadra-se nos limites das flutuações aleatórias (com uma probabilidade de 95%). Se o ponto testado estiver fora do intervalo de confiança, então a probabilidade de tal evento é muito pequena, em qualquer caso abaixo do nível aceitável. Assim, a hipótese é rejeitada por contradizer os dados observados. No nosso caso, a hipótese de expectativa está fora do intervalo de confiança (o valor testado de 90 não está incluído no intervalo de 100±7,5), portanto deve ser rejeitada. Respondendo à pergunta primitiva acima, deve-se dizer: não, não pode, de qualquer forma, isso acontece muito raramente. Muitas vezes, isso indica uma probabilidade específica de rejeição errônea da hipótese (p-level), e não um determinado nível, segundo o qual o intervalo de confiança foi construído, mas mais sobre isso em outro momento.

Como você pode ver, não é difícil construir um intervalo de confiança para a média (ou expectativa matemática). O principal é pegar a essência, e então as coisas vão. Na prática, a maioria usa o intervalo de confiança de 95%, que é cerca de dois erros padrão de cada lado da média.

É tudo por agora. Tudo de bom!

Instrução

Observe que intervalo(l1 ou l2), cuja região central será a estimativa l*, e também na qual o valor verdadeiro do parâmetro provavelmente estará contido, será apenas a confiança intervalo ohm ou o valor correspondente do nível de confiança alfa. Nesse caso, l* se referirá a estimativas pontuais. Por exemplo, com base nos resultados de qualquer valor amostral de um valor aleatório X (x1, x2,..., xn), é necessário calcular um parâmetro indicador desconhecido l, do qual a distribuição dependerá. Nesse caso, obter uma estimativa de um determinado parâmetro l* significará que para cada amostra será necessário colocar um determinado valor do parâmetro em linha, ou seja, criar uma função dos resultados da observação do indicador Q, cujo valor será tomado igual ao valor estimado do parâmetro l* na forma de uma fórmula: l*=Q*(x1, x2,..., xn).

Observe que qualquer função nos resultados de uma observação é chamada de estatística. Além disso, se descreve completamente o parâmetro (fenômeno) em consideração, é chamado de estatística suficiente. E como os resultados das observações são aleatórios, então l * também será uma variável aleatória. A tarefa de cálculo das estatísticas deve ser realizada levando em consideração os critérios de sua qualidade. Aqui é necessário levar em conta que a lei de distribuição da estimativa é bem definida, a distribuição da densidade de probabilidade W(x, l).

Você pode calcular a confiança intervalo bastante fácil se você conhece a lei sobre a distribuição de avaliação. Por exemplo, confie intervalo estimativas em relação à expectativa matemática (valor médio de um valor aleatório) mx* =(1/n)*(x1+x2+ …+xn) . Essa estimativa será imparcial, ou seja, a expectativa matemática ou valor médio do indicador será igual ao valor real do parâmetro (M(mx*) = mx).

Você pode estabelecer que a variância da estimativa por expectativa matemática é: bx*^2=Dx/n. Com base no teorema central do limite, podemos tirar a conclusão correspondente de que a lei de distribuição desta estimativa é gaussiana (normal). Portanto, para cálculos, você pode usar o indicador Ф (z) - a integral das probabilidades. Neste caso, escolha o comprimento da confiança intervalo e 2ld, então você obtém: alfa \u003d P (mx-ld (usando a propriedade da integral de probabilidade de acordo com a fórmula: Ф (-z) \u003d 1- Ф (z)).

Ganhar confiança intervalo estimativas da expectativa matemática: - encontre o valor da fórmula (alfa + 1) / 2; - selecione o valor igual a ld / sqrt (Dx / n) da tabela de probabilidade integral; - obtenha a estimativa da variância verdadeira: Dx * = (1 / n) * ( (x1 - mx*)^2+(x2 - mx*)^2+…+(xn - mx*)^2); intervalo de acordo com a fórmula: (mx*-ld, mx*+ld).

Em estatística, existem dois tipos de estimativas: pontuais e intervalares. Estimativa de pontosé uma estatística de amostra única que é usada para estimar um parâmetro populacional. Por exemplo, a média amostral é uma estimativa pontual da média populacional e a variância da amostra S2- estimativa pontual da variância populacional σ2. mostrou-se que a média amostral é uma estimativa imparcial da expectativa da população. A média amostral é chamada de imparcial porque a média de todas as médias amostrais (com o mesmo tamanho de amostra n) é igual à expectativa matemática da população em geral.

Para a variação da amostra S2 tornou-se um estimador imparcial da variância populacional σ2, o denominador da variância da amostra deve ser igual a n – 1 , mas não n. Em outras palavras, a variância da população é a média de todas as variâncias amostrais possíveis.

Ao estimar os parâmetros da população, deve-se ter em mente que as estatísticas da amostra, como , dependem de amostras específicas. Para ter em conta este facto, para obter estimativa de intervalo a expectativa matemática da população geral analisa a distribuição das médias amostrais (para mais detalhes, ver). O intervalo construído é caracterizado por um certo nível de confiança, que é a probabilidade de que o verdadeiro parâmetro da população geral seja estimado corretamente. Intervalos de confiança semelhantes podem ser usados para estimar a proporção de um recurso R e a principal massa distribuída da população em geral.

Baixar nota em ou formato, exemplos em formato

Construção de um intervalo de confiança para a expectativa matemática da população geral com desvio padrão conhecido

Construindo um intervalo de confiança para a proporção de uma característica na população geral

Nesta seção, o conceito de intervalo de confiança é estendido para dados categóricos. Isso permite estimar a participação da característica na população geral R com uma parte da amostra RS= X/n. Como mencionado, se os valores nR e n(1 - p) exceder o número 5, a distribuição binomial pode ser aproximada pela normal. Portanto, para estimar a participação de uma característica na população geral Ré possível construir um intervalo cujo nível de confiança é igual a (1 - α)x100%.

Onde pS- parcela da amostra do recurso, igual a X/n, ou seja o número de sucessos dividido pelo tamanho da amostra, R- a participação da característica na população em geral, Zé o valor crítico da distribuição normal padronizada, n- tamanho da amostra.

Exemplo 3 Vamos supor que uma amostra seja extraída do sistema de informação, composta por 100 faturas preenchidas durante o último mês. Digamos que 10 dessas faturas estejam incorretas. Por isso, R= 10/100 = 0,1. O nível de confiança de 95% corresponde ao valor crítico Z = 1,96.

Assim, há 95% de chance de que entre 4,12% e 15,88% das faturas contenham erros.

Para um determinado tamanho de amostra, o intervalo de confiança contendo a proporção do traço na população geral parece ser mais amplo do que para uma variável aleatória contínua. Isso ocorre porque as medições de uma variável aleatória contínua contêm mais informações do que as medições de dados categóricos. Em outras palavras, dados categóricos que levam apenas dois valores contêm informações insuficientes para estimar os parâmetros de sua distribuição.

NOcálculo de estimativas extraídas de uma população finita

Estimação da expectativa matemática. Fator de correção para a população final ( fpc) foi usado para reduzir o erro padrão por um fator de . Ao calcular intervalos de confiança para estimativas de parâmetros populacionais, um fator de correção é aplicado em situações em que as amostras são retiradas sem reposição. Assim, o intervalo de confiança para a expectativa matemática, tendo um nível de confiança igual a (1 - α)x100%, é calculado pela fórmula:

Exemplo 4 Para ilustrar a aplicação de um fator de correção para uma população finita, voltemos ao problema de calcular o intervalo de confiança para a quantidade média de faturas discutidas no Exemplo 3 acima. Suponha que uma empresa emita 5.000 faturas por mês e X̅= 110,27 USD, S= $ 28,95 N = 5000, n = 100, α = 0,05, t99 = 1,9842. Pela fórmula (6) obtemos:

Estimativa da participação do recurso. Ao escolher sem retorno, o intervalo de confiança para a proporção do recurso que tem um nível de confiança igual a (1 - α)x100%, é calculado pela fórmula:

Intervalos de confiança e questões éticas

Ao fazer a amostragem de uma população e formular inferências estatísticas, muitas vezes surgem problemas éticos. A principal é como os intervalos de confiança e as estimativas pontuais das estatísticas amostrais concordam. A publicação de estimativas pontuais sem especificar os intervalos de confiança apropriados (geralmente em níveis de confiança de 95%) e o tamanho da amostra da qual são derivadas pode ser enganosa. Isso pode dar ao usuário a impressão de que uma estimativa pontual é exatamente o que ele precisa para prever as propriedades de toda a população. Assim, é necessário entender que em qualquer pesquisa, não pontuais, mas as estimativas de intervalo devem ser colocadas em primeiro plano. Além disso, atenção especial deve ser dada à escolha correta dos tamanhos das amostras.

Na maioria das vezes, os objetos das manipulações estatísticas são os resultados de pesquisas sociológicas da população sobre várias questões políticas. Ao mesmo tempo, os resultados da pesquisa são colocados nas primeiras páginas dos jornais, e o erro de amostragem e a metodologia de análise estatística são impressos em algum lugar no meio. Para comprovar a validade das estimativas pontuais obtidas, é necessário indicar o tamanho da amostra com base na qual foram obtidas, os limites do intervalo de confiança e seu nível de significância.

Próxima nota

São utilizados materiais do livro Levin et al., Estatísticas para gestores. - M.: Williams, 2004. - p. 448–462

Teorema do limite central afirma que, dado um tamanho amostral suficientemente grande, a distribuição amostral das médias pode ser aproximada por uma distribuição normal. Esta propriedade não depende do tipo de distribuição populacional.

Intervalo de confiança(IC; em inglês, intervalo de confiança - IC) obtido no estudo na amostra fornece uma medida da precisão (ou incerteza) dos resultados do estudo, a fim de tirar conclusões sobre a população de todos esses pacientes (população geral ). A definição correta de IC 95% pode ser formulada da seguinte forma: 95% desses intervalos conterão o valor verdadeiro na população. Essa interpretação é um pouco menos precisa: CI é o intervalo de valores dentro do qual você pode ter 95% de certeza de que contém o valor verdadeiro. Ao usar o IC, a ênfase está na determinação do efeito quantitativo, em oposição ao valor P, que é obtido como resultado do teste de significância estatística. O valor P não avalia nenhum valor, mas serve como medida da força da evidência contra a hipótese nula de "sem efeito". O valor de P por si só não nos diz nada sobre a magnitude da diferença, ou mesmo sobre sua direção. Portanto, valores independentes de P são absolutamente não informativos em artigos ou resumos. Em contraste, o IC indica tanto a quantidade de efeito de interesse imediato, como a utilidade de um tratamento, quanto a força da evidência. Portanto, a DI está diretamente relacionada à prática do DM.

A abordagem de estimativa para análise estatística, ilustrada por CI, visa medir a magnitude do efeito de interesse (sensibilidade do teste diagnóstico, incidência prevista, redução de risco relativo com tratamento, etc.), bem como a medição da incerteza em que efeito. Na maioria das vezes, o IC é o intervalo de valores em ambos os lados da estimativa em que o valor verdadeiro provavelmente se encontra, e você pode ter 95% de certeza disso. A convenção para usar a probabilidade de 95% é arbitrária, assim como o valor de P<0,05 для оценки статистической значимости, и авторы иногда используют 90% или 99% ДИ. Заметим, что слово «интервал» означает диапазон величин и поэтому стоит в единственном числе. Две величины, которые ограничивают интервал, называются «доверительными пределами».

O IC baseia-se na ideia de que o mesmo estudo realizado em diferentes conjuntos de pacientes não produziria resultados idênticos, mas que seus resultados seriam distribuídos em torno do valor verdadeiro, mas desconhecido. Em outras palavras, o IC descreve isso como "variabilidade dependente da amostra". O IC não reflete incerteza adicional devido a outras causas; em particular, não inclui o impacto da perda seletiva de pacientes no rastreamento, baixa adesão ou medição imprecisa do resultado, falta de cegamento, etc. CI, portanto, sempre subestima a quantidade total de incerteza.

Cálculo do intervalo de confiança

Tabela A1.1. Erros padrão e intervalos de confiança para algumas medidas clínicas

Normalmente, o IC é calculado a partir de uma estimativa observada de uma medida quantitativa, como a diferença (d) entre duas proporções e o erro padrão (SE) na estimativa dessa diferença. O IC aproximado de 95% assim obtido é d ± 1,96 SE. A fórmula muda de acordo com a natureza da medida de resultado e a cobertura do IC. Por exemplo, em um estudo randomizado controlado por placebo da vacina acelular contra coqueluche, a coqueluche se desenvolveu em 72 de 1.670 (4,3%) bebês que receberam a vacina e 240 de 1.665 (14,4%) no grupo controle. A diferença percentual, conhecida como redução do risco absoluto, é de 10,1%. O SE dessa diferença é de 0,99%. Assim, o IC de 95% é 10,1% + 1,96 x 0,99%, ou seja de 8,2 a 12,0.

Apesar de diferentes abordagens filosóficas, ICs e testes de significância estatística estão intimamente relacionados matematicamente.

Assim, o valor de P é “significativo”, ou seja, R<0,05 соответствует 95% ДИ, который исключает величину эффекта, указывающую на отсутствие различия. Например, для различия между двумя средними пропорциями это ноль, а для относительного риска или отношения шансов - единица. При некоторых обстоятельствах эти два подхода могут быть не совсем эквивалентны. Преобладающая точка зрения: оценка с помощью ДИ - предпочтительный подход к суммированию результатов исследования, но ДИ и величина Р взаимодополняющи, и во многих статьях используются оба способа представления результатов.

A incerteza (imprecisão) da estimativa, expressa em CI, está amplamente relacionada à raiz quadrada do tamanho da amostra. Amostras pequenas fornecem menos informações do que amostras grandes, e os ICs são correspondentemente mais amplos em amostras menores. Por exemplo, um artigo comparando o desempenho de três testes usados para diagnosticar a infecção por Helicobacter pylori relatou uma sensibilidade do teste respiratório com ureia de 95,8% (IC 95% 75-100). Embora o número de 95,8% pareça impressionante, o pequeno tamanho da amostra de 24 pacientes adultos de H. pylori significa que há uma incerteza significativa nessa estimativa, conforme indicado pelo amplo IC. De fato, o limite inferior de 75% é muito inferior à estimativa de 95,8%. Se a mesma sensibilidade fosse observada em uma amostra de 240 pessoas, então o IC 95% seria 92,5-98,0, dando mais garantia de que o teste é altamente sensível.

Em ensaios clínicos randomizados (ECRs), resultados não significativos (ou seja, aqueles com P > 0,05) são particularmente suscetíveis a interpretações errôneas. O IC é particularmente útil aqui, pois indica a compatibilidade dos resultados com o efeito verdadeiro clinicamente útil. Por exemplo, em um RCT comparando sutura versus anastomose com grampo no cólon, infecção da ferida desenvolvida em 10,9% e 13,5% dos pacientes, respectivamente (P = 0,30). O IC de 95% para essa diferença é de 2,6% (-2 a +8). Mesmo neste estudo, que incluiu 652 pacientes, ainda é provável que haja uma diferença modesta na incidência de infecções resultantes dos dois procedimentos. Quanto menor o estudo, maior a incerteza. Sung et ai. realizaram um ECR comparando a infusão de octreotida com escleroterapia de emergência para sangramento agudo de varizes em 100 pacientes. No grupo octreotide, a taxa de parada de sangramento foi de 84%; no grupo escleroterapia - 90%, o que dá P = 0,56. Observe que as taxas de sangramento contínuo são semelhantes às de infecção da ferida no estudo mencionado. Neste caso, entretanto, o IC de 95% para diferença nas intervenções é de 6% (-7 a +19). Essa faixa é bastante ampla em comparação com uma diferença de 5% que seria de interesse clínico. É claro que o estudo não descarta uma diferença significativa na eficácia. Portanto, a conclusão dos autores "a infusão de octreotide e a escleroterapia são igualmente eficazes no tratamento de sangramento por varizes" definitivamente não é válida. Em casos como este, onde o IC de 95% para redução de risco absoluto (ARR) inclui zero, como aqui, o IC para NNT (número necessário para tratar) é bastante difícil de interpretar. . O NLP e seu CI são obtidos dos recíprocos do ACP (multiplicando-os por 100 se esses valores forem dados em porcentagem). Aqui temos NPP = 100: 6 = 16,6 com um IC de 95% de -14,3 a 5,3. Como pode ser visto na nota de rodapé "d" na Tabela. A1.1, este CI inclui valores para NTPP de 5,3 a infinito e NTLP de 14,3 a infinito.

Os ICs podem ser construídos para as estimativas ou comparações estatísticas mais comumente usadas. Para RCTs, inclui a diferença entre proporções médias, riscos relativos, odds ratios e NRRs. Da mesma forma, os ICs podem ser obtidos para todas as principais estimativas feitas em estudos de acurácia do teste diagnóstico - sensibilidade, especificidade, valor preditivo positivo (todos os quais são proporções simples) e razões de verossimilhança - estimativas obtidas em meta-análises e comparação com controle estudos. Um programa de computador pessoal que abrange muitos desses usos de DI está disponível com a segunda edição do Statistics with Confidence. Macros para cálculo de IC para proporções estão disponíveis gratuitamente para Excel e os programas estatísticos SPSS e Minitab em http://www.uwcm.ac.uk/study/medicine/epidemiology_statistics/research/statistics/proportions, htm.

Várias avaliações do efeito do tratamento

Embora a construção de ICs seja desejável para os resultados primários do estudo, eles não são necessários para todos os resultados. O IC diz respeito a comparações clinicamente importantes. Por exemplo, ao comparar dois grupos, o IC correto é aquele construído para a diferença entre os grupos, conforme mostrado nos exemplos acima, e não o IC que pode ser construído para a estimativa em cada grupo. Não só é inútil fornecer ICs separados para as pontuações em cada grupo, como esta apresentação pode ser enganosa. Da mesma forma, a abordagem correta ao comparar a eficácia do tratamento em diferentes subgrupos é comparar dois (ou mais) subgrupos diretamente. É incorreto supor que o tratamento seja eficaz apenas em um subgrupo se seu IC excluir o valor correspondente a nenhum efeito, enquanto outros não. Os ICs também são úteis ao comparar resultados em vários subgrupos. Na fig. A1.1 mostra o risco relativo de eclâmpsia em mulheres com pré-eclâmpsia em subgrupos de mulheres de um ECR de sulfato de magnésio controlado por placebo.

Arroz. A1.2. O Forest Graph mostra os resultados de 11 ensaios clínicos randomizados da vacina contra o rotavírus bovino para a prevenção da diarreia versus placebo. O intervalo de confiança de 95% foi usado para estimar o risco relativo de diarreia. O tamanho do quadrado preto é proporcional à quantidade de informação. Além disso, uma estimativa resumida da eficácia do tratamento e um intervalo de confiança de 95% (indicado por um diamante) são mostrados. A metanálise utilizou um modelo de efeitos aleatórios que supera alguns pré-estabelecidos; por exemplo, pode ser o tamanho usado no cálculo do tamanho da amostra. Sob um critério mais rigoroso, toda a gama de ICs deve apresentar um benefício que exceda um mínimo predeterminado.

Já discutimos a falácia de tomar a ausência de significância estatística como uma indicação de que dois tratamentos são igualmente eficazes. É igualmente importante não equiparar significância estatística com significância clínica. A importância clínica pode ser assumida quando o resultado é estatisticamente significativo e a magnitude da resposta ao tratamento

Estudos podem mostrar se os resultados são estatisticamente significativos e quais são clinicamente importantes e quais não são. Na fig. A1.2 mostra os resultados de quatro ensaios para os quais todo o IC<1, т.е. их результаты статистически значимы при Р <0,05 , . После высказанного предположения о том, что клинически важным различием было бы сокращение риска диареи на 20% (ОР = 0,8), все эти испытания показали клинически значимую оценку сокращения риска, и лишь в исследовании Treanor весь 95% ДИ меньше этой величины. Два других РКИ показали клинически важные результаты, которые не были статистически значимыми. Обратите внимание, что в трёх испытаниях точечные оценки эффективности лечения были почти идентичны, но ширина ДИ различалась (отражает размер выборки). Таким образом, по отдельности доказательная сила этих РКИ различна.

Com este artigo você aprenderá:

O que intervalo de confiança?

Qual é o ponto regras 3 sigma?

Como esse conhecimento pode ser colocado em prática?

Atualmente, devido a uma superabundância de informações associadas a um grande sortimento de produtos, direções de vendas, funcionários, atividades, etc., é difícil escolher o principal, que, antes de tudo, vale a pena prestar atenção e fazer esforços para gerenciar. Definição intervalo de confiança e análise de ir além de seus limites de valores reais - uma técnica que ajudá-lo a identificar situações, influenciando tendências. Você será capaz de desenvolver fatores positivos e reduzir a influência dos negativos. Esta tecnologia é usada em muitas empresas mundialmente conhecidas.

Existem os chamados alertas", que informar os gerentes afirmando que o próximo valor em uma determinada direção foi além intervalo de confiança. O que isto significa? Este é um sinal de que ocorreu algum evento fora do padrão, que pode alterar a tendência existente nessa direção. Este é o sinal para isso para resolver isso na situação e entender o que a influenciou.

Por exemplo, considere várias situações. Calculamos a previsão de vendas com limites de previsão para 100 itens de commodities para 2011 por meses e vendas reais em março:

Para "óleo de girassol" eles ultrapassaram o limite superior da previsão e não caíram no intervalo de confiança.
Para "fermento seco" ultrapassou o limite inferior da previsão.
Em "Oatmeal Mingau" rompeu o limite superior.

Para o restante das mercadorias, as vendas reais estavam dentro dos limites de previsão especificados. Aqueles. suas vendas estavam de acordo com as expectativas. Assim, identificamos 3 produtos que iam além das fronteiras e começamos a descobrir o que influenciou a ir além das fronteiras:

Com o Óleo de Girassol, entramos em uma nova rede de comercialização, o que nos proporcionou um volume de vendas adicional, o que nos levou a ultrapassar o limite superior. Para este produto, vale recalcular a previsão até o final do ano, levando em consideração a previsão de vendas para essa rede.
Para o Dry Yeast, o carro ficou preso na alfândega, e houve desabastecimento em 5 dias, o que afetou a queda nas vendas e ultrapassando a fronteira inferior. Pode valer a pena descobrir o que causou isso e tentar não repetir essa situação.
Para o Oatmeal, foi lançada uma promoção de vendas, que resultou num aumento significativo das vendas e levou a uma ultrapassagem da previsão.

Identificamos 3 fatores que influenciaram o overshoot da previsão. Pode haver muito mais deles na vida.Para melhorar a precisão da previsão e do planejamento, os fatores que levam ao fato de que as vendas reais podem ir além do previsto, vale destacar e construir previsões e planos para eles separadamente. E então leve em consideração o impacto deles na principal previsão de vendas. Você também pode avaliar regularmente o impacto desses fatores e mudar a situação para melhor para reduzindo a influência de fatores negativos e aumentando a influência de fatores positivos.

Com um intervalo de confiança, podemos:

Destaque destinos, que merecem atenção, pois eventos ocorreram nestas áreas que podem afetar mudança de tendência.
Determinar Fatores que realmente fazem a diferença.
Aceitar decisão ponderada(por exemplo, sobre compras, durante o planejamento, etc.).

Agora vamos ver o que é um intervalo de confiança e como calculá-lo no Excel usando um exemplo.

O que é um intervalo de confiança?

O intervalo de confiança são os limites de previsão (superior e inferior), dentro dos quais com uma dada probabilidade (sigma) obter os valores reais.

Aqueles. calculamos a previsão - esta é a nossa principal referência, mas entendemos que os valores reais dificilmente serão 100% iguais à nossa previsão. E surge a pergunta até que ponto pode obter valores reais, se a tendência atual continuar? E esta pergunta nos ajudará a responder cálculo do intervalo de confiança, ou seja - limites superior e inferior da previsão.

O que é um determinado sigma de probabilidade?

Ao calcular intervalo de confiança podemos definir probabilidade exitos valores reais dentro dos limites de previsão fornecidos. Como fazer isso? Para fazer isso, definimos o valor de sigma e, se sigma for igual a:

3 sigma- então, a probabilidade de acertar o próximo valor real no intervalo de confiança será de 99,7%, ou 300 para 1, ou há uma probabilidade de 0,3% de ultrapassar os limites.

2 sigma- então, a probabilidade de atingir o próximo valor dentro dos limites é ≈ 95,5%, ou seja as chances são de cerca de 20 para 1, ou há uma chance de 4,5% de sair dos limites.

1 sigma- então, a probabilidade é ≈ 68,3%, ou seja. as chances são de cerca de 2 para 1, ou há uma chance de 31,7% de que o próximo valor fique fora do intervalo de confiança.

Nós formulamos Regra 3 Sigma,que diz que probabilidade de acerto outro valor aleatório no intervalo de confiança com um determinado valor três sigma é 99,7%.

O grande matemático russo Chebyshev provou um teorema de que há 10% de chance de ultrapassar os limites de uma previsão com um determinado valor de três sigma. Aqueles. a probabilidade de cair no intervalo de confiança de 3 sigma será de pelo menos 90%, enquanto uma tentativa de calcular a previsão e seus limites “a olho” está repleta de erros muito mais significativos.

Como calcular independentemente o intervalo de confiança no Excel?

Vamos considerar o cálculo do intervalo de confiança no Excel (ou seja, os limites superior e inferior da previsão) usando um exemplo. Temos uma série temporal - vendas por meses durante 5 anos. Veja o arquivo anexado.

Para calcular os limites da previsão, calculamos:

Previsão de vendas().
Sigma - desvio padrão modelos de previsão a partir de valores reais.
Três Sigma.
Intervalo de confiança.

1. Previsão de vendas.

=(RC[-14] (dados em séries temporais)-RC[-1] (valor do modelo))^2(quadrado)

3. Soma para cada mês os valores de desvio do estágio 8 Sum((Xi-Ximod)^2), ou seja, Vamos somar janeiro, fevereiro... para cada ano.

Para fazer isso, use a fórmula =SUMIF()

SUMIF(array com números de períodos dentro do ciclo (para meses de 1 a 12); referência ao número do período no ciclo; referência a um array com quadrados da diferença entre os dados iniciais e os valores do períodos)

4. Calcule o desvio padrão para cada período no ciclo de 1 a 12 (estágio 10 no arquivo anexo).

Para fazer isso, do valor calculado no estágio 9, extraímos a raiz e dividimos pelo número de períodos neste ciclo menos 1 = ROOT((Sum(Xi-Ximod)^2/(n-1))

Vamos usar fórmulas no Excel =ROOT(R8 (referência a (Soma(Xi-Ximod)^2)/(CONT.SE($O$8:$O$67 (referência a um array com números de ciclo); O8 (referência a um número de ciclo específico, que consideramos no array))-1))

Usando a fórmula do Excel = CONT.SE contamos o número n

Ao calcular o desvio padrão dos dados reais do modelo de previsão, obtivemos o valor sigma para cada mês - estágio 10 no arquivo anexo .

3. Calcule 3 sigma.

No estágio 11, definimos o número de sigmas - em nosso exemplo, "3" (estágio 11 no arquivo anexo):

Também valores sigma práticos:

1,64 sigma - 10% de chance de ultrapassar o limite (1 chance em 10);

1,96 sigma - 5% de chance de sair dos limites (1 chance em 20);

2,6 sigma - 1% de chance de sair dos limites (1 em 100 chances).

5) Calculamos três sigma, para isso multiplicamos os valores "sigma" de cada mês por "3".

3. Determine o intervalo de confiança.

Limite superior de previsão- previsão de vendas considerando crescimento e sazonalidade + (mais) 3 sigma;
Limite de previsão inferior- previsão de vendas considerando crescimento e sazonalidade - (menos) 3 sigma;

Para a conveniência de calcular o intervalo de confiança por um longo período (ver arquivo anexo), usamos a fórmula do Excel =Y8+PROCV(W8;$U$8:$V$19;2;0), Onde

Y8- previsão de vendas;

W8- o número do mês para o qual tomaremos o valor de 3 sigma;

Aqueles. Limite superior de previsão= "previsão de vendas" + "3 sigma" (no exemplo, PROCV(número do mês; tabela com valores 3 sigma; coluna da qual extraímos o valor sigma igual ao número do mês na linha correspondente; 0)).

Limite de previsão inferior= "previsão de vendas" menos "3 sigma".

Assim, calculamos o intervalo de confiança no Excel.

Agora temos uma previsão e um intervalo com limites dentro dos quais os valores reais cairão com um determinado sigma de probabilidade.

Neste artigo, vimos o que são sigma e a regra de três sigma, como determinar um intervalo de confiança e para que você pode usar essa técnica na prática.

Previsões precisas e sucesso para você!

Quão O Forecast4AC PRO pode ajudá-loao calcular o intervalo de confiança?:

O Forecast4AC PRO calculará automaticamente os limites de previsão superiores ou inferiores para mais de 1000 séries temporais ao mesmo tempo;

A capacidade de analisar os limites da previsão em comparação com a previsão, tendência e vendas reais no gráfico com um toque de tecla;

No programa Forcast4AC PRO, é possível definir o valor sigma de 1 a 3.

Junte-se a nós!

Baixe aplicativos gratuitos de previsão e inteligência de negócios:

Novo Previsão Lite- automático cálculo de previsão dentro sobressair.
4analítica- Análise ABC-XYZ e análise de emissões em Excel.
Qlik SenseÁrea de Trabalho e QlikViewPersonal Edition - Sistemas de BI para análise e visualização de dados.

Teste os recursos das soluções pagas:

Novo Previsão PRO- previsão em Excel para grandes matrizes de dados.

Portal para o aluno. Autotreinamento