Tamanho da amostra como encontrar a fórmula. Tamanho da amostra - método seletivo de pesquisa sociológica

A estatística sabe tudo. E Ilf e E. Petrov, "12 cadeiras"

Imagine que você está construindo um grande shopping center e deseja avaliar o fluxo de tráfego da entrada do estacionamento. Não, vamos dar outro exemplo... eles nunca vão fazer isso de qualquer maneira. Você precisa avaliar as preferências de gosto dos visitantes do seu portal, para o qual você precisa realizar uma pesquisa entre eles. Como vincular a quantidade de dados e o possível erro? Nada complicado - quanto maior sua amostra, menor o erro. No entanto, existem nuances aqui também.

Mínimo teórico

Não será supérfluo refrescar nossa memória, esses termos nos serão úteis mais tarde.

  • população- O conjunto de todos os objetos entre os quais a pesquisa está sendo realizada.
  • Amostra– Um subconjunto, uma parte de objetos de toda a população que está diretamente envolvida no estudo.
  • Erro tipo I- (α) Probabilidade de rejeitar a hipótese nula enquanto ela for verdadeira.
  • Erro tipo II- (β) Probabilidade não rejeitar a hipótese nula quando ela for falsa.
  • 1-β- Poder estatístico do critério.
  • μ 0 e µ 1- Valores médios sob as hipóteses nula e alternativa.


Já nas próprias definições de erro do primeiro e do segundo tipo há espaço para debate e interpretação. Como decidir sobre eles e qual escolher como zero? Se você estiver examinando o nível de poluição do solo ou da água, como você formularia a hipótese nula: a poluição está presente ou não? Mas a partir disso o tamanho da amostra depende da população geral de objetos.



Inicial população, assim como amostra pode ter qualquer distribuição, mas a média tem normal ou distribuição gaussiana graças ao Teorema do Limite Central.


Em relação aos parâmetros de distribuição e à média em particular, vários tipos de inferências são possíveis. Primeiro do qual é chamado intervalo de confiança. Indica o intervalo de valores possíveis para o parâmetro, com o especificado fator de confiança. Então, por exemplo, 100(1-α)% intervalo de confiança por μ será assim (Lv. 1).




Segundo da inferência testando hipóteses. Pode ser algo assim.

  • H 0: μ = h
  • H 1: µ > h
  • H2: µ< h

A PARTIR DE intervalo de confiança 100(1-α) para μ você pode fazer uma escolha em favor de H 1 e H 2:

  • Se o limite inferior intervalo de confiança 100(1-α)< h , то тогда rejeitar H 0 a favor de H 2 .
  • Se o limite superior intervalo de confiança 100(1-α) > h, então rejeitar H 0 a favor de H 1 .
  • Se um intervalo de confiança 100(1-α) inclui h, então não podemos rejeitar H 0 e tal resultado é considerado indeterminado.

Se precisarmos verificar o valor μ para um amostras da população total, então o critério terá a forma



Intervalo de confiança, erro e tamanho da amostra

Pegue a primeira equação e expresse a largura a partir daí intervalo de confiança(Nível 2).



Em alguns casos, podemos substituir a estatística t de Student pela distribuição normal padrão z. Outra simplificação substitui metade W no erro de medição E. Então nossa equação terá a forma (Eq. 3).



Como vemos o erro realmente diminui junto com o crescimento do número de dados de entrada. De onde é fácil derivar o que você está procurando (Eq. 4).


Pratique - conte com R

Vamos testar a hipótese de que o valor médio da amostra dada do número de insetos na armadilha é 1.

  • H 0: μ = 1
  • H1: µ > 1
Insetos 0 1 2 3 4 5 6
Armadilhas 10 9 5 5 1 2 1

> x<- read.table("/tmp/tcounts.txt") >y = unlist(x, use.names="false") > mean(z);sd(z) 1,636364 1,654883

Observe que a média e o desvio padrão são quase iguais, o que é natural para uma distribuição de Poisson. Intervalo de confiança de 95% para a estatística t de Student e df=32 .


> qt(.975, 32) 2.036933

e finalmente obtemos o intervalo crítico para a média: 1.05 - 2.22 .


> µ=média(z) > st = qt(.975, 32) > µ + st * sd(z)/sqrt(33) 2,223159 > µ - st * sd(z)/sqrt(33) 1,049568

Como resultado, H 0 deve ser rejeitado e H 1 aceito, pois com uma probabilidade de 95%, μ > 1.


No mesmo exemplo, supondo que conhecemos o desvio padrão real - σ , e não sua estimativa obtida usando uma amostra aleatória, você pode calcular o n necessário para um determinado erro. Vamos calcular para E=0,5 .


> za2 = qnorm(.975) > (za2*sd(z)/.5)^2 42,08144

correção de vento

Na verdade, não há razão para acreditar que saberemos σ (variação), enquanto μ (média) ainda temos que estimar. Por causa disso, a equação 4 é de pouco uso prático, exceto para exemplos particularmente refinados do campo da combinatória, e a equação realista para n é um pouco mais complicada para desconhecidos. σ (Nível 5).



Observe que σ na última equação, não com um cap (^), mas com um til (~). Isso é uma consequência do fato de que no início não temos sequer um desvio padrão estimado de uma amostra aleatória - e, em vez disso, usamos planejado- . Onde obtemos as últimas? Podemos dizer isso do teto: julgamento de especialistas, estimativas aproximadas, experiência passada, etc.


E o segundo termo do lado direito da 5ª equação, de onde veio? Como , a correção de Günther é necessária.


Além das equações 4 e 5, existem várias outras fórmulas avaliativas aproximadas, mas essa já merece um post à parte.

A fórmula abaixo para calcular tamanho da amostraé usado nos casos em que os respondentes (respondentes) recebem apenas uma pergunta, para a qual há apenas duas respostas possíveis. Por exemplo, "Sim" e "Não"; "eu uso" e "eu não uso". Obviamente, essa fórmula pode ser aplicada apenas ao realizar os estudos mais simples. Se você precisar determinar o tamanho da amostra ao realizar estudos maiores, como questionários, outras fórmulas devem ser usadas.

Uma fórmula simples para calcular o tamanho da amostra

Onde: n– tamanho da amostra;

zé o desvio normalizado determinado com base no nível de confiança selecionado. Este indicador caracteriza a possibilidade, a probabilidade de obter respostas em um intervalo de confiança especial. Na prática, o nível de confiança é muitas vezes considerado como 95% ou 99%. Então os valores de z serão 1,96 e 2,58, respectivamente;

p– variação para a amostra, em ações. Em essência, p é a probabilidade de os respondentes escolherem uma ou outra opção de resposta. Suponha que se acreditarmos que um quarto dos respondentes escolherá a resposta “Sim”, então p será igual a 25%, ou seja, p = 0,25;

q= (1 – p);

e– erro admissível, em frações.

Exemplo de cálculo de tamanho de amostra

A empresa planeja realizar um estudo sociológico para identificar a proporção de fumantes na população da cidade. Para isso, os funcionários da empresa farão uma pergunta aos transeuntes: “Você fuma?”. Assim, há apenas duas respostas possíveis: "Sim" e "Não".

O tamanho da amostra neste caso é calculado da seguinte forma. O nível de confiança é considerado como 95%, então o desvio normalizado z = 1,96. Aceitamos a variação como 50%, ou seja, acreditamos condicionalmente que metade dos entrevistados pode responder à pergunta se fuma – “Sim”. Então p=0,5. A partir daqui encontramos q = 1 – p = 1 – 0,5 = 0,5 . O erro de amostragem aceitável é considerado como 10%, ou seja, e = 0,1.

Substituímos esses dados na fórmula e calculamos:

Obtendo o tamanho da amostra n = 96 pessoas.

Escopo desta fórmula

Ao realizar uma pesquisa simples, quando você precisa obter uma resposta para apenas uma pergunta simples. Nesse caso, a escala de respostas, via de regra, é de natureza dicotômica. Ou seja, são oferecidas (ou implícitas) respostas do tipo "Sim" - "Não", "Preto" - "Branco", etc.

Características desta fórmula para calcular o tamanho da amostra

Galyautdinov R.R.


© A cópia de material só é permitida se você especificar um hiperlink direto para

As populações são frequentemente mantidas entre grandes grupos de pessoas. Muitas vezes é errôneo pensar que a confiabilidade dos resultados será maior se as perguntas forem respondidas por todos os membros da sociedade. Devido aos enormes custos de tempo, dinheiro e mão de obra, esse exame é inaceitável. Com o aumento do número de respondentes, não só os custos aumentarão, mas também aumentará o risco de receber dados incorretos. Do ponto de vista prático, muitos questionários e codificadores reduzirão a probabilidade de controle confiável de suas ações. Tal levantamento é chamado de contínuo.

Na sociologia, um estudo descontínuo, ou um método seletivo, é mais frequentemente usado. Seus resultados podem ser estendidos a um grande conjunto de pessoas, que é chamado de geral.

Definição e significado do método de amostragem

O método de amostragem é uma forma quantitativa de selecionar uma parte das unidades estudadas da massa total, enquanto os resultados da pesquisa também se aplicam a cada indivíduo que não participou desta.

O método de amostragem é ao mesmo tempo objeto de pesquisa científica e uma disciplina acadêmica. Ele atua como um meio de obter informações confiáveis ​​sobre a população em geral e ajuda a avaliar todos os seus parâmetros. As condições de seleção das unidades afetam posteriormente a análise estatística dos resultados. Se os procedimentos de amostragem forem mal implementados, o uso mesmo dos métodos mais confiáveis ​​de processamento das informações coletadas será inútil.

Conceitos-chave da Teoria da Escolha

Chamam a relação de unidades, em relação à qual são formuladas as conclusões do estudo amostral. Podem ser residentes de um país, uma localidade específica, a equipe de trabalho de uma empresa, etc.

A amostra (ou amostra) faz parte do geral, que foi selecionada usando métodos e critérios especiais. Por exemplo, critérios estatísticos são levados em consideração no processo de formação.

O número de indivíduos incluídos em um determinado conjunto é chamado de seu volume. Mas pode ser expresso não apenas pelo número de pessoas, mas também por assembleias de voto, assentamentos, ou seja, unidades definitivamente grandes que incluem unidades de observação. Mas esta já é uma amostra de vários estágios.

A unidade de seleção são as partes constituintes da população geral, podendo ser unidades de observação direta (amostragem de estágio único) ou formações maiores.

Um papel importante na obtenção de resultados de pesquisa confiáveis ​​usando um método de amostragem é uma propriedade como a representatividade da seleção. Ou seja, a parcela da população geral que se tornou respondente deve reproduzir integralmente todas as suas características. Qualquer desvio é considerado um erro.

Etapas para aplicar o método de amostragem

Cada empírico consiste em etapas. Se o método de amostragem for aplicado, sua ordem será organizada da seguinte forma:

  1. Criação de uma amostra preliminar: a população geral é estabelecida, os procedimentos de seleção, os volumes são caracterizados.
  2. Implementação do projeto: no decorrer da coleta de informações sociológicas, os questionários realizam tarefas com indicação do método de seleção dos respondentes.
  3. Identificação e correção de erros de representatividade.

Tipos de amostras em sociologia

Após determinar a população geral, o pesquisador procede a procedimentos seletivos. Eles podem ser divididos em dois tipos (critérios):

  1. O papel das leis probabilísticas no curso da amostragem.
  2. O número de estágios de seleção.

Se o primeiro critério for aplicado, o método de amostragem aleatória e seleção não aleatória serão distinguidos. Com base neste último, pode-se argumentar que a amostra pode ser de estágio único e multiestágio.

Os tipos de amostras refletem diretamente não apenas nas etapas de preparação e condução do estudo, mas também em seus resultados. Antes de dar preferência a um deles, você deve entender o conteúdo dos conceitos.

A definição de "aleatório" no uso diário recebeu um significado completamente oposto ao da matemática. Essa seleção é realizada de acordo com regras rígidas, não sendo permitido nenhum desvio das mesmas, pois é importante garantir que cada unidade da população geral tenha as mesmas chances de ser incluída na amostra. Se essas condições não forem atendidas, essa probabilidade será diferente.

Por sua vez, a amostra aleatória é dividida em:

  • simples;
  • mecânico (sistemático);
  • aninhamento (serial, cluster);
  • estratificado (típico ou zonado).

Um método de amostragem simples é realizado usando uma tabela de números aleatórios. Inicialmente, é determinado o tamanho da amostra; é criada uma lista completa de respondentes numerados incluídos na população geral. Tabelas especiais contidas em publicações matemáticas e estatísticas são usadas para seleção. Quaisquer que não sejam eles são proibidos. Se o tamanho da amostra for um número de três dígitos, então o número de cada unidade amostral deve ser de três dígitos, ou seja, de 001 a 790. O último número indica o número total de pessoas. O estudo envolverá as pessoas que receberam um número no intervalo especificado, encontrado na tabela.

A seleção sistemática é baseada em cálculos. Uma lista alfabética de todos os elementos da população geral é compilada preliminarmente, o passo é definido e só então - o tamanho da amostra. A fórmula para uma etapa é a seguinte:

N: n, onde N é a população e n é a amostra.

Por exemplo, 150.000: 5.000 = 30. Assim, cada trigésima pessoa será selecionada para participar da pesquisa.

Entidade do tipo ninho

Uma amostra agrupada é usada quando a população de pessoas em estudo consiste em pequenos grupos naturais. Nesse caso, deve-se notar que o número da lista de tais ninhos é determinado na primeira etapa. Usando uma tabela de números aleatórios, uma seleção é feita e uma pesquisa contínua de todos os respondentes em cada ninho selecionado é realizada. Além disso, quanto mais deles participaram do estudo, menor o erro amostral médio. No entanto, é possível utilizar tal técnica desde que os ninhos estudados tenham uma característica semelhante.

A essência da escolha estratificada

Uma amostra estratificada diferencia-se das anteriores por, às vésperas da seleção, a população geral ser dividida em estratos, ou seja, partes homogêneas que possuem uma característica comum. Por exemplo, o nível de educação, as preferências eleitorais, o nível de satisfação com vários aspectos da vida. A opção mais simples é separar os sujeitos por sexo e idade. Em princípio, é necessário fazer a seleção de tal forma que de cada estrato se destaque um número de pessoas proporcional ao número total.

O tamanho da amostra neste caso pode ser menor do que em uma situação com seleção aleatória, mas a representatividade será maior. Deve-se reconhecer que a amostragem estratificada será a mais cara em termos financeiros e informacionais, e a amostragem aninhada será a mais benéfica nesse sentido.

Amostragem de cotas não aleatórias

Há também uma amostra de cota. É o único tipo de seleção não aleatória que tem justificativa matemática. A amostra de cotas é formada por unidades que devem ser representadas por proporções e correspondem à população geral. Nesta forma, a distribuição intencional de recursos é realizada. Se as opiniões e avaliações das pessoas estão entre as características estudadas, então o gênero, a idade e a educação dos entrevistados geralmente são cotas.

Em um estudo sociológico, também se distinguem dois métodos de seleção: repetidos e não repetidos. No primeiro caso, a unidade selecionada após a pesquisa é devolvida à população geral para continuar participando da seleção. Na segunda opção, os respondentes são ordenados, o que aumenta as chances dos demais membros da população serem selecionados.

O sociólogo G. A. Churchill desenvolveu a seguinte regra: o tamanho da amostra deve se esforçar para fornecer pelo menos 100 observações para o componente de classificação primária e 20-50 para o componente de classificação secundária. Deve-se ter em mente que alguns dos entrevistados incluídos na amostra, por diversos motivos, podem não participar da pesquisa ou recusá-la totalmente.

Métodos para determinar o tamanho da amostra

Na pesquisa sociológica, os seguintes métodos são aplicáveis:

1. Arbitrário, ou seja, o tamanho da amostra é determinado dentro de 5-10% da composição da população geral.

2. O método de cálculo tradicional baseia-se na realização de inquéritos regulares, por exemplo, uma vez por ano, abrangendo 600, 2.000 ou 2.500 inquiridos.

3. Estatística - é estabelecer a confiabilidade das informações. A estatística como ciência não se desenvolve isoladamente. Os sujeitos e áreas de sua pesquisa estão ativamente envolvidos em outros campos afins: técnico, econômico e humanitário. Assim, seus métodos são usados ​​na sociologia, na preparação de pesquisas e, em particular, na determinação do tamanho das amostras. A estatística como ciência tem uma extensa base metodológica.

4. Caro, em que se estabelece o valor permitido das despesas de pesquisa.

5. O tamanho da amostra pode ser igual ao número de unidades da população geral, então o estudo será contínuo. Esta abordagem é aplicável em pequenos grupos. Por exemplo, a força de trabalho, estudantes, etc.

Anteriormente, foi possível estabelecer que a amostra será considerada representativa quando suas características descreverem as propriedades da população geral com um erro mínimo.

A estimativa do tamanho da amostra precede os cálculos finais do número de unidades que serão selecionadas da população geral:

n = Npqt 2: N∆ 2 p + pqt 2 , em que N é o número de unidades da população geral, p é a proporção da característica em estudo (q = 1 - p), t é o coeficiente de correspondência de a probabilidade de confiança P (determinada a partir de uma tabela especial), ∆ p - erro permitido.

Esta é apenas uma variação de como o tamanho da amostra é calculado. A fórmula pode mudar dependendo das condições e dos critérios de estudo selecionados (por exemplo, reamostragem ou amostragem sem replicação).

Erros de amostragem

Os levantamentos sociológicos da população baseiam-se no uso de um dos tipos de amostragem que consideramos acima. No entanto, em qualquer caso, a tarefa de cada pesquisador deve ser avaliar o grau de precisão dos indicadores obtidos, ou seja, é necessário determinar o quanto eles refletem as características da população em geral.

Os erros de amostragem podem ser divididos em aleatórios e não aleatórios. O primeiro tipo implica o desvio do indicador amostral do geral, que pode ser expresso pela diferença de suas participações (média) e que é causado apenas por um tipo de pesquisa não contínua. E é bastante natural que este indicador diminua no contexto de um aumento do número de inquiridos.

Um erro sistemático é um desvio do indicador geral, encontrado também como resultado da subtração da amostra e das parcelas gerais e decorrente da inconsistência da metodologia de amostragem com as regras estabelecidas.

Esses tipos de erros estão incluídos no erro total de amostragem. Em um estudo, apenas uma amostra pode ser retirada da população. O cálculo do desvio máximo possível do indicador de amostra pode ser realizado usando uma fórmula especial. É chamado de erro amostral marginal. Existe também o erro médio de amostragem. Este é o desvio padrão da amostra da participação geral.

Há também um tipo de erro a posteriori (pós-experimental). Significa o desvio dos indicadores da amostra em relação à participação geral (média). É calculado comparando o indicador geral, cujas informações são provenientes de fontes confiáveis, e a amostra, que foi estabelecida durante a pesquisa. Os departamentos de pessoal das empresas, os órgãos estatais de estatística costumam atuar como fontes confiáveis ​​de informação.

Há também um erro a priori, que também é um desvio da amostra e dos indicadores gerais, que pode ser expresso como a diferença entre suas participações e pode ser calculado por meio de uma fórmula especial.

Na pesquisa educacional, os seguintes erros são cometidos com mais frequência ao selecionar os entrevistados para uma pesquisa:

1. Conjuntos amostrais de grupos pertencentes a diferentes populações gerais. Quando são usados, são desenvolvidas inferências estatísticas que se aplicam a toda a amostra. É bastante óbvio que isso não pode ser aceitável.

2. As capacidades organizacionais e financeiras do pesquisador não são levadas em consideração quando os tipos de amostras são considerados, sendo dada preferência a uma delas.

3. Os critérios estatísticos para a estrutura da população geral não são utilizados integralmente para evitar erros de amostragem.

4. Não são considerados os requisitos de representatividade da seleção dos respondentes no decorrer dos estudos comparativos.

5. As instruções para o entrevistador devem ser adaptadas ao tipo específico de seleção adotado.

A natureza da participação dos entrevistados no estudo pode ser aberta ou anônima. Isso deve ser levado em consideração na formação da amostra, pois, por discordar das condições, os participantes podem sair.

Ao projetar uma observação amostral, surge a questão do tamanho da amostra necessária. Este número pode ser determinado com base no erro admissível na amostragem, com base na probabilidade com base na qual pode ser garantida a magnitude do erro a determinar e, finalmente, com base no método de seleção.

As fórmulas para o tamanho de amostra necessário para vários métodos de amostragem podem ser derivadas das razões correspondentes usadas no cálculo dos erros marginais de amostragem. Aqui estão as expressões mais comumente usadas na prática para o tamanho de amostra necessário:

amostragem aleatória e mecânica adequada:

(reseleção)

(seleção não repetida)

amostra típica:

(reseleção)

(seleção não repetida)

amostragem em série:

(reseleção)

(seleção não repetida)

Nesse caso, dependendo dos objetivos do estudo, as variâncias e erros amostrais podem ser calculados para o valor médio ou proporção da característica.

Vamos considerar exemplos de determinação do tamanho de amostra necessário para vários métodos de formação de uma população amostral.

Exemplo 5 Em 100 agências de viagens da cidade, está prevista a realização de um levantamento do número médio mensal de vouchers vendidos pelo método de seleção mecânica. Qual deve ser o tamanho da amostra para que com uma probabilidade de 0,683 o erro não ultrapasse 3 vales, se, de acordo com a pesquisa piloto, a variância for 225.

Solução. Calcule o tamanho da amostra necessária:

Agências.

Exemplo 6 Para determinar a proporção de funcionários de bancos comerciais da região com mais de 40 anos, está prevista a organização de uma amostra típica proporcional ao número de funcionários do sexo masculino e feminino com seleção mecânica dentro dos grupos. O número total de funcionários do banco é de 12 mil pessoas, sendo 7 mil homens e 5 mil mulheres.

Com base em pesquisas anteriores, sabe-se que a média das variações dentro do grupo é de 1600. Determine o tamanho da amostra necessária com uma probabilidade de 0,997 e um erro de 5%.

Solução. Calcule o tamanho total de uma amostra típica:

pessoas

Vamos agora calcular o volume de grupos típicos individuais:

pessoas

pessoas

Assim, o tamanho necessário da amostra de funcionários do banco é de 550 pessoas, incl. 319 homens e 231 mulheres.

Exemplo 7 A sociedade anônima tem 200 equipes de trabalhadores. Está prevista a realização de um inquérito por amostragem para determinar a proporção de trabalhadores com doenças profissionais. Sabe-se que a variância inter-séries da proporção é de 225. Com uma probabilidade de 0,954, calcule o número de equipes necessárias para pesquisar os trabalhadores se o erro amostral não ultrapassar 5%.

Solução. O número necessário de brigadas será calculado com base na fórmula para o volume de amostragem não repetitiva em série:

brigadas.

3. Determinando o tamanho da amostra necessária

É muito importante determinar o tamanho ideal da amostra, que, com certa probabilidade, fornecerá a precisão especificada dos resultados da observação. À medida que o tamanho da amostra aumenta, o erro de amostragem diminui. Mas como as unidades amostradas para uma pesquisa são frequentemente destruídas, as taxas de amostragem das unidades na amostra devem ser ótimas. O tamanho ideal da amostra pode ser obtido a partir das fórmulas de erro de amostragem.

Tabela 8.4

Fórmulas para determinar o tamanho ideal da amostra

Método de seleção

Para médio

Auto-aleatória repetido

Aleatório e mecânico não repetível

Tipológico não repetitivo

Serial não repetitivo com séries iguais

As fórmulas mostram que, à medida que o erro de amostragem estimado aumenta, o tamanho da amostra necessária diminui significativamente.

Para calcular o tamanho da amostra, você precisa conhecer a variância. Pode ser emprestado de pesquisas anteriores da mesma população ou de populações semelhantes, ou pode ser realizada uma pesquisa de amostra ad hoc de pequeno porte.

Exemplo 2 : Na empresa, 100 trabalhadores de 1000 foram entrevistados na ordem de uma amostra aleatória não repetitiva e os seguintes dados foram obtidos sobre seus rendimentos de outubro (Tabela 8.5).

Tabela 8.5

Distribuição dos trabalhadores por rendimento médio mensal

Definir:

1) o rendimento médio mensal dos empregados desta empresa, garantindo o resultado com probabilidade de 0,997;

2) a parcela dos trabalhadores da empresa com renda mensal de 19 mil rublos. e superior, garantindo um resultado com probabilidade de 0,954;

3) o tamanho da amostra necessária para determinar a renda média mensal dos funcionários da empresa, de modo que, com uma probabilidade de 0,954, o erro marginal de amostragem não exceda 200 rublos.

Solução:

1) Vamos determinar o rendimento médio mensal dos funcionários desta empresa, garantindo o resultado com uma probabilidade de 0,997.

n= 100 pessoas

N= 1000 pessoas

Solução: para determinar o intervalo do rendimento médio mensal dos empregados de uma determinada empresa na população geral, é necessário conhecer o valor do erro amostral marginal e o tamanho da renda média mensal dos trabalhadores de acordo com a pesquisa amostral .


t e erro médio de amostragem .

Como P \u003d 0,997, então (de acordo com a Tabela 8.2) t= 3.

Foi feita uma seleção aleatória não repetitiva, de acordo com a tabela. 8.3 selecionamos a fórmula para calcular o erro amostral médio para a média:

, Onde
é a variância da amostra.

O tamanho do rendimento médio mensal dos trabalhadores de acordo com a pesquisa amostral será determinado pela fórmula da média aritmética ponderada:
.

Cálculos adicionais serão realizados na tabela a seguir:

renda mensal,

Número de trabalhadores, pess.

Ponto médio do intervalo

mil rublos.

mil rublos.

Conhecendo t e
Vamos determinar o valor do erro amostral marginal:

Mil esfregar.

Então o intervalo do rendimento médio mensal dos trabalhadores desta empresa será o seguinte:

;

.

Resposta: a renda média mensal dos funcionários desta empresa com probabilidade de 0,997 está na faixa de 18,08 mil rublos. até 18,92 mil rublos.

2) Vamos determinar a parcela dos trabalhadores da empresa com renda mensal de 19 mil rublos. e superior, garantindo um resultado com probabilidade de 0,954.

n= 100 pessoas

N= 1000 pessoas

Solução: para determinar o intervalo da parcela dos trabalhadores com renda mensal de 19 mil rublos. e acima, é necessário conhecer o valor do erro amostral marginal da proporção
e a proporção de trabalhadores com essa renda média mensal segundo a amostra C.

O erro marginal de amostragem é determinado pela fórmula
. Depende do valor do fator de confiança t e erro médio de amostragem.

Como P \u003d 0,954, então (de acordo com a Tabela 8.2) t= 2.

Foi feita uma seleção aleatória não repetitiva, de acordo com a tabela. 8.3 selecione a fórmula para calcular o erro amostral médio para a ação:

, Onde C- a parcela de trabalhadores da empresa com renda média mensal de 19 mil rublos. e superior na amostra.

A parcela da amostra é determinada pela razão do número de unidades que possuem a característica em estudo m ao número total de unidades de amostragem n, ou
.

Então o erro médio da ação é

Conhecendo t e determine o valor do erro amostral marginal para a parcela:

Em seguida, o intervalo da participação dos trabalhadores com renda mensal de 19 mil rublos. e acima na população em geral será o seguinte:

.

Resposta: a parcela de trabalhadores da empresa com renda mensal de 19 mil rublos. e superior, com uma probabilidade de 0,954 está na faixa de 19,4% a 36,6%.

    Vamos determinar o tamanho da amostra necessária ao determinar a renda média mensal dos funcionários da empresa, de modo que, com uma probabilidade de 0,954, o erro marginal de amostragem não exceda 200 rublos.

N= 1000 pessoas

Solução: o tamanho da amostra necessário para determinar a renda média mensal é determinado pela fórmula (de acordo com a Tabela 8.4):

De acordo com a condição do problema, sabe-se: com uma probabilidade P = 0,954 t\u003d 2 (ver tabela. 8.2);

0,2 mil rublos;
(de acordo com a amostra anterior).

pessoas

Resposta: para que, com uma probabilidade de 0,954, o erro marginal de amostragem não exceda 200 rublos, 189 pessoas devem ser examinadas.

4.5. Determinação do tamanho da amostra

O procedimento de design de amostra inclui solução sequencial das três tarefas a seguir:

Definição do objeto de estudo;

Determinação da estrutura amostral;

Determinando o tamanho da amostra.

Usualmente, objeto de pesquisa de marketingé um conjunto de objetos de observação, que podem ser consumidores, funcionários da empresa, intermediários, etc. Se esta população é tão pequena que a equipe de pesquisa tem a capacidade de trabalho, financeira e de tempo necessária para estabelecer contato com cada um de seus elementos, então é bastante realista realizar um estudo contínuo de toda a população. Neste caso, tendo determinado o objeto de pesquisa, você pode prosseguir para o próximo procedimento (escolhendo o método de coleta de dados, ferramenta de pesquisa e método de comunicação com o público).

No entanto, na prática, muitas vezes não é possível ou apropriado realizar um estudo contínuo de toda a população. Pode haver as seguintes razões para isso:

A impossibilidade de estabelecer contacto com alguns elementos da população;

Custos excessivamente elevados para a realização de um estudo completo ou a existência de restrições financeiras que não permitem a realização de um estudo completo;

O pouco tempo destinado ao estudo, devido à perda de relevância das informações ao longo do tempo ou outros motivos, e que não permitem a coleta, sistematização e análise de dados extensos para toda a população.

Portanto, populações grandes e dispersas são frequentemente estudadas com a ajuda de uma amostra, que, como você sabe, é entendida como uma parte da população, projetada para representar a população como um todo.

A precisão com que uma amostra reflete a população como um todo depende estrutura e tamanho da amostra.

Existem duas abordagens para a estrutura da amostra- probabilística e determinística.

Abordagem probabilística para a estrutura da amostra assume que qualquer elemento da população pode ser selecionado com uma certa probabilidade (não zero). Existem vários tipos de amostras baseadas na teoria da probabilidade (típica, aninhada, etc.). A mais simples e mais comum na prática é uma amostra aleatória simples, na qual cada elemento da população tem igual probabilidade de ser selecionado para pesquisa.

A amostragem probabilística é mais precisa, permitindo ao pesquisador avaliar o grau de confiabilidade dos dados coletados, embora seja mais complicada e mais cara que a amostragem determinística.

Abordagem Determinística para amostrar a estrutura assume que a seleção dos elementos da população é feita por métodos baseados em considerações de conveniência, ou na decisão do pesquisador, ou em grupos contingentes.

por motivos de comodidade, consiste em escolher quaisquer elementos da população com base na facilidade de estabelecer contato com eles. A imperfeição desse método se deve, talvez, à baixa representatividade da amostra obtida, uma vez que elementos da população que são convenientes para o pesquisador podem não ser representantes suficientemente característicos da população devido à sua seleção não aleatória e irracional.

No entanto, por outro lado, a simplicidade, economia e eficiência do estudo realizado por este método, valeram-lhe uma distribuição bastante ampla na prática e, sobretudo, na realização de estudos preliminares destinados a esclarecer os principais problemas.

Método de amostragem baseado na decisão do pesquisador, consiste em escolher os elementos da população, que, em sua opinião, são seus representantes característicos. Esse método é mais perfeito que o anterior, pois se baseia em uma orientação para os representantes característicos da população estudada, embora sejam selecionados com base nas ideias subjetivas dos pesquisadores sobre ela.

Método de amostragem baseado em normas contingentes, consiste em escolher os elementos característicos da população de acordo com as características previamente obtidas da população como um todo. Essas características podem ser obtidas por meio de estudos preliminares e, diferentemente do método anterior, não são subjetivas. Portanto, esse método é mais avançado, pois permite obter populações amostrais não menos representativas que amostras probabilísticas a custos significativamente menores para a realização de uma pesquisa.

Tendo escolhido a estrutura da amostra (a abordagem à sua formação, o tipo de formação probabilística ou de lançamento de uma amostra determinística), o pesquisador terá que determinar o volume, ou seja, o número de elementos da amostra.

Tamanho da amostra determina a confiabilidade das informações obtidos como resultado de seu estudo, bem como os custos necessários para o estudo. O tamanho da amostra depende no nível de homogeneidade ou variedade dos objetos estudados.

Quanto maior o tamanho da amostra, maior sua precisão e maior o custo de realização de sua pesquisa. Com uma abordagem probabilística da estrutura da amostra, seu volume pode ser determinado usando fórmulas estatísticas bem conhecidas, com base nos requisitos especificados para sua precisão.

Na prática, várias abordagens são usadas para determinar o tamanho da amostra:

1. Abordagem arbitrária com base na aplicação da "regra de ouro". Por exemplo, supõe-se sem evidência que para obter resultados precisos, a amostra deve ser de 5% da população. Esta abordagem é simples e fácil de implementar, mas não é possível estabelecer a precisão dos resultados obtidos. Com uma população grande o suficiente, também pode ser bastante caro.

O tamanho da amostra pode ser definido com base em certas condições predeterminadas. Por exemplo, um cliente de pesquisa de mercado sabe que ao estudar a opinião pública, a amostra geralmente é de 1.000 a 1.200 pessoas, então ele recomenda que o pesquisador se atenha a esse número. No caso de serem realizadas pesquisas anuais em um mercado específico, uma amostra do mesmo tamanho é usada a cada ano. Ao contrário da primeira abordagem, aqui, ao determinar o tamanho da amostra, utiliza-se a lógica conhecida, que, no entanto, é muito vulnerável.

Por exemplo, ao realizar certos estudos, a precisão pode ser menor do que no estudo de opinião pública, e o tamanho da população pode ser muitas vezes menor do que no estudo de opinião pública. Assim, essa abordagem não leva em consideração as circunstâncias atuais e pode ser bastante cara.

Em alguns casos, o custo da realização de uma pesquisa é usado como principal argumento para determinar o tamanho da amostra. Assim, o orçamento para pesquisa de marketing prevê o custo da realização de determinadas pesquisas, que não pode ser ultrapassado. Obviamente, o valor da informação recebida não é levado em consideração. No entanto, em alguns casos, mesmo uma pequena amostra pode fornecer resultados bastante precisos.

Parece razoável considerar os custos não de forma absoluta, mas em relação à utilidade das informações obtidas como resultado das pesquisas. O cliente e o pesquisador devem considerar diferentes tamanhos de amostra e métodos de coleta de dados, custos, outros fatores

2. Tamanho da amostra a partir do nível do intervalo de confiança do erro permitido, que, como já mencionado, é dado pela precisão conveniente das generalizações finais: de aumentada a aproximada. No entanto, aqui temos em mente os chamados erros aleatórios associados à natureza de quaisquer erros estatísticos. São eles que são calculados como os erros da representatividade das amostras probabilísticas.

V. I. Paniotto fornece os seguintes cálculos de uma amostra representativa com a suposição de um erro de 5 por cento (Tabela 4.2).

Tabela 4.2

Tabela de amostra estimada

Para uma população de mais de 100.000, a amostra é de 400 unidades. Se, no entanto, temos em mente populações gerais de 5 mil ou mais, então, de acordo com os cálculos do mesmo autor, é possível indicar a magnitude do erro amostral real dependendo de seu volume, o que é muito importante para nós , tendo em mente que a magnitude do erro admissível depende do objetivo da pesquisa e não precisa necessariamente se aproximar do nível de 5%.

Tabela 4.3

Tabela de cálculo

Junto com erros aleatórios, erros sistemáticos são possíveis. Dependem da organização do inquérito por amostragem. Estes são vários vieses de amostra em direção a um dos pólos do parâmetro de amostra.

3. Tamanho da amostra com base na análise estatística . Esta abordagem baseia-se na determinação do tamanho mínimo da amostra com base em certos requisitos para a confiabilidade e confiabilidade dos resultados. Também é usado na análise dos resultados obtidos para subgrupos individuais formados como parte de uma amostra por sexo, idade, nível de escolaridade, etc. Os requisitos para a confiabilidade e precisão dos resultados para subgrupos individuais ditam certos requisitos para o tamanho da amostra como um todo.

A abordagem mais justificada e correta teoricamente para determinar o tamanho da amostra é baseada no cálculo de intervalos confiáveis. O conceito de variação caracteriza a quantidade de dissimilaridade (semelhança) das respostas dos respondentes a uma determinada questão. Em um sentido mais estrito, a variação nos valores de uma característica no agregado é a diferença em seus valores entre diferentes unidades do agregado dado no mesmo período ou ponto no tempo. Os resultados das respostas às perguntas da pesquisa são geralmente apresentados na forma de uma curva de distribuição (Fig. 4.1). Com alta similaridade de respostas, falam de pequena variação (curva de distribuição estreita) e com baixa similaridade de respostas, alta variação (curva de distribuição ampla).

Como medida de variação, costuma-se tomar o desvio padrão, que caracteriza a distância média da pontuação média das respostas de cada respondente a uma determinada questão.

Pequena variação

alta variação

Arroz. 4.1. Curvas de Variação e Distribuição

Como todas as decisões de marketing são tomadas em condições de incerteza, é aconselhável levar essa circunstância em consideração ao determinar o tamanho da amostra. Como a definição dos valores estudados para uma população em uma estreita é realizada com base em estatísticas amostrais, é necessário estabelecer o intervalo (intervalo de confiança) em que se espera que as estimativas para a população como um todo queda, e o erro em sua determinação.

Um intervalo de confiança é um intervalo cujos pontos extremos correspondem a uma certa porcentagem de certas respostas a uma pergunta. O intervalo de confiança está intimamente relacionado ao desvio padrão do traço estudado na população geral: quanto maior, maior deve ser o intervalo de confiança para incluir uma determinada porcentagem de respostas.

Um intervalo de confiança de 95% ou 99% é padrão na pesquisa de marketing. Nenhuma empresa realiza pesquisas de mercado com várias amostras. E a estatística matemática permite obter algumas informações sobre a distribuição da amostra, tendo apenas dados sobre a variação de uma única amostra.

Um indicador do grau em que uma estimativa verdadeira para a população como um todo difere de uma estimativa esperada para uma amostra típica é o erro padrão. Além disso, quanto maior o tamanho da amostra, menor o erro. Um alto valor de variação causa um alto valor de erro e vice-versa.

Quando uma determinada questão tem apenas duas respostas, expressas em porcentagem (é usada uma medida de porcentagem), o tamanho da amostra é determinado pela seguinte fórmula:

onde n é o tamanho da amostra; z é o desvio normalizado determinado com base no nível de confiança selecionado; p é a variação encontrada para a amostra; g-(100-r); e é um erro aceitável.

Ao determinar o indicador de variação para uma determinada população, é aconselhável antes de tudo realizar uma análise qualitativa preliminar da população em estudo, em primeiro lugar, para estabelecer a semelhança das unidades da população em aspectos demográficos, sociais e outros de interesse do pesquisador. É possível realizar um estudo piloto, utilizando os resultados de estudos semelhantes realizados no passado. Ao usar uma medida percentual de variabilidade, leva-se em consideração a circunstância de que a variabilidade máxima é alcançada para p = 50%, que é o pior caso. Além disso, esse indicador não afeta radicalmente o tamanho da amostra. A opinião do cliente do estudo sobre o tamanho da amostra também é levada em consideração.

É possível determinar o tamanho da amostra com base no uso de médias em vez de porcentagens.

onde s é o desvio padrão.

Na prática, se a amostra for formada novamente e pesquisas semelhantes não tiverem sido realizadas, então s não é conhecido. Neste caso, é aconselhável especificar o erro e em frações do desvio padrão. A fórmula de cálculo é convertida e assume a seguinte forma:

Onde .

Acima, falamos sobre agregados de tamanhos muito grandes. No entanto, em alguns casos, as populações não são grandes. Normalmente, se a amostra for inferior a cinco por cento da população, a população é considerada grande e os cálculos são realizados de acordo com as regras acima. Se o tamanho da amostra exceder 5% da população, então esta é considerada pequena e um fator de correção é introduzido nas fórmulas acima.

O tamanho da amostra neste caso é determinado da seguinte forma:

,

Trabalho prático nº 8. "Determinando o tamanho da amostra necessária"

"Determinando o tamanho da amostra necessária"

O tipo mais difundido de observação descontínua é a observação seletiva, na qual nem todas as unidades da população estudada são examinadas, mas apenas uma parte delas selecionada.

Todo o conjunto de objetos (observações) a serem estudados é chamado a população em geral. População de amostra ou amostra chamada de parcela da população em geral, selecionada para o estudo de imóveis proporcionando representatividade.

A seleção da população geral é realizada de forma que, com base na amostra, possa ser obtida uma ideia bastante precisa dos principais parâmetros da população como um todo. Neste caso, estamos falando tanto de uma estimativa pontual, que é tomada como o valor correspondente da média, participação, etc., obtida como resultado da amostra, quanto de uma estimativa intervalar, ou seja, sobre os limites dentro dos quais, com certa probabilidade, pode estar o valor do parâmetro desejado na população geral. O principal requisito que a amostra deve atender é o requisito de sua representatividade, ou seja, representatividade.

Em estatística, os resultados da observação contínua às vezes são avaliados como características seletivas. Tal interpretação dos dados obtidos ocorre nos casos em que o número de unidades examinadas é pequeno e não há firme convicção de que as características em estudo não possam assumir outros valores além dos identificados como resultado da observação. Ao realizar experimentos, o número de valores pode ser infinitamente grande, portanto, ao formular conclusões com base em seu número limitado, é necessário considerar os dados obtidos como características seletivas.

Ao estender os resultados de uma pesquisa amostral à população geral, deve-se ter em mente que pode haver uma discrepância entre as características da população geral e amostral, devido ao fato de não ser pesquisada toda a população, mas apenas parte dela. disso.

Erro de observação estatística o valor do desvio entre os valores calculados e reais das características dos objetos em estudo é considerado.

O método de amostragem proporciona uma economia significativa de recursos materiais e financeiros na realização da observação estatística, o que possibilita ampliar o programa de pesquisa e aumentar sua eficiência. A segunda vantagem é a alta confiabilidade dos dados obtidos, pois com um tamanho amostral relativamente pequeno, é possível organizar um controle efetivo sobre a qualidade das informações coletadas. Assim, a probabilidade de ocorrência de erros de registro e sua não detecção na etapa de verificação das informações primárias é reduzida. E, finalmente, em alguns casos, quando a observação completa está associada à destruição ou deterioração das unidades examinadas (por exemplo, ao verificar a qualidade dos produtos alimentícios que entram no mercado), apenas uma pesquisa seletiva é possível.

A precisão das estimativas obtidas com base no método de amostragem não depende da proporção de unidades pesquisadas, mas do seu número.

As principais etapas da observação seletiva;

1) determinação do objetivo, tarefas e elaboração de um programa de observação;

2) amostragem;

3) coleta de dados com base no programa desenvolvido;

4) análise dos resultados obtidos e cálculo das principais características da amostra;

5) cálculo do erro amostral e distribuição de seus resultados para a população geral.

Distinguir tipos de amostra:

1) aleatória(na verdade aleatório);

2) mecânico(por exemplo, a cada 10, 20, etc.);

3) típica (estratificado), quando a população geral é dividida em grupos e vários objetos são examinados em cada grupo));

4) serial (aninhamento) quando séries inteiras são selecionadas aleatoriamente.

A maneira mais simples de formar uma amostra populacional é seleção aleatória adequada. Os fundamentos teóricos do método de amostragem, originalmente desenvolvidos em relação à seleção aleatória real, também são utilizados para determinar erros de amostragem em outros métodos de observação.

Na verdade, a seleção aleatória pode ser repetida e não repetida. No repetido Na seleção, cada unidade selecionada aleatoriamente da população geral, após a observação ser devolvida a essa população, pode ser reexaminada. Na prática, esse método de seleção é raro. Muito mais comum é realmente aleatório Não repetitivo seleção em que as unidades pesquisadas não são devolvidas à população e não podem ser repesquisadas. Com a seleção repetida, a probabilidade de ser incluído na amostra para cada unidade da população geral permanece inalterada. Com a seleção não repetitiva, muda, mas para todas as unidades que permanecem na população geral após a seleção de várias unidades dela, a probabilidade de serem incluídas na amostra é a mesma.

Precisão - o grau de erro nos resultados da pesquisa ou o tamanho do intervalo de confiança.

A precisão absoluta é dada por um determinado intervalo no qual o valor estimado deve estar.

A precisão relativa é definida em relação ao nível de estimativa do parâmetro.

Confiança é o grau de confiança de que uma estimativa está próxima do valor verdadeiro.

Vários fatores qualitativos devem ser levados em consideração ao determinar o tamanho da amostra: a importância da decisão a ser tomada, a natureza do estudo, o número de variáveis, a natureza da análise, o tamanho da amostra usada em tais estudos, a cobertura taxa, a taxa de conclusão e as restrições de recursos. O tamanho da amostra estatisticamente determinado é o tamanho líquido ou final da amostra, ou seja, unidades populacionais restantes após a exclusão de potenciais entrevistados que não atendem aos critérios fornecidos ou não completaram a entrevista. Dependendo das taxas de cobertura e completude, pode ser necessário um tamanho de amostra inicial muito maior. Na pesquisa de marketing comercial, a falta de tempo, dinheiro e boas pessoas podem ser fundamentais para determinar o tamanho da amostra. No Projeto de Estudo de Fidelidade de Lojas de Departamentos, o tamanho da amostra foi determinado precisamente por esses motivos.

Método de intervalo de confiança:

A determinação do tamanho da amostra pelo método dos intervalos de confiança baseia-se na sua criação em torno da média amostral ou fração amostral utilizando a fórmula do erro padrão. Como exemplo, suponha que um pesquisador use amostragem aleatória simples para selecionar uma amostra de 300 famílias para estimar os gastos mensais de uma família em compras em uma loja de departamentos e determine que o gasto médio mensal das famílias na amostra é de $ 182. Estudos anteriores mostraram que o RMS o desvio dos gastos na população do estudo é de $ 55.

Queremos encontrar um intervalo no qual uma certa porcentagem das médias amostrais cairia. Suponha que queremos definir um intervalo em torno da média populacional que inclua 95% das médias amostrais, com base em uma amostra de 300 famílias; 95% das médias amostrais podem ser divididas em duas partes iguais, metade a menos e metade a mais que a média, conforme mostrado na Fig. 1. O cálculo do intervalo de confiança inclui a determinação da área menor que (XL) e maior que (XU) o valor médio (X) do gasto.

Os valores do fator z correspondentes a XL e XU podem ser calculados da seguinte forma:

Portanto, o valor mínimo de X é definido como

e o valor máximo

Agora vamos definir um intervalo de confiança de 95% em torno da média amostral de $ 182. Primeiro, vamos calcular o erro padrão da média:

Os 95% centrais da distribuição normal estão dentro dos valores z de 1,96; O intervalo de confiança de 95% é definido como

Assim, o intervalo de confiança de 95% se estende de $ 175,77 a $ 188,23. Há 95% de chance de que a verdadeira média da população observada esteja entre $ 175,77 e $ 188,23.

Método médio:

O método usado para criar o intervalo de confiança pode ser modificado para determinar o tamanho da amostra dado o intervalo de confiança desejado. Suponha que você queira calcular os gastos mensais da loja de departamentos da família com mais precisão para que o resultado fique dentro de $ 5,0 da média real da população em estudo. Qual deve ser o tamanho da amostra? A tabela contém a lista necessária de ações que você deve executar.


  • 1. Determine o grau de precisão. Esta é a diferença máxima permitida (D) entre a média da amostra e a média da população. Em nosso exemplo, D = +$5,0
  • 2. Especifique o nível de confiança. Suponha que o nível de confiança desejado seja de 95%.
  • 3. Determine o valor do desvio normalizado z associado ao nível de confiança dado. No nível de confiança de 95%, a probabilidade de que a média da população fique fora do intervalo unilateral é 0,025 (0,05/2). O valor z correspondente é 1,96.
  • 4. Determine o desvio padrão da média populacional. Pode ser obtido de fontes secundárias ou calculado a partir de um estudo piloto. Além disso, o desvio padrão pode ser definido com base na opinião do pesquisador. Por exemplo, o intervalo de uma variável normalmente distribuída é de aproximadamente seis desvios padrão (três à esquerda e três à direita da média).

5. Determine o tamanho da amostra usando a fórmula para o erro padrão da média

Em nosso exemplo

(arredondado para o número inteiro mais próximo).

Pode-se ver pela fórmula do tamanho da amostra que ela cresce com o aumento da variabilidade (dispersão) da população em geral, bem como com o aumento do nível de confiabilidade e do grau de precisão com que os cálculos devem ser realizados . O tamanho da amostra é diretamente proporcional ao Q2, portanto, quanto maior a variância populacional, maior o tamanho da amostra. Da mesma forma, um nível de confiança mais alto implica um valor de z maior e, portanto, um tamanho de amostra maior. As variáveis ​​Q2 e z estão no numerador. Aumentar o grau de precisão é obtido diminuindo o valor de D e, portanto, aumenta o tamanho da amostra, pois D está no denominador.

6. Se o tamanho da amostra for 10% ou mais do tamanho da população, então o ajuste populacional final (fpc) ​​é aplicado. Em seguida, o tamanho da amostra necessária é calculado pela fórmula

7. Se o desvio padrão populacional o for desconhecido e seu valor estimado for utilizado, ele deverá ser recalculado após a obtenção da amostra. O desvio padrão da amostra s é usado como uma estimativa para Q. O intervalo de confiança corrigido deve então ser calculado para determinar o grau de precisão realmente obtido.

Suponha que o valor 55,00 foi usado como uma estimativa para a porque o valor verdadeiro era desconhecido. Obteve-se uma amostra em que n = 465. Com base nos dados do estudo, calcula-se a média X, igual a 180,00, e o desvio padrão da amostra s, igual a 50,00. Então o intervalo de confiança corrigido será:

Observe que o intervalo de confiança resultante já está estimado. Isso ocorre porque o desvio padrão populacional é superestimado com base nas características da amostra.

8. Às vezes, a precisão é definida em termos relativos em vez de absolutos. Em outras palavras, pode-se saber que o resultado do cálculo deve ser mais ou menos R% da média. Nesse caso, o tamanho da amostra pode ser definido como

O tamanho populacional N não afeta diretamente o tamanho da amostra, exceto quando um fator de ajuste populacional final é aplicado. Pode parecer incrível, mas se você pensar bem, essa afirmação faz sentido. Por exemplo, se as características estudadas de todos os elementos da população são idênticas, uma amostra composta por um elemento é suficiente para calcular a média. Isso também está correto se a população consistir em 50, 500, 5.000 ou 50.000 itens. Ao mesmo tempo, a variabilidade das características da população afeta diretamente o tamanho da amostra. Essa variabilidade é levada em consideração ao calcular o tamanho da amostra usando a variância geral Q2 ou a variância amostral s2.

Método de compartilhamento:

Se a estatística em estudo for representada não pela média, mas pela participação, o profissional de marketing determina o tamanho da amostra da mesma maneira. Suponha que o pesquisador esteja interessado em determinar a proporção de domicílios que possuem um cartão de crédito de uma loja de departamentos. O procedimento será o seguinte.

1. Especifique o grau de precisão. Suponha que o grau de precisão desejado seja tal que o intervalo de tolerância seja definido como

D \u003d p - l \u003d ± 0,05.

  • 2. Especifique o nível de confiança. Suponha que um nível de confiança de 95% seja desejado.
  • 3. Determine o valor de z associado ao nível de confiança fornecido. Conforme explicado ao calcular a média, será 1,96.
  • 4. Determinar a fração total de n. Como indicamos anteriormente, ela pode ser obtida de fontes secundárias, no decorrer de um estudo experimental ou com base na opinião do pesquisador. Suponha que, com base em dados secundários, o pesquisador suponha que 64% das famílias da população estudada tenham cartão de crédito de loja de departamentos. Portanto, l = 0,64.
  • 5. Determine o tamanho da amostra usando a fórmula de erro padrão de proporção:

Em nosso exemplo

  • (arredondado para o número inteiro mais próximo).
  • 6. Se o tamanho final da amostra for 10% ou mais do tamanho da população, um ajuste populacional final (fpc) ​​é aplicado. Em seguida, o tamanho da amostra necessária é calculado pela fórmula

onde n é o tamanho da amostra antes de aplicar a correção final; nc é o tamanho da amostra após a aplicação da correção final.

7. Se o cálculo do TC estiver errado, o intervalo de confiança será mais ou menos preciso do que o necessário. Suponha que ao final da amostra, o valor da parcela p seja calculado igual a 0,55. O intervalo de confiança é então recalculado, com sp sendo usado para calcular o Qp desconhecido, como segue:

Em nosso exemplo

O intervalo de confiança é então 0,55 ± 1,96 (0,0264) = 0,55 + 0,052, o que significa que é mais amplo do que o especificado. Isso se explica pelo fato de que o desvio padrão da amostra p = 0,55 acabou sendo maior que o valor estimado do desvio padrão da população geral em n = 0,64.

Se um intervalo maior que o intervalo especificado for inaceitável, o tamanho da amostra pode ser ajustado para refletir o desvio máximo possível na população. Tal desvio ocorre quando o produto l (1 - l) atinge seu valor máximo, para o qual l deve ser igual a 0,5. Esta conclusão pode ser alcançada sem cálculos. Como metade da população tem um valor característico e a outra metade tem outro, mais dados serão necessários para tirar uma conclusão correta do que quando a situação é mais claramente definida e a maioria dos elementos tem o mesmo valor característico. Em nosso exemplo, isso resultará em um tamanho de amostra de

  • (arredondado para o número inteiro mais próximo).
  • 8. Às vezes, a precisão é definida em termos relativos em vez de absolutos. Em outras palavras, pode-se saber que o resultado do cálculo deve ser mais ou menos R% da proporção da população. Isso significa que D = Rl. Nesse caso, o tamanho da amostra pode ser definido como