Modelos estatísticos. Princípios para construção de objetos estatísticos de ecoprocessos

A modelagem estática é uma representação ou descrição de um determinado fenômeno ou sistema de relações entre fenômenos por meio de um conjunto de variáveis ​​(indicadores, características) e relações estatísticas entre elas. O objetivo da modelagem estática (como qualquer outra modelagem) é apresentar as características mais essenciais do fenômeno que está sendo estudado de forma visual e acessível para estudo. Todos os modelos estatísticos são, em última análise, concebidos para medir a força e a direção das relações entre duas ou mais variáveis. Os modelos mais complexos também permitem julgar a estrutura das relações entre diversas variáveis. A maioria dos modelos estatísticos pode ser amplamente dividida em correlacionais, estruturais e causais. Modelos de correlação são usados ​​para medir relações “não direcionais” de pares entre variáveis, ou seja, tais conexões nas quais o componente causal está ausente ou ignorado. Exemplos de tais modelos são o coeficiente de correlação linear pareada de Pearson, coeficientes de classificação de correlações pareadas e múltiplas e a maioria das medidas de associação desenvolvidas para tabelas de contingência (com exceção de coeficientes teóricos da informação e análise log-linear).

Os modelos estruturais na modelagem estática são projetados para estudar a estrutura de um determinado conjunto de variáveis ​​​​ou objetos. O dado inicial para estudar a estrutura das relações entre diversas variáveis ​​​​é a matriz de correlações entre elas. A análise da matriz de correlação pode ser realizada manualmente ou por meio de métodos de análise estatística multidimensional - fator, cluster, método de escala multidimensional. Em muitos casos, estudar a estrutura das relações entre variáveis ​​é um passo preliminar na resolução de um problema mais complexo – reduzir a dimensão do espaço de características.

Para estudar a estrutura de um conjunto de objetos, são utilizados métodos de análise de cluster e escalonamento multidimensional. A matriz de distâncias entre eles é usada como dado inicial. A distância entre os objetos é menor, mais os objetos são “semelhantes” entre si no sentido dos valores das variáveis ​​​​medidas neles; se os valores de todas as variáveis ​​​​para dois objetos forem iguais, a distância entre eles é zero. Dependendo dos objetivos do estudo, os modelos estruturais podem ser apresentados na forma de matrizes (correlações, distâncias), estrutura fatorial ou visualmente. Os resultados da análise de cluster são frequentemente apresentados na forma de um dendograma; os resultados da análise fatorial e do escalonamento multidimensional são apresentados na forma de um gráfico de dispersão. A estrutura da matriz de correlação também pode ser apresentada na forma de um gráfico que reflete as relações mais significativas entre as variáveis. Os modelos causais são projetados para explorar relações causais entre duas ou mais variáveis. As variáveis ​​que medem fenômenos causais são chamadas de variáveis ​​independentes ou preditores nas estatísticas; Variáveis ​​que medem fenômenos de consequência são chamadas de dependentes. A maioria dos modelos causais estatísticos assume uma variável dependente e um ou mais preditores. A exceção são os modelos linear-estruturais, nos quais diversas variáveis ​​dependentes podem ser utilizadas simultaneamente, e algumas variáveis ​​podem atuar ao mesmo tempo como dependentes em relação a alguns indicadores e como preditoras em relação a outros.

Existem duas áreas de aplicação do método de modelagem estatística: planejamento de modelagem de simulação estática

  • - para estudar sistemas estocásticos;
  • - para resolver problemas determinísticos.

A ideia principal que se utiliza para resolver problemas determinísticos utilizando o método de modelagem estatística é substituir o problema determinístico por um circuito equivalente de algum sistema estocástico, as características de saída deste último coincidem com o resultado da resolução do problema determinístico. Com tal substituição, o erro diminui com o aumento do número de testes (implementação do algoritmo de modelagem) N.

Como resultado da modelagem estatística do sistema S obtém-se uma série de valores parciais das grandezas ou funções desejadas, cujo processamento estatístico permite obter informações sobre o comportamento de um objeto ou processo real em momentos arbitrários do tempo. Se a quantidade de vendas Né suficientemente grande, então os resultados obtidos da modelagem do sistema adquirem estabilidade estatística e podem ser aceitos com precisão suficiente como estimativas das características exigidas do processo de funcionamento do sistema S.

A modelagem estatística é um método numérico para resolução de problemas matemáticos, em que as quantidades desejadas são representadas pelas características probabilísticas de algum fenômeno aleatório. Este fenômeno é modelado, após o que as características exigidas são determinadas aproximadamente pelo processamento estatístico das “observações” do modelo.

O desenvolvimento de tais modelos consiste na escolha de um método de análise estatística, planejamento do processo de obtenção de dados, coleta de dados sobre o sistema ecológico, algoritmos e cálculo computacional de relações estatísticas. A mudança dos padrões de desenvolvimento da situação ecológica exige a repetição do procedimento descrito, mas numa nova capacidade.

A descoberta estatística de um modelo matemático inclui escolha do tipo de modelo e determinação de seus parâmetros. Além disso, a função desejada pode ser uma função de uma variável independente (fator único) ou de muitas variáveis ​​(fator múltiplo). A tarefa de escolher o tipo de modelo é informal, pois a mesma dependência pode ser descrita com o mesmo erro por uma variedade de expressões analíticas (equações de regressão). Uma escolha racional do tipo de modelo pode ser justificada tendo em conta uma série de critérios: compacidade (por exemplo, descrito por um monômio ou polinômio), interpretabilidade (a capacidade de dar significado significativo ao coeficiente do modelo), etc. A tarefa de calcular os parâmetros do modelo selecionado é muitas vezes puramente formal e realizada em um computador.

Ao formar uma hipótese estatística sobre um determinado sistema ecológico, é necessário ter um conjunto de dados diversos (banco de dados), que pode ser excessivamente grande. Uma compreensão adequada do sistema está associada, neste caso, à separação de informações sem importância. Tanto a lista (tipo) de dados quanto a quantidade de dados podem ser reduzidas. Um dos métodos para realizar tal compressão de informações ambientais (sem suposições a priori sobre a estrutura e dinâmica do ecossistema observado) pode ser a análise fatorial. A redução dos dados é realizada pelo método dos mínimos quadrados, componentes principais e outros métodos estatísticos multivariados, utilizando futuramente, por exemplo, análise de cluster.

Observe que informações ambientais primárias têm mais ou menos os seguintes recursos:

– multidimensionalidade dos dados;

– não linearidade e ambiguidade das relações no sistema em estudo;

- erro de medição;

– a influência de factores não contabilizados;

– dinâmica espaçotemporal.

Ao resolver o primeiro problema de escolha do tipo de modelo, assume-se que m dados de entrada (x 1, x 2, ..., x m e n saída (y 1, y 2, ..., y) são conhecidos. Neste caso, são possíveis, em particular, os dois modelos seguintes em notação matricial:

onde X e Y são parâmetros conhecidos de entrada (saída) e saída (entrada) de um objeto ambiental ("caixa preta") em forma de notação vetorial; A e B são as matrizes desejadas de coeficientes constantes do modelo (parâmetros do modelo).

Junto com os modelos indicados uma forma mais geral de modelagem estatística é considerada:

onde F é o vetor de fatores de influência ocultos; C e D são as matrizes de coeficientes necessárias.

Ao resolver problemas ambientaisÉ aconselhável utilizar modelos matemáticos lineares e não lineares, uma vez que muitos padrões ambientais têm sido pouco estudados. Como resultado, será levada em consideração a multidimensionalidade e a não linearidade das relações modeladas.

Com base em um modelo generalizadoé possível identificar fatores internos ocultos dos processos ambientais em estudo que não são conhecidos pelo engenheiro ambiental, mas sua manifestação se reflete nos componentes dos vetores X e Y. Este procedimento é mais adequado no caso em que não há relação estrita de causa e efeito entre os valores de X e Y. Um modelo generalizado que leva em conta a influência de fatores ocultos elimina uma certa contradição entre dois modelos com matrizes A e B, quando na verdade dois modelos diferentes poderiam ser usados ​​para descrever o mesmo processo ambiental. Essa contradição é causada pelo significado oposto da relação de causa e efeito entre as quantidades A e Y (em um caso, X é a entrada e Y é a saída e, no outro, vice-versa). Um modelo generalizado, levando em consideração o valor F, descreve um sistema mais complexo do qual os valores X e Y são produzidos e os fatores ocultos F atuam na entrada.

É importante na modelagem estatística utilizar dados a priori, quando durante o processo de decisão algumas regularidades dos modelos podem ser estabelecidas e seu número potencial pode ser reduzido.

Suponha que seja necessário criar um modelo com o qual a fertilidade de um determinado tipo de solo possa ser determinada numericamente em 24 horas, levando em consideração sua temperatura T e umidade W. Nem o trigo nem a macieira podem produzir uma colheita em 24 horas. Mas para a semeadura de teste, você pode usar bactérias com ciclo de vida curto, e usar a quantidade de P liberado CO 2 por unidade de tempo como critério quantitativo para a intensidade de sua atividade vital. Então o modelo matemático do processo em estudo é a expressão

onde P 0 é um indicador numérico da qualidade do solo.

Parece que não temos dados sobre a forma da função f(T, W) porque o engenheiro de sistemas não possui o conhecimento agronômico necessário. Mas não é assim. Quem não sabe que a T≈0°C a água congela e, portanto, o CO 2 não pode ser libertado, e a 80°C ocorre a pasteurização, ou seja, a maioria das bactérias morre. Dados a priori já são suficientes para afirmar que a função desejada é de natureza quase parabólica, próxima de zero em T = 0 e 80°C e tem um extremo dentro desta faixa de temperatura. Raciocínio semelhante em relação à umidade leva ao fato de que o extremo máximo da função desejada é registrado em W=20% e sua aproximação de zero em W=0 e 40%. Assim, a forma do modelo matemático aproximado foi determinada a priori, e a tarefa do experimento é apenas esclarecer a natureza da função f(T, W) em T = 20...30 e 50...60 ° C, bem como para W = 10...15 e 25...30% e determinação mais precisa das coordenadas do extremo (o que reduz o volume de trabalho experimental, ou seja, o volume de dados estatísticos).

Modelagem Estatística

um método numérico para resolução de problemas matemáticos, em que as quantidades necessárias são representadas pelas características probabilísticas de algum fenômeno aleatório, esse fenômeno é modelado, após o qual as características necessárias são determinadas aproximadamente pelo processamento estatístico das “observações” do modelo. Por exemplo, é necessário calcular os fluxos de calor em uma placa metálica fina aquecida, cujas bordas são mantidas em temperatura zero. A distribuição de calor é descrita pela mesma equação que o espalhamento de uma mancha de tinta em uma camada de líquido (ver Condutividade térmica, Difusão). Portanto, eles simulam o movimento browniano plano das partículas de “tinta” na placa, monitorando suas posições em momentos kτ, k= 0, 1, 2,... Supõe-se aproximadamente que durante um pequeno intervalo τ a partícula se move um passo h igualmente provável em todas as direções. Cada vez a direção é escolhida aleatoriamente, independente de tudo o que foi anterior. A relação entre τ e h determinado pelo coeficiente de condutividade térmica. O movimento começa na fonte de calor e termina quando a borda é alcançada pela primeira vez (observa-se aderência de “tinta” na borda). O fluxo de calor Q (C) através da seção C da fronteira é medido pela quantidade de tinta aderida. Com quantidade total N partículas de acordo com a lei dos grandes números tal estimativa fornece um erro relativo aleatório de ordem h devido à discrição do modelo escolhido).

O valor desejado é representado pela expectativa matemática (Ver Expectativa matemática) de uma função numérica f do resultado aleatório ω do fenômeno: , ou seja, uma integral sobre a medida de probabilidade P (ver Medida de um conjunto). Para avaliação , onde ω 1 ,..., ω N resultados simulados podem ser vistos como uma fórmula de quadratura para a integral indicada com nós aleatórios ω k e erro aleatório R N é geralmente aceito , considerar um erro grande como insignificante; Dispersão Df pode ser avaliado através de observações (ver teoria do erro).

No exemplo acima f(ω) = 1 , quando a trajetória termina em C; de outra forma f(ω) = 0. Variância

A condução de cada “experimento” é dividida em duas partes: o “sorteio” ​​de um resultado aleatório ω e o posterior cálculo da função f(ω). Quando o espaço de todos os resultados e a medida de probabilidade P são muito complexos, o sorteio é realizado sequencialmente em várias etapas (ver exemplo). A seleção aleatória em cada estágio é realizada por meio de números aleatórios, por exemplo, gerados por algum sensor físico; Sua imitação aritmética também é usada - números pseudoaleatórios (ver Números aleatórios e pseudoaleatórios). Procedimentos de seleção aleatória semelhantes são usados ​​em estatística matemática e teoria dos jogos.

SM é amplamente utilizado para resolver equações integrais em um computador, por exemplo, no estudo de grandes sistemas (ver Sistema grande). São convenientes pela sua versatilidade, via de regra não requerem grande quantidade de memória. A desvantagem são os grandes erros aleatórios, que diminuem muito lentamente à medida que o número de experimentos aumenta. Portanto, foram desenvolvidos métodos de transformação de modelos que permitem reduzir a dispersão dos valores observados e o volume do experimento modelo.

Aceso.: Método de testes estatísticos (método Monte Carlo), M., 1962; Ermakov S. M., método Monte Carlo e questões relacionadas, M., 1971.

N. N. Chentsov.


Grande Enciclopédia Soviética. - M.: Enciclopédia Soviética. 1969-1978 .

Veja o que é “Modelagem Estatística” em outros dicionários:

    Estudo de modelagem estatística e econométrica de objetos de conhecimento em seus modelos estatísticos; construção e estudo de modelos de objetos, processos ou fenômenos da vida real (por exemplo: processos econômicos em ... ... Wikipedia

    Modelagem Estatística- uma forma de estudar os processos de comportamento de sistemas probabilísticos em condições onde as interações internas nesses sistemas são desconhecidas. Consiste na imitação mecânica do processo em estudo, que é, por assim dizer, copiado para... ... Dicionário econômico e matemático

    Método de matemática aplicada e computacional, que consiste na implementação em um computador de estocástica especialmente desenvolvida. modelos dos fenômenos ou objetos em estudo. A ampliação do escopo de aplicação do S. m. está associada ao rápido desenvolvimento da tecnologia e principalmente... ... Enciclopédia Matemática

    Modelagem de situações utilizando padrões estatísticos inerentes ao fenômeno em consideração. Dicionário de termos comerciais. Akademik.ru. 2001... Dicionário de termos comerciais

    Modelagem é o estudo de objetos de conhecimento em seus modelos; construir e estudar modelos de objetos, processos ou fenômenos da vida real, a fim de obter explicações desses fenômenos, bem como prever fenômenos de interesse... ... Wikipedia

    MODELAGEM DE SIMULAÇÃO em sociologia- um tipo de modelagem matemática que consiste em reproduzir em um computador um processo social ou o funcionamento de um sistema social. Quase sempre envolve a reprodução de fatores aleatórios que influenciam o fenômeno em estudo e, como consequência,... ... Sociologia: Enciclopédia

    MODELAGEM ESTATÍSTICA- desenvolvimento de vários modelos que refletem os padrões estatísticos do objeto, fenômeno descrito. Uma característica específica comum destes modelos é a consideração de perturbações ou desvios aleatórios. Objetos S.m. são diferentes... ... Grande dicionário econômico

    MODELAGEM ESTATÍSTICA- representação ou descrição de um determinado fenómeno ou sistema de relações entre fenómenos através de um conjunto de variáveis ​​(indicadores, características) e relações estatísticas entre elas. O objetivo de M.S. (como qualquer outra modelagem) imagine... ... Sociologia: Enciclopédia

    Para melhorar este artigo, é aconselhável?: Corrigir o artigo de acordo com as regras estilísticas da Wikipédia. Modelagem de simulação (situacional... Wikipedia

    MODELAGEM DE SIMULAÇÃO- (...do modelo francês) um método para estudar quaisquer fenômenos e processos usando testes estatísticos (método Monte Carlo) usando um computador. O método baseia-se em desenhar (simular) a influência de fatores aleatórios sobre o fenômeno em estudo ou... ... Dicionário Enciclopédico de Psicologia e Pedagogia

Livros

  • Modelagem estatística. Métodos de Monte Carlo. Livro didático para bacharelado e mestrado, Mikhailov G.A. O livro é dedicado aos recursos de modelagem de variáveis ​​​​aleatórias, processos e campos. É dada especial atenção à integração numérica, em particular ao método de Monte Carlo. Uma solução é dada...

A ideia de seleção aleatória. Antes de começarmos a descrever hipóteses estatísticas, vamos discutir mais uma vez o conceito de seleção aleatória.

Deixando de lado os detalhes e algumas exceções (embora importantes), pode-se dizer que toda análise estatística é baseada em a ideia de escolha aleatória. Aceitamos a tese de que os dados disponíveis surgiram como resultado de uma seleção aleatória de uma determinada população geral, muitas vezes imaginária. Geralmente assumimos que esta escolha aleatória é produzida pela natureza. Contudo, em muitos problemas esta população geral é bastante real, e a escolha a partir dela é feita por um observador ativo.

Para resumir, diremos que todos os dados que vamos estudar como um todo são uma observação. A natureza desta observação coletiva pode ser muito diversa. Pode ser um único número, uma sequência de números, uma sequência de caracteres, uma tabela numérica, etc. Denotemos por enquanto esta observação coletiva por X. Uma vez que contamos X resultado de uma seleção aleatória, devemos indicar a população geral da qual X foi escolhido. Isso significa que devemos indicar os valores que podem aparecer no lugar do real X. Vamos denotar esta coleção por X. Um monte de X também chamado espaço amostral, ou espaço amostral.

Assumimos ainda que a escolha especificada ocorreu de acordo com uma certa distribuição de probabilidade no conjunto X, segundo o qual cada elemento de X tem uma certa chance de ser selecionado. Se X -é um conjunto finito, então cada um de seus elementos x; existe uma probabilidade positiva R(X) a ser escolhido. A seleção aleatória de acordo com essa lei probabilística é fácil de entender literalmente. Para conjuntos infinitos mais complexos Xé necessário determinar a probabilidade não para seus pontos individuais, mas para subconjuntos. A seleção aleatória de uma entre infinitas possibilidades é mais difícil de imaginar, é semelhante a escolher um ponto X de um segmento ou região espacial X.

Relação entre observação X e espaço amostral X, entre os elementos dos quais a probabilidade é distribuída - exatamente o mesmo que entre os resultados elementares e o espaço de resultados elementares com o qual a teoria das probabilidades lida. Graças a isso, a teoria das probabilidades torna-se a base da estatística matemática e, portanto, em particular, podemos aplicar considerações probabilísticas ao problema de testar hipóteses estatísticas.

Regra pragmática.É claro que, uma vez adoptados um ponto de vista probabilístico sobre a origem dos nossos dados (ou seja, acreditamos que foram obtidos por selecção aleatória), então todos os julgamentos posteriores baseados nestes dados serão de natureza probabilística. Qualquer afirmação será verdadeira apenas com alguma probabilidade e, com alguma probabilidade também positiva, pode acabar sendo falsa. Serão tais conclusões úteis e será mesmo possível obter resultados fiáveis ​​ao longo deste caminho?



Ambas as questões devem ser respondidas positivamente. Em primeiro lugar, o conhecimento das probabilidades dos acontecimentos é útil, pois o pesquisador desenvolve rapidamente a intuição probabilística, permitindo-lhe operar com probabilidades, distribuições, expectativas matemáticas, etc., beneficiando-se dela. Em segundo lugar, os resultados puramente probabilísticos podem ser bastante convincentes: uma conclusão pode ser considerada praticamente fiável se a sua probabilidade for próxima de um.

O seguinte pode ser dito regra pragmática que orienta as pessoas e que conecta a teoria da probabilidade com as nossas atividades.

Consideramos como praticamente certo um evento cuja probabilidade é próxima de 1;

Consideramos praticamente impossível que um evento cuja probabilidade seja próxima de 0.

E não só pensamos assim, mas também agimos de acordo com isso!

A regra pragmática estabelecida é, em sentido estrito, obviamente, incorreta, uma vez que não protege completamente contra erros. Mas erros ao usá-lo serão raros. A regra é útil porque permite aplicar na prática conclusões probabilísticas.

Às vezes, a mesma regra é expressa de forma um pouco diferente: em uma única tentativa o evento improvável não ocorre(e vice-versa - ocorre necessariamente um evento cuja probabilidade é próxima de 1). A palavra “único” é inserida para fins de esclarecimento, porque em uma sequência suficientemente longa de repetições independentes do experimento, o evento improvável mencionado (em um experimento!) quase certamente ocorrerá. Mas esta é uma situação completamente diferente.

Ainda não está claro qual probabilidade deve ser considerada baixa. Não existe uma resposta quantitativa a esta questão que seja aplicável em todos os casos. A resposta depende do perigo que o erro representa para nós. Muitas vezes - ao testar hipóteses estatísticas, por exemplo, veja abaixo - as probabilidades são consideradas pequenas, começando em 0,01 ¸ 0,05. Outra coisa é a confiabilidade dos dispositivos técnicos, por exemplo, freios de automóveis. Aqui a probabilidade de falha será inaceitavelmente alta, digamos 0,001, uma vez que a falha dos freios uma vez a cada mil eventos de frenagem levará a um grande número de acidentes. Portanto, ao calcular a confiabilidade, muitas vezes é necessário que a probabilidade de operação sem falhas seja da ordem de 1-10 -6. Não discutiremos aqui quão realistas são tais requisitos: se um modelo matemático inevitavelmente aproximado pode fornecer tal precisão no cálculo da probabilidade e como então comparar os resultados calculados e reais.

Avisos 1. Devem ser dados alguns conselhos sobre como construir modelos estatísticos, muitas vezes em problemas que não têm uma natureza estatística óbvia. Para isso, é necessário expressar as características inerentes ao problema em discussão em termos relacionados ao espaço amostral e à distribuição de probabilidade. Infelizmente, este processo não pode ser descrito em termos gerais. Além disso, este processo é criativo e não pode ser memorizar como, digamos, uma tabuada. Mas ele pode aprender a, estudando padrões e exemplos e seguindo seu espírito. Veremos vários desses exemplos. No futuro, daremos também especial atenção a esta fase da investigação estatística.

2. Ao formalizar problemas reais podem surgir modelos estatísticos muito diversos. Contudo, a teoria matemática preparou os meios para estudar apenas um número limitado de modelos. Para vários modelos padrão, a teoria foi desenvolvida detalhadamente, e aí é possível obter respostas às principais questões de interesse do pesquisador. Discutiremos alguns desses modelos padrão, com os quais lidamos com mais frequência na prática, neste livro. Outros podem ser encontrados em guias e livros de referência mais especializados e detalhados.

3. Vale lembrar as limitações das ferramentas matemáticas na formalização matemática de um experimento. Se possível, deveríamos reduzir o assunto a um problema estatístico padrão. Estas considerações são especialmente importantes quando planejamento experimento ou pesquisa; na recolha de informação, se se trata de um inquérito estatístico; ao configurar experimentos, se estivermos falando de um experimento ativo.

Observação estatística.

A essência da observação estatística.

O estágio inicial de qualquer pesquisa estatística é a coleta sistemática e cientificamente organizada de dados sobre os fenômenos e processos da vida social, chamada observação estatística. A importância desta fase do estudo é determinada pelo facto de a utilização apenas de dados completamente objectivos e suficientemente completos obtidos como resultado da observação estatística nas fases subsequentes ser capaz de fornecer conclusões cientificamente fundamentadas sobre a natureza e os padrões de desenvolvimento do objeto que está sendo estudado. A observação estatística é efectuada através da avaliação e registo das características das unidades da população em estudo nos respectivos documentos contabilísticos. Os dados assim obtidos representam fatos que de uma forma ou de outra caracterizam os fenômenos da vida social. O uso da argumentação baseada em evidências não contradiz o uso da análise teórica, uma vez que qualquer teoria é, em última análise, baseada em material factual. O poder probatório dos fatos aumenta ainda mais com o processamento estatístico, que garante sua sistematização e apresentação de forma compactada. A observação estatística deve ser diferenciada de outras formas de observação realizadas na vida cotidiana, baseadas na percepção sensorial. Somente pode ser chamada de estatística aquela observação que garante o registro dos fatos apurados nos documentos contábeis para sua posterior generalização. Exemplos específicos de observação estatística são a recolha sistemática de informações, por exemplo, em empresas de construção de máquinas, sobre o número de máquinas e componentes produzidos, custos de produção, lucros, etc. A observação estatística deve satisfazer requisitos bastante rigorosos: 1. Os fenómenos observados devem têm um certo significado económico nacional, valor científico ou prático, expressam certos tipos de fenómenos socioeconómicos. 2. A observação estatística deve assegurar a recolha de dados massivos, que reflictam todo o conjunto de factos relacionados com a questão em apreço, uma vez que os fenómenos sociais estão em constante mudança, desenvolvimento e apresentam diferentes estados qualitativos.

Dados incompletos que não caracterizam o processo de forma suficientemente abrangente levam a conclusões erradas a partir da sua análise. 3. A variedade de causas e factores que determinam o desenvolvimento dos fenómenos sociais e económicos predetermina a orientação da observação estatística, juntamente com a recolha de dados que caracterizam directamente o objecto em estudo, para ter em conta os factos e acontecimentos sob a influência de quais mudanças em seus estados ocorrem. 4. Para garantir a fiabilidade dos dados estatísticos na fase de observação estatística, é necessária uma verificação minuciosa da qualidade dos factos recolhidos. A estrita confiabilidade de seus dados é uma das características mais importantes da observação estatística. Os defeitos na informação estatística, expressos na sua falta de fiabilidade, não podem ser eliminados no processo de processamento posterior, pelo que o seu aparecimento dificulta a tomada de decisões com base científica e o equilíbrio da economia. 5. A observação estatística deve ser realizada com base científica de acordo com um sistema, plano e regras (programa) pré-desenvolvidos, proporcionando uma solução estritamente científica para todas as questões programáticas, metodológicas e organizacionais.

Software e suporte metodológico para observação estatística.

A preparação para a observação estatística, garantindo o sucesso do caso, pressupõe a necessidade de resolver atempadamente uma série de questões metodológicas relacionadas com a definição de tarefas, objetivos, objetos, unidades de observação, desenvolvimento de programas e ferramentas, e determinação do método de coleta de dados estatísticos. As tarefas de observação estatística decorrem diretamente das tarefas de investigação estatística e consistem, em particular, na obtenção de dados massivos diretamente sobre o estado do objeto em estudo, tendo em conta o estado dos fenómenos que influenciam o objeto, e no estudo de dados sobre o processo de desenvolvimento dos fenômenos. Os objetivos da vigilância são determinados, em primeiro lugar, pelas necessidades de suporte de informação para o desenvolvimento económico e social da sociedade. Os objetivos definidos para as estatísticas estaduais são esclarecidos e especificados pelos seus órgãos sociais, a partir dos quais são determinados os rumos e o âmbito dos trabalhos. Dependendo da finalidade, decide-se a questão do objeto de observação estatística, ou seja, o que exatamente deve ser observado. Entende-se por objeto o conjunto de objetos materiais, empresas, coletivos de trabalho, indivíduos, etc., por meio dos quais se realizam fenômenos e processos sujeitos a pesquisas estatísticas. Os objetos de observação, dependendo dos objetivos, podem ser, em particular, massas de unidades de equipamentos de produção, produtos, estoques, assentamentos, regiões, empresas, organizações e instituições de diversos setores da economia nacional, da população e suas categorias individuais. , etc. O estabelecimento de um objeto de observação estatística está associado à determinação de seus limites com base em um critério adequado, expresso por algum traço restritivo característico denominado qualificação. A escolha da qualificação tem impacto significativo na formação de populações homogêneas e garante a impossibilidade de misturar objetos diferentes ou subestimar alguma parte do objeto. A essência do objeto de observação estatística é mais bem compreendida quando se consideram as unidades que o constituem: As unidades de observação são os elementos primários do objeto de observação estatística, portadores das características registradas.

Uma unidade de relatório deve ser diferenciada de uma unidade de observação. A unidade de reporte é a unidade de observação estatística da qual é recebida a informação sujeita a registo na forma prescrita. Em alguns casos, ambos os conceitos coincidem, mas muitas vezes têm um significado completamente independente. Acontece que é impossível e impraticável levar em consideração todo o conjunto de características que caracterizam o objeto de observação, portanto, ao desenvolver um plano de observação estatística, a questão da composição das características a serem registradas de acordo com o objetivo deve ser cuidadosamente e habilmente decidido. Uma lista de características formulada sob a forma de perguntas dirigidas a unidades da população, às quais um estudo estatístico deve responder, representa um programa de observação estatística.

Para obter uma descrição abrangente do fenómeno em estudo, o programa deve ter em conta toda a gama das suas características essenciais. No entanto, a natureza problemática da implementação prática deste princípio exige a inclusão no programa apenas das características mais essenciais que expressam os tipos socioeconómicos do fenómeno, as suas características, propriedades e relações mais importantes. O âmbito do programa é regulado pela quantidade de recursos disponíveis às autoridades estatísticas, pelo calendário de obtenção dos resultados, pelos requisitos relativos ao grau de detalhe dos desenvolvimentos, etc. O conteúdo do programa é determinado pela natureza e propriedades do objeto em estudo, pelas metas e objetivos do estudo. Entre os requisitos gerais para a elaboração de um programa está a inadmissibilidade de incluir questões para as quais seja difícil obter respostas precisas, totalmente fiáveis ​​e que dêem uma imagem objetiva de uma determinada situação. Ao considerar algumas das características mais importantes, costuma-se incluir questões de controle no programa para garantir a consistência das informações recebidas. Para melhorar a verificação mútua das questões e a natureza analítica do programa de observação, as questões inter-relacionadas são organizadas numa determinada sequência, por vezes em blocos de características inter-relacionadas.

As questões do programa de observação estatística devem ser formuladas de forma clara, concisa e concisa, sem permitir a possibilidade de diferentes interpretações. O programa geralmente fornece uma lista de possíveis opções de resposta, por meio da qual o conteúdo semântico das perguntas é esclarecido. O apoio metodológico à observação estatística pressupõe que em simultâneo com o programa de observação seja elaborado um programa para o seu desenvolvimento. Os objetivos da pesquisa são formulados em uma lista de indicadores estatísticos generalizantes. Estes indicadores devem ser obtidos a partir do processamento do material recolhido, das características a que corresponde cada indicador e dos layouts de tabelas estatísticas, que apresentam os resultados do processamento da informação primária. O programa de desenvolvimento, ao identificar informações faltantes, permite esclarecer o programa de observação estatística. A realização da observação estatística requer a preparação de ferramentas adequadas: formulários e instruções para seu preenchimento. Um formulário estatístico é um documento primário que registra as respostas às perguntas do programa para cada uma das unidades populacionais. A forma, portanto, é portadora de informações primárias. Todos os formulários são caracterizados por alguns elementos obrigatórios: uma parte de conteúdo, incluindo uma lista de perguntas do programa, uma coluna livre ou várias colunas para registro de respostas e códigos de resposta, impressão de título e endereço. Para garantir a uniformidade na interpretação do seu conteúdo, os formulários estatísticos são normalmente acompanhados de instruções, ou seja, instruções escritas e explicações para o preenchimento de formulários de observação estatística. As instruções explicam a finalidade da observação estatística, caracterizam o seu objeto e unidade, o tempo e a duração da observação, o procedimento de preparação da documentação e o prazo de apresentação dos resultados. Porém, o objetivo principal das instruções é explicar o conteúdo das questões do programa, como respondê-las e preencher o formulário.

Tipos e métodos de observação estatística.

O sucesso da recolha de dados iniciais completos e de elevada qualidade, tendo em conta a necessidade de utilização económica de recursos materiais, laborais e financeiros, é em grande parte determinado pela decisão sobre a escolha do tipo, método e forma organizacional de observação estatística.

Tipos de observação estatística.

A necessidade de escolher uma ou outra opção de recolha de dados estatísticos que melhor se adapte às condições do problema a resolver é determinada pela presença de vários tipos de observação, diferindo principalmente na natureza do registo dos factos ao longo do tempo. A observação sistemática, realizada contínua e necessariamente à medida que surgem sinais de um fenômeno, é chamada de atual. A observação atual é realizada com base em documentos primários que contêm as informações necessárias para uma descrição bastante completa do fenômeno em estudo. A observação estatística realizada em determinados intervalos de tempo iguais é chamada de periódica. Um exemplo é o censo populacional. A observação realizada de tempos em tempos, sem observação de frequência estrita ou pontual, é chamada de única. Os tipos de observação estatística são diferenciados tendo em conta as diferenças de informação com base na abrangência da cobertura da população. A este respeito, é feita uma distinção entre observações contínuas e não contínuas. Uma observação contínua é aquela que leva em consideração todas as unidades da população em estudo, sem exceção. A observação descontínua está obviamente orientada para ter em conta uma determinada parte, geralmente bastante massiva, das unidades de observação, o que permite, no entanto, obter características generalizantes estáveis ​​​​de toda a população estatística. Na prática estatística, são utilizados vários tipos de observação não contínua: método seletivo, método volumétrico, questionário e monográfico. A qualidade da observação não contínua é inferior aos resultados da observação contínua, porém, em alguns casos, a observação estatística em geral acaba sendo possível apenas como não contínua. Para obter uma característica representativa de toda a população estatística para alguma parte de suas unidades, utiliza-se a observação amostral, baseada nos princípios científicos de formação de uma população amostral. A natureza aleatória da seleção das unidades populacionais garante a imparcialidade dos resultados da amostragem e evita o seu viés. Utilizando o método do array principal, são selecionadas as maiores e mais significativas unidades da população, predominantes em sua massa total de acordo com a característica em estudo. Um tipo específico de observação estatística é a descrição monográfica, que é um exame detalhado de um objeto separado, mas muito típico, que é interessante do ponto de vista do estudo de toda a população.

Métodos de observação estatística.

A diferenciação dos tipos de observação estatística também é possível dependendo das fontes e métodos de obtenção da informação primária. A este respeito, é feita uma distinção entre observação direta, levantamento e observação documental. A observação direta é realizada por meio de contagem, medição dos valores dos sinais, leitura de instrumentos por pessoas especiais que realizam observações, ou seja, registradores. Muitas vezes, devido à impossibilidade de utilização de outros métodos, a observação estatística é realizada através de um inquérito sobre uma determinada lista de questões. As respostas são registradas em formulário especial. Dependendo dos métodos de recebimento das respostas, é feita uma distinção entre os métodos de encaminhamento e de correspondência, bem como o método de autorregistro. O método de inquérito de encaminhamento é realizado oralmente por uma pessoa especial (balcão, despachante), que preenche simultaneamente um formulário ou formulário de inquérito.

O método de pesquisa correspondente é organizado por órgãos estatísticos que distribuem formulários de pesquisa a um determinado círculo de pessoas adequadamente preparado, denominado correspondentes. Estes últimos são obrigados, nos termos do acordo, a preencher o formulário e devolvê-lo ao organismo estatístico. A verificação da correção do preenchimento dos formulários ocorre durante a pesquisa por meio do autorregistro. Os questionários são preenchidos, como no método correspondente, pelos próprios respondentes, mas são distribuídos e recolhidos, bem como instruídos e monitorados para o correto preenchimento, pelos recenseadores.

Formas organizacionais básicas de observação estatística.

Toda a variedade de tipos e métodos de observação é realizada na prática através de duas formas organizacionais principais: relatórios e observação especialmente organizada. O relato estatístico é a principal forma de observação estatística na sociedade social, abrangendo todas as empresas, organizações e instituições das esferas produtiva e não produtiva. O reporte é a apresentação sistemática de documentação contabilística e estatística em tempo útil, sob a forma de relatórios que caracterizam de forma abrangente os resultados do trabalho das empresas e instituições durante os períodos de reporte. O reporte está diretamente relacionado aos documentos primários e contábeis, baseia-se neles e representa sua sistematização, ou seja, o resultado do processamento e generalização. Os relatórios são realizados de uma forma estritamente estabelecida, aprovada pelo Comitê Estadual de Estatística da Rússia. A lista de todos os formulários com indicação de seus detalhes (acessórios) é chamada de planilha de relatório. Cada formulário de relatório deve conter as seguintes informações: nome; número e data da aprovação; nome da empresa, seu endereço e subordinação; endereços para os quais os relatórios são enviados; frequência, data de apresentação, forma de transmissão; conteúdo em forma de tabela; a composição oficial das pessoas responsáveis ​​​​pelo desenvolvimento e confiabilidade dos dados de relatórios, ou seja, obrigado a assinar o relatório. A variedade de condições do processo produtivo nos diversos setores da produção material, a especificidade do processo de reprodução nas condições locais, tendo em conta a importância de determinados indicadores determinam a diferença nos tipos de reporte. Existem, em primeiro lugar, relatórios padronizados e especializados. O relatório padrão tem a mesma forma e conteúdo para todas as empresas ou instituições da economia nacional. Os relatórios especializados expressam aspectos específicos de empresas individuais do setor. Com base no princípio da frequência, os relatórios são divididos em anuais e atuais: trimestrais, mensais, quinzenais, semanais. Dependendo do método de transmissão da informação, distinguem-se os relatórios postais e telegráficos. Os censos estatísticos servem como a segunda forma organizacional mais importante de observação estatística. Um censo é uma observação estatística especialmente organizada que visa registrar o número e a composição de determinados objetos (fenômenos), bem como estabelecer as características qualitativas de seus agregados em um determinado momento. Os censos fornecem informações estatísticas não previstas nos relatórios e, em alguns casos, esclarecem significativamente os dados contábeis atuais.

Para garantir a elevada qualidade dos resultados do censo estatístico, é realizado um conjunto de trabalhos preparatórios. O conteúdo das medidas organizacionais para a preparação dos censos, realizados de acordo com os requisitos e regras da ciência estatística, é definido num documento especialmente desenvolvido denominado plano organizacional de observação estatística. No plano organizacional, são consideradas as questões do sujeito (executor) da observação estatística, o local, horário, momento e procedimento da conduta, a organização das áreas censitárias, a seleção e formação dos contadores, fornecendo-lhes a necessária documentação contábil , uma série de outros trabalhos preparatórios e etc. O objeto da observação é a organização (instituição) ou sua divisão responsável pela observação, organizando a sua implementação, bem como desempenhando diretamente as funções de recolha e tratamento de dados estatísticos. A questão do local de observação (local onde os fatos são registrados) surge principalmente na realização de pesquisas estatísticas e sociológicas e é resolvida dependendo do objetivo do estudo.

O tempo de observação é o período de tempo durante o qual deve ser iniciado e concluído o trabalho de registro e verificação dos dados obtidos. O tempo de observação é selecionado com base no critério de mobilidade espacial mínima do objeto em estudo. O momento crítico em que os dados coletados são datados deve ser diferenciado do momento da observação.

O conceito de observação estatística é um tema bastante interessante a considerar. As observações estatísticas são usadas em quase todos os lugares onde sua aplicação pode ser determinada. Ao mesmo tempo, apesar do amplo âmbito de aplicação, as observações estatísticas são um assunto bastante complexo e os erros não são incomuns. No entanto, em geral, as observações estatísticas como tema a considerar são de grande interesse.