Resumo: Estimulos na econometria. Especificação do modelo de regressão múltipla Seleção da equação de regressão da especificação do modelo

Dependendo do número de fatores incluídos na equação de regressão, as regressões pareadas e múltiplas são diferenciadas.

Equação de relação entre duas variáveis ​​e x chamado regressão pareada , e a dependência sim de diversas variáveis ​​explicativas = ( x 1 ,x 2 ,...x n)– regressão múltipla .

A equação de regressão aos pares é:

Onde - variável independente que afeta no; – coeficientes do modelo.

Como já observado, na primeira etapa da pesquisa econométrica é feita a escolha da forma de relacionamento entre as variáveis, ou seja, a especificação da equação de regressão é realizada. Para este propósito, sua gama de fatores que influenciam a variável resultante no, são destacados os fatores que mais influenciam significativamente. A regressão pareada é considerada suficiente se for possível isolar o fator dominante, que é utilizado como variável explicativa (independente). A magnitude dos erros aleatórios depende da escolha correta da especificação do modelo: quanto mais próximos os dados reais, menores eles são no aos valores calculados usando a equação construída.

Os erros de especificação do modelo incluem não apenas a escolha incorreta de uma função matemática específica f relações entre variáveis no e , mas subestimação de qualquer fator significativo na equação de regressão, ou seja, usando regressão pareada em vez de regressão múltipla.

Na regressão pareada, a escolha da função matemática pode ser feita de forma gráfica, analítica e experimental.

Na maioria das vezes, para selecionar o tipo de equação de regressão emparelhada, é usado método gráfico , com base na construção de um campo de correlação. Os principais tipos de curvas utilizadas na avaliação das relações entre as variáveis ​​são apresentados na Figura 1:




a) b) V)

Método Analítico a escolha do tipo de equação de regressão consiste em estudar a natureza material da relação entre os fatores em estudo e levar em consideração os graus de influência entre eles na equação de regressão.

Usando método experimental equações de vários tipos são construídas e, em seguida, a melhor delas é selecionada em termos da magnitude da variância do erro:

.

Quanto menor a variância do erro, melhor a equação de regressão construída se ajusta aos dados originais.

A construção de uma equação de regressão múltipla começa com a decisão sobre a especificação do modelo. Inclui duas gamas de questões: seleção de fatores e escolha do tipo de equação de regressão.

A inclusão de um determinado conjunto de factores numa equação de regressão múltipla está principalmente relacionada com a compreensão do investigador sobre a natureza da relação entre o indicador modelado e outros fenómenos económicos. Os fatores incluídos na regressão múltipla devem atender aos seguintes requisitos.

    Eles devem ser quantificáveis. Caso seja necessário incluir no modelo um fator qualitativo que não possua medida quantitativa, então deve-se dar certeza quantitativa.

    Os fatores não devem estar intercorrelacionados e muito menos estar em uma conexão funcional exata.

A seleção dos fatores é feita com base em análises teóricas e econômicas qualitativas. No entanto, a análise teórica muitas vezes não permite responder de forma inequívoca à questão sobre a relação quantitativa das características em consideração e a conveniência de incluir o fator no modelo. Portanto, a seleção dos fatores costuma ser realizada em duas etapas: na primeira, os fatores são selecionados com base na essência do problema; no segundo, as estatísticas dos parâmetros de regressão são determinadas com base na matriz de indicadores de correlação.

Os coeficientes de intercorrelação (ou seja, correlações entre variáveis ​​explicativas) permitem excluir fatores redundantes do modelo. Acredita-se que duas variáveis ​​sejam explicitamente colinear, ou seja estão em uma relação linear entre si se. Se os fatores forem claramente colineares, então eles se duplicam e é recomendável excluir um deles da regressão. Neste caso, dá-se preferência não ao fator que está mais relacionado com o resultado, mas ao fator que, apesar de uma ligação suficientemente estreita com o resultado, tem a ligação menos estreita com outros fatores. Este requisito revela a especificidade da regressão múltipla como método para estudar o impacto complexo de fatores em condições de independência entre si.

A magnitude dos coeficientes de correlação pareada revela apenas uma colinearidade clara dos fatores. As maiores dificuldades na utilização do aparelho de regressão múltipla surgem na presença de multicolinearidade de fatores, quando mais de dois fatores estão relacionados entre si por uma relação linear, ou seja, há uma influência cumulativa de fatores uns sobre os outros.

Para avaliar a multicolinearidade dos fatores, pode-se utilizar o determinante da matriz de coeficientes de correlação pareados entre os fatores.

Quanto mais próximo de zero estiver o determinante da matriz de correlação interfator, mais forte será a multicolinearidade dos fatores e menos confiáveis ​​serão os resultados da regressão múltipla. E, inversamente, quanto mais próximo o determinante da matriz de correlação interfator estiver de um, menor será a multicolinearidade dos fatores.

Existem várias abordagens para superar a forte correlação entre fatores. A maneira mais simples de eliminar a multicolinearidade é excluir um ou mais fatores do modelo. Outra abordagem envolve fatores transformadores, o que reduz a correlação entre eles.

Ao selecionar os fatores, também é recomendado usar a seguinte regra: o número de fatores incluídos é geralmente 6 a 7 vezes menor que o volume da população sobre a qual a regressão é construída. Se esta relação for violada, então o número de graus de liberdade da dispersão residual é muito pequeno. Isso leva ao fato de que os parâmetros da equação de regressão se revelam estatisticamente insignificantes e o critério é menor que o valor da tabela.

A base da econometria é a construção de um modelo econométrico e a determinação das possibilidades de utilização deste modelo para descrever a análise e previsão de processos econômicos reais. Os objetivos do projeto de curso são o desenvolvimento de soluções de design de informação e apoio metodológico à investigação na área da modelação econométrica, bem como a obtenção de competências práticas na construção e investigação de modelos econométricos. O objetivo final aplicado da modelagem econométrica de processos socioeconômicos reais em um determinado...


Compartilhe seu trabalho nas redes sociais

Se este trabalho não combina com você, no final da página há uma lista de trabalhos semelhantes. Você também pode usar o botão de pesquisa


MINISTÉRIO DA EDUCAÇÃO E CIÊNCIA DA RÚSSIA

Instituição Educacional Orçamentária do Estado Federal

ensino profissional superior

"Universidade Técnica Estadual de Tver"

(TvSTU)

Instituto de Educação Profissional Adicional

Departamento de Contabilidade, Análise e Auditoria

Projeto de curso

Disciplina: Econometria

No tema: “Análise comparativa de modelos de regressão econométrica”

CONCLUÍDO: aluno do 3º ano

Instituto de Educação e Treinamento Continuados

Grupos RBAiA-37-12

Zamiatin

Cristina Dmitrievna

(Nome completo do aluno)

VERIFICADO:

Konovalova A.S.

(Nome completo do professor)

Rjev 2015

INTRODUÇÃO

CAPÍTULO 1. PARTE ANALÍTICA

Fundamentos da pesquisa econométrica de modelos de regressão.

Tecnologia de pesquisa econométrica de modelos de regressão.

CAPÍTULO 2. PARTE DO PROJETO

2.1 Informações e suporte metodológico

pesquisa econométrica

Regressão pareada e múltipla.

CONCLUSÃO

Lista de FONTES USADAS

INTRODUÇÃO

A econometria é uma ciência cujo objeto de estudo são os padrões quantitativos e as interdependências da economia com base nos métodos da estatística matemática. A base da econometria é a construção de um modelo econométrico e a determinação das possibilidades de utilização deste modelo para descrever, analisar e prever processos econômicos reais.

Ao criar a capacidade de tomar decisões económicas informadas, a análise econométrica é a base da análise e previsão económica.

Em qualquer área da economia, a atividade de um especialista exige a utilização de métodos de trabalho modernos baseados em modelos, conceitos e técnicas econométricas.

O número de pessoas que chegam aos países da UE para residência permanente foi escolhido como tema de investigação econométrica no projecto do curso. Os processos migratórios são um fator extremamente importante para avaliar as perspectivas de desenvolvimento da sociedade, pois a relevância do tema de investigação determina o crescente significado social destes processos no mundo moderno.

A investigação económica dos processos migratórios é um factor significativo no aumento da eficiência do desenvolvimento dos países. A história do desenvolvimento humano está indissociavelmente ligada às mudanças na dinâmica populacional. Na Europa, o rápido crescimento populacional deve-se principalmente a mudanças socioeconómicas, ou seja, acompanha o crescimento económico e as mudanças sociais.

Os objetivos do projeto de curso são o desenvolvimento de soluções de design de informação e apoio metodológico à investigação na área da modelação econométrica, bem como a obtenção de competências práticas na construção e investigação de modelos econométricos.

O objetivo do projeto de curso é utilizar na prática conhecimentos e habilidades na construção e pesquisa de modelos econométricos para realização de análise de dados econométricos.

O objetivo final aplicado da modelagem econométrica de processos socioeconômicos reais neste projeto de curso é a previsão de indicadores econômicos e socioeconômicos que caracterizam o estado e o desenvolvimento do sistema analisado, ou seja, a determinação de tendências nos processos de migração na UE países e sua dependência de fatores existentes levados em consideração na construção de modelos econométricos.

CAPÍTULO 1. PARTE ANALÍTICA

1.1. Fundamentos da pesquisa econométrica de modelos de regressão.

A disciplina económica preocupada com o desenvolvimento e aplicação de métodos estatísticos para medir as relações entre variáveis ​​econométricas é a econometria, que é uma combinação de teoria económica, estatística e matemática.

Os dados econométricos não são resultados de uma experiência controlada. A econometria trata de dados econômicos específicos e preocupa-se com a descrição quantitativa de relações específicas, ou seja, substitui coeficientes apresentados de forma geral por valores numéricos específicos. Na econometria, são desenvolvidos métodos de análise especiais para reduzir o impacto dos erros de medição nos resultados obtidos.

A principal ferramenta da econometria é um modelo econométrico, ou seja, uma descrição formalizada das relações quantitativas entre variáveis. A metodologia de modelagem contém grandes oportunidades de autodesenvolvimento, pois a modelagem é um processo cíclico, cada ciclo pode ser seguido pelo próximo, e o conhecimento sobre o objeto em estudo é ampliado e refinado, o modelo original é gradativamente aprimorado. Deficiências descobertas após o ciclo de modelagem anterior, devido ao pouco conhecimento do objeto e erros na construção do modelo, podem ser corrigidas em ciclos subsequentes.

Podem ser distinguidas três classes de modelos econométricos:

Modelo de dados temporais;

Modelo de regressão de equação única;

Sistema de equações simultâneas.

Classificação dos problemas resolvidos através de modelo econométrico: 1) de acordo com os objetivos finais aplicados:

Previsão de indicadores econométricos e socioeconômicos que caracterizam o estado e o desenvolvimento do sistema analisado;

Imitação de cenários possíveis para o desenvolvimento socioeconómico do sistema.

2) por nível de hierarquia:

Tarefas de nível macro (país como um todo);

Tarefas de nível meso (regiões, indústrias, corporações);

Nível micro (família, empresa, firma).

3) de acordo com o perfil do sistema econométrico, visando estudar:

Mercado;

Política de investimento, financeira ou social;

Preços;

Relações de distribuição;

Demanda e consumo;

Um conjunto de problemas.

Principais etapas da modelagem econométrica:

Etapa 1 - encenação. Determinação dos objetivos finais do modelo, do conjunto de fatores e indicadores nele envolvidos e do seu papel. Os principais objetivos da pesquisa: análise do estado e comportamento de um objeto econômico, previsão de seus indicadores econômicos, imitação do desenvolvimento do objeto, desenvolvimento de decisões de gestão.

Etapa 2 - a priori. Análise da essência do objeto em estudo, formação e formalização de informações conhecidas antes do início da modelagem.

Etapa 3 – parametrização. Selecionando a forma geral do modelo, a composição e a forma das conexões nele incluídas. A principal tarefa desta etapa é selecionar a função f(X).

Etapa 4 - informativa. Recolha de informação estatística necessária.

Etapa 5 – identificação do modelo. Análise estatística do modelo e estimação dos seus parâmetros. A maior parte da pesquisa econométrica.

Etapa 6 – verificação do modelo. Verificar a adequação do modelo, avaliando a precisão dos dados do modelo. Acontece com que sucesso os problemas de especificação e identificação foram resolvidos e qual é a precisão dos cálculos usando este modelo. É verificado até que ponto o modelo construído corresponde ao objeto ou processo econômico real simulado.

Ao modelar processos econômicos em modelos econométricos, é utilizado o seguinte:

1. Dados espaciais - um conjunto de informações sobre diferentes objetos obtidos no mesmo período de tempo.

2. Dados temporários - conjunto de informações que caracterizam o mesmo objeto, mas para períodos de tempo diferentes.

Um conjunto de informações representa um conjunto de características que caracterizam o objeto de estudo. Os sinais podem atuar em uma de duas funções: o papel de um sinal efetivo e o papel de um sinal fatorial.

As variáveis ​​são divididas em:

Exógeno, cujos valores são definidos externamente;

Endógeno, cujos valores são determinados dentro do modelo;

Desfasadas - variáveis ​​endógenas ou exógenas do modelo econométrico, datadas de momentos anteriores e localizadas na equação com variáveis ​​atuais;

Predeterminadas - variáveis ​​exógenas vinculadas a momentos passados, atuais e futuros e variáveis ​​endógenas defasadas já conhecidas em um determinado momento.

A econometria analisa principalmente os erros de especificação do modelo, assumindo que os erros de medição são reduzidos ao mínimo.

Especificação do modelo - seleção do tipo de dependência funcional (equações de regressão). A magnitude dos erros aleatórios não será a mesma entre as especificações do modelo, e minimizar o termo residual permite selecionar a melhor especificação.

Além da escolha da especificação do modelo, a descrição correta da estrutura do modelo também é importante. O valor do atributo resultante pode não depender do valor real da variável explicativa, mas do valor que era esperado no período anterior.

O modelo de regressão mais simples com apenas duas variáveis ​​faz parte da classe de modelos de regressão de equação única, nos quais uma variável explicada é representada como uma função de diversas variáveis ​​​​e parâmetros independentes (explicativos). Esta classe inclui vários modelos de regressão.

Mais simples são os modelos de séries temporais que explicam o comportamento de uma série temporal com base apenas em seus valores anteriores, estes são os modelos:

Tendência,

Sazonalidade,

Previsão adaptativa,

Média móvel, etc.

Mais gerais são os sistemas de equações simultâneas nos quais, além de variáveis ​​explicativas, o lado direito também pode conter variáveis ​​explicadas de outras equações, ou seja, diferente da variável explicada no lado esquerdo desta equação.

Ao usar equações de regressão separadas, assume-se que os fatores podem ser alterados independentemente uns dos outros, embora na realidade suas mudanças não sejam independentes, e uma mudança em uma variável na maioria das vezes acarreta mudanças em todo o sistema de características, porque eles estão interligados. É necessário ser capaz de descrever a estrutura das relações entre variáveis ​​​​por meio de um sistema de equações (estruturais) simultâneas.

Os modelos estatísticos e matemáticos de fenômenos e processos econômicos são determinados pelas especificidades de uma determinada área de pesquisa econômica. A teoria e a prática das avaliações periciais são uma seção importante da econometria, uma vez que as avaliações periciais são utilizadas para resolver uma série de problemas econômicos.

Mais conhecidos em publicações teóricas e educacionais são vários modelos econométricos concebidos para prever indicadores macroeconómicos. Geralmente são modelos que visam prever uma série temporal multivariada. Eles representam um sistema de dependências lineares entre valores passados ​​e presentes de variáveis. Nessas tarefas, tanto a estrutura do modelo é avaliada, ou seja, o tipo de dependência entre os valores das coordenadas vetoriais conhecidas em momentos anteriores e seus valores no momento previsto, bem como os coeficientes incluídos nesta dependência. A estrutura de tal modelo é um objeto de natureza não numérica. Cada área de pesquisa econômica possui seus próprios modelos econométricos.

1.2. Tecnologia de pesquisa econométrica de modelos de regressão.

A pesquisa e avaliação quantitativa das relações e dependências objetivamente existentes entre os fenômenos econômicos é a principal tarefa da econometria.

Uma relação de causa e efeito é uma relação entre fenômenos em que uma mudança em um deles, chamada de causa, leva a uma mudança no outro, chamado de efeito. Portanto, a causa sempre precede o efeito.

As relações de causa e efeito entre os fenômenos são de maior interesse para o pesquisador, o que permite identificar os fatores que têm grande influência na variação dos fenômenos e processos em estudo.

As relações de causa e efeito nos fenômenos socioeconômicos têm as seguintes características:

1. a causa X e o efeito Y não interagem diretamente, mas através de fatores intermediários, que são omitidos na análise.

2. Os fenómenos socioeconómicos desenvolvem-se e formam-se como resultado da influência simultânea de um grande número de factores. Um dos principais problemas no estudo desses fenômenos é a tarefa de identificar as causas principais e abstrair das secundárias.

De acordo com a direção da mudança, as conexões são divididas em:

1. direto (mudanças nas características resultantes e fatoriais ocorrem na mesma direção),

2. reverso (mudanças nas características resultantes e fatoriais ocorrem em direções opostas).

Com base na natureza da manifestação, distinguem-se:

1. conexão funcional - conexão em que um determinado valor de uma característica fatorial corresponde a um e apenas um valor da característica resultante, se manifesta em todos os casos de observação e para cada unidade específica da população em estudo, e é estudada principalmente nas ciências naturais.

2. dependência estocástica - uma dependência causal que não se manifesta em cada caso individual, mas em geral, com um grande número de observações, e os mesmos valores das características dos fatores, via de regra, correspondem a diferentes valores de a característica resultante, mas, considerando todo o conjunto de observações, é possível notar a presença de uma certa relação entre os valores das características. Um caso especial de relação estocástica é uma relação de correlação, na qual uma mudança no valor médio de uma característica efetiva se deve a uma mudança nas características dos fatores.

De acordo com a expressão analítica, as conexões são diferenciadas:

1. linear: a mudança na característica resultante é diretamente proporcional à mudança nas características do fator.

2. não linear.

Analiticamente, uma relação estocástica linear entre fenômenos pode ser representada por uma equação de uma linha reta em um plano, ou uma equação de um hiperplano no espaço n-dimensional (se houver n variáveis ​​de fator).

A construção de um modelo econométrico é a base da pesquisa econométrica. O grau de confiabilidade dos resultados da análise e sua aplicabilidade depende de quão bem o modelo resultante descreve os padrões estudados entre os processos econômicos.

A construção de um modelo econométrico começa com a especificação do modelo, que consiste na obtenção de resposta a duas questões:

1) quais indicadores econômicos deveriam ser incluídos no modelo;

2) que tipo de relação analítica existe entre as características selecionadas.

Em estudos dedicados ao desenvolvimento de métodos de previsão de indicadores financeiros como taxas de câmbio, títulos e índices, são amplamente utilizados modelos baseados no pressuposto de que a dinâmica desses processos é completamente determinada pelas condições internas.

Após identificar o conjunto de variáveis ​​em consideração, o próximo passo é determinar o tipo específico de modelo que melhor se adapta ao fenómeno em estudo.

Com base na natureza das relações entre fatores e variáveis, o modelo é dividido em linear e não linear. Com base nas propriedades de seus parâmetros, os modelos são divididos em modelos com estrutura constante e variável.

Um tipo especial de modelos consiste em sistemas de equações econométricas interligadas.

Se, com base numa análise qualitativa preliminar do fenómeno em consideração, não for possível selecionar de forma inequívoca o tipo de modelo mais adequado, são considerados vários modelos alternativos, entre os quais, durante o processo de investigação, aquele que melhor corresponde ao fenômeno em estudo é selecionado.

Em geral, o procedimento de construção de um modelo econométrico pode ser representado nas seguintes etapas:

1. Especificação do modelo, ou seja, seleção da classe de modelos mais adequada para descrever os fenômenos e processos em estudo.

Esta etapa envolve a resolução de dois problemas:

a) seleção de fatores significativos para sua posterior inclusão no modelo;

b) escolha do tipo de modelo, ou seja, escolha do tipo de relação analítica que liga as variáveis ​​incluídas no modelo.

2. Estimativa dos parâmetros do modelo, ou seja, obtenção de valores numéricos das constantes do modelo. Nesse caso, uma matriz de dados de origem obtida anteriormente é usada.

3. Verificar a qualidade do modelo construído e justificar a possibilidade de sua posterior utilização. A parte mais complexa e demorada da pesquisa econométrica é a etapa de estimativa dos parâmetros do modelo, onde são utilizados métodos de teoria das probabilidades e estatística matemática.

Ao resolver o problema de escolha do tipo de dependência analítica, várias considerações podem ser utilizadas:

Conclusões de estudos analíticos sobre a natureza qualitativa da dependência,

Descrição das propriedades de várias dependências analíticas,

Objetivos da construção do modelo.

A escolha do tipo de modelo econométrico baseia-se, em primeiro lugar, nos resultados de análises preliminares qualitativas ou substantivas realizadas através dos métodos da teoria económica. A natureza da dependência esperada é justificada com base em pressupostos teóricos sobre a natureza do padrão de desenvolvimento do fenômeno ou processo em estudo.

Outra abordagem baseia-se na análise de um conjunto de dados iniciais, o que nos permite identificar algumas características das dependências esperadas e, com base nisso, formular, via de regra, vários pressupostos sobre o tipo de ligação analítica. O modelo construído é utilizado para formular suposições sobre a natureza do padrão no desenvolvimento do fenômeno em estudo, que são testadas em pesquisas futuras.

Os modelos lineares são mais amplamente utilizados em econometria.

Isto acontece por diversas razões:

Existem métodos eficazes para construir tais modelos.

Em uma pequena faixa de valores das características dos fatores, os modelos lineares podem aproximar dependências não lineares reais com precisão suficiente.

Os parâmetros do modelo têm uma interpretação económica clara.

As previsões baseadas em modelos lineares são caracterizadas por um menor risco de erros de previsão significativos.

Um componente importante do processo de construção de um modelo econométrico é a seleção de fatores que influenciam significativamente o indicador em estudo e que devem ser incluídos no modelo em desenvolvimento. O conjunto ideal de fatores é determinado com base em análises qualitativas e quantitativas.

Na fase de formulação do problema e análise económica significativa do modelo económico, são selecionados fatores cuja influência deve ser tida em conta na construção do modelo. Em alguns casos, um conjunto de factores é determinado de forma inequívoca ou com um elevado grau de confiança. Em casos mais complexos, a próxima etapa utiliza métodos estatísticos formais para verificar a viabilidade de inclusão de cada fator no modelo. Em primeiro lugar, os fatores são verificados quanto à presença de uma correlação linear estreita entre eles, cuja existência leva a estimativas não confiáveis ​​dos parâmetros do modelo.

Para superar a forte correlação entre fatores, são usados ​​os seguintes:

exclusão de um ou mais fatores do modelo. Dos dois fatores correlacionados, elimina-se aquele que está mais correlacionado com os demais fatores;

transformação de fatores, o que reduz a correlação entre eles.

Um dos critérios para inclusão de fatores no modelo é o grau de sua influência isolada na característica resultante.

Dois métodos para determinar o conjunto ideal de fatores:

1. método de inclusão. Uma equação de regressão é construída com um fator mais influente, então os seguintes fatores são introduzidos sequencialmente nela e o par de fatores mais influentes é determinado, então mais um fator é adicionado aos dois primeiros e os três melhores fatores são determinados, etc. A cada etapa, um modelo de regressão é construído e a significância dos fatores é testada. Apenas fatores significativos são incluídos no modelo. Para testar a significância de um fator, pode-se usar o teste t de Student ou o teste parcial de Fisher. O processo termina quando não há mais fatores a serem incluídos no modelo.

2. método de exclusão. Uma equação de regressão é construída com um conjunto completo de fatores, dos quais fatores insignificantes ou menos significativos são então excluídos sequencialmente. A cada etapa, apenas um fator é excluído, pois após a eliminação de um fator, outro fator, que antes era insignificante, pode tornar-se significativo. O processo termina quando não há mais fatores a serem excluídos.

Os métodos de inclusão e exclusão não garantem a determinação do conjunto ótimo de fatores, mas na maioria dos casos fornecem resultados ótimos ou próximos deles. Não é recomendado incluir um número muito grande de fatores no modelo, pois isso pode dificultar a identificação de padrões qualitativos e aumentar o risco de inclusão de fatores aleatórios sem importância no modelo. Para obter estimativas confiáveis ​​de parâmetros, é desejável que o número de observações exceda o número de parâmetros a serem determinados em pelo menos 6 a 7 vezes.

Após selecionar os fatores e escolher o tipo de dependência analítica, são avaliados os parâmetros do modelo. Ao estimar os parâmetros do modelo, um conjunto de observações previamente preparado é usado como dados iniciais. A qualidade das estimativas é determinada pela presença de propriedades como imparcialidade, consistência e eficiência. Uma estimativa de parâmetro é chamada de imparcial se sua expectativa matemática for igual ao parâmetro estimado. Uma estimativa de um parâmetro é chamada de consistente se convergir em probabilidade para o parâmetro estimado à medida que o número de observações aumenta. Uma estimativa de parâmetro é considerada eficiente se tiver a menor variância entre possíveis estimativas de parâmetros imparciais calculadas a partir de amostras do mesmo tamanho n.

CAPÍTULO 2. PARTE DO PROJETO

2.1 Informação e suporte metodológico para pesquisas econométricas.

A metodologia de pesquisa econométrica compreende as seguintes etapas: especificação; parametrização, verificação, pesquisas adicionais.

1. A especificação de modelos de equações de regressão pareada e múltipla inclui uma análise da dependência da correlação da variável dependente em cada variável explicativa. Com base nos resultados da análise, chega-se a uma conclusão sobre o modelo de equação de regressão. Como resultado desta etapa, é determinado o modelo da equação de regressão.

2. A parametrização de uma equação de regressão pareada envolve a estimativa de parâmetros de regressão e sua interpretação socioeconômica. Para parametrização, recomenda-se a utilização da ferramenta “Regressão” como parte dos complementos “Análise de Dados” do MsExcel. Com base nos resultados da análise de regressão automatizada, os parâmetros de regressão são determinados e sua interpretação também é dada.

Assim, um estudo econométrico de regressão pareada inclui o cálculo dos parâmetros das equações de regressão, avaliação das variâncias dos erros e variâncias dos parâmetros do modelo, avaliação da força da relação entre um fator e o resultado por meio do coeficiente de elasticidade, avaliação da proximidade da relação, avaliação a qualidade da equação por meio do erro médio de aproximação, avaliando a confiabilidade estatística das equações de regressão por meio do teste F de Fisher.

Para construir e analisar a regressão emparelhada, foi selecionada uma lista dos vinte maiores países da União Europeia a partir do anuário estatístico, nomeadamente o número de pessoas que chegam ao país para residência permanente e os salários nominais anuais dos empregados.

O coeficiente de correlação é calculado usando a fórmula:

Onde

O coeficiente de correlação mostra a estreita relação entre os fenômenos em estudo.

Para construir uma equação de regressão pareada, é necessário considerar possíveis equações de regressão:

  1. dependência linear
  2. relação exponencial
  3. dependência quadrática
  4. dependência cúbica

Para estimar os parâmetros de regressão, aplicamos o método dos mínimos quadrados (MQO) a todos esses modelos.

A ideia do método é obter a melhor aproximação de um conjunto de observações x eu , y eu , eu = 1,…, n função linear no sentido de minimizar o funcional:

Para calcular parâmetros a e b a regressão linear resolve um sistema de equações em relação a a e b.

a partir do qual as estimativas dos parâmetros podem ser determinadas a e b.

t Teste do aluno.

Uma hipótese é apresentada H 0 sobre a natureza aleatória do indicador, ou seja, sua diferença insignificante de zero. H 0 : =0

A construção da equação da curva exponencial é precedida do procedimento de linearização das variáveis ​​tomando o logaritmo de ambos os lados da equação:

Os parâmetros da equação do modelo são encontrados usando as seguintes fórmulas:

Uma equação linear é obtida.

X , resultados de valores teóricos podem ser obtidos. Com base neles, é calculado um indicador da proximidade do índice de correlação de conexão.

Este coeficiente é verificado quanto à significância usando t Teste do aluno.

O cálculo das estimativas das variâncias dos erros e variâncias dos parâmetros do modelo é realizado usando as seguintes fórmulas:

A equação de uma curva quadrática é construída fazendo a substituição

Substituindo valores reais na equação X

Este coeficiente é verificado quanto à significância usando t Teste do aluno.

O cálculo das estimativas das variâncias dos erros e variâncias dos parâmetros do modelo é realizado usando as seguintes fórmulas:

A equação de uma curva cúbica é construída fazendo a substituição

Isso resulta em uma equação linear

Substituindo valores reais nesta equação X , resultados de valores teóricos podem ser obtidos. Utilizando-os, calcularemos o indicador do índice de correlação de proximidade de conexão.

Este coeficiente é verificado quanto à significância usando t Teste do aluno.

O cálculo das estimativas das variâncias dos erros e variâncias dos parâmetros do modelo é realizado usando as seguintes fórmulas:

O coeficiente de elasticidade médio mostra em que porcentagem, em média, o resultado y mudará em relação ao seu valor médio quando o fator x mudar em 1% em relação ao seu valor médio:

O coeficiente de determinação fornece uma avaliação da qualidade do modelo construído. O coeficiente de determinação caracteriza a proporção da variância da característica resultante y, explicada pela regressão, na variância total da característica resultante.

O coeficiente de determinação é igual ao quadrado do índice de correlação. Quanto mais próximo da unidade, melhor será a qualidade do ajuste, ou seja, aproxima y com mais precisão.

Erro médio de aproximação desvio médio dos valores calculados dos reais:

O limite de valores permitido não é superior a 8-10%.

A significância da equação de regressão é avaliada usando F -Critério de Fisher. Neste caso, é apresentada uma hipótese nula sobre a igualdade das variâncias reais e residuais e, portanto, o fator x não tem efeito sobre sim, ou seja

H 0 : D real = D repouso

Para fazer isso, é feita uma comparação entre os valores reais e críticos (tabulares) F -Critério de Fisher. determinado a partir da razão entre os valores das variâncias fatoriais e residuais:

O valor máximo possível do critério sob a influência de fatores aleatórios com determinados graus de liberdade e nível de significância. O nível de significância é a probabilidade de rejeitar uma hipótese correta, desde que seja verdadeira.

Se<, то отклоняется и признается статистическая значимость и надежность уравнения регрессии, иначе - принимается и делается вывод о не значимости уравнения регрессии.

3. A parametrização de uma equação de regressão múltipla envolve a estimativa de parâmetros de regressão e a sua interpretação socioeconómica. Para parametrização, recomenda-se a utilização da ferramenta “Regressão” como parte dos complementos “Análise de Dados” do MsExcel. Com base nos resultados da análise de regressão automatizada, os parâmetros de regressão são determinados e sua interpretação também é dada.

A equação de regressão é verificada com base nos resultados da análise de regressão automatizada.

Assim, um estudo econométrico de regressão múltipla inclui a construção de uma equação de regressão múltipla, o cálculo dos coeficientes de elasticidade para cada fator e uma avaliação comparativa da força da relação de cada fator com o resultado, a interpretação econômica do modelo construído, a construção de uma matriz de correlação, o cálculo do coeficiente de correlação múltipla, o cálculo das estimativas das variâncias dos erros do modelo e estimativas dos parâmetros do modelo, a construção de intervalos de confiança para os coeficientes do modelo com um nível de significância selecionado, a verificação da significância de cada coeficiente, a avaliação do proximidade da relação, avaliando a confiabilidade estatística da equação de regressão por meio do teste F de Fisher.

Para construir e analisar a regressão múltipla, vários outros indicadores são introduzidos no modelo para ter em conta vários factores que influenciam o número de pessoas que chegam ao país para residência permanente. Ou seja, fatores como o número de desempregados e o PIB do país.

Equação de relacionamento de regressão múltipla com diversas variáveis ​​desconhecidas:

onde você variável dependente (característica resultante),

Variáveis ​​independentes (fatores).

Para construir uma equação de regressão múltipla, é usada uma função linear escrita em forma de matriz:

Onde,

Para estimar os parâmetros da equação de regressão múltipla, é utilizado o método dos mínimos quadrados:

É construído o seguinte sistema de equações, cuja solução permite obter estimativas dos parâmetros de regressão:

Sua solução explícita geralmente é escrita em forma de matriz, caso contrário torna-se muito complicado.

As estimativas dos parâmetros do modelo em forma de matriz são determinadas pela expressão:

X matriz de valores de variáveis ​​explicativas;

S vetor de valores da variável dependente.

Para identificar a dependência do número de pessoas que chegam para residência permanente do salário nominal anual dos trabalhadores contratados, do número de desempregados e do nível do PIB, construiremos uma equação de regressão múltipla na forma:

Caracterizar a força relativa da influência dos fatores sobre sim Vamos calcular os coeficientes médios de elasticidade. Os coeficientes médios de elasticidade para regressão linear são calculados usando as fórmulas:

Com uma dependência linear, o coeficiente de correlação múltipla pode ser determinado através da matriz de coeficientes de correlação pareados:

onde está o determinante da matriz de coeficientes de correlação pareados;

Determinante da matriz de correlação interfatorial.

Matriz de coeficientes de correlação de pares:

Matriz de correlação interfatorial:

O cálculo das estimativas das variâncias dos erros e variâncias dos parâmetros do modelo é realizado usando as seguintes fórmulas:

Para avaliar a significância estatística dos coeficientes de regressão, calculamos t -Teste de estudante e intervalos de confiança para cada parâmetro. É apresentada uma hipótese sobre a natureza aleatória dos indicadores, ou seja, sobre sua diferença insignificante de zero. Obtemos um conjunto de hipóteses:

: b 0 =0; b 1 =0; b 2 =0; b 3 =0

t -O teste t de Student é realizado comparando seus valores com o valor da tabela, calculado como um quantil da distribuição de Student, onde o nível de significância é a probabilidade de rejeitar a hipótese correta, desde que seja verdadeira.

Para calcular intervalos de confiança, use a seguinte fórmula:

A qualidade do modelo construído como um todo é avaliada pelo coeficiente de determinação. O coeficiente de determinação múltipla é calculado como o quadrado do índice de correlação múltipla: .

O índice ajustado de determinação múltipla contém uma correção para o número de graus de liberdade e é calculado pela fórmula:

onde n número de observações;

eu número de fatores.

A significância da equação de regressão múltipla como um todo, bem como na regressão pareada, é avaliada usando F- Teste de Fisher:

Neste caso, levanta-se uma hipótese sobre a insignificância da equação de regressão:

Finalmente, é formado um julgamento sobre a qualidade da equação de regressão.

4. É realizada uma análise comparativa dos modelos de regressão.

2.2. Um exemplo de estudo econométrico.

Com base em dados estatísticos, a investigação econométrica é realizada de acordo com a metodologia da cláusula 2.1.

Todos os cálculos necessários são realizados em MS Excel, são realizados cálculos manuais e os resultados obtidos são verificados através das funções do pacote de análise de dados “Regressão”.

O coeficiente de correlação de pares lineares é:

0,504652547

O coeficiente de correlação tem valor positivo e é igual a uma relação direta moderada entre o indicador y e fator x : com o aumento do salário médio anual dos trabalhadores de um país, aumenta o número de pessoas que chegam ao país.

2. A regressão pareada é construída e analisada. Os dados iniciais são apresentados na Tabela 1.

Tabela 1. Dados iniciais para construção e análise de regressão pareada

sim - número de pessoas que chegaram ao país para residência permanente, mil pessoas;

Como resultado da análise, é necessário estabelecer o quanto os salários dos trabalhadores contratados no país influenciam o número de pessoas que chegaram ao país para residência permanente.

Estimativa de parâmetros a e b.

Equação de regressão:

Coeficiente de regressão b=4,279 mostra a variação média do resultado com a variação do fator em uma unidade: com o aumento do salário anual dos trabalhadores contratados em 1 mil euros. o número de chegadas para residência permanente aumentará em média 4.279 mil pessoas. Um valor positivo do coeficiente de regressão indica a direção direta do relacionamento.

O coeficiente de correlação de pares lineares é:

0,504652547

A conexão é direta e moderada.

Mesa 2,47 T (0,05;18) = 2,101

> Mesa T , o coeficiente é significativo.

É realizado o cálculo das estimativas das variâncias dos erros e das variâncias dos parâmetros do modelo. Os cálculos provisórios são apresentados na Tabela 2.

10765,218 = 1477,566815 = 2,976774696

Construção da equação da curva exponencial.

Os valores dos parâmetros de regressão foram

0,068027 = 1,68049

A equação linear obtida é: .

Após potencialização:

Índice de correlação.

Este coeficiente é verificado quanto à significância.

Aba 2,15 T (0,05;18) = 2,101

> Mesa T , o coeficiente é significativo.

É realizado o cálculo das estimativas das variâncias dos erros e das variâncias dos parâmetros do modelo. Os cálculos provisórios são apresentados na Tabela 3.

Como resultado, foram obtidos os seguintes valores:

11483,75 = 452,87517 = 3,1754617

Tabela 2. Cálculo de valores para o modelo linear

Tabela 3. Cálculo de valores para o modelo exponencial

A equação de uma curva quadrática é construída.

Parâmetros da equação:

Índice de correlação.

Este coeficiente é verificado quanto à significância.

Guia T 3,41 (0,05;18) = 2,101

> Mesa T , o coeficiente é significativo.

É realizado o cálculo das estimativas das variâncias dos erros e das variâncias dos parâmetros do modelo. Os cálculos provisórios são apresentados na Tabela 4.

Como resultado, foram obtidos os seguintes valores:

8760,35808 = 743,283328 = 0,00123901

A equação de uma curva cúbica é construída.

Parâmetros da equação:

A equação de regressão assume a forma:

Índice de correlação.

Este coeficiente é verificado quanto à significância.

Guia T 4,38 (0,05;18) = 2,101

> Mesa T , o coeficiente é significativo.

É realizado o cálculo das estimativas das variâncias dos erros e das variâncias dos parâmetros do modelo. Os cálculos provisórios são apresentados na Tabela 5.

Como resultado, foram obtidos os seguintes valores:

6978,45007 = 514,7649432 = 5,9851E-07

O maior grau de conexão entre variáveis ​​está no modelo com dependência cúbica, pois o coeficiente de correlação no modelo cúbico é o mais próximo da unidade e o mais baixo no modelo exponencial. As variâncias dos erros e parâmetros do modelo assumem valores cúbicos mínimos.

Tabela 4. Cálculo de valores para o modelo quadrático

Tabela 5. Cálculo de valores para o modelo cúbico

O coeficiente de elasticidade médio é encontrado.

Dependência linear

1,250028395 %.

Dependência exponencial

1,2083965

Com um aumento de 1% no salário anual dos trabalhadores contratados, o número de pessoas que chegam ao país para residência permanente aumenta em 1,2083965 % .

Dependência quadrática

Com um aumento de 1% no salário anual dos trabalhadores contratados, o número de pessoas que chegam ao país para residência permanente aumenta em 1,24843054 % .

Dependência cúbica

0,938829224

Com um aumento de 1% no salário anual dos trabalhadores contratados, o número de pessoas que chegam ao país para residência permanente aumenta em 0,938829224 % .

Os coeficientes de elasticidade são apresentados na Tabela 6.

Todos os modelos construídos confirmam que os salários dos trabalhadores contratados são um factor de aumento do número de pessoas que chegam ao país para residência permanente. O coeficiente de elasticidade mostra que os salários anuais dos trabalhadores contratados têm maior influência no número de pessoas que chegam ao país para residência permanente com dependências lineares e quadráticas. Em menor grau, esta relação pode ser traçada na dependência cúbica.

O coeficiente de determinação é encontrado.

Dependência linear

A equação de regressão explica 25% da variância do atributo efetivo, e os demais fatores respondem por 75% da sua variância.

O modelo de dependência linear não se aproxima bem dos dados originais.

Dependência exponencial =

A relação entre os indicadores é tão fraca como no modelo linear. Variação apenas 20% explicado pela variação X , e os demais fatores respondem por 80%. A conexão neste modelo é a mais fraca. Portanto, a qualidade do modelo é insatisfatória.

Dependência quadrática

A relação entre os indicadores é ligeiramente melhor do que nos modelos exponencial e linear. A variação em y é de apenas 40% explicada pela variação em x. Também não é aconselhável utilizar este modelo para previsão.

Dependência cúbica

A relação entre os indicadores é melhor que nos modelos anteriores. 52% da variação em y é explicada pela variação em x.

Os valores dos coeficientes de determinação são apresentados na Tabela 6.

Tabela 6. Cálculo de parâmetros e características dos modelos.

A qualidade dos modelos construídos é baixa, O modelo com dependência cúbica apresentou o maior índice de qualidade, pois a parcela da variação explicada foi de 52%.

O erro médio de aproximação é determinado pelo desvio médio dos valores calculados dos reais:

Modelo linear = 1153,261 %

Em média, os valores calculados divergem dos reais em 1153,261 %, o que indica um erro de aproximação muito grande.

Dependência exponencial = 396,93259

O erro de aproximação é ligeiramente inferior ao de outros modelos, mas também é inaceitável.

Dependência quadrática = 656,415018

Observa-se um alto erro de aproximação, o que indica uma baixa qualidade de ajuste da equação

Dependência cúbica = 409,3804652

O erro de aproximação também excede significativamente os valores aceitáveis.Em todos os modelos considerados, o erro médio de aproximação excede significativamente os valores permitidos e a qualidade de ajuste dos modelos aos dados originais é muito baixa.

3. É realizada a construção e análise de regressão múltipla.

Os dados iniciais para a construção da regressão múltipla são apresentados na Tabela 7.

Tabela 7. Dados iniciais para construção de regressão múltipla.

sim - número de pessoas que chegaram ao país para residência permanente, mil pessoas:

x 1 - salários nominais anuais dos empregados, milhares de euros.

x 2 - número de desempregados, mil pessoas.

x 3 - PIB, mil milhões de euros.

Estimativas dos parâmetros da equação de regressão:

Equação de regressão múltipla:

Coeficientes médios de elasticidade.

0,12026241 = -0,06319176 = 0,86930458

O cálculo desses valores é dado na Tabela 8.

Com um aumento dos salários anuais dos trabalhadores contratados em 1% do nível médio, mantendo-se os restantes factores inalterados, o número de pessoas que chegam para residência permanente aumenta em 0,12 %.

Com um aumento do número de desempregados em 1% da média, mantendo-se os restantes factores inalterados, o número de pessoas que chegam para residência permanente diminui em 0,06 %

Com um aumento do PIB de 1% da média, mantendo-se outros factores inalterados, o número de chegadas para residência permanente aumenta em 0,87 %

A variação do número de pessoas que chegam ao país para residência permanente depende diretamente dos salários anuais dos trabalhadores contratados e do nível do PIB do país e inversamente dependente do número de desempregados, o que não contradiz pressupostos lógicos. Os coeficientes de elasticidade, enquanto indicadores da força da ligação, mostram que a maior variação no número de chegadas ao país é causada pelo valor do PIB, e a menor pelo número de desempregados.

O coeficiente de correlação múltipla é calculado:

O valor do índice de correlação múltipla varia de 0 a 1.

O erro médio de aproximação é calculado:

372,353247%

O valor do erro médio de aproximação indica um mau ajuste do modelo aos dados originais.

Tabela 8. Cálculo dos valores das características do modelo de regressão múltipla

A influência combinada de todos os factores no número de pessoas que chegam ao país para residência permanente é bastante grande. COMa relação entre o indicador em consideração e os fatores que o influenciam fortaleceu-se em comparação com a regressão pareada ( r yx =0,506). Existe uma conexão bastante forte.

É necessário levar em consideração que existe uma leve multicolinearidade no modelo, o que pode indicar sua instabilidade, uma vez que o determinante da matriz de correlação interfator está bastante distante de 1. O coeficiente máximo de correlação de pares é observado entre os fatores x 1 e x 3 (r x 1 x 3 =0,595), o que é compreensível, pois O salário médio anual no país deveria depender diretamente do PIB do país.

Cálculo de estimativas de variâncias de erros e variâncias de parâmetros do modelo:

n = 20 número de observações, eu =4 número de parâmetros.

Para o modelo construído, a estimativa da variância do erro foi:

6674,02207

Estimativas de variâncias dos parâmetros do modelo:

Erros padrão dos parâmetros do modelo:

Cálculos provisórios dos dados obtidos são apresentados no Apêndice 8.

Avaliando a significância dos coeficientes de regressão usando t -Teste t de Student.

Significados,<, значит коэффициенты являются статистически незначимыми и случайно отличаются от 0.

>, portanto é estatisticamente significativo

Para o modelo construído, intervalos de confiança dos coeficientes de regressão:

Todos os coeficientes de regressão obtidos, exceto, são estatisticamente insignificantes, o intervalo de confiança para eles é bastante grande, o que pode indicar qualidade insuficiente do modelo.

Coeficiente de determinação múltipla para o modelo construído

Este coeficiente de determinação mostra que a qualidade do modelo é satisfatória.

Com a adição de outra variável geralmente aumenta. Para evitar possível exagero na proximidade da ligação, utiliza-se um coeficiente de determinação ajustado. Para um determinado volume de observações, ceteris paribus, com o aumento do número de variáveis ​​​​independentes (parâmetros), o coeficiente de determinação múltipla ajustado diminui. Para o modelo construído, os valores do coeficiente de determinação ajustado e não ajustado não diferem significativamente entre si, mas como o coeficiente de determinação ajustado diminuiu ligeiramente, o que sugere que o aumento na proporção da regressão explicada ao adicionar uma nova variável é insignificante, e que a adição de uma variável não é aconselhável.

Avaliando a significância da equação de regressão usando F -Critério de Fisher.

F (0,05, m -1, n - m )= F (0,05,1,18)= 4,413873

Modelo linear = 6,150512218

Dependência exponencial = 4,6394274

Dependência quadrática = 11,6775003

Dependência cúbica = 19,25548322

Em todos os modelos considerados<, гипотеза отвергается.

A significância da equação de regressão múltipla como um todo usando F- Teste de Fisher:

Desde a tabela F< F факт então não é aceito

4. Como resultado do estudo, podemos tirar a seguinte conclusão: Todas as equações de regressão obtidas são significativas. De acordo com os resultados F -teste e os indicadores do coeficiente de determinação e do erro médio de aproximação, podemos concluir que entre os modelos de regressão pareados considerados não existe nenhum modelo com boa qualidade que possa ser utilizado para fins de previsão. Porém, o melhor modelo que descreve a relação entre o salário anual dos trabalhadores assalariados de um país e o número de pessoas que chegam ao país para residência permanente é um modelo com dependência cúbica, por ser significativo, o coeficiente de determinação leva o maior valor e o erro médio de aproximação não é tão grande em comparação com outros modelos, embora não aceite um valor aceitável.

Todos os quatro modelos de regressão pareados são estatisticamente significativos, porém, valores bastante pequenos do coeficiente de determinação e grandes erros na aproximação média indicam a má qualidade desses modelos.

Comparados os parâmetros e características dessas equações, conclui-se que o modelo com dependência cúbica apresenta maior confiabilidade e precisão. Isso é evidenciado pelo maior valor do índice de correlação e, consequentemente, do coeficiente de determinação, que é mais próximo de 1 e confirma a melhor qualidade do modelo em termos de aproximação dos dados, os resultados do teste F, que reconheceu o modelo como significativo, bem como o erro médio de aproximação, que é menor que o de outros modelos. Os erros padrão dos parâmetros de regressão e o erro padrão da previsão para este modelo também assumem valores menores.

A equação de regressão múltipla é significativa, ou seja, rejeita-se a hipótese sobre o caráter aleatório das características avaliadas. O modelo resultante é estatisticamente confiável.

CONCLUSÃO

Como resultado da pesquisa econométrica e da análise dos dados, foram consideradas quatro equações de regressão pareadas, estabelecendo a relação entre o salário médio anual dos trabalhadores contratados no país e o número de pessoas que chegaram ao país para residência permanente. Este é um modelo linear, modelo exponencial, modelos com dependência quadrática e cúbica. Todos os modelos construídos confirmam que o aumento dos salários dos trabalhadores contratados é um factor de aumento do número de pessoas que chegam ao país para residência permanente.

O maior indicador da proximidade da relação entre as variáveis ​​​​está no modelo com dependência cúbica, pois o coeficiente de determinação no modelo cúbico assume o maior valor, o que indica a maior confiabilidade da equação de regressão encontrada. Um modelo em forma de relação cúbica descreve melhor a relação entre o número de pessoas que chegam ao país para residência permanente e os salários anuais dos trabalhadores contratados.Em todos os modelos considerados, o erro médio de aproximação excede significativamente os valores aceitáveis, o que indica uma baixa qualidade de ajuste dos modelos. Porém, o modelo com dependência cúbica é o melhor em termos de aproximação dos dados e avaliação da proximidade da relação, pois possui a maior parcela de variação explicada em comparação com outros modelos - 52% (o coeficiente de determinação é mais próximo de 1) .

Para todos os parâmetros considerados, a equação de regressão com dependência cúbica é a melhor das consideradas. Mas não é ideal para utilização prática e previsão, o que é explicado pela grande dispersão dos dados, bem como pelo facto de o número de imigrantes depender de muitos factores que não podem ser tidos em conta na regressão emparelhada.

Características insuficientemente boas do modelo podem ser causadas pela presença nos dados de origem de unidades com valores anômalos das características em estudo: no Reino Unido, o número de chegadas para residência permanente é significativamente superior a este indicador para outros países . Talvez este país devesse ser excluído da amostra para obter um resultado mais preciso e confiável.

Como resultado da construção da regressão múltipla, foi investigada a influência no número de pessoas que chegam ao país para residência permanente de fatores como o PIB do país, o número de desempregados e o salário médio anual dos trabalhadores contratados.

A variação do número de pessoas que chegam ao país para residência permanente está diretamente dependente dos salários anuais dos trabalhadores contratados e do nível do PIB do país e inversamente relacionada com o número de desempregados. A maior variação no número de chegadas ao país é causada pelo valor do PIB, e a menor pelo número de desempregados.

A influência combinada de todos os fatores no número de pessoas que chegam ao país para residência permanente é bastante grande, uma vez que o índice de correlação múltiplaassume um valor alto. No entanto, isso pode ser devido à presença de multicolinearidade.

Todos os coeficientes obtidos da equação de regressão múltipla, exceto o coeficiente para o fator nível do PIB, são estatisticamente insignificantes, o intervalo de confiança para eles é bastante grande.

Apesar disso, o coeficiente de determinação mostra que a qualidade do modelo é satisfatória. A equação de regressão múltipla é significativa, ou seja, rejeita-se a hipótese sobre o caráter aleatório das características avaliadas.

No entanto, heterocedasticidade pode ser observada no modelo, ou seja, O modelo pode precisar ser corrigido.

Estes resultados podem ser explicados pelo tamanho bastante reduzido da amostra, especialmente tendo em conta a natureza global do estudo, a presença de um valor anómalo da característica estudada, a não consideração de quaisquer factores significativos, bem como o facto de que o número de emigrantes para o país depende de um grande número de fatores pessoais não quantitativos, de preferências individuais.

Apesar da falta de um resultado exato e de uma equação de regressão qualitativa adequada para previsões e futuras pesquisas, o estudo revelou que os salários dos trabalhadores contratados no país, a taxa de desemprego e o PIB têm um impacto importante no número de pessoas que chegam ao país para residência permanente.

Lista de fontes usadas

1. Gerasimov, A.N. Econometria: teoria e prática [recurso eletrônico]: livro eletrônico / Gerasimov, A.N., Gladilin, A.V., Gromov, E.I. - M.: KnoRus, 2011. - CD. - (82803-2) (U;G 37)

2. Yakovleva, A. Ordem. Econometria: curso de palestras - M.: Eksmo, 2010. - (83407-1)

3. Valentinov, V.A. Econometria [Texto]: workshop - M.: Dashkov i K, 2010. - 435 p. - (84265-12) (U;V 15)

4. Valentinov, V.A. Econometria [Texto]: livro didático para universidades sobre temas especiais. "Métodos matemáticos em economia" e outras economias. especialista. - M.: Dashkov e K, 2010. - 448 p. - (84266-30) (U;V 15)

5. Novikov, A.I. Econometria [Texto]: livro didático. manual para universidades na direção 521600 "Economia" e economia. especialidades - M.: INFRA-M, 2011. - 143, p. - (86112-10) (U; N 73)

6. Kolemaev, V.A. Econometria [Texto]: livro didático para universidades na especialidade 061800 “Métodos matemáticos em economia” / Estado. Universidade do Ex. - M.: INFRA-M, 2010. - 160 p. - (86113-10) (U; K 60)

7. Gladilin, A.V. Econometria [Texto]: livro didático. manual para universidades em economia. especialidades / Gladilin, A.V., Gerasimov, A.N., Gromov, E.I. - M.: KnoRus, 2011. - 227 p. - (86160-10) (U;G 52)

8. Novikov, A.I. Econometria [Texto]: livro didático. benefícios por exemplo "Finanças e Crédito", "Economia" - M.: Dashkov e K, 2013. - 223 p. - (93895-1) (U; N 73)

9. Timofeev, V.S. Econometria [Texto]: livro didático para bacharéis em economia. por exemplo e especial / Timofeev, V.S., Faddeenkov, A.V., Shchekoldin, V.Yu. - M.: Yurayt, 2013. - 328 p. - (94305-3) (U;T 41)

10. Econometria [Texto]: livro didático para mestrado, para universidades de economia. direções e promoções / Eliseeva, I.I., Kurysheva, S.V., Neradovskaya, Yu.V., [etc.] ; editado por Eu. eu. Eliseeva; Estado de São Petersburgo Universidade de Economia e Finanças - M.: Yurayt, 2012. - 449 p. - (95469-2) (U; E 40)

11. Novikov, A.I. Econometria [recurso eletrônico]: livro didático. manual - M.: Dashkov e K, 2013. - EBS Lan. - (104974-1) (U; N 73)

12. Varyukhin, A.M. Econometria [Texto]: notas de aula / Varyukhin, A.M., Pankina, O.Yu., Yakovleva, A.V. - M.: Yurayt, 2007. - 191 p. - (105626-1) (U; V 18)

13. Econometria [recurso eletrônico]: livro didático / Baldin, K.V., Bashlykov, V.N., Bryzgalov, N.A., [etc.]; editado por V. B. Utkina - Moscou: Dashkov e K, 2013. - EBS Lan. - (107123-1) (U; E 40)

14. Perepelitsa, N.M. *Econometria: workshop (direção 100700.62 Negócio comercial) [Recurso eletrônico]: como parte do complexo educacional e metodológico / Estado de Tver. tecnologia. Universidade, Dep. HOMENS - Tver: TvSTU, 2012. - Servidor. - (107926-1)

Equação INCORPORADA.3

Outros trabalhos semelhantes que podem lhe interessar.vshm>

1589. Análise comparativa de programas antivírus 79,33KB
Este trabalho final de qualificação examina o problema do combate aos vírus informáticos, que é tratado por programas antivírus. Entre o conjunto de programas utilizados diariamente pela maioria dos usuários de computadores pessoais, os programas antivírus tradicionalmente ocupam um lugar especial.
19100. Análise comparativa do pensamento intuitivo e lógico 22,37KB
Análise comparativa do pensamento intuitivo e lógico. Teorias básicas do pensamento e abordagens ao seu estudo na psicologia estrangeira e nacional. No processo de pensar, uma pessoa reflete o mundo objetivo de maneira diferente do que nos processos de percepção e imaginação. Durante o trabalho independente, serão consideradas as principais teorias do pensamento e abordagens para seu estudo em psicologia.
18483. CONTOS DOS ÍNDIOS DA AMÉRICA DO NORTE: ANÁLISE COMPARATIVA 8,39 KB
O fenômeno dos contos de fadas é um tema de pesquisa muito misterioso, uma vez que a arte popular oral, mais do que outros tipos de arte, está sujeita a mudanças e distorções de significado sob a influência de fatores de mudança no ambiente sociocultural.
18490. 115,79KB
Responsabilidade do notário público na prática de atos notariais. Base jurídica para as atividades dos notários com exercício privado no território da República do Cazaquistão. Responsabilidade do notário que exerce atividade privada. Análise comparativa de instituições notariais públicas e privadas no território da República do Cazaquistão. Prática judicial na apreciação de casos de impugnação da atuação dos notários na prática notarial...
9809. Análise comparativa e perspectivas de desenvolvimento para laptops 343,85 KB
O problema deste estudo é relevante nas condições modernas. Isto é evidenciado pelo estudo frequente das questões levantadas e, apesar da abundância de informações sobre computadores portáteis, suas características funcionais, diferenças fundamentais e perspectivas de desenvolvimento a longo prazo permanecem obscuras.
14351. ECONOMIA DE SOMBRA NA INTERPRETAÇÃO MODERNA: ANÁLISE COMPARATIVA 186,56KB
Para atingir o objetivo formulado, as seguintes tarefas são definidas. Em primeiro lugar, é necessário considerar as principais razões e pré-requisitos para o surgimento da economia paralela. Em segundo lugar, fornecer uma descrição geral do conceito de fenómeno da economia paralela e da sua natureza económica. Em terceiro lugar, é necessário realizar uma análise significativa e estrutural deste fenómeno económico
14398. ANÁLISE COMPARATIVA DOS CAMPOS DE GÁS DA REGIÃO DE AMUDARYA DO TURQUEMENISTÃO 5,97MB
Características comparativas de campos de gás baseados em depósitos do Jurássico Superior e Médio. Hoje, os principais objetos de busca de jazidas de petróleo e gás são as jazidas do Jurássico e do Cretáceo. Outros objetos da região de Amudarya, apesar de suas perspectivas, permanecem aguardando perfuração e descoberta de campos de petróleo e gás no Cenozóico...
20554. Análise comparativa de abordagens para determinar requisitos de margem para carteiras de derivativos 275,48KB
As contrapartes centrais servem mercados que muitas vezes diferem significativamente tanto na microestrutura como na gama de instrumentos financeiros com diferentes perfis de risco: mercados à vista com modo de execução T+, instrumentos do mercado monetário (por exemplo, acordos de recompra), derivados negociados em bolsa e no mercado de balcão
19049. ANÁLISE COMPARATIVA E AVALIAÇÃO DAS CARACTERÍSTICAS DE DESEMPENHO DE FONTE DE ALIMENTAÇÃO PARA PC 1,04MB
Uma fonte de alimentação moderna é uma unidade de comutação, não uma unidade de alimentação. A unidade de pulso contém mais componentes eletrônicos e tem suas vantagens e desvantagens. As vantagens incluem peso leve e possibilidade de fornecimento contínuo de energia durante uma queda de tensão. As desvantagens são que não têm uma vida útil muito longa em comparação com as unidades de potência devido à presença de componentes eletrônicos.
16100. Demanda por serviços educacionais na Rússia: análise econométrica comparativa 228,72 KB
Dados e variáveis ​​utilizados Para analisar as despesas das famílias russas em serviços educativos, foram utilizados dados de um micro inquérito por amostragem regular dos orçamentos familiares do Serviço Federal de Estatísticas do Estado da Federação Russa para 2007. A variável foi alterada para eliminar outliers na amostra e obter resultados de estimação mais robustos. Modelos e resultados Modelo Heckman Para estimar a demanda domiciliar por educação optou-se pelo modelo Heckman, variáveis ​​com asteriscos são inobserváveis...

O principal objetivo da regressão múltipla é construir um modelo com um grande número de fatores e determinar a influência de cada fator separadamente no resultado, bem como determinar o impacto total dos fatores no indicador modelado.

A especificação de um modelo de regressão múltipla inclui a seleção de um fator e a escolha do tipo de função matemática (escolha do tipo de equação de regressão). Os fatores incluídos na regressão múltipla devem ser quantitativamente mensuráveis ​​e não devem ser intercorrelacionados, muito menos estar em uma conexão funcional exata (ou seja, devem influenciar-se mutuamente em menor grau e, em maior medida, influenciar a característica resultante).

Os fatores incluídos na regressão múltipla devem explicar a variação da variável independente. Por exemplo, se um modelo é construído com um conjunto de fatores -, então é encontrado para ele o valor do indicador de determinação, que fixa a parcela da variação explicada da característica resultante devido aos fatores -.

A influência de outros fatores não contabilizados no modelo é estimada como a variância residual correspondente.

Quando um fator adicional é incluído no modelo, o valor do indicador de determinação deve aumentar e o valor da variância residual deve diminuir. Caso isso não aconteça, então o fator adicional não melhora o modelo e é praticamente supérfluo, e a introdução de tal fator pode levar à insignificância estatística dos parâmetros de regressão de acordo com o teste t de Student.

A seleção dos fatores para regressão múltipla é realizada em duas etapas:

1. Os fatores são selecionados com base na natureza do problema.

2. Com base na matriz de indicadores de correlação, são determinadas as estatísticas dos parâmetros de regressão.

Os coeficientes de correlação entre variáveis ​​explicativas, também chamados de coeficientes de intercorrelação, permitem excluir do modelo fatores duplicados.

Dizemos que duas variáveis ​​são claramente colineares se o coeficiente de correlação for .

Se as variáveis ​​forem claramente colineares, então elas estão numa forte relação linear.



Na presença de variáveis ​​claramente colineares, dá-se preferência não ao fator mais relacionado ao resultado, mas ao fator que tem menor ligação com outros fatores.

Com base na magnitude dos coeficientes de correlação pareada, apenas a colinearidade óbvia dos fatores é revelada.

Ao usar a regressão múltipla, pode surgir multicolateralidade de fatos, ou seja, mais de dois fatores estão relacionados entre si por uma relação linear. Nesses casos, o MQO torna-se menos confiável na estimativa de fatores individuais, resultando em dificuldade de interpretação de múltiplos parâmetros de regressão como características da ação de um fator em sua forma pura. Os parâmetros de regressão linear perdem significado econômico, as estimativas dos parâmetros não são confiáveis, surgem grandes erros padrão, que podem mudar com mudanças no volume de observações, ou seja, o modelo torna-se inadequado para analisar e prever a situação económica. Para avaliar a multicolateralidade de um fator, são utilizados os seguintes métodos:

1. Determinação da matriz de coeficientes de correlação pareados entre fatores, por exemplo, se um modelo de regressão linear múltipla for especificado, então o determinante da matriz de coeficientes pareados terá a forma:

Se o valor deste determinante for 1

,

então os fatores não são colineares entre si.

Se houver uma relação linear completa entre os fatores, então todos os coeficientes de correlação dos pares serão iguais a 1, resultando em

.

2. Método de teste da hipótese de independência das variáveis. Neste caso, fica provada a hipótese nula de que o valor tem uma distribuição aproximada com o número de graus de liberdade.

Se , então a hipótese nula é rejeitada.

Ao determinar e comparar os coeficientes de determinação múltipla de um fator, utilizando sequencialmente cada um dos fatores como variável dependente, é possível determinar os fatores responsáveis ​​pela multicolateralidade, ou seja, fator com o maior valor.

Existem as seguintes maneiras de superar a forte correlação entre fatores:

1) exclusão de um ou mais dados do modelo;

2) transformação de fatores para reduzir correlação;

3) combinar equações de regressão que refletirão não apenas os fatores, mas também sua interação;

4) transição da equação da forma reduzida, etc.

Ao construir uma equação de regressão múltipla, uma das etapas mais importantes é a seleção dos fatores incluídos no modelo. Várias abordagens para selecionar fatores com base em indicadores de correlação com vários métodos, entre os quais os mais aplicáveis:

1) Método de exclusão – os dados são filtrados;

2) Método de inclusão - é introduzido um fator adicional;

3) Análise de regressão passo a passo - exclui o fator introduzido anteriormente.

Ao selecionar os fatores, a seguinte regra é usada: o número de fatores incluídos é geralmente 6 a 7 vezes menor que o volume da população sobre a qual o modelo é construído.

O parâmetro não está sujeito a interpretação económica. Em um modelo power-law, uma equação de regressão múltipla não linear, os coeficientes , ,..., são coeficientes de elasticidade que mostram o quanto, em média, o resultado mudará quando o fator correspondente mudar em 1%, com a influência de outros fatores permanecendo inalterado.

Um dos pressupostos básicos para a construção de um modelo qualitativo é a correta (boa) especificação da equação de regressão. A especificação correta de uma equação de regressão significa que ela geralmente reflete corretamente a relação entre a variável de interesse e os fatores explicativos envolvidos no modelo. Este é um pré-requisito necessário para uma avaliação qualitativa adicional do modelo de regressão.

A escolha errada de uma forma funcional ou conjunto de variáveis ​​explicativas é chamada erros de especificação, cujos principais tipos são.

  • 1. Descartando uma variável significativa. A essência deste erro e suas consequências são claramente ilustradas pelo exemplo a seguir. Deixe o modelo teórico que reflete a dependência econômica em consideração ter a forma

Este modelo corresponde à seguinte equação de regressão empírica:

O pesquisador, por algum motivo (falta de informação, conhecimento superficial sobre o tema da pesquisa, etc.) acredita que a variável Y é realmente afetada apenas pela variável X e Limita-se a considerar o modelo

Ao mesmo tempo, não considera a variável X2 como variável explicativa, cometendo o erro de descartar uma variável essencial.

Deixe a equação de regressão empírica correspondente à equação teórica (9.28) ter a forma

As consequências deste erro são bastante graves. As estimativas obtidas usando MQO usando a equação (9.29) são tendenciosas (M[y* 0 ] F b 0 , M[y*] Fbg) e insustentável mesmo com um número infinitamente grande de testes. Consequentemente, possíveis estimativas de intervalo e os resultados dos testes das hipóteses correspondentes não serão confiáveis.

As consequências deste erro não serão tão graves como no caso anterior. Estimativas de 0, os coeficientes encontrados para o modelo (9.30) permanecem, via de regra, imparciais (M = b 0, M[y* 1 ] = b 1) e rico. No entanto, a sua precisão diminuirá, enquanto os erros padrão aumentarão, ou seja, as estimativas tornar-se-ão ineficientes, o que afetará a sua robustez. Esta conclusão decorre logicamente do cálculo das variâncias das estimativas dos coeficientes de regressão para estas equações:

Aqui rXiX2- coeficiente de correlação entre variáveis ​​explicativas X 1 e X 2.

Portanto, e o sinal de igual é possível

apenas quando

Um aumento na dispersão das estimativas pode levar a resultados errôneos de testes de hipóteses sobre os valores dos coeficientes de regressão e a uma expansão das estimativas intervalares.

3. Escolha da forma funcional errada. Ilustramos a essência do erro com o exemplo a seguir. Deixe o modelo de regressão correto ter a forma

Qualquer outra dependência com as mesmas variáveis, mas com forma funcional diferente, leva a uma distorção da verdadeira dependência. Por exemplo, nas seguintes equações

foi cometido um erro ao escolher a forma funcional errada da equação de regressão. As consequências deste erro serão muito graves. Normalmente, esse erro leva a estimativas tendenciosas ou à deterioração das propriedades estatísticas das estimativas dos coeficientes de regressão e de outros indicadores da qualidade das equações. Isto é causado principalmente pela violação das condições de Gauss-Markov para desvios. As qualidades preditivas do modelo, neste caso, são muito baixas.

Na construção de equações de regressão, principalmente nos estágios iniciais, muitas vezes são cometidos erros de especificação devido ao conhecimento superficial sobre os processos econômicos em estudo, ou devido a uma teoria insuficientemente desenvolvida, ou devido a erros na coleta e processamento de dados estatísticos durante a construção uma equação de regressão empírica. É importante ser capaz de detectar e corrigir esses erros. A complexidade do procedimento de detecção é determinada pelo tipo de erro e pelo nosso conhecimento do objeto em estudo.

Se houver uma variável insignificante em uma equação de regressão, ela aparecerá com uma estatística t baixa. No futuro, esta variável será excluída de consideração.

Se houver diversas variáveis ​​explicativas estatisticamente insignificantes na equação, então outra equação de regressão deverá ser construída sem essas variáveis ​​insignificantes. Em seguida, usando estatísticas F, os coeficientes de determinação para as equações de regressão inicial e adicionais são comparados

onde n é o número de observações;

ha - número de variáveis ​​explicativas da equação original;

Para-- o número de variáveis ​​explicativas descartadas da equação original.

Possíveis justificações e conclusões para esta situação são apresentadas no ponto 6.7.2.

Porém, realizar essas verificações só faz sentido com a seleção correta do tipo (forma funcional) da equação de regressão, o que pode ser feito se for consistente com a teoria. Por exemplo, ao construir uma curva de Phillips que estabelece a relação entre salários Y e desemprego X,é o inverso. Os seguintes modelos são possíveis:

Note-se que a escolha do modelo nem sempre é feita de forma inequívoca e no futuro é necessário comparar o modelo com dados teóricos e empíricos e melhorá-lo. Lembremos que na determinação da qualidade de um modelo normalmente são analisados ​​​​os seguintes parâmetros:

  • a) coeficiente de determinação ajustado I;
  • b) estatísticas t;
  • c) Estatísticas Durbin-Watson DW;
  • d) consistência dos sinais dos coeficientes com a teoria;
  • e) qualidades preditivas (erros) do modelo.

Se todos estes indicadores forem satisfatórios, então este modelo pode ser proposto para descrever o processo real em estudo. Se alguma das características descritas acima não for satisfatória, ou seja, há motivos para duvidar da qualidade deste modelo (a forma funcional da equação foi escolhida incorretamente; uma variável explicativa importante não é levada em consideração; existe uma variável explicativa que não tem efeito significativo na variável dependente).

  • Adicionando uma variável não significativa. Em alguns casos, muitas variáveis ​​explicativas são incluídas nas equações de regressão, e nem sempre de forma justificada. Por exemplo, o modelo teórico tem a seguinte forma: deixe o pesquisador substituí-lo por um modelo mais complexo: adicionando ao mesmo tempo uma variável explicativa X2 que não tem impacto real em Y. Neste caso, comete-se o erro de adicionar uma variável sem importância.