O método tradicional de mínimos quadrados. Método dos mínimos quadrados

Tem muitas aplicações, pois permite uma representação aproximada de uma determinada função por outras mais simples. O LSM pode ser extremamente útil no processamento de observações e é usado ativamente para estimar algumas quantidades a partir dos resultados de medições de outras que contenham erros aleatórios. Neste artigo, você aprenderá como implementar cálculos de mínimos quadrados no Excel.

Declaração do problema em um exemplo específico

Suponha que existam dois indicadores X e Y. Além disso, Y depende de X. Como o OLS nos interessa do ponto de vista da análise de regressão (no Excel, seus métodos são implementados usando funções internas), devemos proceder imediatamente considerar um problema específico.

Então, seja X a área de vendas de uma mercearia, medida em metros quadrados, e Y o faturamento anual, definido em milhões de rublos.

É necessário fazer uma previsão do volume de negócios (Y) que a loja terá se tiver um ou outro espaço de retalho. Obviamente, a função Y = f(X) é crescente, pois o hipermercado vende mais mercadorias do que a barraca.

Algumas palavras sobre a exatidão dos dados iniciais usados ​​para previsão

Digamos que temos uma tabela construída com dados para n armazenamentos.

De acordo com estatísticas matemáticas, os resultados serão mais ou menos corretos se os dados de pelo menos 5-6 objetos forem examinados. Além disso, resultados "anômalos" não podem ser usados. Em particular, uma pequena boutique de elite pode ter um faturamento muitas vezes maior do que o faturamento de grandes lojas da classe “masmarket”.

A essência do método

Os dados da tabela podem ser exibidos no plano cartesiano como pontos M 1 (x 1, y 1), ... M n (x n, y n). Agora a solução do problema será reduzida à seleção de uma função de aproximação y = f (x), que tenha um gráfico passando o mais próximo possível dos pontos M 1, M 2, .. M n .

Obviamente, você pode usar um polinômio de alto grau, mas essa opção não é apenas difícil de implementar, mas simplesmente incorreta, pois não refletirá a tendência principal que precisa ser detectada. A solução mais razoável é procurar uma linha reta y = ax + b, que melhor se aproxime dos dados experimentais e, mais precisamente, os coeficientes - a e b.

Pontuação de precisão

Para qualquer aproximação, a avaliação de sua precisão é de particular importância. Denote por e i a diferença (desvio) entre os valores funcionais e experimentais para o ponto x i , ou seja, e i = y i - f (x i).

Obviamente, para avaliar a precisão da aproximação, você pode usar a soma dos desvios, ou seja, ao escolher uma linha reta para uma representação aproximada da dependência de X em Y, deve-se dar preferência àquela que possui o menor valor de a soma e i em todos os pontos considerados. No entanto, nem tudo é tão simples, pois junto com desvios positivos, praticamente haverá negativos.

Você pode resolver o problema usando os módulos de desvio ou seus quadrados. Este último método é o mais utilizado. Ele é usado em muitas áreas, incluindo análise de regressão (no Excel, sua implementação é realizada usando duas funções internas) e tem se mostrado eficaz há muito tempo.

Método dos mínimos quadrados

No Excel, como você sabe, existe uma função de soma automática integrada que permite calcular os valores de todos os valores localizados no intervalo selecionado. Assim, nada nos impedirá de calcular o valor da expressão (e 1 2 + e 2 2 + e 3 2 + ... e n 2).

Em notação matemática, isso se parece com:

Como a decisão inicial foi feita de aproximar usando uma linha reta, temos:

Assim, a tarefa de encontrar uma linha reta que melhor descreva uma relação específica entre X e Y equivale a calcular o mínimo de uma função de duas variáveis:

Isso requer igualar a zero derivadas parciais em relação às novas variáveis ​​a e b, e resolver um sistema primitivo consistindo de duas equações com 2 incógnitas da forma:

Após transformações simples, incluindo dividir por 2 e manipular as somas, obtemos:

Resolvendo, por exemplo, pelo método de Cramer, obtemos um ponto estacionário com certos coeficientes a * e b * . Este é o mínimo, ou seja, para prever qual o volume de negócios que a loja terá para uma determinada área, é adequada a linha recta y = a * x + b *, que é um modelo de regressão para o exemplo em questão. Obviamente, isso não permitirá que você encontre o resultado exato, mas ajudará você a ter uma ideia de se a compra de uma loja a crédito para uma área específica valerá a pena.

Como implementar o método dos mínimos quadrados no Excel

O Excel tem uma função para calcular o valor dos mínimos quadrados. Tem a seguinte forma: TREND (valores Y conhecidos; valores X conhecidos; novos valores X; constante). Vamos aplicar a fórmula para calcular o OLS no Excel à nossa tabela.

Para isso, na célula em que deve ser exibido o resultado do cálculo pelo método dos mínimos quadrados no Excel, insira o sinal “=” e selecione a função “TREND”. Na janela que se abre, preencha os campos apropriados, destacando:

  • intervalo de valores conhecidos para Y (neste caso, dados para rotatividade);
  • intervalo x 1 , …x n , ou seja, o tamanho do espaço de varejo;
  • e valores conhecidos e desconhecidos de x, para os quais você precisa descobrir o tamanho do faturamento (para informações sobre sua localização na planilha, veja abaixo).

Além disso, há uma variável lógica "Const" na fórmula. Se você inserir 1 no campo correspondente, isso significará que os cálculos devem ser realizados, supondo que b \u003d 0.

Se você precisar saber a previsão para mais de um valor x, depois de inserir a fórmula, não pressione "Enter", mas digite a combinação "Shift" + "Control" + "Enter" ("Enter" ) no teclado.

Algumas funcionalidades

A análise de regressão pode ser acessível até mesmo para dummies. A fórmula do Excel para prever o valor de um array de variáveis ​​desconhecidas - "TREND" - pode ser usada mesmo por quem nunca ouviu falar do método dos mínimos quadrados. Basta conhecer algumas características de seu trabalho. Em particular:

  • Se você colocar o intervalo de valores conhecidos da variável y em uma linha ou coluna, cada linha (coluna) com valores conhecidos de x será percebida pelo programa como uma variável separada.
  • Se o intervalo com x conhecido não for especificado na janela TREND, no caso de usar a função no Excel, o programa o considerará como um array composto por inteiros, cujo número corresponde ao intervalo com os valores fornecidos da variável y.
  • Para gerar uma matriz de valores "previstos", a expressão de tendência deve ser inserida como uma fórmula de matriz.
  • Se nenhum novo valor x for especificado, a função TREND os considerará iguais aos conhecidos. Se eles não forem especificados, então o array 1 é tomado como argumento; 2; 3; 4;…, que é compatível com o intervalo com os parâmetros y já fornecidos.
  • O intervalo que contém os novos valores de x deve ter as mesmas ou mais linhas ou colunas que o intervalo com os valores de y fornecidos. Em outras palavras, deve ser proporcional às variáveis ​​independentes.
  • Um array com valores x conhecidos pode conter múltiplas variáveis. No entanto, se estamos falando de apenas um, é necessário que os intervalos com os valores dados de x e y sejam proporcionais. No caso de várias variáveis, é necessário que o intervalo com os valores de y dados caiba em uma coluna ou linha.

Função PREVISÃO

Ele é implementado usando várias funções. Um deles é chamado de "PREDIÇÃO". É semelhante ao TREND, ou seja, fornece o resultado de cálculos usando o método dos mínimos quadrados. No entanto, apenas para um X, para o qual o valor de Y é desconhecido.

Agora você conhece as fórmulas do Excel para dummies que permitem prever o valor do valor futuro de um indicador de acordo com uma tendência linear.

A aproximação de dados experimentais é um método baseado na substituição de dados obtidos experimentalmente por uma função analítica que mais se aproxima ou coincide nos pontos nodais com os valores iniciais (dados obtidos durante o experimento ou experimento). Atualmente, existem duas maneiras de definir uma função analítica:

Construindo um polinômio de interpolação de n graus que passa diretamente por todos os pontos determinada matriz de dados. Neste caso, a função de aproximação é representada como: um polinômio de interpolação na forma de Lagrange ou um polinômio de interpolação na forma de Newton.

Construindo um polinômio de aproximação de n graus que passa perto de pontos da matriz de dados fornecida. Assim, a função de aproximação suaviza todos os ruídos aleatórios (ou erros) que podem ocorrer durante o experimento: os valores medidos durante o experimento dependem de fatores aleatórios que flutuam de acordo com suas próprias leis aleatórias (erros de medição ou instrumento, imprecisão ou erros). Neste caso, a função de aproximação é determinada pelo método dos mínimos quadrados.

Método dos mínimos quadrados(na literatura inglesa Ordinary Least Squares, OLS) é um método matemático baseado na definição de uma função de aproximação, que é construída na proximidade mais próxima de pontos de um determinado conjunto de dados experimentais. A proximidade das funções inicial e aproximadora F(x) é determinada por uma medida numérica, a saber: a soma dos quadrados dos desvios dos dados experimentais da curva aproximadora F(x) deve ser a menor.

Curva de ajuste construída pelo método dos mínimos quadrados

O método dos mínimos quadrados é usado:

Resolver sistemas de equações sobredeterminados quando o número de equações excede o número de incógnitas;

Procurar uma solução no caso de sistemas de equações não lineares ordinários (não sobredeterminados);

Para aproximar valores de pontos por alguma função de aproximação.

A função de aproximação pelo método dos mínimos quadrados é determinada a partir da condição da soma mínima dos desvios quadrados da função de aproximação calculada a partir de uma dada matriz de dados experimentais. Este critério do método dos mínimos quadrados é escrito como a seguinte expressão:

Valores da função de aproximação calculada em pontos nodais,

Matriz especificada de dados experimentais em pontos nodais.

O critério quadrático tem várias propriedades "boas", como a diferenciabilidade, fornecendo uma solução única para o problema de aproximação com funções de aproximação polinomial.

Dependendo das condições do problema, a função de aproximação é um polinômio de grau m

O grau da função de aproximação não depende do número de pontos nodais, mas sua dimensão deve ser sempre menor que a dimensão (número de pontos) do dado conjunto de dados experimentais.

∙ Se o grau da função de aproximação for m=1, então aproximamos a função de tabela com uma linha reta (regressão linear).

∙ Se o grau da função de aproximação for m=2, então aproximamos a função de tabela com uma parábola quadrática (aproximação quadrática).

∙ Se o grau da função de aproximação for m=3, então aproximamos a função de tabela com uma parábola cúbica (aproximação cúbica).

No caso geral, quando é necessário construir um polinômio aproximado de grau m para valores tabulares dados, a condição para a soma mínima dos desvios quadrados sobre todos os pontos nodais é reescrita da seguinte forma:

- coeficientes desconhecidos do polinômio de aproximação de grau m;

O número de valores de tabela especificados.

Uma condição necessária para a existência de um mínimo de uma função é a igualdade a zero de suas derivadas parciais em relação a variáveis ​​desconhecidas. . Como resultado, obtemos o seguinte sistema de equações:

Vamos transformar o sistema linear de equações resultante: abra os colchetes e mova os termos livres para o lado direito da expressão. Como resultado, o sistema resultante de expressões algébricas lineares será escrito da seguinte forma:

Este sistema de expressões algébricas lineares pode ser reescrito em forma de matriz:

Como resultado, obteve-se um sistema de equações lineares de dimensão m + 1, que consiste em m + 1 incógnitas. Este sistema pode ser resolvido usando qualquer método para resolver equações algébricas lineares (por exemplo, o método de Gauss). Como resultado da solução, serão encontrados parâmetros desconhecidos da função de aproximação que fornecem a soma mínima dos desvios quadrados da função de aproximação dos dados originais, ou seja, a melhor aproximação quadrática possível. Deve ser lembrado que se mesmo um valor dos dados iniciais mudar, todos os coeficientes mudarão seus valores, uma vez que são completamente determinados pelos dados iniciais.

Aproximação dos dados iniciais por dependência linear

(regressão linear)

Como exemplo, considere o método para determinar a função de aproximação, que é dada como uma relação linear. De acordo com o método dos mínimos quadrados, a condição para a soma mínima dos desvios quadrados é escrita da seguinte forma:

Coordenadas dos pontos nodais da tabela;

Coeficientes desconhecidos da função de aproximação, que é dada como uma relação linear.

Uma condição necessária para a existência de um mínimo de uma função é a igualdade a zero de suas derivadas parciais em relação a variáveis ​​desconhecidas. Como resultado, obtemos o seguinte sistema de equações:

Vamos transformar o sistema linear de equações resultante.

Resolvemos o sistema de equações lineares resultante. Os coeficientes da função de aproximação na forma analítica são determinados da seguinte forma (método de Cramer):

Esses coeficientes proporcionam a construção de uma função de aproximação linear de acordo com o critério para minimizar a soma dos quadrados da função de aproximação a partir de dados tabulares dados (dados experimentais).

Algoritmo para implementar o método dos mínimos quadrados

1. Dados iniciais:

Dada uma matriz de dados experimentais com o número de medições N

O grau do polinômio de aproximação (m) é dado

2. Algoritmo de cálculo:

2.1. Os coeficientes são determinados para construir um sistema de equações com dimensão

Coeficientes do sistema de equações (lado esquerdo da equação)

- índice do número da coluna da matriz quadrada do sistema de equações

Membros livres do sistema de equações lineares (lado direito da equação)

- índice do número da linha da matriz quadrada do sistema de equações

2.2. Formação de um sistema de equações lineares com dimensão .

2.3. Solução de um sistema de equações lineares para determinar os coeficientes desconhecidos do polinômio aproximador de grau m.

2.4 Determinação da soma dos desvios quadrados do polinômio de aproximação dos valores iniciais em todos os pontos nodais

O valor encontrado da soma dos desvios quadrados é o mínimo possível.

Aproximação com outras funções

Deve-se notar que ao aproximar os dados iniciais de acordo com o método dos mínimos quadrados, uma função logarítmica, uma função exponencial e uma função de potência são algumas vezes usadas como uma função de aproximação.

Aproximação de registro

Considere o caso em que a função de aproximação é dada por uma função logarítmica da forma:

A essência do método dos mínimos quadrados é em encontrar os parâmetros de um modelo de tendência que melhor descreve a tendência de desenvolvimento de algum fenômeno aleatório no tempo ou no espaço (uma tendência é uma linha que caracteriza a tendência desse desenvolvimento). A tarefa do método dos mínimos quadrados (OLS) é encontrar não apenas algum modelo de tendência, mas encontrar o melhor ou o modelo ideal. Este modelo será ideal se a soma dos desvios quadrados entre os valores reais observados e os valores de tendência calculados correspondentes for mínimo (menor):

onde é o desvio padrão entre o valor real observado

e o valor de tendência calculado correspondente,

O valor real (observado) do fenômeno em estudo,

Valor estimado do modelo de tendência,

O número de observações do fenômeno em estudo.

O MNC raramente é usado sozinho. Como regra, na maioria das vezes é usado apenas como uma técnica necessária em estudos de correlação. Deve-se lembrar que a base de informações do LSM só pode ser uma série estatística confiável, e o número de observações não deve ser inferior a 4, caso contrário, os procedimentos de suavização do LSM podem perder o bom senso.

O kit de ferramentas OLS é reduzido aos seguintes procedimentos:

Primeiro procedimento. Acontece se há alguma tendência de mudar o atributo resultante quando o argumento do fator selecionado muda, ou em outras palavras, se há uma conexão entre " no " e " X ».

Segundo procedimento. Determina-se qual linha (trajetória) é mais capaz de descrever ou caracterizar essa tendência.

Terceiro procedimento.

Exemplo. Suponha que tenhamos informações sobre o rendimento médio de girassol para a fazenda em estudo (Tabela 9.1).

Tabela 9.1

Número de observação

Produtividade, c/ha

Como o nível de tecnologia na produção de girassol em nosso país não mudou muito nos últimos 10 anos, significa que, muito provavelmente, as oscilações da produtividade no período analisado dependeram muito das oscilações do clima e das condições climáticas. É verdade?

Primeiro procedimento MNC. A hipótese sobre a existência de uma tendência na mudança da produtividade do girassol em função das mudanças nas condições climáticas e climáticas ao longo dos 10 anos analisados ​​está sendo testada.

Neste exemplo, para " y » é aconselhável tirar o rendimento do girassol, e para « x » é o número do ano observado no período analisado. Testando a hipótese sobre a existência de qualquer relação entre " x " e " y » pode ser feito de duas maneiras: manualmente e com a ajuda de programas de computador. Claro que, com a disponibilidade da tecnologia informática, este problema é resolvido por si só. Mas, para entender melhor o kit de ferramentas OLS, é aconselhável testar a hipótese sobre a existência de uma relação entre " x " e " y » manualmente, quando apenas uma caneta e uma calculadora comum estão à mão. Nesses casos, a hipótese da existência de uma tendência é melhor verificada visualmente pela localização da imagem gráfica da série temporal analisada - o campo de correlação:

O campo de correlação em nosso exemplo está localizado em torno de uma linha que sobe lentamente. Isso por si só indica a existência de uma certa tendência na mudança na produtividade do girassol. É impossível falar sobre a presença de qualquer tendência apenas quando o campo de correlação se parece com um círculo, um círculo, uma nuvem estritamente vertical ou estritamente horizontal, ou consiste em pontos dispersos aleatoriamente. Em todos os outros casos, é necessário confirmar a hipótese da existência de uma relação entre " x " e " y e continuar a investigação.

Segundo procedimento MNC. Determina-se qual linha (trajetória) é mais capaz de descrever ou caracterizar a tendência das mudanças na produtividade do girassol no período analisado.

Com a disponibilidade de tecnologia de computador, a seleção da tendência ideal ocorre automaticamente. Com o processamento "manual", a escolha da função ideal é realizada, via de regra, de maneira visual - pela localização do campo de correlação. Ou seja, de acordo com o tipo de gráfico, seleciona-se a equação da linha que melhor se adapta à tendência empírica (à trajetória real).

Como você sabe, na natureza há uma enorme variedade de dependências funcionais, por isso é extremamente difícil analisar visualmente mesmo uma pequena parte delas. Felizmente, na prática econômica real, a maioria das relações pode ser descrita com precisão por uma parábola, uma hipérbole ou uma linha reta. Nesse sentido, com a opção "manual" para selecionar a melhor função, você pode se limitar apenas a esses três modelos.

Hipérbole:

Parábola de segunda ordem: :

É fácil ver que em nosso exemplo, a tendência das mudanças na produção de girassol ao longo dos 10 anos analisados ​​é melhor caracterizada por uma linha reta, então a equação de regressão será uma equação de linha reta.

Terceiro procedimento. Calculam-se os parâmetros da equação de regressão que caracteriza esta linha, ou seja, determina-se uma fórmula analítica que descreve o melhor modelo de tendência.

Encontrar os valores dos parâmetros da equação de regressão, no nosso caso, os parâmetros e , é o núcleo do LSM. Este processo é reduzido a resolver um sistema de equações normais.

(9.2)

Este sistema de equações é facilmente resolvido pelo método de Gauss. Lembre-se que como resultado da solução, em nosso exemplo, os valores dos parâmetros e são encontrados. Assim, a equação de regressão encontrada terá a seguinte forma:

Após o alinhamento, obtemos uma função da seguinte forma: g (x) = x + 1 3 + 1 .

Podemos aproximar esses dados com uma relação linear y = a x + b calculando os parâmetros apropriados. Para fazer isso, precisaremos aplicar o chamado método dos mínimos quadrados. Você também precisará fazer um desenho para verificar qual linha alinhará melhor os dados experimentais.

Yandex.RTB R-A-339285-1

O que exatamente é OLS (método dos mínimos quadrados)

A principal coisa que precisamos fazer é encontrar tais coeficientes de dependência linear em que o valor da função de duas variáveis ​​F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 será o menor. Em outras palavras, para determinados valores de a e b, a soma dos quadrados dos desvios dos dados apresentados da reta resultante terá um valor mínimo. Este é o significado do método dos mínimos quadrados. Tudo o que precisamos fazer para resolver o exemplo é encontrar o extremo da função de duas variáveis.

Como derivar fórmulas para calcular coeficientes

Para derivar fórmulas de cálculo dos coeficientes, é necessário compor e resolver um sistema de equações com duas variáveis. Para fazer isso, calculamos as derivadas parciais da expressão F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 em relação a aeb e as igualamos a 0 .

δ F (a , b) δ a = 0 δ F (a , b) δ b = 0 ⇔ - 2 ∑ i = 1 n (y i - (a x i + b)) x i = 0 - 2 ∑ i = 1 n ( y i - (a x i + b)) = 0 ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + ∑ i = 1 n b = ∑ i = 1 n y i ⇔ a ∑ i = 1 n x i 2 + b ∑ i = 1 n x i = ∑ i = 1 n x i y i a ∑ i = 1 n x i + n b = ∑ i = 1 n y i

Para resolver um sistema de equações, você pode usar qualquer método, como substituição ou método de Cramer. Como resultado, devemos obter fórmulas que calculam os coeficientes usando o método dos mínimos quadrados.

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n

Calculamos os valores das variáveis ​​para as quais a função
F (a , b) = ∑ i = 1 n (y i - (a x i + b)) 2 assumirá o valor mínimo. No terceiro parágrafo, vamos provar porque é assim.

Esta é a aplicação do método dos mínimos quadrados na prática. Sua fórmula, que é usada para encontrar o parâmetro a , inclui ∑ i = 1 n x i , ∑ i = 1 n y i , ∑ i = 1 n x i y i , ∑ i = 1 n x i 2 , e o parâmetro
n - denota a quantidade de dados experimentais. Aconselhamos que calcule cada valor separadamente. O valor do coeficiente b é calculado imediatamente após a .

Vamos voltar ao exemplo original.

Exemplo 1

Aqui temos n igual a cinco. Para facilitar o cálculo dos valores necessários incluídos nas fórmulas dos coeficientes, preenchemos a tabela.

eu = 1 eu = 2 eu = 3 eu = 4 eu = 5 ∑ i = 1 5
XI 0 1 2 4 5 12
eu 2 , 1 2 , 4 2 , 6 2 , 8 3 12 , 9
x eu eu 0 2 , 4 5 , 2 11 , 2 15 33 , 8
x e 2 0 1 4 16 25 46

Solução

A quarta linha contém os dados obtidos multiplicando os valores da segunda linha pelos valores da terceira para cada indivíduo i. A quinta linha contém os dados do segundo quadrado. A última coluna mostra as somas dos valores das linhas individuais.

Vamos usar o método dos mínimos quadrados para calcular os coeficientes aeb que precisamos. Para isso, substitua os valores desejados da última coluna e calcule as somas:

n ∑ i = 1 n x i y i - ∑ i = 1 n x i ∑ i = 1 n y i n ∑ i = 1 n - ∑ i = 1 n x i 2 b = ∑ i = 1 n y i - a ∑ i = 1 n x i n ⇒ a = 5 33, 8 - 12 12, 9 5 46 - 12 2 b = 12, 9 - a 12 5 ⇒ a ≈ 0, 165 b ≈ 2, 184

Temos que a linha de aproximação desejada será y = 0 , 165 x + 2 , 184 . Agora precisamos determinar qual linha irá aproximar melhor os dados - g (x) = x + 1 3 + 1 ou 0 , 165 x + 2 , 184 . Vamos fazer uma estimativa usando o método dos mínimos quadrados.

Para calcular o erro, precisamos encontrar as somas dos desvios quadrados dos dados das linhas σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 e σ 2 = ∑ i = 1 n (y i - g (x i)) 2 , o valor mínimo corresponderá a uma linha mais adequada.

σ 1 = ∑ i = 1 n (y i - (a x i + b i)) 2 = = ∑ i = 1 5 (y i - (0 , 165 x i + 2 , 184)) 2 ≈ 0 , 019 σ 2 = ∑ i = 1 n (y i - g (x i)) 2 = = ∑ i = 1 5 (y i - (x i + 1 3 + 1)) 2 ≈ 0 , 096

Responda: desde σ 1< σ 2 , то прямой, наилучшим образом аппроксимирующей исходные данные, будет
y = 0, 165 x + 2, 184.

O método dos mínimos quadrados é claramente mostrado na ilustração gráfica. A linha vermelha marca a linha reta g (x) = x + 1 3 + 1, a linha azul marca y = 0, 165 x + 2, 184. Os dados brutos são marcados com pontos rosa.

Vamos explicar por que exatamente são necessárias aproximações desse tipo.

Eles podem ser usados ​​em problemas que exigem suavização de dados, bem como naqueles em que os dados precisam ser interpolados ou extrapolados. Por exemplo, no problema discutido acima, pode-se encontrar o valor da quantidade observada y em x = 3 ou em x = 6 . Dedicamos um artigo separado a esses exemplos.

Prova do método LSM

Para que a função tome o valor mínimo quando a e b são calculados, é necessário que em um dado ponto a matriz da forma quadrática da diferencial da função da forma F(a, b) = ∑ i = 1 n (y i - (a x i + b)) 2 seja positivo definido. Vamos mostrar como deve ser.

Exemplo 2

Temos um diferencial de segunda ordem da seguinte forma:

d 2 F (a ; b) = δ 2 F (a ; b) δ a 2 d 2 a + 2 δ 2 F (a ; b) δ a δ b d a d b + δ 2 F (a ; b) δ b 2 d 2b

Solução

δ 2 F (a ; b) δ a 2 = δ δ F (a ; b) δ a δ a = = δ - 2 ∑ i = 1 n (y i - (a x i + b)) x i δ a = 2 ∑ i = 1 n (x i) 2 δ 2 F (a ; b) δ a δ b = δ δ F (a ; b) δ a δ b = = δ - 2 ∑ i = 1 n (y i - (a x i + b) ) x i δ b = 2 ∑ i = 1 n x i δ 2 F (a ; b) δ b 2 = δ δ F (a ; b) δ b δ b = δ - 2 ∑ i = 1 n (y i - (a x i + b)) δ b = 2 ∑ i = 1 n (1) = 2 n

Em outras palavras, pode ser escrito da seguinte forma: d 2 F (a ; b) = 2 ∑ i = 1 n (x i) 2 d 2 a + 2 2 ∑ x i i = 1 n d a d b + (2 n) d 2 b .

Obtivemos uma matriz de forma quadrática M = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n .

Nesse caso, os valores dos elementos individuais não serão alterados dependendo de a e b . Essa matriz é positiva definida? Para responder a esta pergunta, vamos verificar se seus menores angulares são positivos.

Calcule o menor angular de primeira ordem: 2 ∑ i = 1 n (x i) 2 > 0 . Como os pontos x i não coincidem, a desigualdade é estrita. Vamos manter isso em mente em cálculos posteriores.

Calculamos o menor angular de segunda ordem:

d e t (M) = 2 ∑ i = 1 n (x i) 2 2 ∑ i = 1 n x i 2 ∑ i = 1 n x i 2 n = 4 n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2

Em seguida, procedemos à prova da desigualdade n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 por indução matemática.

  1. Vamos verificar se esta desigualdade é válida para n arbitrário. Vamos pegar 2 e calcular:

2 ∑ i = 1 2 (x i) 2 - ∑ i = 1 2 x i 2 = 2 x 1 2 + x 2 2 - x 1 + x 2 2 = = x 1 2 - 2 x 1 x 2 + x 2 2 = x 1 + x 2 2 > 0

Obtivemos a igualdade correta (se os valores x 1 e x 2 não corresponderem).

  1. Vamos supor que essa desigualdade será verdadeira para n , ou seja. n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 – verdadeiro.
  2. Agora vamos provar a validade para n + 1 , ou seja. que (n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 > 0 se n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 > 0 .

Calculamos:

(n + 1) ∑ i = 1 n + 1 (x i) 2 - ∑ i = 1 n + 1 x i 2 = = (n + 1) ∑ i = 1 n (x i) 2 + x n + 1 2 - ∑ i = 1 n x i + x n + 1 2 = = n ∑ i = 1 n (x i) 2 + n x n + 1 2 + ∑ i = 1 n (x i) 2 + x n + 1 2 - - ∑ i = 1 n x i 2 + 2 x n + 1 ∑ i = 1 n x i + x n + 1 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + n x n + 1 2 - x n + 1 ∑ i = 1 n x i + ∑ i = 1 n (x i) 2 = = ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + x n + 1 2 - 2 x n + 1 x 1 + x 1 2 + + x n + 1 2 - 2 x n + 1 x 2 + x 2 2 + . . . + x n + 1 2 - 2 x n + 1 x 1 + x n 2 = = n ∑ i = 1 n (x i) 2 - ∑ i = 1 n x i 2 + + (x n + 1 - x 1) 2 + (x n + 1 - x 2) 2 + . . . + (x n - 1 - x n) 2 > 0

A expressão entre chaves será maior que 0 (com base no que presumimos na etapa 2), e o restante dos termos será maior que 0 porque são todos quadrados de números. Provamos a desigualdade.

Responda: os a e b encontrados corresponderão ao menor valor da função F (a, b) = ∑ i = 1 n (y i - (a x i + b)) 2, o que significa que eles são os parâmetros necessários do método dos mínimos quadrados (LSM).

Se você notar um erro no texto, destaque-o e pressione Ctrl+Enter

É amplamente utilizado em econometria na forma de uma clara interpretação econômica de seus parâmetros.

A regressão linear é reduzida a encontrar uma equação da forma

ou

Tipo de equação permite valores de parâmetros fornecidos X ter valores teóricos do recurso efetivo, substituindo os valores reais do fator nele X.

Construir uma regressão linear se resume a estimar seus parâmetros − uma e dentro. As estimativas dos parâmetros de regressão linear podem ser encontradas por diferentes métodos.

A abordagem clássica para estimar parâmetros de regressão linear é baseada em mínimos quadrados(MNK).

LSM permite obter tais estimativas de parâmetros uma e dentro, em que a soma dos desvios quadrados dos valores reais da característica resultante (s) de calculado (teórico) mini-mínimo:

Para encontrar o mínimo de uma função, é necessário calcular as derivadas parciais em relação a cada um dos parâmetros uma e b e igualá-los a zero.

Indicar por S, então:

Transformando a fórmula, obtemos o seguinte sistema de equações normais para estimar os parâmetros uma e dentro:

Resolvendo o sistema de equações normais (3.5) pelo método de eliminação sucessiva de variáveis ​​ou pelo método de determinantes, encontramos as estimativas de parâmetros desejadas uma e dentro.

Parâmetro dentro chamado de coeficiente de regressão. Seu valor mostra a mudança média no resultado com uma mudança no fator em uma unidade.

A equação de regressão é sempre complementada com um indicador de estanqueidade da conexão. Ao usar a regressão linear, o coeficiente de correlação linear atua como tal indicador. Existem várias modificações da fórmula do coeficiente de correlação linear. Alguns deles estão listados abaixo:

Como você sabe, o coeficiente de correlação linear está dentro dos limites: -1 1.

Para avaliar a qualidade da seleção de uma função linear, o quadrado é calculado

Um coeficiente de correlação linear chamado coeficiente de determinação. O coeficiente de determinação caracteriza a proporção da variância da característica efetiva sim, explicado pela regressão, na variância total da característica resultante:

Assim, o valor 1 - caracteriza a proporção de dispersão sim, causada pela influência de outros fatores não considerados no modelo.

Perguntas para autocontrole

1. A essência do método dos mínimos quadrados?

2. Quantas variáveis ​​fornecem uma regressão aos pares?

3. Qual coeficiente determina a estanqueidade da conexão entre as mudanças?

4. Dentro de que limites é determinado o coeficiente de determinação?

5. Estimativa do parâmetro b na análise de correlação-regressão?

1. Christopher Dougherty. Introdução à econometria. - M.: INFRA - M, 2001 - 402 p.

2. S.A. Borodich. Econometria. Minsk LLC "Novo Conhecimento" 2001.


3. R.U. Rakhmetova Curso de curta duração em econometria. Tutorial. Almaty. 2004. -78s.

4. I.I. Eliseeva Econometria. - M.: "Finanças e estatísticas", 2002

5. Informação mensal e revista analítica.

Modelos econômicos não lineares. Modelos de regressão não linear. Conversão variável.

Modelos econômicos não lineares.

Conversão variável.

coeficiente de elasticidade.

Se houver relações não lineares entre fenômenos econômicos, elas serão expressas usando as funções não lineares correspondentes: por exemplo, uma hipérbole equilátero , parábolas de segundo grau e etc

Existem duas classes de regressões não lineares:

1. Regressões não lineares em relação às variáveis ​​explicativas incluídas na análise, mas lineares em relação aos parâmetros estimados, por exemplo:

Polinômios de vários graus - , ;

Hipérbole equilátero - ;

Função semilogarítmica - .

2. Regressões não lineares nos parâmetros estimados, por exemplo:

Poder - ;

Demonstrativo -;

Exponencial - .

A soma total dos desvios quadrados dos valores individuais do atributo resultante no do valor médio é causado pela influência de muitos fatores. Dividimos condicionalmente todo o conjunto de razões em dois grupos: fator x estudado e outros fatores.

Se o fator não afetar o resultado, então a linha de regressão no gráfico é paralela ao eixo oh e

Então toda a dispersão do atributo resultante é devido à influência de outros fatores e a soma total dos desvios quadrados coincidirá com o resíduo. Se outros fatores não afetarem o resultado, então você amarrou Com X funcionalmente, e a soma dos quadrados dos resíduos é zero. Nesse caso, a soma dos quadrados dos desvios explicados pela regressão é igual à soma dos quadrados totais.

Como nem todos os pontos do campo de correlação estão na linha de regressão, sua dispersão sempre ocorre devido à influência do fator X, ou seja, regressão no sobre X, e causada pela ação de outras causas (variação inexplicável). A adequação da linha de regressão para a previsão depende de qual parte da variação total do traço no explica a variação explicada

Obviamente, se a soma dos quadrados dos desvios devido à regressão for maior que a soma dos quadrados dos resíduos, então a equação de regressão é estatisticamente significativa e o fator X tem um impacto significativo no resultado. sim

, ou seja, com o número de liberdade de variação independente do recurso. O número de graus de liberdade está relacionado ao número de unidades da população n e ao número de constantes determinadas a partir dela. Em relação ao problema em estudo, o número de graus de liberdade deve mostrar quantos desvios independentes de P

A avaliação da significância da equação de regressão como um todo é dada com a ajuda de F- Critério de Fisher. Neste caso, é apresentada uma hipótese nula de que o coeficiente de regressão é igual a zero, ou seja, b= 0 e, portanto, o fator X não afeta o resultado sim

O cálculo direto do critério F é precedido por uma análise da variância. Central para isso é a expansão da soma total dos desvios quadrados da variável no do valor médio no em duas partes - "explicado" e "inexplicado":

- soma total dos desvios quadrados;

- soma dos desvios quadrados explicados pela regressão;

é a soma residual dos quadrados do desvio.

Qualquer soma de desvios quadrados está relacionada ao número de graus de liberdade , ou seja, com o número de liberdade de variação independente do recurso. O número de graus de liberdade está relacionado com o número de unidades populacionais n e com o número de constantes determinadas a partir dele. Em relação ao problema em estudo, o número de graus de liberdade deve mostrar quantos desvios independentes de P possível é necessário para formar uma dada soma de quadrados.

Dispersão por grau de liberdadeD.

Razões F (critério F):

Se a hipótese nula for verdadeira, então as variâncias fatoriais e residuais não diferem umas das outras. Para H 0, é necessária uma refutação para que a variância do fator exceda o residual em várias vezes. O estatístico inglês Snedecor desenvolveu tabelas de valores críticos F-relações em diferentes níveis de significância da hipótese nula e um número diferente de graus de liberdade. Valor da tabela F-critério é o valor máximo da razão de variâncias que podem ocorrer se divergirem aleatoriamente para um determinado nível de probabilidade da presença de uma hipótese nula. Valor calculado F-relação é reconhecida como confiável se o for maior que o tabular.

Neste caso, a hipótese nula sobre a ausência de uma relação de características é rejeitada e uma conclusão é feita sobre o significado dessa relação: F fato > tabela F H 0 é rejeitado.

Se o valor for menor que a tabela F fato ‹, tabela F, então a probabilidade da hipótese nula é maior do que um determinado nível e não pode ser rejeitada sem um sério risco de tirar uma conclusão errada sobre a presença de um relacionamento. Neste caso, a equação de regressão é considerada estatisticamente insignificante. N o não se desvia.

Erro padrão do coeficiente de regressão

Para avaliar a significância do coeficiente de regressão, seu valor é comparado com seu erro padrão, ou seja, o valor real é determinado t-Critério do aluno: que é então comparado com o valor tabular em um certo nível de significância e o número de graus de liberdade ( n- 2).

Erro padrão do parâmetro uma:

A significância do coeficiente de correlação linear é verificada com base na magnitude do erro coeficiente de correlação r:

Variação total de um recurso X:

Regressão linear múltipla

Construção do modelo

Regressão múltiplaé uma regressão de um recurso efetivo com dois ou mais fatores, ou seja, um modelo da forma

A regressão pode dar um bom resultado na modelagem se a influência de outros fatores que afetam o objeto de estudo puder ser desprezada. O comportamento das variáveis ​​econômicas individuais não pode ser controlado, ou seja, não é possível garantir a igualdade de todas as outras condições para avaliar a influência de um fator em estudo. Nesse caso, você deve tentar identificar a influência de outros fatores introduzindo-os no modelo, ou seja, construir uma equação de regressão múltipla: y = a+b 1 x 1 +b 2 +…+b p x p + .

O principal objetivo da regressão múltipla é construir um modelo com um grande número de fatores, ao mesmo tempo em que determina a influência de cada um deles individualmente, bem como seu impacto cumulativo no indicador modelado. A especificação do modelo inclui duas áreas de questões: a seleção dos fatores e a escolha do tipo de equação de regressão