Matemática Essencial:  Alegria  Financeira  Fundamental  Médio  Geometria  Trigonometria  Superior  Cálculos
Ensino Superior: Método dos Mínimos Quadrados

"Não há sabedoria, nem entendimento, nem conselho contra o Senhor."
Provérbios 21:30 A Bíblia Sagrada

Introdução à Regressão Linear

Consideremos uma coleção de pares ordenados obtidos em função de algum experimento, como:

xx1x2x3x4x5...xn-1xn
yy1y2y3y4y5...yn-1yn

A colocação destes pares ordenados num plano cartesiano, depende dos valores de xi e yi, (i=1..n) e pode fornecer um gráfico como:

img

Um fato que atrai pesquisadores aplicados das mais diversas áreas é a possibilidade de obter uma função real que passe nos pontos ou pelo menos passe próximo dos pontos (xi,yi) dados.

Estudando uma Matemática mais aprofundada existe a Teoria de Interpolação que é a área que estuda tais processos para obter funções que passam exatamente pelos pontos dados, enquanto que a Teoria de Aproximação estuda processos para obter funções que passem o mais próximo possível dos pontos dados.

É óbvio que se pudermos obter funções que passem próximas dos pontos dados e que tenham uma expressão fácil de ser manipulada, teremos obtido algo positivo e de valor científico.

Dentre os processos matemáticos que resolvem tal problema, com certeza, um dos mais utilizados é o Método dos Mínimos Quadrados, que serve para gerar o que se chama em Estatística: Regressão Linear ou Ajuste Linear.

As curvas mais comuns utilizadas pelos estatísticos são:

OrdemFunçãoNome
1y = ao+a1 x Reta
2y = ao+a1 x+a2Parábola
3y = ao+a1 x+a2 x²+a3Cúbica
4y = ao+a1 x+a2 x²+a3 x³+a4 x4 Quártica

A idéia básica para qualquer uma das funções acima citadas é tentar descobrir quais são os valores dos coeficientes ao, a1, a2 e a3, de tal modo que a soma dos quadrados das distâncias (tomadas na vertical) da referida curva y=f(x) a cada um dos pontos dados (yi) seja a menor possível, daí o nome Método dos Mínimos Quadrados.

Para obter tais coeficientes, deve-se conhecer conceitos de Derivadas Parciais, a Teoria de Máximos e Mínimos de funções de várias variáveis e as características de formas quadráticas positivas definidas de funções de várias variáveis envolvidas com o Teorema de Sylvester. Tais teoremas são normalmente encontrados em bons livros de Álgebra Linear e Cálculo Avançado.

Para não nos perdermos em considerações teóricas, apresentarei aqui as fórmulas para a obtenção da Regressão Linear para a Reta, a Parábola e a Cúbica.


Observação: Se você está interessado em aprender o "processo", fique atento às mudanças que ocorrem quando passamos da reta para a parábola e da parábola para a cúbica. Não construiremos o processo para a quártica mas julgo que você saberá construí-lo com o material apresentado.


Notações usadas na sequência


A reta dos mínimos quadrados

Para obter a reta dos mínimos quadrados, basta resolver o sistema linear com 2 equações e 2 incógnitas ao e a1 :

ao n+a1 SX = SY
ao SX+a1 SX2 = SXY

Na forma matricial este sistema pode ser escrito como:

nSX . a0 = SY
SXSX2a1SXY

Para resolver este sistema, existem vários métodos, mas a Regra de Cramer dá uma resposta rápida para os coeficientes:

ao = (SY.SX2-SX.SXY)/(n SX2-SX.SX)
a1 = (n SXY-SX.SY) / (n SX2-SX.SX)


A parábola dos mínimos quadrados

Para obter a parábola de melhor ajuste, basta resolver o sistema com as 3 incógnitas ao, a1 e a2:

ao n+a1 SX+a2 SX2 = SY
ao SX+a1 SX2+a2 SX3 = SXY
ao SX2+a1 SX3+a2 SX4 = SX2Y

Este sistema pode ser escrito na forma matricial como:


nSXSX2 . a0 = SY
SXSX2SX3a1SXY
SX2SX3SX4a2SX2Y

Observação: Encontre as diferenças entre este sistema e o sistema obtido no caso anterior da reta.

Como todos os termos da primeira matriz (matriz dos coeficientes) e da última matriz (matriz das constantes) são conhecidos, fica fácil resolver o sistema pelo processo de inverter a primeira delas e multiplicar pela última para obter os coeficientes ao, a1 e a2 .


A cúbica dos mínimos quadrados

Para obter a cúbica dos mínimos quadrados resolve-se o sistema de equações com 4 equações e 4 incógnitas ao, a1, a2 e a3, colocado na forma matricial:

nSXSX2SX3 . a0 = SY
SXSX2SX3SX4a1SXY
SX2SX3SX4SX5a2SX2Y
SX3SX4SX5SX6a3SX3Y

Como os termos da primeira e última matrizes são conhecidos, pode-se resolver o sistema invertendo a primeira matriz e multiplicando pela última.


A quártica dos mínimos quadrados


Observação: Observe novamente as diferenças entre o sistema obtido para a cúbica e os sistemas obtidos nos casos da reta e da parábola. De posse de tais informações, você estaria capacitado a produzir a curva quártica de melhor ajuste dos mínimos quadrados apenas com o material apresentando aqui?

É possível estender o método para a construção de uma superfície de melhor ajuste no espaço tridimensional.


Regressão Linear no espaço

Agora estudaremos uma situação no espaço R³ onde é conhecido um conjunto de pontos (ternos) dados por:

C = { (xi, yi, zi) : i=1,2,3,...,n }

Desejamos ajustar uma superfície da forma

z = f(x,y) = a+b x+c y+d x²+e xy+f y²

Usando procedimentos semelhantes ao caso do plano, poderemos construir uma função:

S(a,b,c,d,e,f) = Soma (z-zi


onde esta soma é tomada sobre todos os i=1,2,3,4,...,n.

Esta função S é não negativa e diferenciável, assim podemos garantir que o ponto de mínimo para S ocorrerá quando o gradiente da função S for nulo, isto é, quando:

Sa = Sb = Sc = Sd = Se = Sf = 0

o que equivale a:

Sa = 2 Soma (z-zi).(1) = 0
Sb = 2 Soma (z-zi).(xi) = 0
Sc = 2 Soma (z-zi).(yi) = 0
Sd = 2 Soma (z-zi).(xi²) = 0
Se = 2 Soma (z-zi).(xiyi) = 0
Sf = 2 Soma (z-zi).(yi²) = 0

A notação Sm usada significa a derivada parcial da função S em relação à variável m, onde m pode ser a,b,c,d,e ou f.


Temos aqui um sistema com 6 equações e 6 incógnitas, que pode ser reescrito como:

Soma (a+bxi+cyi+dxi²+exiyi+fyi² - zi) = 0
Soma (a+bxi+cyi+dxi²+exiyi+fyi² - zi)(xi) = 0
Soma (a+bxi+cyi+dxi²+exiyi+fyi² - zi)(yi) = 0
Soma (a+bxi+cyi+dxi²+exiyi+fyi² - zi)(xi²) = 0
Soma (a+bxi+cyi+dxi²+exiyi+fyi² - zi)(xiyi) = 0
Soma (a+bxi+cyi+dxi²+exiyi+fyi² - zi)(yi²) = 0

Passando as constantes para o segundo membro da igualdade de cada equação, teremos o sistema com 6 equações e 6 incógnitas:

a n    + b X1Y0 + c X0Y1 + d X2Y0 + e X1Y1 + f X0Y2 = Z1X0Y0
a X1Y0 + b X2Y0 + c X1Y1 + d X3Y0 + e X2Y0 + f X1Y2 = Z1X1Y0
a X0Y1 + b X1Y1 + c X0Y2 + d X2Y0 + e X1Y2 + f X0Y3 = Z1X0Y1
a X2Y0 + b X3Y0 + c X2Y1 + d X4Y0 + e X3Y1 + f X2Y2 = Z1X2Y0
a X1Y1 + b X2Y1 + c X1Y2 + d X3Y1 + e X2Y2 + f X1Y3 = Z1X1Y1
a X0Y2 + b X1Y2 + c X0Y3 + d X2Y2 + e X1Y3 + f X0Y4 = Z1X0Y2

onde n é o número de ternos ordenados e

sendo que p e q podem assumir os valores 0,1,2,3 ou 4.

Este sistema pode ser escrito na forma matricial:


nX1Y0X0Y1X2Y0X1Y1X0Y2 . a=Z1X0Y0
X1Y0X2Y0X1Y1X3Y0X2Y0X1Y2bZ1X1Y0
X0Y1X1Y1X0Y2X2Y0X1Y2X0Y3cZ1X0Y1
X2Y0X3Y0X2Y1X4Y0X3Y1X2Y2dZ1X2Y0
X1Y1X2Y1X1Y2X3Y1X2Y2X1Y3eZ1X1Y1
X0Y2X1Y2X0Y3X2Y2X1Y3X0Y4fZ1X0Y2

Para resolver este sistema, sugiro que utilize uma planilha de cálculo. Existem muitas disponíveis gratuitamente na Internet. Em qualquer uma delas, deve-se montar a planilha como a que aparece abaixo, dando uma forte ênfase na última linha que é a mais importante e que contem as somas necessárias à montagem do sistema.

 ABCDEFGHIJKLMNOPQRST
1xyzxyx²yxy²x³yx²yx4x²y²xy³zxzyzx²zxyzy²
2                    
3                    
4                    
...                    
n                    
n+1                    
Soma                    

Após a construção da tabela acima, deve-se construir uma segunda tabela com a matriz aumentada do sistema. Nesta nova tabela aparecerão todas as somas calculadas na tabela anterior (indicadas na linha em amarelo) e pode-se observar que a nova matriz será simétrica:

nX1Y0X0Y1X2Y0X1Y1X0Y2Z1X0Y0
X1Y0X2Y0X1Y1X3Y0X2Y0X1Y2Z1X1Y0
X0Y1X1Y1X0Y2X2Y0X1Y2X0Y3Z1X0Y1
X2Y0X3Y0X2Y1X4Y0X3Y1X2Y2Z1X2Y0
X1Y1X2Y1X1Y2X3Y1X2Y2X1Y3Z1X1Y1
X0Y2X1Y2X0Y3X2Y2X1Y3X0Y4Z1X0Y2
Matriz dos
coeficientes
Matriz das
constantes

Na sequência, deve-se obter a inversa da matriz dos coeficientes e multiplicá-la pela matriz das constantes para obter uma matriz com 6x1, que é exatamente a matriz dos coeficientes procurados:

a=...
b...
c...
d...
e...
f...

Resolução de um problema prático

Consideremos os dados fornecidos na tabela:

X303030301010101044441111
Y1,52351,52351,52351,5235
Z7341,218,46,843,523,710,53,926,7156,82,213,573,71,5

Pergunta: Qual é a função matemática que relaciona as variáveis x e y com a variável z?

Resposta: Tentei obter uma função quadrática da forma:

z = a + b x + c y + d x² + e xy + f y²

que se ajustasse aos dados. Como a soma dos quadrados dos erros ficou muito grande, alterei a estratégia de análise.

Observei que os dados x e z eram grandes em relação aos dados y, assim, tomei os logaritmos naturais dos dados x e z e refiz todas as operações e obtive um ajuste muito bom!

Na sequência eu apresento alguns detalhes dos cálculos.

Os coeficientes calculados são:

a=-0,08519, b=0,069359, c=0,349672,
d=-0,0096, e=-0,01209, f=0,000927

A função deveria ser a seguinte:

z=-0,08519+0,069359x+0,349672y-0,0096x²-0,01209xy+0,000927y²

mas como eu usei Ln(x) e Ln(z), respectivamente nos lugares de x e z, então a forma que resolve o problema com grande precisão é:

Ln(z)=-0,08519+0,069359Ln(x)+0,349672y-0,0096(Ln(x))²-0,01209y.Ln(x)+0,000927y²

Para obter o valor de z, calculamos a exponencial de Ln(z) uma vez que a função exponencial é a inversa da função logaritmo natural.


Valid XHTML 1.0! Construída por Ulysses Sodré.