"O temor do Senhor é o princípio do conhecimento; mas os insensatos desprezam a sabedoria e a instrução."
Provérbios 1:7, A Bíblia Sagrada
Introdução aos autovalores
Seja V um espaço vetorial de dimensão n sobre um corpo K, A uma matriz quadrada de ordem n e T:V
V uma transformação linear, definida para cada v
V por:
T(v) = A.v
Pergunta: Será que existe algum vetor v
V, cuja imagem T(v) pela transformação T tenha a mesma direção que o vetor v, ou seja, será que existe um escalar µ
K tal que
T(v) = µ v
O vetor nulo tem essa propriedade para qualquer escalar, mas observamos que o vetor nulo não pode ser utilizado em uma base do espaço vetorial V, objetivo fundamental no contexto do estudo de autovalores e autovetores.
Estamos procurando vetores v
V e escalares µ
K para os quais
T(v) = A.v = µ v
Subjacente ao processo de descoberta desses escalares e vetores estão as soluções de muitos problemas aplicados da Matemática, Física, Engenharias Civil e Elétrica, etc.
Autovalores e Autovetores
Seja A uma matriz quadrada de ordem n sobre um corpo K. Se existe um escalar µ
K e um vetor v
0 tal que:
A.v = µ v
este escalar µ é denominado um autovalor de A e v é um autovetor associado a este escalar µ.
Sinônimos para autovalor são: valor próprio e valor característico.
Exemplo 1: Seja uma matriz A e um vetor v
R³ tal que:
| A = | | | | |
1 0 0 0 2 0 0 0 3 |
| | | |
e v = | | | | |
x y z |
| | | |
|---|
Observamos que:
| A.v = | | | | |
1 0 0 0 2 0 0 0 3 |
| | | |
. | | | | |
x y z |
| | | |
= | | | | |
1x 2y 3z |
| | | |
|---|
Procuramos escalares µ tal que A.v=µv, isto é:
| | | | |
1x 2y 3z |
| | | |
= µ | | | | |
x y z |
| | | |
|---|
Devemos resolver o sistema com as três equações:
(1–µ) x = 0, (2–µ) y = 0, (3–µ) z = 0
com a condição que vt=(x,y,z)
(0,0,0).
Usamos a notação vt=(x,y,z) para indicar a transposta do vetor coluna com os elementos x, y e z.
Temos três possibilidades para os autovalores.
Se x
0 então µ=1. Com tais valores nas outras equações segue que y=0 e z=0. Um vetor com estas propriedades é u=(1,0,0)t.
Se y
0 obtemos µ=2, o que implica que x=0 e z=0. Um vetor com estas propriedades é v=(0,1,0)t.
Se z
0 então µ=3, garantindo que x=0 e y=0. Um vetor com estas propriedades é w=(0,0,1)t.
Neste caso específico, concluímos que para cada autovalor existe um único autovetor associado.
Exemplo 2: Seja uma matriz A e um vetor v
R³ tal que:
| A = | | | | |
1 0 0 0 2 0 0 0 2 |
| | | |
e v = | | | | |
x y z |
| | | |
|---|
Como
| A.v = | | | | |
1 0 0 0 2 0 0 0 2 |
| | | |
. | | | | |
x y z |
| | | |
= | | | | |
1x 2y 2z |
| | | |
|---|
Devemos obter escalares µ tal que A.v=µv, isto é:
| | | | |
1x 2y 2z |
| | | |
= µ | | | | |
x y z |
| | | |
|---|
Basta resolver o sistema de equações
(1–µ) x = 0, (2–µ) y = 0, (2–µ) z = 0
exigindo que vt=(x,y,z)
(0,0,0).
Existem duas possibilidades para os autovalores.
Se x
0 então µ=1,y=0 e z=0. Um vetor com estas propriedades é u=(1,0,0)t.
Se y
0 então µ=2 e x=0, mas existem infinitos valores para z, inclusive z=0. Um vetor com estas propriedades é v=(0,1,0)t.
Se z
0 então µ=2 e x=0, mas existem infinitos valores para y, inclusive y=0. Um vetor com estas propriedades é w=(0,0,1)t.
Neste caso, observamos que para o autovalor µ=1 existe apenas um autovetor, mas para o autovalor µ=2 existem dois autovetores.
Exemplo 3: Seja uma matriz A e um vetor v
R³ tal que:
| A = | | | | |
2 0 0 0 2 0 0 0 2 |
| | | |
e v = | | | | |
x y z |
| | | |
|---|
Como
| A.v = | | | | |
2 0 0 0 2 0 0 0 2 |
| | | |
. | | | | |
x y z |
| | | |
= | | | | |
2x 2y 2z |
| | | |
|---|
Devemos obter escalares µ tal que A.v=µv, isto é:
| | | | |
2x 2y 2z |
| | | |
= µ | | | | |
x y z |
| | | |
|---|
Basta resolver o sistema de equações
(2–µ) x = 0, (2–µ) y = 0, (2–µ) z = 0
exigindo que vt=(x,y,z)
(0,0,0).
Aqui temos um único autovalor µ=2. Realmente, se x
0 ou y
0 ou z
0 ou xyz
0 então µ=2, garantindo que existem infinitos valores para x, y e z, mas escolheremos três simples:
Com x=1, y=0 e z=0, obtemos u=(1,0,0)t.
Com x=0, y=1 e z=0, obtemos v=(0,1,0)t.
Com x=0, y=0 e z=1, obtemos w=(0,0,1)t.
Observamos que o mesmo autovalor µ=2 gerou três autovetores.
Autoespaço associado ao autovalor
Levando em consideração os três exemplos, tem sentido definir o conceito de autoespaço associado a cada autovalor.
Se µ é um autovalor de uma matriz A, definimos o autoespaço associado a µ como o conjunto de todos os vetores obtidos pela combinação linear dos autovetores associados a µ. Denotamos este conjunto por:
S(µ) = {v
V: A.v=µv }
Proposição: O conjunto S(µ) é um subespaço vetorial de V gerado pelos autovetores associados a µ.
Demonstração: O vetor nulo não é um autovetor mas 0
S(µ) pois A.0=µ0.
Se v
S(µ) e w
S(µ), então A.v=µv e A.w=µw, logo
A(v+w) = A.v+A.w = µv + µw = µ(v+w)
e concluímos que v+w
S(µ).
Analogamente, se k
K e v
S(µ), então:
A(kv) = µ(kv)
e concluímos que kv
S(µ).
Polinômio característico
Ao invés de trabalhar diretamente com a resolução de sistemas como nos exemplos apresentados, existe um processo mais simples para obter os autovalores de A.
Se A é uma matriz nxn sobre K e I é a matriz identidade de mesma ordem que A, definimos o polinômio característico de A como:
f(µ) = det(µI–A)
Exemplo: Seja a matriz definida por:
| A = | | | |
1 2 4 9 |
| | |
|---|
Assim:
| f(µ) = det | | | | µ–1 –4 | –2 µ–9 |
| | | = | µ²–10µ+1 |
|---|
Algumas vezes vemos na literatura o polinômio característico da matriz A definido na forma trocada
f(µ) = det(A–µI)
Lema: Seja M uma matriz quadrada de ordem n. Um sistema M.v=0 tem solução não trivial se, e somente se, det(M)=0.
Teorema: Os autovalores de uma matriz quadrada A de ordem n são os zeros do polinômio característico de A, isto é, escalares µ para os quais f(µ)=0.
Demonstração: Os autovalores da matriz A podem ser obtidos a partir da exist|ncia de escalares µ e vetores não nulos v=(x,y,z)t para os quais: A.v=µv. Este sistema pode ser reescrito como A.v=µIv, ou seja:
(µI–A).v = 0
Este sistema terá uma solução não trivial se, e somente se, o determinante da matriz µI–A for nulo (consequência da Regra de Cramer), isto é:
det(A–µI) = 0
Observamos que det(A–µI) é uma função polinomial da variável µ, daí a razão de indicarmos esta expressão por:
f(µ) = det(A–µI)
A partir deste Teorema podemos obter os autovetores se resolvermos o sistema: (µI–A)v=0.
Exemplo: Seja a matriz dada por
| A = | | | | |
0 1 1 –1 2 1 –1 1 2 |
| | | |
|---|
O polinômio característico associado à matriz A é
f(µ) = µ³–4µ²+5µ–2
Como a soma dos coeficientes deste polinômio é igual a zero, µ=1 é um zero de f=f(µ) e f(1)=0.
Dividindo esta função polinômial por (µ–1), obtemos a forma decomposta: f(µ)=(µ–1)(µ²–3µ+2). Com a fórmula quadrática, obtemos: f(µ)=(µ–1)(µ–1)(µ–2), significando que os autovalores de A são:
µ=1, µ=1 e µ=2
Em geral, o sistema (µI–A)v=0 fica na forma
| (µI–A) | | | | |
x y z |
| | | |
= | | | | |
µ 1 1 |
–1 µ–2 –1 |
–1 –1 µ–2 |
| | | |
. | | | | |
x y z |
| | | |
= | | | | |
0 0 0 |
| | | |
|---|
Para µ=1, o sistema toma a forma:
| | | | |
1 1 1 |
–1 –1 –1 |
–1 –1 –1 |
| | | |
. | | | | |
x y z |
| | | |
= | | | | |
0 0 0 |
| | | |
|---|
e este sistema se reduz a apenas uma equação: x–y–z=0. Como temos duas variáveis livres, podemos escrever x=y+z, para obter x em função de y e de z. Se y=1 e z=0 então x=1 e u=(1,1,0)t é um autovetor. Se y=0 e z=1 então x=1 e v=(1,0,1)t é outro autovetor.
Para µ=2, o sistema toma a forma:
| | | | |
2 1 1 |
–1 0 –1 |
–1 –1 0 |
| | | |
. | | | | |
x y z |
| | | |
= | | | | |
0 0 0 |
| | | |
|---|
e este sistema se reduz a apenas uma relação x=y=z. Tomando x=y=z=1, obtemos o terceiro autovetor da matriz A: w=(1,1,1)t.
Matrizes Semelhantes
Duas matrizes A e B são semelhantes, se existe uma matriz inversível P tal que
A = P–1B P
Em muitas situações, a matriz P é formada pelos autovetores da matriz A, postos em colunas.
Exercício: Seja a matriz A do exemplo anterior:
| A = | | | | |
0 1 1 –1 2 1 –1 1 2 |
| | | |
|---|
Construa uma matriz P que tem como colunas os autovetores u, v e w da matriz A.
Obtenha a inversa da matriz P.
Calcule a matriz D=P–1AP semelhante a A.
Conclua algo sobre a posição dos autovalores na matriz D.
Verifique que traço(D)=traço(A).
Verifique que det(D)=det(A).
Exercício: Considere uma matriz A definida por:
| A= | | | | |
1 2 –1 0 0 1 1 1 0 |
| | | |
|---|
Mostre que o polinômio característico de A é dado por: f(µ)=µ³–µ²–1.
Para obter os autovalores complexos de A, resolva a equação f(µ)=0, cujos zeros são:
µ1=1.46557, µ2=–0.23279+0.79255 i, µ3=–0.23279–0.79255 i
Obtenha os autovetores da matriz A.
Construa uma matriz P que tem como colunas os autovetores u, v e w da matriz A.
Obtenha a inversa da matriz P.
Calcule a matriz D=P–1AP semelhante a A.
Conclua algo sobre os autovalores na matriz D.
Mostre que traço(D)~traço(A), onde ~ significa que o cálculo é aproximado.
Mostre que det(D)~det(A).
Matriz ortogonal
Uma matriz M é dita ortogonal se M–1=Mt, isto é, se M.Mt=I.
Exemplo: Uma típica matriz ortogonal é a matriz de rotação ø radianos, definida por:
| Rø = | | | |
cos(ø) –sin(ø) sin(ø) cos(ø) |
| | |
|---|
pois a inversa de Rø é igual à transposta de Rø.
Aplicação de autovalores em Geometria
Consideremos a curva plana definida pela forma quadrática
ax² +2bxy +cy² = d
onde a²+b²+c²
0.
Podemos reescrever o membro da esquerda da equação acima, como:
| ax² +2bxy +cy² = | | x y | | | | |
a b b c |
| | |
| | |
x y |
| | |
= vt A v |
|---|
onde
| A = | | | |
a b b c |
| | |
e v = | | | |
x y |
| | |
|---|
Pergunta: Será que podemos escrever x e y em função de duas novas variáveis X e Y (em maiúscula) de modo que a nova forma quadrática nessas variáveis X e Y, não possua o termo em XY para que a forma quadrática fique na forma
A X² + XY² = D
Esta nova forma recebe o nome de forma canônica.
Uma resposta adequada é dada pela rotação de eixos, uma vez que o termo em xy que aparece na primeira equação é responsável pela inclinação dos eixos principais associados à curva no sistema cartesiano.
Como a matriz de rotação de ø radianos é dada por:
| R(ø) = | | | |
cos(ø) –sen(ø) sen(ø) cos(ø) |
| | |
|---|
podemos realizar a mudança de variáveis com:
| v = | | | |
x y |
| | |
= | | | |
cos(ø) sen(ø) |
–sen(ø) cos(ø) |
| | | | | |
X Y |
| | |
|---|
Tomando P=R(ø) na relação acima, podemos escrever:
| W = | | | | X Y | | | |
= | | | |
cos(ø) –sen(ø) |
sen(ø) cos(ø) |
| | |
| | | x y | | | |
= | P–1v |
|---|
Como a matriz P é ortogonal, podemos escrever:
vtAv=(PW)tA(PW)=Wt Pt APW=Wt(P–1AP)W=d
Escolhendo o valor de ø em função das constantes a, b e c da forma quadrática, poderemos escrever a matriz:
| P–1AP = D = | | | | p 0 | 0 q | | | |
|---|
e a nova forma quadrática:
p X² + q Y² = k
não contém o termo em XY.
Conclusão: Os valores p e q são os autovalores da matriz A e a matriz P é a matriz cujas colunas são os autovetores obtidos a partir da matriz A.
Aplicação de autovalores em Eq. Diferenciais
Consideremos a equação diferencial ordinária (EDO)
2 y"(x) – 6y'(x) + 4y(x) = 0
O polinômio característico associado a esta EDO é dado por:
p(k) = 2k² –6k +4
cujos zeros são k1=1 e k2=2 (autovalores). As autofunções são: y1(x)=exp(k1x) e y2(x)=exp(k2x) (autovetores), garantindo que:
W = {y1(x), y2(x) } = {exp(1x), exp(2x) }
é o conjunto de autofunções e a solução geral da EDO é a combinação linear dos elementos de W:
y(x) = A exp(x) + B exp(2x)
|
Construída por Ulysses Sodré. |
|---|