Matemática Essencial:  Alegria  Financeira  Fundamental  Médio  Geometria  Trigonometria  Superior  Cálculos
Ensino Superior: Álgebra Linear: Autovalores e autovetores

"O temor do Senhor é o princípio do conhecimento; mas os insensatos desprezam a sabedoria e a instrução."
Provérbios 1:7, A Bíblia Sagrada


Introdução aos autovalores

Seja V um espaço vetorial de dimensão n sobre um corpo K, A uma matriz quadrada de ordem n e T:VsetaV uma transformação linear, definida para cada vemV por:

T(v) = A.v

Pergunta: Será que existe algum vetor vemV, cuja imagem T(v) pela transformação T tenha a mesma direção que o vetor v, ou seja, será que existe um escalar µemK tal que

T(v) = µ v

O vetor nulo tem essa propriedade para qualquer escalar, mas observamos que o vetor nulo não pode ser utilizado em uma base do espaço vetorial V, objetivo fundamental no contexto do estudo de autovalores e autovetores.

Estamos procurando vetores vemV e escalares µemK para os quais

T(v) = A.v = µ v

Subjacente ao processo de descoberta desses escalares e vetores estão as soluções de muitos problemas aplicados da Matemática, Física, Engenharias Civil e Elétrica, etc.


Autovalores e Autovetores

Seja A uma matriz quadrada de ordem n sobre um corpo K. Se existe um escalar µemK e um vetor vdif0 tal que:

A.v = µ v

este escalar µ é denominado um autovalor de A e v é um autovetor associado a este escalar µ.

Sinônimos para autovalor são: valor próprio e valor característico.

Exemplo 1: Seja uma matriz A e um vetor vemR³ tal que:

A = |
|
|
1  0  0
0  2  0
0  0  3
|
|
|
   e   v = |
|
|
x
y
z
|
|
|

Observamos que:

A.v = |
|
|
1  0  0
0  2  0
0  0  3
|
|
|
. |
|
|
x
y
z
|
|
|
= |
|
|
1x
2y
3z
|
|
|

Procuramos escalares µ tal que A.v=µv, isto é:

|
|
|
1x
2y
3z
|
|
|
= µ |
|
|
x
y
z
|
|
|

Devemos resolver o sistema com as três equações:

(1–µ) x = 0, (2–µ) y = 0,  (3–µ) z = 0

com a condição que vt=(x,y,z)dif(0,0,0).

Usamos a notação vt=(x,y,z) para indicar a transposta do vetor coluna com os elementos x, y e z.

Temos três possibilidades para os autovalores.

  1. Se xdif0 então µ=1. Com tais valores nas outras equações segue que y=0 e z=0. Um vetor com estas propriedades é u=(1,0,0)t.

  2. Se ydif0 obtemos µ=2, o que implica que x=0 e z=0. Um vetor com estas propriedades é v=(0,1,0)t.

  3. Se zdif0 então µ=3, garantindo que x=0 e y=0. Um vetor com estas propriedades é w=(0,0,1)t.

Neste caso específico, concluímos que para cada autovalor existe um único autovetor associado.

Exemplo 2: Seja uma matriz A e um vetor vemR³ tal que:

A = |
|
|
1  0  0
0  2  0
0  0  2
|
|
|
   e   v = |
|
|
x
y
z
|
|
|

Como

A.v = |
|
|
1  0  0
0  2  0
0  0  2
|
|
|
. |
|
|
x
y
z
|
|
|
= |
|
|
1x
2y
2z
|
|
|

Devemos obter escalares µ tal que A.v=µv, isto é:

|
|
|
1x
2y
2z
|
|
|
= µ |
|
|
x
y
z
|
|
|

Basta resolver o sistema de equações

(1–µ) x = 0, (2–µ) y = 0,  (2–µ) z = 0

exigindo que vt=(x,y,z)dif(0,0,0).

Existem duas possibilidades para os autovalores.

  1. Se xdif0 então µ=1,y=0 e z=0. Um vetor com estas propriedades é u=(1,0,0)t.

  2. Se ydif0 então µ=2 e x=0, mas existem infinitos valores para z, inclusive z=0. Um vetor com estas propriedades é v=(0,1,0)t.

  3. Se zdif0 então µ=2 e x=0, mas existem infinitos valores para y, inclusive y=0. Um vetor com estas propriedades é w=(0,0,1)t.

Neste caso, observamos que para o autovalor µ=1 existe apenas um autovetor, mas para o autovalor µ=2 existem dois autovetores.

Exemplo 3: Seja uma matriz A e um vetor vemR³ tal que:

A = |
|
|
2  0  0
0  2  0
0  0  2
|
|
|
   e   v = |
|
|
x
y
z
|
|
|

Como

A.v = |
|
|
2  0  0
0  2  0
0  0  2
|
|
|
. |
|
|
x
y
z
|
|
|
= |
|
|
2x
2y
2z
|
|
|

Devemos obter escalares µ tal que A.v=µv, isto é:

|
|
|
2x
2y
2z
|
|
|
= µ |
|
|
x
y
z
|
|
|

Basta resolver o sistema de equações

(2–µ) x = 0, (2–µ) y = 0,  (2–µ) z = 0

exigindo que vt=(x,y,z)dif(0,0,0).

Aqui temos um único autovalor µ=2. Realmente, se xdif0 ou ydif0 ou zdif0 ou xyzdif0 então µ=2, garantindo que existem infinitos valores para x, y e z, mas escolheremos três simples:

  1. Com x=1, y=0 e z=0, obtemos u=(1,0,0)t.

  2. Com x=0, y=1 e z=0, obtemos v=(0,1,0)t.

  3. Com x=0, y=0 e z=1, obtemos w=(0,0,1)t.

Observamos que o mesmo autovalor µ=2 gerou três autovetores.


Autoespaço associado ao autovalor

Levando em consideração os três exemplos, tem sentido definir o conceito de autoespaço associado a cada autovalor.

Se µ é um autovalor de uma matriz A, definimos o autoespaço associado a µ como o conjunto de todos os vetores obtidos pela combinação linear dos autovetores associados a µ. Denotamos este conjunto por:

S(µ) = {v em V: A.v=µv }

Proposição: O conjunto S(µ) é um subespaço vetorial de V gerado pelos autovetores associados a µ.

Demonstração: O vetor nulo não é um autovetor mas 0emS(µ) pois A.0=µ0.

Se vemS(µ) e wemS(µ), então A.v=µv e A.w=µw, logo

A(v+w) = A.v+A.w = µv + µw = µ(v+w)

e concluímos que v+w em S(µ).

Analogamente, se kemK e vemS(µ), então:

A(kv) = µ(kv)

e concluímos que kvemS(µ).


Polinômio característico

Ao invés de trabalhar diretamente com a resolução de sistemas como nos exemplos apresentados, existe um processo mais simples para obter os autovalores de A.

Se A é uma matriz nxn sobre K e I é a matriz identidade de mesma ordem que A, definimos o polinômio característico de A como:

f(µ) = det(µI–A)

Exemplo: Seja a matriz definida por:

A = |
|
1  2
4  9
|
|

Assim:

f(µ) = det |
|
µ–1
–4
  –2
µ–9
|
|
 =  µ²–10µ+1

Algumas vezes vemos na literatura o polinômio característico da matriz A definido na forma trocada

f(µ) = det(A–µI)

Lema: Seja M uma matriz quadrada de ordem n. Um sistema M.v=0 tem solução não trivial se, e somente se, det(M)=0.

Teorema: Os autovalores de uma matriz quadrada A de ordem n são os zeros do polinômio característico de A, isto é, escalares µ para os quais f(µ)=0.

Demonstração: Os autovalores da matriz A podem ser obtidos a partir da exist|ncia de escalares µ e vetores não nulos v=(x,y,z)t para os quais: A.v=µv. Este sistema pode ser reescrito como A.v=µIv, ou seja:

(µI–A).v = 0

Este sistema terá uma solução não trivial se, e somente se, o determinante da matriz µI–A for nulo (consequência da Regra de Cramer), isto é:

det(A–µI) = 0

Observamos que det(A–µI) é uma função polinomial da variável µ, daí a razão de indicarmos esta expressão por:

f(µ) = det(A–µI)

A partir deste Teorema podemos obter os autovetores se resolvermos o sistema: (µI–A)v=0.

Exemplo: Seja a matriz dada por

A = |
|
|
 0  1  1
–1  2  1
–1  1  2
|
|
|

O polinômio característico associado à matriz A é

f(µ) = µ³–4µ²+5µ–2

Como a soma dos coeficientes deste polinômio é igual a zero, µ=1 é um zero de f=f(µ) e f(1)=0.

Dividindo esta função polinômial por (µ–1), obtemos a forma decomposta: f(µ)=(µ–1)(µ²–3µ+2). Com a fórmula quadrática, obtemos: f(µ)=(µ–1)(µ–1)(µ–2), significando que os autovalores de A são:

µ=1, µ=1 e µ=2

Em geral, o sistema (µI–A)v=0 fica na forma

(µI–A) |
|
|
x
y
z
|
|
|
= |
|
|
µ
1
1
–1
µ–2
–1
–1
–1
µ–2
|
|
|
. |
|
|
x
y
z
|
|
|
= |
|
|
0
0
0
|
|
|

Para µ=1, o sistema toma a forma:

|
|
|
1
1
1
 –1
 –1
 –1
 –1
 –1
 –1
|
|
|
. |
|
|
x
y
z
|
|
|
= |
|
|
0
0
0
|
|
|

e este sistema se reduz a apenas uma equação: x–y–z=0. Como temos duas variáveis livres, podemos escrever x=y+z, para obter x em função de y e de z. Se y=1 e z=0 então x=1 e u=(1,1,0)t é um autovetor. Se y=0 e z=1 então x=1 e v=(1,0,1)t é outro autovetor.

Para µ=2, o sistema toma a forma:

|
|
|
2
1
1
  –1
   0
  –1
  –1
  –1
   0
|
|
|
. |
|
|
x
y
z
|
|
|
= |
|
|
0
0
0
|
|
|

e este sistema se reduz a apenas uma relação x=y=z. Tomando x=y=z=1, obtemos o terceiro autovetor da matriz A: w=(1,1,1)t.


Matrizes Semelhantes

Duas matrizes A e B são semelhantes, se existe uma matriz inversível P tal que

A = P–1B P

Em muitas situações, a matriz P é formada pelos autovetores da matriz A, postos em colunas.

Exercício: Seja a matriz A do exemplo anterior:

A = |
|
|
 0  1  1
–1  2  1
–1  1  2
|
|
|

  1. Construa uma matriz P que tem como colunas os autovetores u, v e w da matriz A.

  2. Obtenha a inversa da matriz P.

  3. Calcule a matriz D=P–1AP semelhante a A.

  4. Conclua algo sobre a posição dos autovalores na matriz D.

  5. Verifique que traço(D)=traço(A).

  6. Verifique que det(D)=det(A).


Exercício: Considere uma matriz A definida por:

A= |
|
|
1  2 –1
0  0  1
1  1  0
|
|
|

  1. Mostre que o polinômio característico de A é dado por: f(µ)=µ³–µ²–1.

  2. Para obter os autovalores complexos de A, resolva a equação f(µ)=0, cujos zeros são:

    µ1=1.46557, µ2=–0.23279+0.79255 i, µ3=–0.23279–0.79255 i

  3. Obtenha os autovetores da matriz A.

  4. Construa uma matriz P que tem como colunas os autovetores u, v e w da matriz A.

  5. Obtenha a inversa da matriz P.

  6. Calcule a matriz D=P–1AP semelhante a A.

  7. Conclua algo sobre os autovalores na matriz D.

  8. Mostre que traço(D)~traço(A), onde ~ significa que o cálculo é aproximado.

  9. Mostre que det(D)~det(A).


Matriz ortogonal

Uma matriz M é dita ortogonal se M–1=Mt, isto é, se M.Mt=I.

Exemplo: Uma típica matriz ortogonal é a matriz de rotação ø radianos, definida por:

Rø = |
|
cos(ø) –sin(ø)
sin(ø)  cos(ø)
|
|

pois a inversa de Rø é igual à transposta de Rø.


Aplicação de autovalores em Geometria

Consideremos a curva plana definida pela forma quadrática

ax² +2bxy +cy² = d

onde a²+b²+c²dif0.

Podemos reescrever o membro da esquerda da equação acima, como:

ax² +2bxy +cy² = | x  y | |
|
a  b
b  c
|
|
|
|
x
y
|
|
= vt A v

onde

A = |
|
a  b
b  c
|
|
  e   v = |
|
x
y
|
|

Pergunta: Será que podemos escrever x e y em função de duas novas variáveis X e Y (em maiúscula) de modo que a nova forma quadrática nessas variáveis X e Y, não possua o termo em XY para que a forma quadrática fique na forma

A X² + XY² = D

Esta nova forma recebe o nome de forma canônica.

Uma resposta adequada é dada pela rotação de eixos, uma vez que o termo em xy que aparece na primeira equação é responsável pela inclinação dos eixos principais associados à curva no sistema cartesiano.

Como a matriz de rotação de ø radianos é dada por:

R(ø) = |
|
cos(ø) –sen(ø)
sen(ø)  cos(ø)
|
|

podemos realizar a mudança de variáveis com:

 v = |
|
x
y
|
|
= |
|
cos(ø)
sen(ø)
 –sen(ø)
  cos(ø)
|
|
|
|
X
Y
|
|

Tomando P=R(ø) na relação acima, podemos escrever:

W = |
|
X
Y
|
|
= |
|
cos(ø)
–sen(ø)
 sen(ø)
  cos(ø)
|
|
|
|
x
y
|
|
= P–1v

Como a matriz P é ortogonal, podemos escrever:

vtAv=(PW)tA(PW)=Wt Pt APW=Wt(P–1AP)W=d

Escolhendo o valor de ø em função das constantes a, b e c da forma quadrática, poderemos escrever a matriz:

P–1AP = D = |
|
p
 0
0
 q
|
|

e a nova forma quadrática:

p X² + q Y² = k

não contém o termo em XY.

Conclusão: Os valores p e q são os autovalores da matriz A e a matriz P é a matriz cujas colunas são os autovetores obtidos a partir da matriz A.


Aplicação de autovalores em Eq. Diferenciais

Consideremos a equação diferencial ordinária (EDO)

2 y"(x) – 6y'(x) + 4y(x) = 0

O polinômio característico associado a esta EDO é dado por:

p(k) = 2k² –6k +4

cujos zeros são k1=1 e k2=2 (autovalores). As autofunções são: y1(x)=exp(k1x) e y2(x)=exp(k2x) (autovetores), garantindo que:

W = {y1(x), y2(x) } = {exp(1x), exp(2x) }

é o conjunto de autofunções e a solução geral da EDO é a combinação linear dos elementos de W:

y(x) = A exp(x) + B exp(2x)


Valid XHTML 1.0! Construída por Ulysses Sodré.