Inversa de Moore-Penrose

Inversa generalizada mais conhecida de uma matriz

Em matemática, e em particular em álgebra linear, a matriz inversa de Moore-Penrose A + {\displaystyle A^{+}} de uma matriz A {\displaystyle A} é a generalização mais conhecida da matriz inversa.[1] [2] [3] [4] Ela foi descrita independentemente por EH Moore[5] em 1920, Arne Bjerhammar[6] em 1951 e Roger Penrose[7] em 1955. Anteriormente, Erik Ivar Fredholm introduziu o conceito de pseudoinversa para operadores integrais em 1903. Ao se referir a uma matriz, o termo pseudoinversa, sem maiores especificações, é frequentemente usado para indicar a inversa de Moore-Penrose. O termo inversa generalizada às vezes é usado como sinônimo de pseudoinversa.

Um uso comum da pseudoinversa é o cálculo da solução de mínimos quadrados para um sistema de equações lineares que não possui solução. Outro uso é encontrar a solução de norma (euclidiana) mínima para um sistema de equações lineares com múltiplas soluções. A matriz pseudoinversa facilita o enunciado e a e a prova de resultados em álgebra linear.

A pseudoinversa é definida e única para todas as matrizes cujas entradas são números reais ou complexos. Pode ser determinada usando-se a decomposição de valores singulares. No caso especial em que A {\displaystyle A} é uma matriz normal (por exemplo, uma matriz Hermitiana), a pseudoinversa A + {\displaystyle A^{+}} anula o núcleo de A {\displaystyle A} e atua como uma inversa tradicional de A {\displaystyle A} no subespaço ortogonal ao núcleo.

Notação

Na discussão a seguir, as seguintes convenções são adotadas:

  • K {\displaystyle \mathbb {K} } denota o corpo dos números reais ( R {\displaystyle \mathbb {R} } ) ou o cordos dos números complexos ( C {\displaystyle \mathbb {C} } ). O espaço vetorial de matrizes m × n {\displaystyle m\times n} sobre K {\displaystyle \mathbb {K} } é denotado por K m × n {\displaystyle \mathbb {K} ^{m\times n}} .
  • Para A K m × n {\displaystyle A\in \mathbb {K} ^{m\times n}} , sua transposta é denotada por A T {\displaystyle A^{\operatorname {T} }} e a transposta conjugada (também chamada de adjunta) é denotada por A {\displaystyle A^{*}} . Se K = R {\displaystyle \mathbb {K} =\mathbb {R} } , entãoo A = A T {\displaystyle A^{*}=A^{\operatorname {T} }} .
  • Para A K m × n {\displaystyle A\in \mathbb {K} ^{m\times n}} , Col ( A ) {\displaystyle \operatorname {Col} (A)} denota o espaço coluna (imagem) de A {\displaystyle A} (o espaço gerado pelos vetores colunas de A {\displaystyle A} ) e Nul ( A ) {\displaystyle \operatorname {Nul} (A)} (ou ker ( A ) {\displaystyle \ker(A)} ) denota o núcleo (espaço nulo) de A {\displaystyle A} .
  • Para qualquer inteiro positivo n {\displaystyle n} , a matriz identidade de ordem n × n {\displaystyle n\times n} é denotada por I n K n × n {\displaystyle I_{n}\in \mathbb {K} ^{n\times n}} .

Definição

Para A K m × n {\displaystyle A\in \mathbb {K} ^{m\times n}} , uma pseudoinversa de A é definida como uma matriz A + K n × m {\displaystyle A^{+}\in \mathbb {K} ^{n\times m}} satisfazendo todos os quatro critérios a seguir, conhecidos como condições de Moore-Penrose:[8][9]

  1. A A + {\displaystyle AA^{+}} não precisa ser a matriz identidade, mas deve mapear todos os vetores colunas de A em si mesmos:
    A A + A = A . {\displaystyle AA^{+}A=\;A.}
  2. A + {\displaystyle A^{+}} atua como uma inversa graca:
    A + A A + = A + . {\displaystyle A^{+}AA^{+}=\;A^{+}.}
  3. A A + {\displaystyle AA^{+}} é Hermitiana:
    ( A A + ) = A A + . {\displaystyle \left(AA^{+}\right)^{*}=\;AA^{+}.}
  4. A + A {\displaystyle A^{+}A} também é Hermitiana:
    ( A + A ) = A + A . {\displaystyle \left(A^{+}A\right)^{*}=\;A^{+}A.}

A pseudoinversa A + {\displaystyle A^{+}} existe para qualquer matriz A K m × n {\displaystyle A\in \mathbb {K} ^{m\times n}} . Se, além disso, A {\displaystyle A} tem posto completo, ou seja, seu posto é min { m , n } {\displaystyle \min\{m,n\}} , então A + {\displaystyle A^{+}} tem uma expressão algébrica particularmente simples.

Em particular, quando A {\displaystyle A} tem colunas linearmente independentes (equivalentemente, A {\displaystyle A} é injetiva e, portanto A A {\displaystyle A^{*}A} é invertível), A + {\displaystyle A^{+}} pode ser calculado como

A + = ( A A ) 1 A . {\displaystyle A^{+}=\left(A^{*}A\right)^{-1}A^{*}.}

Esta pseudoinversa específica é uma inversa à esquerda, ou seja, A + A = I {\displaystyle A^{+}A=I} . Se, por outro lado, A {\displaystyle A} tem linhas linearmente independentes (equivalentemente, A {\displaystyle A} é sobrejetiva e, portanto, A A {\displaystyle AA^{*}} é invertível), A + {\displaystyle A^{+}} pode ser calculado como

A + = A ( A A ) 1 . {\displaystyle A^{+}=A^{*}\left(AA^{*}\right)^{-1}.}
Esta é uma inversa à direita, uma vez que A A + = I {\displaystyle AA^{+}=I} .

No caso mais geral, a matriz pseudoinversa pode ser expressa usando-se a decomposição de valores singulares. Qualquer matriz pode ser decomposta como A = U D V {\displaystyle A=UDV^{*}} para algumas matrizes U , V {\displaystyle U,V} e matriz real positiva diagonal D {\displaystyle D} . A pseudoinversa pode então ser escrita como A + = V D 1 U {\displaystyle A^{+}=VD^{-1}U^{*}} . Que esta matriz satisfaz o requisito acima é verificado diretamente observando que A A + = U U {\displaystyle AA^{+}=UU^{*}} e A + A = V V {\displaystyle A^{+}A=VV^{*}} , que são as projeções na imagem e suporte de A {\displaystyle A}

A {\displaystyle A} , respectivamente.

Propriedades

Existência e unicidade

Para qualquer matriz A {\displaystyle A} , existe uma, e somente uma pseudoinversa A + {\displaystyle A^{+}} .[10]

Uma matriz que satisfaz a primeira condição da definição é conhecida como inversa generalizada. Se a matriz também satisfaz a segunda definição, ela é chamada de inversa generalizada reflexiva. Inversas generalizadas sempre existem, mas em geral não são únicas. A unicidade é uma consequência dessas duas condições.

Propriedades básicas

  • Se A {\displaystyle A} tem entradas reais, então A + {\displaystyle A^{+}} também tem.
  • Se A {\displaystyle A} é invertível, sua pseudoinversa é sua inversa, ou seja, A + = A 1 {\displaystyle A^{+}=A^{-1}} .[11]
  • A pseudoinversa de uma matriz nula é sua transposta, ou seja, A + = A T {\displaystyle A^{+}=A^{\operatorname {T} }} .
  • A pseudoinversa da pseudoinversa de A {\displaystyle A} é a própria matriz A {\displaystyle A} , ou seja, ( A + ) + = A {\displaystyle \left(A^{+}\right)^{+}=A} .[11]
  • Pseudoinversion commutes with transposition, conjugation, and taking the conjugate transpose:[11]:245
    ( A T ) + = ( A + ) T {\displaystyle \left(A^{\mathrm {T} }\right)^{+}=\left(A^{+}\right)^{\mathrm {T} }} , ( A ¯ ) + = A + ¯ {\displaystyle \left({\overline {A}}\right)^{+}={\overline {A^{+}}}} , ( A ) + = ( A + ) {\displaystyle \left(A^{*}\right)^{+}=\left(A^{+}\right)^{*}} .
  • A pseudoinversa de um múltiplo escalar de A {\displaystyle A} é o múltiplo inverso de A + {\displaystyle A^{+}} , ou seja, ( α A ) + = α 1 A + {\displaystyle \left(\alpha A\right)^{+}=\alpha ^{-1}A^{+}} for α 0 {\displaystyle \alpha \neq 0} .

Identidades

As seguintes identidades podem ser usadas para simplificar ou expandir expressões envolvendo pseudoinversas:

A + = A + A + A = A A + A + , A = A + A A = A A A + , A = A A A + = A + A A . {\displaystyle {\begin{alignedat}{3}A^{+}={}&A^{+}&&A^{+*}&&A^{*}\\={}&A^{*}&&A^{+*}&&A^{+},\\A={}&A^{+*}&&A^{*}&&A\\={}&A&&A^{*}&&A^{+*},\\A^{*}={}&A^{*}&&A&&A^{+}\\={}&A^{+}&&A&&A^{*}.\end{alignedat}}}

Exemplos

Como para matrizes invertíveis a pseudoinversa é igual à inversa usual, apenas exemplos de matrizes não invertíveis são apresentados abaixo.

  • Para A = ( 0 0 0 0 ) , {\displaystyle \mathbf {A} ={\begin{pmatrix}0&0\\0&0\end{pmatrix}},\,} a pseudoinversa é A + = ( 0 0 0 0 ) . {\displaystyle \mathbf {A^{+}} ={\begin{pmatrix}0&0\\0&0\end{pmatrix}}.} (De modo geral, a pseudoinversa de uma matriz nula é a sua transposta). A unicidade desta pseudoinversa pode ser vista a partir da condição A + = A + A A + {\displaystyle A^{+}=A^{+}AA^{+}} , já que a multiplicação por uma matriz nual sempre produz uma matriz nula.
  • Para A = ( 1 0 1 0 ) , {\displaystyle \mathbf {A} ={\begin{pmatrix}1&0\\1&0\end{pmatrix}},\,} a pseudoinversa é A + = ( 1 2 1 2 0 0 ) . {\displaystyle \mathbf {A^{+}} ={\begin{pmatrix}{\frac {1}{2}}&{\frac {1}{2}}\\0&0\end{pmatrix}}.}
    De fato, A A + = ( 1 2 1 2 1 2 1 2 ) , {\displaystyle \mathbf {A\,A^{+}} ={\begin{pmatrix}{\frac {1}{2}}&{\frac {1}{2}}\\{\frac {1}{2}}&{\frac {1}{2}}\end{pmatrix}},\,} e portanto A A + A = ( 1 0 1 0 ) = A . {\displaystyle \mathbf {A\,A^{+}A} ={\begin{pmatrix}1&0\\1&0\end{pmatrix}}=A.}
    Similarmente, A + A = ( 1 0 0 0 ) , {\displaystyle \mathbf {A^{+}A} ={\begin{pmatrix}1&0\\0&0\end{pmatrix}},\,} e portanto A + A A + = ( 1 2 1 2 0 0 ) = A + . {\displaystyle \mathbf {A^{+}A\,A^{+}} ={\begin{pmatrix}{\frac {1}{2}}&{\frac {1}{2}}\\0&0\end{pmatrix}}=A^{+}.}
  • Para A = ( 1 0 1 0 ) ,   {\displaystyle \mathbf {A} ={\begin{pmatrix}1&0\\-1&0\end{pmatrix}},\ } A + = ( 1 2 1 2 0 0 ) . {\displaystyle \mathbf {A^{+}} ={\begin{pmatrix}{\frac {1}{2}}&-{\frac {1}{2}}\\0&0\end{pmatrix}}.}
  • Para A = ( 1 0 2 0 ) ,   {\displaystyle \mathbf {A} ={\begin{pmatrix}1&0\\2&0\end{pmatrix}},\ } A + = ( 1 5 2 5 0 0 ) . {\displaystyle \mathbf {A^{+}} ={\begin{pmatrix}{\frac {1}{5}}&{\frac {2}{5}}\\0&0\end{pmatrix}}.} (Os denominadores são 5 = 1 2 + 2 2 {\displaystyle 5=1^{2}+2^{2}} .)
  • Para A = ( 1 1 1 1 ) ,   {\displaystyle \mathbf {A} ={\begin{pmatrix}1&1\\1&1\end{pmatrix}},\ } A + = ( 1 4 1 4 1 4 1 4 ) . {\displaystyle \mathbf {A^{+}} ={\begin{pmatrix}{\frac {1}{4}}&{\frac {1}{4}}\\{\frac {1}{4}}&{\frac {1}{4}}\end{pmatrix}}.}
  • Para A = ( 1 0 0 1 0 1 ) , {\displaystyle \mathbf {A} ={\begin{pmatrix}1&0\\0&1\\0&1\end{pmatrix}},\,} a pseudoinversa é A + = ( 1 0 0 0 1 2 1 2 ) . {\displaystyle \mathbf {A^{+}} ={\begin{pmatrix}1&0&0\\0&{\frac {1}{2}}&{\frac {1}{2}}\end{pmatrix}}.}
    Observe que para esta matriz, a inversa à esquerda existe e, portanto, é igual A + {\displaystyle \mathbf {A^{+}} } . De fato, A + A = ( 1 0 0 1 ) . {\displaystyle \mathbf {A^{+}A} ={\begin{pmatrix}1&0\\0&1\end{pmatrix}}.}

Ver também

Referências

  1. Ben-Israel & Greville 2003, p. 7.
  2. Campbell & Meyer 1991, p. 10.
  3. Nakamura 1991, p. 42.
  4. Rao & Mitra 1971, p. 50–51.
  5. Moore, E. H. (1920). «On the reciprocal of the general algebraic matrix». Bulletin of the American Mathematical Society. 26 (9): 394–95. doi:10.1090/S0002-9904-1920-03322-7Acessível livremente 
  6. Bjerhammar, Arne (1951). «Application of calculus of matrices to method of least squares; with special references to geodetic calculations». Trans. Roy. Inst. Tech. Stockholm. 49 
  7. Penrose, Roger (1955). «A generalized inverse for matrices». Proceedings of the Cambridge Philosophical Society. 51 (3): 406–13. Bibcode:1955PCPS...51..406P. doi:10.1017/S0305004100030401Acessível livremente 
  8. Penrose, Roger (1955). «A generalized inverse for matrices». Proceedings of the Cambridge Philosophical Society. 51 (3): 406–13. Bibcode:1955PCPS...51..406P. doi:10.1017/S0305004100030401Acessível livremente 
  9. Golub, Gene H.; Charles F. Van Loan (1996). Matrix computations 3rd ed. Baltimore: Johns Hopkins. pp. 257–258. ISBN 978-0-8018-5414-9 
  10. Golub, Gene H.; Charles F. Van Loan (1996). Matrix computations 3rd ed. Baltimore: Johns Hopkins. pp. 257–258. ISBN 978-0-8018-5414-9 
  11. a b c Stoer, Josef; Bulirsch, Roland (2002). Introduction to Numerical Analysis 3rd ed. Berlin, New York: Springer-Verlag. ISBN 978-0-387-95452-3 .

Bibliografia

  • Ben-Israel, Adi; Greville, Thomas N.E. (2003). Generalized inverses: Theory and applications 2nd ed. New York, NY: Springer. ISBN 978-0-387-00293-4. doi:10.1007/b97366 
  • Campbell, S. L.; Meyer, Jr., C. D. (1991). Generalized Inverses of Linear TransformationsRegisto grátis requerido. [S.l.]: Dover. ISBN 978-0-486-66693-8 
  • Nakamura, Yoshihiko (1991). Advanced Robotics: Redundancy and Optimization. [S.l.]: Addison-Wesley. ISBN 978-0201151985 
  • Rao, C. Radhakrishna; Mitra, Sujit Kumar (1971). Generalized Inverse of Matrices and its ApplicationsRegisto grátis requerido. New York: John Wiley & Sons. p. 240. ISBN 978-0-471-70821-6