Обобщённый собственный вектор

Обобщённый собственный вектор матрицы вектор, который удовлетворяет определённым критериям, которые слабее, чем критерии для (обычных) собственных векторов[1].

Пусть будет -мерным векторным пространством. Пусть будет линейным отображением в , множества всех линейных отображений из в себя. Пусть будет матричным представлением отображения для некоторого упорядоченного базиса.

Может не существовать полного набора линейно независимых собственных векторов матрицы , которые образуют полный базис для . То есть, матрица не может быть диагонализирована[2][3]. Это происходит, когда алгебраическая кратность по меньшей мере одного собственного значения больше, чем его геометрическая кратность (степень вырожденности матрицы , или размерность его ядра). В этом случае называется дефектным собственным значением[англ.], а сама матрица называется дефектной матрицей[англ.][4].

Обобщённый собственный вектор , соответствующий , вместе с матрицей образует цепочку Жордана линейно независимых обобщённых собственных векторов, которые образуют базис для инвариантного подпространства пространства [5][6][7].

Используя обобщённые собственные векторы, множество линейно независимых собственных векторов матрицы может быть расширено, если необходимо, до полного базиса для [8]. Этот базис можно использовать для определения «почти диагональной матрицы» в жордановой нормальной форме, подобной матрице , что применяется при вычислении определённых матричных функций от [1]. Матрица также применяется при решении системы линейных дифференциальных уравнений , где не обязательно диагонализируема[9][3].

Размерность обобщённого собственного пространства, соответствующего заданному собственному значению , равна алгебраической кратности [8].

Обзор и определение

править

Имеется несколько эквивалентных путей определения обычного собственного вектора[10][11][12][13][14][15][16][17]. Для наших целей собственным вектором  , ассоциированным с собственным значением     матрицы  , является ненулевой вектор, для которого  , где   является   единичной матрицей, а   является нулевым вектором длины  [12]. То есть,   является ядром преобразования  . Если   имеет   линейно независимых собственных векторов, то   подобна диагональной матрице  . То есть, существует невырожденная матрица  , такая что   диагонализируема с помощью преобразование подобия  [18][19]. Матрица   называется спектральной матрицей[англ.] матрицы  . Матрица   называется модальной матрицей[англ.] матрицы  [20]. Диагонализируемые матрицы представляют определённый интерес, поскольку матричные функции от неё могут быть легко вычислены[21].

С другой стороны, если матрица   не имеет   линейно независимых собственных векторов, ассоциированных с ней, то   не диагонализируема[18][19].

Определение: Вектор   является обобщённым собственным вектором ранга   матрицы  , соответствующим собственному значению  , если:

 

но

  [1].

Обобщённый собственный вектор ранга 1 является обычным собственным вектором[22]. Любая   матрица   имеет   линейно независимых обобщённых собственных векторов, ассоциированных с ней, и можно показать, что она подобна «почти диагональной» матрице   в жордановой нормальной форме[23]. То есть, существует обратимая матрица  , такая что  [24]. Матрица   в этом случае называется обобщённой модальной матрицей[англ.] матрицы  [25]. Если   является собственным значением с алгебраической кратностью  , то   будет иметь   линейно независимых обобщённых собственных векторов, соответствующих  [8]. Эти результаты, в свою очередь, предоставляют метод вычисления определённых матричных функций от  [26].

Примечание: Для того, что бы   матрица   над полем   могла быть выражена в жордановой нормальной форме, все собственные значения матрицы   должны быть в  . То есть, характеристический многочлен   должен разлагаться полностью на линейные множители. Альтернативный пример: если матрица   состоит из вещественных элементов, может оказаться, что собственные значения и компоненты собственных векторов будут содержать мнимые значения[4][27][3].

Линейная оболочка всех обобщённых собственных векторов для данного   образует обобщённое собственное пространство для  [3].

Примеры

править

Несколько примеров для иллюстрации концепции обобщённых собственных векторов. Некоторые детали будут описаны ниже.

Пример 1

править

Представленный ниже тип матрицы часто используется в учебниках[3][28][2]. Возьмём матрицу

 

Тогда имеется только одно собственное значение,  , и его алгебраическая кратность  .

Заметим, что эта матрица имеет жорданову нормальную форму, но не диагональна. Следовательно, эта матрица не диагонализируема. Поскольку наддиагональ содержит один элемент, имеется один обобщённый собственный вектор ранга, большего 1 (заметим, что векторное пространство   имеет размерность 2, так что может быть не более одного обобщённого собственного вектора ранга, большего 1). Можно также вычислить размерность ядра матрицы  , которая равняется  , тогда имеется   обобщённых собственных векторов ранга, большего 1.

Обыкновенный собственный вектор   вычисляется стандартным методом (см. статью Собственный вектор). Используя этот собственный вектор определяется обобщённый собственный вектор   путём решения уравнения:

 

Выписывая значения:

 

Это выражение упрощается до:

 

Элемент   не имеет ограничений. Обобщённый собственный вектор ранга 2 равен тогда  , где   может иметь любое скалярное значение. Выбор   является, как правило, простейшим.

При этом:

 

так что   является обобщённым собственным вектором,

 

так что   является обычным собственным вектором, а   и   являются линейно независимыми, и, следовательно, образуют базис для векторного пространства  .

Пример 2

править

Следующий пример несколько сложнее примера 1, но также небольшого размера[29]. Матрица

 

имеет собственные значения   и   с алгебраическими кратностями   и  , но геометрические кратности будут равны   и .

Обобщённое собственное подпространство матрицы   вычисляется ниже.   является обычным собственным вектором, ассоциированным с  .   является обобщённым собственным вектором, ассоциированным с  .   является обобщённым собственным вектором, ассоциированным с  .   и   являются обобщёнными собственными векторами, ассоциированными с  .

 
 
 
 
 

Получаем базис для каждого из обобщённых собственных пространств матрицы  . Вместе линейные комбинации двух цепочек обобщённых собственных векторов заполняют пространство всех 5-мерных векторов-столбцов:

 

«Почти диагональная» матрица   в жордановой нормальной форме, подобная  , получается следующим образом:

 
 

где   является обобщённой модальной матрицей[англ.] матрицы  , столбцы матрицы   являются каноническим базисом[англ.] матрицы  , и  [30].

Цепочки Жордана

править

Определение: Пусть   будет обобщённым собственным вектором ранга  , соответствующим матрице   и собственному значению  . Цепочка, образованная вектором   — это набор векторов  , определённых выражением:

 
 
 

 

 

(1)

Тогда:

  (2)

Вектор  , заданный формулой (2), является обобщённым собственным вектором ранга  , соответствующим собственному значению  . Цепочка является набором линейно независимых векторов[6].

Канонический базис

править

Определение: Набор   линейно независимых обобщённых собственных векторов является каноническим базисом, если набор полностью состоит из цепочек Жордана.

Таким образом, если обобщённый собственный вектор ранга   находится в каноническом базисе, то   векторов  , находящихся в цепочке Жордана, образованной  , также находятся в каноническом базисе[31].

Пусть   будет собственным значением матрицы   с алгебраической кратностью  . Найдём (матричные) ранги матриц  . Целое число   определяется как первое число, для которого   имеет ранг   (здесь   равно числу строк или столбцов матрицы  , то есть, матрица   имеет размер  ).

Далее определим:

 

Переменная   обозначает число линейно независимых обобщённых собственных векторов ранга  , соответствующих собственному значению  , которые появятся в каноническом базисе матрицы  . При этом:

 [32].

Вычисление обобщённых собственных векторов

править

В предыдущих разделах представлены техники получения   линейно независимых обобщённых собственных векторов канонического базиса для векторного пространства  , ассоциированного с   матрицей  . Эти техники могут быть собраны в процедуре:

Решаем характеристический многочлен матрицы  , чтобы получить собственные значения   и их алгебраические кратности  ;
Для каждого  :
Определяем  ;
Определяем  ;
Определяем   для  ;
Определяем каждую жорданову цепь для  .

Пример 3

править

Матрица

 

имеет собственное значение   с алгебраической кратностью   и собственное значение   с алгебраической кратностью  , при этом  . Для каждого   выполняется:  .

 
 
 

Первое целое  , для которого   имеет ранг  , равно  .

Далее определяем:

 
 
 

Следовательно, будет три линейно независимых обобщённых собственных вектора, по одному из рангов 3, 2 и 1. Поскольку   соответствует одной цепи из трёх линейно независимых обобщённых собственных векторов, существует обобщённый собственный вектор   ранга 3, соответствующий  , такой что:

  (3)

но:

  (4)

Выражения (3) и (4) представляют линейную систему, которую можно решить относительно  . Пусть

 

Тогда:

 

и

 

Тогда, чтобы удовлетворить условиям (3) и (4), необходимо иметь   и  . Никакие ограничения не накладываются на   и  . Выбрав  , получим:

 

как обобщённый собственный вектор ранга 3, соответствующий  . Можно получить бесконечно много других обобщённых собственных векторов ранга 3, выбрав другие значения  ,   и   при  . Сделанный выбор, однако, самый простой[33].

Теперь, используя равенства (1), получим   и   как обобщённые собственные векторе ранга 2 и 1 соответственно, где:

 

и

 

Некратное собственное значение   может быть вычислено с помощью стандартных техник и оно соответствует обычному собственному вектору:

 

Каноническим базисом матрицы   будет:

 

  и   будут обобщёнными собственными векторами, ассоциированными с  , в то время как   является обычным собственным вектором, ассоциированным с  .

Это довольно простой пример. В общем случае количества   линейно независимых обобщённых собственных векторов ранга   не всегда будут одинаковыми. То есть, могут быть цепочки с разными длинами соответствующих собственных значений[34].

Обобщённая модальная матрица

править

Пусть   является   матрицей. Обобщённая модальная матрица   для   — это   матрица, столбцы которой, рассматриваемые как вектора, образуют канонический базис матрицы   и появляются в   по следующим правилам:

  • Все цепочки Жордана, состоящие из одного вектора (то есть, длиной в один вектор) появляются в первом столбце матрицы  .
  • Все вектора одной цепочки появляются вместе в смежных столбцах матрицы  .
  • Каждая цепочка появляется в   в порядке увеличения ранга (то есть, обобщённый собственный вектор ранга 1 появляется до обобщённого собственного вектора ранга 2 той же цепочки, этот вектор появляется до обобщённого собственного вектора ранга 3 той же цепочки, и т. д.)[25].

Жорданова нормальная форма

править
 
Пример матрицы в жордановой нормальной форме. Серые блоки называются блоками Жордана.

Пусть   является  -мерным векторным пространством. Пусть   будет линейным отображением из  ), множества всех линейных отображений из   в себя. Пусть   будет матричным представлением   для некоторого упорядоченного базиса. Можно показать, что если характеристический многочлен   матрицы   разлагается на линейные множители, так что   имеет вид:

 

где   являются различными собственными значениями  , то каждое   является алгебраической кратностью соответствующего собственного значения  , а   подобна матрице   в жордановой нормальной форме, где каждая   появляется   раз последовательно на диагонали. При этом элемент непосредственно над каждой   (то есть, на наддиагонали) равен либо 0, либо 1 — элементы, выше первого вхождения каждой   всегда равны 0; все другие элементы на наддиагонали равны 1. При этом все другие элементы вне диагонали и наддиагонали равны 0. Матрица   наиболее близка к диагонализации матрицы  . Если матрица   диагонализируема, все элементы выше диагонали равны нулю [35]. Заметим, что в некоторых книгах единицы располагаются на поддиагонали, то есть, непосредственно под главной диагонали, а не на наддиагонали. Собственные значения при этом остаются на главной диагонали[36][37].

Любая   матрица   подобна матрице   в жордановой нормальной форме, которая получается посредством преобразований подобия  , где   является обобщённой модальной матрицей матрицы  [38] (См. Примечание выше).

Пример 4

править

Найдём матрицу в жордановой нормальной форме, которая подобна:

 

Решение: Характеристическое уравнение матрицы   , следовательно,   является собственным значением с алгебраической кратностью три. Следуя процедуре из предыдущего раздела, находим что:

 

и

 

Тогда   и  , откуда следует, что канонический базис матрицы   будет содержать один линейно независимый обобщённый собственный вектор ранга 2 и два линейно независимых обобщённых собственных вектора ранга 1, или, что эквивалентно: одну цепочку из двух векторов   и одну цепочку векторов  . Обозначив  , получим:

 

и

 

где   является обобщённой модальной матрицей матрицы  , столбцы матрицы   являются каноническим базисом матрицы  , и  [39]. Поскольку обобщённые собственные векторы сами по себе не единственны, и поскольку некоторые из столбцов матриц   и   могут быть обменены, то отсюда следует, что как матрица  , так и   не уникальны[40].

Пример 5

править

В Примере 3 был найден канонический базис линейно независимых обобщённых собственных векторов матрицы  . Обобщённая модальная матрица матрицы   равна:

 

Матрица в жордановой нормальной форме, подобная матрице  , равна:

 

так что  .

Приложения

править

Матричные функции

править

Три главные операции, которые можно проводить с квадратными матрицами — это сложение матриц, умножение на скаляр и матричное умножение[41]. Это в точности те операции, которые нужны для определения полиномиальной функции от   матрицы  [42]. Многие функции могут быть представлены в виде ряда Маклорена, Следовательно, можно определить более общие функции от матриц[43]. Если матрица   диагонализируема, то есть:

 

с

 

тогда:

 

и суммирование ряда Маклорена функции   сильно упрощается [44]. Например, для получения любой степени k матрицы  , нужно лишь вычислить  , умножив затем слева матрицу   на  , а затем справа на  [45].

С помощью обобщённых собственных векторов можно получить жорданову нормальную форму матрицы   и эти результаты можно обобщить для получения прямого метода вычисления функций от недиагонализируемых матриц[46] (См. Разложение Жордана.)

Дифференциальные уравнения

править

Рассмотрим задачу решения системы линейных обыкновенных дифференциальных уравнений:

  (5)

где:

       и       

Если матрица   диагонализируема, так что   для  , система (5) сводится к системе из   уравнений, которые принимают вид:

 
 

 

 

(6)

В этом случае общее решение задаётся выражениями:

 
 
 
 

В общем случае следует диагонализировать матрицу   и свести систему (5) к системе вида (6) как указано ниже. Если матрица   диагонализируема, имеем  , где   является модальной матрицей матрицы  . После подстановки   равенство (5) принимает вид  , или:

  (7)

где:

  (8)

Решением уравнения (7) будет:

 
 
 
 

Решение   системы (5) получается тогда с помощью отношения (8)[47].

С другой стороны, если матрица   не диагонализируема, выберем в качестве матрицы   обобщённую модальную матрицу для матрицы  , так что   является жордановой нормальной формой матрицы  . Система   имеет вид:

 

(9)

где значениями   являются собственные значения с главной диагонали матрицы  , а значениями   будут единицы и нули с наддиагонали матрицы  . Систему (9) часто решить проще, чем (5), например, по следующей схеме:

Решая последнее равенство в (9) относительно   получаем  . Подставляя полученное значение   в предпоследнее равенство в (9), решаем его относительно  . Продолжая этот процесс, пройдём по всем равенствам (9) от последнего до первого, решая тем самым всю систему уравнений. Решение   тогда получается из отношений (8)[48].

Примечания

править
  1. 1 2 3 Bronson, 1970, с. 189.
  2. 1 2 Beauregard, Fraleigh, 1973, с. 310.
  3. 1 2 3 4 5 Nering, 1970, с. 118.
  4. 1 2 Golub, Van Loan, 1996, с. 316.
  5. Beauregard, Fraleigh, 1973, с. 319.
  6. 1 2 Bronson, 1970, с. 194–195.
  7. Golub, Van Loan, 1996, с. 311.
  8. 1 2 3 Bronson, 1970, с. 196.
  9. Beauregard, Fraleigh, 1973, с. 316–318.
  10. Anton, 1987, с. 301–302.
  11. Beauregard, Fraleigh, 1973, с. 266.
  12. 1 2 Burden, Faires, 1993, с. 401.
  13. Golub, Van Loan, 1996, с. 310–311.
  14. Harper, 1976, с. 58.
  15. Herstein, 1964, с. 225.
  16. Kreyszig, 1972, с. 273,684.
  17. Nering, 1970, с. 104.
  18. 1 2 Beauregard, Fraleigh, 1973, с. 270–274.
  19. 1 2 Bronson, 1970, с. 179–183.
  20. Bronson, 1970, с. 181.
  21. Bronson, 1970, с. 179.
  22. Bronson, 1970, с. 190,202.
  23. Bronson, 1970, с. 189,203.
  24. Bronson, 1970, с. 206–207.
  25. 1 2 Bronson, 1970, с. 205.
  26. Bronson, 1970, с. 189,209–215.
  27. Herstein, 1964, с. 259.
  28. Herstein, 1964, с. 261.
  29. Nering, 1970, с. 122,123.
  30. Bronson, 1970, с. 189–209.
  31. Bronson, 1970, с. 196,197.
  32. Bronson, 1970, с. 197,198.
  33. Bronson, 1970, с. 190–191.
  34. Bronson, 1970, с. 197–198.
  35. Beauregard, Fraleigh, 1973, с. 311.
  36. Cullen, 1966, с. 114.
  37. Franklin, 1968, с. 122.
  38. Bronson, 1970, с. 207.
  39. Bronson, 1970, с. 208.
  40. Bronson, 1970, с. 206.
  41. Beauregard, Fraleigh, 1973, с. 57–61.
  42. Bronson, 1970, с. 104.
  43. Bronson, 1970, с. 105.
  44. Bronson, 1970, с. 184.
  45. Bronson, 1970, с. 185.
  46. Bronson, 1970, с. 209–218.
  47. Beauregard, Fraleigh, 1973, с. 274–275.
  48. Beauregard, Fraleigh, 1973, с. 317.

Литература

править
  • Anton Howard. Elementary Linear Algebra. — 5th. — New York: Wiley, 1987. — ISBN 0-471-84819-0.
  • Sheldon Axler. Linear Algebra Done Right. — 2nd. — Springer, 1997. — ISBN 978-0-387-98258-8.
  • Raymond A. Beauregard, John B. Fraleigh. A First Course In Linear Algebra: with Optional Introduction to Groups, Rings, and Fields. — Boston: Houghton Mifflin Co., 1973. — ISBN 0-395-14017-X.
  • Richard Bronson. Matrix Methods: An Introduction. — New York: Academic Press, 1970.
  • Richard L. Burden, J. Douglas Faires. Numerical Analysis. — 5th. — Boston: Prindle, Weber and Schmidt, 1993. — ISBN 0-534-93219-3.
  • Charles G. Cullen. Matrices and Linear Transformations. — Reading: Addison-Wesley, 1966.
  • Joel N. Franklin. Matrix Theory. — Englewood Cliffs: Prentice-Hall, 1968.
  • Gene H. Golub, Charles F. Van Loan. Matrix Computations. — 3rd. — Baltimore: Johns Hopkins University Press, 1996. — ISBN 0-8018-5414-8.
    • Перевод Дж. Голуб, Ч. Ван Лоун. Матричные вычисления. — М.: «Мир», 1999. — ISBN 5-03-002406-9.
  • Charlie Harper. Introduction to Mathematical Physics. — New Jersey: Prentice-Hall, 1976. — ISBN 0-13-487538-9.
  • Herstein I. N. Topics In Algebra. — Waltham: Blaisdell Publishing Company, 1964. — ISBN 978-1114541016.
  • Erwin Kreyszig. Advanced Engineering Mathematics. — 3rd. — New York: Wiley, 1972. — ISBN 0-471-50728-8.
  • Evar D. Nering. Linear Algebra and Matrix Theory. — 2nd. — New York: Wiley, 1970.