3. Матрицы
1. Матрица как таблица. Матрица – это совокупность чисел или объектов другой природы, расположенных в виде прямоугольной таблицы:
Такая таблица, состоящая из m строк и n столбцов, содержит mn клеток (позиций). При этом говорят, что матрица имеет размер m × n и ее называют ( m × n )-матрицей. Позиция на пересечении i -й строки и j -го столбца называется ij -клеткой.
Числа или любые другие объекты, расположенные в клетках таблицы, называют элементами матрицы. Положение элементов строго фиксировано: в каждой клетке должен располагаться только один элемент и ни одна клетка не должна оставаться свободной.
- 29 -
В общем обозначении элемента aij первый индекс i всегда указывает номер строки, а второй – номер столбца. Элемент, расположенный в ij -клетке, называют ij -элементом.
Матрица обозначается одной буквой (часто буквы, обозначающие матриц, набирают жирным шрифтом или снабжают какими-либо дополнительными символами). Однако независимо от принятого способа обозначения матрица всегда является совокупностью таблично упорядоченных элементов. Две матрицы равны, если и только если равны их соответствующие элементы, т.е. А = В при условии aij = bij (i = 1, 2, ... , n). Ясно, что сравнивать можно только матрицы одного и того же размера, между элементами которых определено отношение равенства.
Матрицы, элементами которых являются вещественные или комплексные числа, называют соответственно вещественными или комплексными. Пусть А — комплексная (m × n)-матрица с элементами aij = αij + iβij. Матрица A̅ того же размера с элементами a*ij = αij + iβij называется комплексно-сопряженной с А.
Часто для упрощения нулевые элементы в таблицу не записывают, но при этом имеют в виду, что пустые клетки тоже содержат числа (нули).
Кроме приведенной выше клеточной записи, используют и другие способы представления матриц, например:
Матрицы впервые появились в середине прошлого столетия в работах английских математиков А. Кэли и У. Гамильтона. Представление совокупностей элементов в виде матриц и разработанные правила операций над ними оказались весьма плодотворными в математике и нашли широкое применение в физике, технике, экономике. Существенный вклад в разработку общей теории матриц и ее приложений внесли советские математики И. А. Лаппо-Данилевский, А. Н. Крылов, Ф. Р. Гантмахер, М. Г. Крейн.
2. Типы матриц. Матрица может иметь любое количество строк и столбцов (конечное или бесконечное). В дальнейшем при отсутствии оговорок будут рассматриваться конечные матрицы с числовыми элементами.
Если матрица состоит из одного столбца или одной строки, то она соответственно называется столбцовой или строчной (употребляются также названия матрица-столбец и матрица-строка). В таких случаях достаточно отмечать элементы одним индексом:
- 30 -
Столбцевую и строчную матрицы называют также векторами и сокращенно обозначают как x = (x1, x2, ..., xn) y = (y1, y1, ..., y1). Обычно из контекста ясно, идет ли речь о векторе-столбце или о векторе-строке. В противном случае используют приведенные выше обозначения.
Матрица, количество строк и столбцов которой одинаково и равно n, называется квадратной матрицей порядка n. Совокупность ii-клеток (i = 1, 2, ..., n) образуют главную диагональ квадратной матрицы. Матрица, все элемента которой вне главной диагонали равны нулю, т.е.
называется диагональной и более кратко записывается D = diag(d1, d2, ..., dn). Если в диагональной матрице d1 = d2 = ...= dn = 1, то имеем единичную матрицу n-го порядка
- 31 -
которая часто обозначается также через 1n или просто цифрой 1 (не следует принимать это обозначение за число, равное единице).
Матрица, все элементы которой равны нулю, называется нулевой и обозначается цифрой 0. Заметим, что нулевая матрица может иметь любой размер m × n, в то время как единичная матрица всегда квадратная. Матрица, состоящая только из одного элемента, обычно отождествляется с этим элементом.
Квадратная матрица зазывается верхней (нижней) треугольной, если равны нулю все элементы, расположенные под (над) главной диагональю:
Диагональная матрица является частным случаем как верхней (А), так и нижней (В) треугольных матриц.
3. Сложение матриц. Сумма двух матриц А и В одинаковых размеров определяется как матрица С тех же размеров, каждый элемент которой равен сумме соответствующих элементов матриц, т.е. C = A +B, если cij = aij + bij. Пример:
Из приведенного определения следует, что операция сложения матриц коммутативна, т.е. А+В = В+А, и ассоциативна, т.е. (А+В)+С = А+(В+С). Она естественным образом распространяется на любое число слагаемых. Очевидно также, что матрица А не изменяется при суммировании ее с нулевой матрицей тех же размеров, т.е. А + 0 = А.
4. Умножение матрицы на число. По определению произведением матрицы А на число α (в отличие от матриц и векторов, числа часто называют скалярами) является матрица С = αА, элементы которой получаются умножением соответствующих элементов матрицы А на это число α, т.е. cij = αaij. Пример:
- 32 -
Очевидно, справедливы следующие соотношения: α(A + B) = αA +αB; (α + β)A = αA + βA; (αβ)A = α(βA), где A и B — матрицы одинакового размера; α и β — числа (скаляры). Общий множитель элементов можно выносить за знак матрицы, считая его скалярным множителем.
Разность двух матриц одинаковых размеров сводится к уже рассмотренным операциям соотношением A — B = A + (-I)B, т.е. C = A — B, если cij = aij — bij.
5. Умножение матриц. По многим соображениям целесообразно определить эту операцию следующим образом: Произведением матрицы A размера (m × n) на матрицу B размера (n × r) является матрица C = AB размера (m × r), элемент cij которой, расположенный в ij-клетке, равен сумме произведений элементов i-й строки матрица A на соответствующие элементы j-го столбца матрицы B, т.е.
Умножение А на В допустимо (произведение АВ существует) если число столбцов А равно числу строк В ( в таких случаях говорят, что эти две матрицы согласуются по форме). Пример:
- 33 -
Для матриц A (m × n) и B(n × m) существует как произведение АВ размера m × m, так и произведение BA размера n × n. Ясно, что при m × n эти произведения не могут быть равными уже вследствие различных размеров результирующих матриц. Но даже при m = n, т.е. в случае квадратных матриц одинакового порядка, произведения АВ и ВА не обязательно равны между собой. Например, для матриц
имеем:
Отсюда следует, что вообще операция умножения матриц не подчиняется коммутативному закону (AB ≠ BA). Если же выполняется соотношение AB = BA, то матрицы А и В называю коммутирующими или перестановочными. Ассоциативный и дистрибутивный законы для матричного умножения выполняются во всех случаях, когда размеры матриц допускают соответствующие операции: (AB)C = A(BC) = ABC (ассоциативностью), A(B + C) = AB + AC и (A +B)C = AC +BC (дистрибутивность умножения слева и справа относительно сложения).
Умножение (m × n) — матрицы А на единичную матрицу m-го порядка слева и на единичную матрицу n-го порядка справа не изменяет этой матрицы, т.е. EmA = AEn = A. Если хотя бы одна из матриц произведения АВ является нулевой, то в результате получим нулевую матрицу.
Отметим, что из АВ = 0 не обязательно следует, что А = 0 или В = 0. В этом можно убедиться на следующем примере:
6. Транспонирование матрицы. Преобразование матрицы А, состоящее в замене строк столбцами ( или столбцов строками) при
- 34 -
сохранении их нумерации, называется транспонированием. Полученная в результате такого преобразования матрица называется транспонированной к матрице А и обозначается At или A':
Произвольная (m × n) — матрица при транспонировании становится ( n × m ) - матрицей, а элемент aij занимает ji — клетку, т.е. aij = atji.
Если матрица (квадратная) совпадает со своей транспонированной, т.е. A = At, то она называется симметричной и ее элементы связаны соотношением aij = aji (симметрия относительно главной диагонали). Матрица, для которой A = -At, называется кососимметричной, и ее элементы связаны соотношением aij = -aji . Она, как и симметричная матрица, всегда квадратная, но диагональные элементы равны нулю, т.е. aii = 0 (i = 1, 2, ..., n). Ниже приведены примеры симметричной и кососимметричной матриц:
Ясно, что не все элементы таких матриц могут быть выбраны произвольно. Можно убедиться, что из n2 элементов для симметричной матрицы независимыми могут быть только 1/2 n (n + 1), а для кососимметричной -1/2 n (n + 1) элементов.
- 35 -
Комплексно-сопряженная и транспонированная матрица (A)t называется сопряженной с А и обозначается A*. Матрица, равная своей сопряженной, т.е. A = (A̅)t = A*, называется эрмитовой. Если A = -(A̅)t, то А — косоэрмитова матрица.
Легко показать, что транспонирование произведения АВ равно произведению транспонированных матриц, взятых в обратном порядке: (AB)t = BtAt. Дважды транспонированная матрица равна исходной, т.е. (At)t = A.
7. Матричная запись системы линейных уравнений. Первоначально матрицы были введены для упрощения записи систем линейных уравнений, что и обусловило и определение основных матричных операций. Система линейных уравнений:
записывается одним матричным равенством
Действительно, перемножив в правой части равенства ( m × n ) - матрицу на столбцевую матрицу, получим
- 36 -
Из равенства матриц-столбцов следуют равенства для соответствующих элементов, которые совпадают с исходной системой уравнений. Если обозначить
то матричное равенство запишется еще короче
y = Ax.
Такое представление системы линейных уравнений оказалось возможным благодаря правилу умножения матиц, которое наилучшим образом подходит для этой цели. Однако исторически дело обстояло как раз наоборот: правила действий над матрицами определялись, прежде всего, исходя из удобства представлений систем линейных уравнений.
8. Линейные преобразования. Систему уравнений, записанную в начале предыдущего пункта, можно рассматривать как линейное преобразование совокупности величин x1, x2, ..., xn в совокупность y1, y2, ..., ym. Это преобразование полностью определяется коэффициентами aij (i = 1, 2, ..., m; j = 1, 2, ..., n). На языке матриц линейное преобразование y = Ax означает преобразование столбца х в столбец у, которое определяется матрицей преобразования А.
Пусть величины x1, x2, ..., xn получаются из некоторой совокупности величин z1, z2, ..., zn посредством линейного преобразования x = Bz, где x и z — столбцы соответствующих величин; В — матрица их преобразования. Тогда формальной подстановкой х в первое матричное уравнение получаем
y = Ax = A(Bz) = (AB)z = Cz,
где C = AB — матрица преобразования величин z и y. К этому же результату можно прийти путем подстановки значений x1, x2, ..., xn из второй системы уравнений в первую с учетом введенного ранее правила умножения прямоугольных матиц.
9. Обратная матрица. В обычной алгебре два числа, произведение которых равно единице, называют взаимно обратными. Число, обратное числу a обозначают через a-1 и по определению aa-1 = 1
- 37 -
Аналогично в матричной алгебре две квадратные матрицы, произведение которых равно единичной матрице, т.е. AA-1 = A-1A = 1, называют взаимно обратными ( A-1 обратна A). Однако дальше этого аналогия не проходит.
Выражение a-1b, где a и b — числа, можно представить как частное от деления b на a, но для матриц такое представление не имеет смысла и в общем случае A-1B ≠ BA-1. Поэтому вместо операции деления В на А различают левое частное A-1B и правое частное BA-1, которые сводятся к умножению слева или справа на обратную матрицу A-1.
Способ обращения матрицы проще всего установить, рассматривая решение системы n линейных уравнений с n неизвестными:
В матричной форме эта система уравнений запишется как Ax = q, где А — квадратная матрица n-го порядка, называемая матрицей системы: x и q — столбцевые матрицы неизвестных переменных и свободных членов:
Матричное уравнение Ax = q решается умножением обеих его частей слева на обратную матрицу A-1 т.е. A-1Ax = A-1q в результате получаем x = A-1q.
В соответствии с правилом Крамера неизвестные xk(k = 1, 2, ..., n) определяются соотношением:
где Δ — определитель системы уравнений Δsk — алгебраические дополнения.
- 38 -
Определитель Δ представляет собой числовую функцию, которая вычисляется по определенным правилам на основании квадратной таблицы, состоящей из коэффициентов системы уравнений
Табличное представление определителя Δ по форме совпадает с матрицей системы уравнений, т.е. состоит из тех же элементов и в том же порядке, что и матрица А. В таких случаях его называют определителем матрицы А и записывают Δ = detA.
Алгебраическое дополнение Δsk вычисляется как определитель матрицы, полученной удалением из матицы A s-й строки и k-го столбца, причем этот определитель умножается еще на (-1)s+k. Величину Δsk называют также алгебраическим дополнением элемента ask матрицы A. Часто определитель матрицы А обозначается через |A|, а алгебраическое дополнение — через Ask.
Записав для всех элементов столбцевой матрицы x выражения по правилам Крамера, получим решение системы уравнений в виде:
- 39 -
откуда, сравнивая с A-1q, имеем
Из полученного выражения следует правило определения обратной матрицы: 1) элементы aij данной матрицы A n-го порядка заменяются их алгебраическими дополнениями Δij: 2) матрица алгебраических дополнений транспонируется, в результате чего получаем присоединенную или взаимную матрицу к А ( она обозначается через AdjA); 3) вычисляется определитель Δ матрицы А и присоединенная матрица AdjA умножается на величину, обратную этому определителю.
Обратная матрица существует для матрицы А при условии, что detA ≠ 0. Такие матрицы называются неособенными, в отличие от особенных (вырожденных), определитель которых равен нулю. Ниже вычисление обратной матрицы иллюстрируется примером:
- 40 -
Матрица, обратная произведению двух матриц, равна переставленному произведению матриц, обратных исходным, т.е. (AB)-1 = B-1A-1. Действительно, умножив обе части этого равенства на АВ, приходим тождеству E = B-1A-1(AB), так как B-1(A-1A)B = B-1EB = B-1B =E, где E — единичная матрица n-го порядка.
10. Блочные матрицы. Часто матрицу удобно разбить вертикальными и горизонтальными линиями на блоки которые являются матрицами меньших размеров и при выполнении операций рассматриваются как элементы исходных матриц. Операции над блочными матрицами выполняются по сформулированным выше правилам при условии, что эти операции допускаются размерами соответствующих матриц.
Пусть, например, матрицы А и В разбиты на блоки (жирными линиями) так, чтобы для соответствующих блоков имела смысл операция умножения, т.е.
По правилу умножения прямоугольных матриц можно записать:
Вычислим блоки C11 и C21 матрицы C:
- 41 -
В результате имеем
Конечно, тот же результат получается и при непосредственном перемножении матриц. Но разбиение на блоки позволяет оперировать с матрицами меньших размеров ( это бывает необходимо, например, когда не хватает места на бумаге или ячеек оперативной памяти машины) и особенно удобно, если можно выделить нулевые блоки.