1. 행렬 연산 심화

1.1 행렬 곱셈

행렬 곱셈(matrix multiplication)은 두 행렬의 원소들을 특정 규칙에 따라 곱하고 더하는 연산입니다. 두 행렬 A와 B가 있을 때, 이 둘을 곱한 결과인 C는 A의 행과 B의 열을 내적한(누적하여 더한) 값으로 구성됩니다. 이 때, A의 열 수와 B의 행 수가 같아야 합니다. 즉, A의 크기가 m × n이고 B의 크기가 n × p일 때, 두 행렬을 곱한 결과인 C의 크기는 m × p가 됩니다.

단위 행렬은 주대각선이 1이고 나머지는 0인 정사각형 행렬을 말합니다. 단위 행렬은 행렬 곱셈에서 곱해도 변화가 없는 중요한 역할을 합니다. 행렬 A와 단위 행렬 I를 곱하면 A가 그대로 나오고, 단위 행렬과 다른 행렬을 곱하면 다른 행렬이 그대로 나옵니다. 아래 이미지는 2 × 2 단위 행렬의 예시입니다.

행렬 곱셈의 중요한 특징 중 하나는 교환법칙이 일반적으로 성립하지 않는다는 점입니다. 즉, (AB ≠ BA)일 수 있습니다. 행렬 곱셈은 각 행과 열이 만나는 지점에서 특정 규칙을 적용하여 두 행렬의 정보를 결합해 새로운 정보를 생성하는 과정입니다. 예를 들어, 두 데이터 세트의 연관성을 분석하거나, 변환 매트릭스를 사용해 데이터나 이미지를 변환하는 데 사용됩니다.

import numpy as np A = np.array([[1, 2], [3, 4]]) B = np.array([[5, 6], [7, 8]]) C = np.dot(A, B) D = np.dot(B, A) print("행렬 A:") print(A) print("\n행렬 B:") print(B) print("\n행렬 곱셈 결과 (A * B):") print(C) print("\n행렬 곱셈 결과 (B * A):") print(D)

1.2 역행렬

역행렬(inverse matrix)은 주어진 행렬과 곱했을 때 단위 행렬이 되는 행렬을 말합니다. 즉, 행렬 A와 역행렬 A^(-1)을 곱하면 단위 행렬 I가 됩니다. 역행렬을 구하는 것은 np.linalg.inv로 가능합니다. 다만 실행 결과가 정확히 정수로 나오지 않을 수 있습니다. 이는 부동소수점 연산의 한계로 인해 발생하는 문제입니다.

import numpy as np A = np.array([[1, 2], [3, 4]]) print("A의 역행렬:") print(np.linalg.inv(A)) # 역행렬의 검증 print("\nA와 A의 역행렬의 곱:") print(np.dot(A, np.linalg.inv(A)))

1.3 의사역행렬

의사역행렬(pseudoinverse)은 앞서 배운 역행렬의 개념을 더욱 확장한 것입니다. 역행렬이 존재하지 않는 상황에서도 적용할 수 있는 강력한 도구로, 데이터 분석과 수치 계산에서 중요한 역할을 합니다.

의사역행렬의 필요성은 역행렬의 한계에서 비롯됩니다. 모든 행렬에 역행렬이 존재하는 것은 아닙니다. 정방행렬이 아니거나 행렬식(determinant)이 0인 경우에는 역행렬을 구할 수 없습니다. 이러한 상황에서 의사역행렬이 해결책을 제시합니다.

의사역행렬은 일반적으로 A+로 표기되며, 모든 행렬에 대해 정의될 수 있습니다. 정방행렬이 아니어도, 심지어 역행렬이 존재하지 않는 경우에도 의사역행렬을 계산할 수 있습니다. 이는 의사역행렬이 "최선의 근사 역변환"을 제공한다는 의미입니다.

의사역행렬을 직관적으로 이해하기 위해서는 다음과 같이 생각할 수 있습니다.

첫째, 정확한 역행렬이 존재하는 경우, 의사역행렬은 그 역행렬과 동일합니다. 즉, 역행렬이 존재하는 상황에서는 의사역행렬이 역행렬의 역할을 그대로 수행합니다.

둘째, 정확한 역행렬이 존재하지 않는 경우, 의사역행렬은 원래 변환을 가능한 한 가장 가깝게 되돌리는 역할을 합니다. 이는 마치 완벽한 해결책은 아니지만, 주어진 조건에서 최선의 근사해를 제공하는 것과 같습니다.

의사역행렬의 주요 용도 중 하나는 최소제곱법 문제를 해결하는 것입니다. 최소제곱법은 데이터 피팅, 과대결정 시스템 해결, 선형 회귀 등 다양한 분야에서 활용됩니다. 예를 들어, 실험 데이터에 가장 잘 맞는 함수를 찾거나, 방정식의 수가 미지수보다 많은 경우의 해를 구하거나, 데이터 포인트들을 가장 잘 설명하는 직선이나 평면을 찾는 데 의사역행렬이 사용됩니다.

import numpy as np A = np.array([[1, 2, 3], [4, 5, 6]]) A_pinv = np.linalg.pinv(A) print("행렬 A:") print(A) print("\nA의 의사역행렬:") print(A_pinv) print("\nA * A+ * A ≈ A:") print(np.round(A @ A_pinv @ A, decimals=10)) print("\nA+ * A * A+ ≈ A+:") print(np.round(A_pinv @ A @ A_pinv, decimals=10))

이 코드는 의사역행렬이 원래 행렬과 어떻게 상호작용하는지를 보여주는 예제입니다. A * A+ * A ≈ A와 A+ * A * A+ ≈ A+라는 관계가 성립함을 볼 수 있습니다. 여기서 A는 원래 행렬이고, A+는 의사역행렬입니다. 이 관계는 의사역행렬이 원래 행렬과 상호작용하여 최선의 근사해를 제공한다는 것을 보여줍니다.

2. 벡터 연산 심화

2.1 고유값 (Eigenvalues)

고유값(eigenvalue)은 선형대수학에서 매우 중요한 개념으로, 행렬 변환의 핵심적인 특성을 나타내는 스칼라 값입니다. 이 값은 행렬을 특정 스칼라 값으로 곱했을 때 방향이 변하지 않는 벡터, 즉 고유벡터에 대응합니다. 고유값과 고유벡터는 항상 쌍을 이루어 존재합니다. 예를 들어, λ가 고유값이고 v가 그에 대응하는 고유벡터라면, Av = λv라는 관계가 성립합니다. 여기서 A는 주어진 정방행렬입니다. 또한, 오직 정방행렬에 대해서만 계산할 수 있습니다. 그리고 n × n 정방행렬의 경우, 최대 n개의 고유값이 존재할 수 있습니다. 이는 행렬의 차원과 같은 수입니다.

A = np.array([[1, 2], [2, 3]]) eigenvalues = np.linalg.eigvals(A) print("행렬 A:") print(A) print("고유값:", eigenvalues)

2.2 고유벡터 (Eigenvectors)

고유벡터(eigenvector)는 행렬 변환에서 특별한 성질을 갖는 벡터입니다. 고유벡터는 행렬에 의해 변환될 때 그 방향이 변하지 않고 오직 크기만 변하는 0이 아닌 벡터를 말합니다. 각 고유값에는 대응하는 고유벡터가 존재합니다. 만약 λ가 행렬 A의 고유값이라면, Av = λv를 만족하는 0이 아닌 벡터 v가 바로 이 고유값에 대응하는 고유벡터입니다. 여기서 중요한 점은 서로 다른 고유값에 대응하는 고유벡터들은 선형독립이라는 것입니다. 이는 이 벡터들이 서로 독립적인 방향을 나타낸다는 의미입니다.

A = np.array([[1, 2], [2, 3]]) eigenvalues, eigenvectors = np.linalg.eig(A) print("행렬 A:") print(A) print("고유벡터:", eigenvectors)

3. 선형 방정식

선형 방정식(linear equation)은 수학과 과학 분야에서 매우 중요한 개념입니다. Ax = b 형태로 표현되는 이 방정식에서 우리의 목표는 x를 찾는 것입니다. 여기서 A는 계수들로 이루어진 행렬, b는 상수들로 이루어진 벡터, 그리고 x는 우리가 구하고자 하는 미지수 벡터입니다. 이 방정식의 해는 세 가지 경우 중 하나에 해당합니다. 해가 전혀 존재하지 않을 수도 있고, 단 하나의 유일한 해가 있을 수도 있으며, 때로는 무한히 많은 해가 존재할 수도 있습니다. 이는 A 행렬의 특성과 b 벡터의 관계에 따라 결정됩니다.

# 선형 방정식 Ax = b 설정 A = np.array([[3, 1], [1, 2]]) b = np.array([9, 8]) # 방정식 풀기 x = np.linalg.solve(A, b) print("행렬 A:") print(A) print("벡터 b:", b) print("해 x:", x) # 해의 검증 print("검증 (Ax == b):", np.allclose(np.dot(A, x), b))

이번 장에서는 NumPy를 통해 선형대수학의 핵심 개념들을 살펴보았습니다. 행렬 연산, 역행렬, 의사역행렬, 고유값과 고유벡터, 선형 방정식 해결 등을 다루었습니다. 이 개념들은 데이터 변환, 시스템 분석, 최적화 등 실제 문제 해결에 광범위하게 적용됩니다. NumPy는 이러한 복잡한 연산을 효율적으로 수행할 수 있게 해주는 강력한 도구입니다. 이를 통해 데이터 과학, 기계 학습, 신호 처리 등의 분야에서 선형대수학의 힘을 충분히 활용할 수 있습니다.