Tag Archives: 수학

이상엽/ 자료의 처리

우선순위 평가

인접행렬

개념

요소간의 연결 관계를 나타내는 정사각 행렬

  • 참조한 (화살표가 나가는) 쪽은 행에, 참조된 (화살표를 받는) 쪽은 열에 쓴다.
    • 1은 2와 3으로 화살표를 쏘고 있으므로, 1행은 2열과 3열에 값이 있음.

권위벡터와 허브벡터

n \times n 인접행렬 A = (a_{ij}) 에 대하여

\left( \begin{array}{rrrr} \sum_{i = 1}^{n} a_{i1} \\ \sum_{i = 1}^{n} a_{i2} \\ ... \\ \sum_{i = 1}^{n} a_{in} \end{array} \right) \left( \begin{array}{rrrr} \sum_{j = 1}^{n} a_{1j} \\ \sum_{j = 1}^{n} a_{2j} \\ ... \\ \sum_{j = 1}^{n} a_{nj} \end{array} \right) 을 각각 A 의 권위벡터와 허브벡터라 하며, 각 벡터의 성분을 권위 가중치와 허브가중치라 한다.

  • 가중치로부터 중요도를 판단한다는게 아이디어
    • 권위 벡터(u_{0} )는 연관받은 (열) 데이터에 대한 벡터가 된다. 그 각각의 값은 권위 가중치가 된다.
    • 허브 벡터(v_{0} )는 연관한 (행) 데이터에 대한 벡터가 된다. 그 각각의 값은 허브 가중치가 된다.
  • 권위 벡터와 허브 벡터는 상호작용을 기반으로 계속 값이 업데이트 된다.
    • 업데이트 되는 와중에 어떤 기준선에 도달하여 값이 안정되면 최종적으로 그 벡터를 중요도 평가에 사용한다.

순위평가 원리

인접행렬 A 와 초기권위벡터 u_{0} 와 초기허브벡터 v_{0} 에 대하여

u_{k} = \begin{cases} u_{0} & k =0 \\ {A_{v_{k}}^{T} \over \|A_{v_{k}}^{T}\|} & k > 0 \end{cases},  v_{k} = \begin{cases} v_{0} & k =0 \\ {A_{v_{k-1}} \over \|A_{v_{k-1}}\|} & k > 0 \end{cases}

  • 현재 권위 벡터는 이전 허브 벡터의 값을 원본 행렬(의 전치 행렬)에 곱하여 구하고, 마찬가지로 현재 허브 벡터는 이전 권위 벡터의 값을 원본 행렬에 곱하여 구한다.
    • 이 곱을 반복하여 값을 업데이트 한다.
  • 다만 이것을 점화식을 이용해서 구성하면 자기 자신만 보면 되는 (권위 벡터는 권위 벡터만으로, 허브 벡터는 허브 벡터만으로) 해석적인 결과가 구성되고, 이를 컴퓨터에 넣어서 계속 돌리면 값이 나온다.

와 같이 새로운 정규화된 권위벡터 u_{k} 와 허브벡터 v_{k} 를 정의한다. (k 는 정수)

이때 u_{k}, v_{k} 를 연립하면 다음과 같이 정규화된 u_{k} v_{k} 의 점화식을 얻을 수 있다.

u_{k} = {A_{v_{k}}^{T} \over \|A_{v_{k}}^{T}\|} = {A^{T}({A_{u_{k-1}} \over \|A_{u_{k-1}}\|}) \over \|A^{T}({A_{u_{k-1}} \over \|A_{u_{k-1}}\|})\|} = {(A^{T}A)_{u_{k-1}} \over \|(A^{T}A)_{u_{k-1}}\|}

마찬가지로 v_{k} = {(AA^{T})_{v_{k-1}} \over \|(AA^{T})_{v_{k-1}}\|}

이 벡터들이 안정화가 되었다고 판단되는 상태로부터 각각 최종 중요도를 판별한다.

사례

10개의 인터넷 페이지(ㄱ~ㅊ)들 간의 인접행렬 $latex A &s=2가 다음과 같다고 하자.

앞에서 소개된 절차에 따라 $latex A &s=2의 정규화된 권위벡터가 안정화 될 때까지 반복계산한 결과는 다음과 같다.

  • 위 수식은 소숫점 4자리까지만 연산하는데, u_{9}, u_{10} 에 도달하면 값의 차이가 없기 때문에 더는 연산을 하지 않고 멈춘다.
    • 만일 소숫점 자리를 5자리 이상으로 보면 더 돌 수 있다.

따라서 $latex A &s=2 권위가중치로부터 페이지 ㄱ, ㅂ, ㅅ, ㅈ는 관련이 적고, 그 외의 페이지는 중요도가 높은 것부터 ㅁ > ㅇ > ㄴ > ㅊ > ㄷ = ㄹ 순서대로 검색엔진에서 노출되어야 함을 알 수 있다.

  • 요게 바로 구글 페이지 랭크 연산 방식
  • 주요 키워드) 거듭제곱법(power method), 우세 고유벡터/값(dominant eigen vector/value)

자료압축

특잇값 분해

분해

한 행렬을 여러 행렬들의 곱으로 표현하는 것

ex) QR  분해, LU 분해, LDU 분해, 고윳값 분해, 헤센버그 분해, 슈르 분해, 특잇값 분해 등

특잇값

m \times n 행렬 A 에 대하여 \lambda_{1}, \lambda_{2}, ... , \lambda_{n} A^{T}A 의 고윳값일 때

\sigma_{1} = \sqrt{\lambda_{1}}, \sigma_{2} = \sqrt{\lambda_{2}}, ... \sigma_{n} = \sqrt{\lambda_{n}}

A 의 특잇값이라 한다.

  • 고윳값을 만들려면 정사각 행렬이어야 한다. 반면 특잇값은 임의의 행렬에서도 만들어낼 수 있음.
    • 일반적인 행렬을 정사각 행렬로 만들기 위해  m \times n 행렬 A 에 대하여 A^{T}A 를 한 후 거기서 특이값을 추출한다.

ex) 행렬 A = \left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) 에 대하여

A^{T}A = \left( \begin{array}{rrr} 1 & 0 & 1 \\ 1 & 1 & 0 \end{array} \right) \left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) = \left( \begin{array}{rr} 2 & 1 \\ 1 & 2 \end{array} \right) 이므로

A^{T}A 의 고유방정식은 \lambda^{2} - 4 \lambda + 3 = (\lambda - 1)(\lambda - 3) = 0 이다

따라서 A 의 두 특잇값은 각각 \sqrt{3}, 1 이다.

특잇값 분해

영행렬이 아닌 임의의 m \times n 행렬 A 는 다음과 같이 나타낼 수 있다.

A = U \Sigma V^{T}

이때 U, V 는 직교행렬이며, A 는 주대각성분이 \Sigma 의 특잇값이고 나머지 성분들은 0 m \times n 행렬이다.

  • 여기서 \Sigma 는 합을 의미하는 것이 아니라 \sigma 의 대문자 형태이다. (벡터를 의미하는 \sigma 의 행렬 형태)

ex) 행렬 A = \left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) 는 다음과 같이 특잇값 분해된다.

\left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) = \left( \begin{array}{rrr} {\sqrt{6} \over 3} & 0 & - {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & -{\sqrt{2} \over 2} & {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & {\sqrt{2} \over 2} & {1 \over \sqrt{3}} \end{array} \right) \left( \begin{array}{rrr} \sqrt{3} & 0 \\ 0 & 1 \\ 0 & 0 \end{array} \right) \left( \begin{array}{rr} {\sqrt{2} \over 2} & {\sqrt{2} \over 2} \\ {\sqrt{2} \over 2} & -{\sqrt{2} \over 2} \end{array} \right)

축소된 특잇값 분해

특잇값 분해에서 0 인 성분들로만 이루어진, 대수적으로 무의미한 행 또는 열을 제거한 형태를 축소된 특잇값 분해라고 한다.

즉, A = U_{1} \Sigma_{1} V_{1}^{T} = (u_{1}, u_{2}, ... , u_{k}) \left( \begin{array}{rrrr} \sigma_{1} & 0 & ... & 0 \\ 0 & \sigma_{2} & ... & 0 \\ ... & ... & ... & ... \\ 0 & 0 & ... & \sigma_{k} \end{array} \right) \left( \begin{array}{rrrr} v_{1}^{T} \\ v_{2}^{T} \\ ... \\ v_{k}^{T} \end{array} \right)

또한 축소된 특잇값 분해를 이용하여 행렬 A 를 다음과 같이 전개한 것을 A 의 축소된 특잇값 전개라 한다.

A = \sigma_{1}u_{1}v_{1}^{T} + \sigma_{2}u_{2}v_{2}^{T} + ... + \sigma_{k}u_{k}v_{k}^{T} 

ex)

\left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) = \left( \begin{array}{rrr} {\sqrt{6} \over 3} & 0 & - {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & -{\sqrt{2} \over 2} & {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & {\sqrt{2} \over 2} & {1 \over \sqrt{3}} \end{array} \right) \left( \begin{array}{rrr} \sqrt{3} & 0 \\ 0 & 1 \\ 0 & 0 \end{array} \right) \left( \begin{array}{rr} {\sqrt{2} \over 2} & {\sqrt{2} \over 2} \\ {\sqrt{2} \over 2} & -{\sqrt{2} \over 2} \end{array} \right)

= \left( \begin{array}{rrr} {\sqrt{6} \over 3} & 0 \\ {\sqrt{6} \over 6} & -{\sqrt{2} \over 2} \\ {\sqrt{6} \over 6} & {\sqrt{2} \over 2} \end{array} \right) \left( \begin{array}{rr} \sqrt{3} & 0 \\ 0 & 1 \end{array} \right) \left( \begin{array}{rr} {\sqrt{2} \over 2} & {\sqrt{2} \over 2} \\ {\sqrt{2} \over 2} & -{\sqrt{2} \over 2} \end{array} \right)

= \sqrt{3}u_{1}v_{1}^{T} + u_{2}v_{2}^{T}

자료압축 원리

압축되지 않은 m \times n 행렬 A 를 위한 필요 저장 공간은 mn 이다.

A 를 축소된 특잇값 분해한 결과가 A = \sigma_{1}u_{1}v_{1}^{T} + \sigma_{2}u_{2}v_{2}^{T} + ... + \sigma_{k}u_{k}v_{k}^{T}  라면

이제 필요한 저장 공간은 k + km + kn = k(1 + m + n) (\sigma_{1} \geq \sigma_{2} \geq ... \geq \sigma_{k}) 이다.

  • k 는 특잇값 개수 = \Sigma 의 행개수 or 열개수
  • m U 의 행 개수 = u_{i} 의 성분개수
  • n V^{T} 의 열 개수 = v_{i}^{T} 의 성분개수

충분히 작다고 판단되는 \sigma_{r+1}, ... \sigma_{k} 에 대응하는 항들을 추가로 제거하면, 이때 필요한 저장 공간은 r(1 + m + n) 뿐이다.

이상엽/ 최적화 문제

곡선 적합

보간법

개념

주어진 특징 점들을 포함하는 함수를 구하는 방법

정리) 좌표평면에 있는 임의의 서로 다른 n 개의 점을 지나는 k 차 다항함수는 유일하게 존재한다. (단 k k < n 인 자연수)

사례

네 점 (1, 3), (2, -2), (3, -5), (4, 0) 을 모두 지나는 3차 함수

f(x) = a_{0} + a_{1} x + a_{2} x^{2} + a_{3} x^{3}

를 구하자. 우선 다음의 방정식을 세운다.

Step 1)

\left( \begin{array}{rrrr} 1 & x_{1} & x_{1}^{2} & x_{1}^{3} \\ 1 & x_{2} & x_{2}^{2} & x_{2}^{3} \\ 1 & x_{3} & x_{3}^{2} & x_{3}^{3} \\ 1 & x_{4} & x_{4}^{2} & x_{4}^{3} \end{array} \right) \left( \begin{array}{rrrr} a_{0} \\ a_{1} \\ a_{2} \\ a_{3} \end{array} \right) = \left( \begin{array}{rrrr} y_{1} \\ y_{2} \\ y_{3} \\ y_{4} \end{array} \right)

Step 2) 네 점을 대입하고 첨가행렬을 만든다.

\left( \begin{array}{rrrrr} 1 & 1 & 1 & 1 & 3 \\ 1 & 2 & 4 & 8 & -2 \\ 1 & 3 & 9 & 27 & -5 \\ 1 & 4 & 16 & 64 & 0 \end{array} \right)

Step 3) 첨가행렬을 가우스-조던 소거법을 이용하여 풀이한다.

\left( \begin{array}{rrrrr} 1 & 1 & 1 & 1 & 3 \\ 1 & 2 & 4 & 8 & -2 \\ 1 & 3 & 9 & 27 & -5 \\ 1 & 4 & 16 & 64 & 0 \end{array} \right) \Rightarrow \left( \begin{array}{rrrrr} 1 & 0 & 0 & 0 & 4 \\ 0 & 1 & 0 & 0 & 3 \\ 0 & 0 & 1 & 0 & -5 \\ 0 & 0 & 0 & 1 & 1 \end{array} \right)

Step 4) 

a_{0} = 4, a_{1} = 3, a_{2} = -5, a_{3} = 1 이므로 f(x) = 4 + 3 x - 5 x^{2} + x^{3} 이다.

  • 곡선 접합은 현재 가진 데이터에 대해 분석은 잘 할 수 있지만, 신규 데이터가 현재 그려 놓은 곡선 위에 존재한다는 보증이 없음. 유연성이 매우 떨어진다.
    • 애초에 데이터를 모두 포함하는 함수가 존재하지 않는 경우도 많음.

최소제곱법

  • 곡선 접합의 단점을 보완할 수 있는 방법.
  • 가우스가 창안한 방법으로 가우스는 이 방법을 통해 소행성 ‘세레스’ 의 궤도를 정확히 예측해 냄.

개념

특징 점들을 포함하는 함수를 특정 지을 수 없을 때, 실제 해와의 오차 제곱 합이 최소가 되는 근사적인 해를 구하는 방법

정리) 방정식 Ax = B 을 변형한 방정식 A^{T}Ax = A^{T}B (정규방정식)의 모든 해는 Ax = B 의 최소제곱해이다.

  • 요게 결국 선형회귀이다.
  • A^{T}Ax = A^{T}B (정규방정식)의 모든 해는 Ax = B 의 최소제곱해이라는 부분은 증명이 복잡하므로 강의 상에서는 생략.

사례

네 점 (0, 1), (1, 3), (2, 4), (3, 4) 에 근사하는 일차 함수 f(x) = a_{0} + a_{1} x 을 구하자. 우선 다음의 방정식을 세운다.

Step 1) Ax = B

\Leftrightarrow \left( \begin{array}{rrrr} 1 & x_{1} \\ 1 & x_{2} \\ 1 & x_{3} \\ 1 & x_{4} \end{array} \right) \left( \begin{array}{rr} a_{0} \\ a_{1} \end{array} \right) = \left( \begin{array}{rrrr} y_{1} \\ y_{2} \\ y_{3} \\ y_{4} \end{array} \right)

Step 2) 네 점을 대입하고 정규방정식 A^{T}Ax = A^{T}B 으로부터 방정식 x = (A^{T}A)^{-1} A^{T}B 을 구성한다.

A^{T}A = \left( \begin{array}{rr} 4 & 6 \\ 6 & 14  \end{array} \right) 이므로

(A^{T}A)^{-1} = \left( \begin{array}{rr} 4 & 6 \\ 6 & 14  \end{array} \right)^{-1} = {1 \over 10} \left( \begin{array}{rr} 7 & -3 \\ -3 & 2  \end{array} \right)  

\therefore x = {1 \over 10} \left( \begin{array}{rr} 7 & -3 \\ -3 & 2  \end{array} \right) \left( \begin{array}{rrrr} 1 & 1 & 1 & 1 \\ 0 & 1 & 2 & 3  \end{array} \right) \left( \begin{array}{rrrr} 1 \\ 3 \\ 4 \\ 4  \end{array} \right)

Step 3) x = \left( \begin{array}{rr} a_{0} \\ a_{1}  \end{array} \right) = \left( \begin{array}{rr} {2 \over 3} \\ 1 \end{array} \right) 이므로 구하고자 하는 함수는 f(x) = {3 \over 2} + x 이다.

n차 일반화

m 개의 자료점 (x_{1}, y_{1}), (x_{2}, y_{2}), ... , (x_{m}, y_{m}) 에 대해 n 차 다항식 y = a_{0} + a_{1} x + ... + a_{n} x^{n} 을 최소제곱법을 이용하여 근사하기 위해서는 Ax = B

A = \left( \begin{array}{rrrr} 1 & x_{1} & ... & x_{1}^{n} \\ 1 & x_{2} & ... & x_{2}^{n} \\ ... & ... & ... & ... \\ 1 & x_{m} & ... & x_{m}^{n} \end{array} \right), x = \left( \begin{array}{rrrr} a_{0} \\ a_{1} \\ ... \\ a_{n} \end{array} \right), B = \left( \begin{array}{rrrr} y_{1} \\ y_{2} \\ ... \\ y_{m} \end{array} \right)

로 설정하면 된다.

두 방법의 비교

  보간법 최소제곱법
목표 데이터를 모두 포함하는 함수 데이터의 경향을 반영하는 함수
데이터의 수 적을 수록 좋음 많아도 무방함
정밀도 매우 높음 상대적으로 낮음
신축성 조절이 어려움 조절이 자유로움

이차형식의 최적화

이차형식

가환환 K 위의 가군 V 에 대해 다음 세 조건을 만족시키는 함수 Q : V \to K

  • \forall k, l \in K, \forall u, v, w \in V
    • Q(kv) = k^{2} Q(v)
    • Q(u + v + w) = Q(u + v) + Q(v+w) + Q(u+w) - Q(u) - Q(v) - Q(w)
    • Q(kv + lv) = k^{2} Q(u) + l^{2} Q(v) + kl Q(u+v) - klQ(u) - klQ(v)

ex 1) R^{2} 상의 일반적인 이차형식은 다음과 같다.

a_{1}x_{1}^{2} + a_{2}x_{2}^{2} + 2a_{3}x_{1}x_{2} \Leftrightarrow \left( \begin{array}{rr} x_{1} & x_{2} \end{array} \right) \left( \begin{array}{rr} a_{1} & a_{3} \\ a_{3} & a_{2} \end{array} \right) \left( \begin{array}{rr} x_{1} \\ x_{2}  \end{array} \right)

ex 2) R^{3} 상의 일반적인 이차형식은 다음과 같다.

a_{1}x_{1}^{2} + a_{2}x_{2}^{2} + a_{3}x_{3}^{2} +  2a_{4}x_{1}x_{2} + 2a_{5}x_{1}x_{3} + 2a_{6}x_{2}x_{2}

\Leftrightarrow \left( \begin{array}{rrr} x_{1} & x_{2} & x_{3} \end{array} \right) \left( \begin{array}{rrr} a_{1} & a_{4} & a_{5} \\ a_{4} & a_{2} & a_{6} \\ a_{5} & a_{6} & a_{3} \end{array} \right) \left( \begin{array}{rrr} x_{1} \\ x_{2} \\ x_{3} \end{array} \right)

제약된 극값

개념

특정 제약 하에 결정되는 원하는 식의 최댓값 또는 최솟값

정리) n \times n 행렬 A 의 고윳값을 큰 순서대로 \lambda_{1}, \lambda_{2}, ... , \lambda_{n} 이라 하자. 이때 \|v\| = 1 제약 하에 v^{T}Av 의 최댓(솟)값은 \lambda_{1} (\lambda_{n}) 에 대응하는 단위고유벡터에서 존재한다.

사례

제약 x^{2} + y^{2} = 1 하에서

  • 위 제약 조건은 \vec{v} = (x, y) 로 정한 것과 같다. \|v\| = 1 이 된다.

z = 5 x^{2} + 5 y^{2} + 4xy

의 최댓값과 최솟값을 구하자. 우선 z 를 이차형식 v^{T} Av 형태로 변환한다.

Step 1) a_{1}x^{2} + a_{2}y^{2} + 2a_{3}xy

\Leftrightarrow \left( \begin{array}{rr} x & y \end{array} \right) \left( \begin{array}{rr} a_{1} & a_{3} \\ a_{3} & a_{2} \end{array} \right) \left( \begin{array}{rr} x \\ y \end{array} \right) = v^{T} A v

즉, z = \left( \begin{array}{rr} x & y \end{array} \right) \left( \begin{array}{rr} 5 & 2 \\ 2 & 5 \end{array} \right) \left( \begin{array}{rr} x \\ y \end{array} \right)

Step 2) 행렬 A = \left( \begin{array}{rr} 5 & 2 \\ 2 & 5 \end{array} \right) 의 고윳값과 고유벡터를 구한다.

\Rightarrow \begin{cases} \lambda_{1} = 7 & v_{1} = (1, 1) \\ \lambda_{2} = 3 & v_{2} = (-1, 1) \end{cases}

Step 3) 고유벡터를 정규화한다.

\Rightarrow \begin{cases} \lambda_{1} = 7 & v_{1} = ({1 \over \sqrt{2}}, {1 \over \sqrt{2}}) \\ \lambda_{2} = 3 & v_{2} = (-{1 \over \sqrt{2}}, {1 \over \sqrt{2}}) \end{cases}

Step 4) 따라서 (x, y) = ({1 \over \sqrt{2}}, {1 \over \sqrt{2}}) 일 때 z 는 최댓값 7을 갖고, (x, y) = (-{1 \over \sqrt{2}}, {1 \over \sqrt{2}}) 일 때 z 최솟값 3을 갖는다.

물론 v_{1} = (-1, -1), v_{2} = (1, -1)   등으로 설정해도 무방하며, 최댓(솟)값은 변하지 않는다.

이상엽/ 복소벡터공간

복소벡터공간

정의

복소수체 \mathbb{C} 에 대한 가군. 즉 적당한 집합 V 에 대해 벡터공간 (V, \mathbb{C}, +, \cdot) 을 복소벡터공간이라 한다.

((V, \mathbb{C}, +, \cdot) 에서 \mathbb{C} 는 스칼라를 복소수에서 가져왔다는 얘기다. 실수벡터공간에서는 스칼라를 어디서 가져왔는지를 생략해서 표기한 셈. 엄밀하게 쓰면 (V, \mathbb{R}, +, \cdot) 이 되지만 일반적으로 생략해서 표기한다.)

또한 모든 복소 n-튜플 (v_{1}, v_{2}, ... , v_{n}) 의 집합을 복수 n-공간이라 하고 \mathbb{C}^{n} 으로 표시한다.

복소켤레

\mathbb{C}^{n} 의 임의의 벡터

  • v = (v_{1}, v_{2}, ... , v_{n})
    • = (a_{1} + b_{1}i, a_{2} + b_{2}i, ... , a_{n} + b_{n}i)
    • = (a_{1}, a_{2}, ... , a_{n}) + i(b_{1}, b_{2}, ... , b_{n})
    • = Re(v) + i Im(v)

에 대하여 v 의 복소켤레 (복소수 부분의 부호만 바뀜)

  • \bar{v} = (\bar{v_{1}}, \bar{v_{2}}, ... , \bar{v_{n}}) = Re(v) - i Im(v)
  • ex 1) v = (1+i, -i, 3, 3i) 에 대하여 Re(v), Im(v), \bar{v} 를 구하시오
    • Re(v) = (1, 0, 3, 0)
    • Im(v) = (1, -1, 0, 3)
    • \bar{v} = Re(v) - i Im(v) = (1 - i, i, 3, -3i)
  • ex 2) A = \left( \begin{array}{rr} 1 - i & 2i \\ -1 & 3+2i \end{array} \right) 에 대하여 \bar{A}, det(\bar{A}) 를 구하시오
    • \bar{A} = \left( \begin{array}{rr} 1 + i & -2i \\ -1 & 3-2i \end{array} \right)
    • det(\bar{A}) = 3 - 2i + 3i + 2 - 2i = 5 - i 

대수적 성질

  • \mathbb{C}^{n} 의 벡터 u, v 와 스칼라 k 에 대해
    • \bar{\bar{u}} = u
    • \overline{ku} = \bar{k} \bar{u}
    • \overline{u \pm v} = \bar{u} \pm \bar{v}
  • m \times k 행렬 A k \times n 행렬 B 에 대해
    • \bar{\bar{A}} = A
    • (\overline{A^{T}}) = (\bar{A})^{T}
    • \overline{AB} = \bar{A} \bar{B}

복소내적공간

정의

복소벡터공간 (V, \mathbb{C}, +, \cdot) 의 두 벡터 u = (u_{1}, u_{2}, ... , u_{n}), v = (v_{1}, v_{2}, ... , v_{n}) 의 내적 <u, v> : V \times V \to \mathbb{C}

<u, v> = u \cdot v = u_{1} \bar{v_{1}} + u_{2} \bar{v_{2}} + ... + u_{n} \bar{v_{n}}

로 정의한다. 또한 내적이 정의되어 있는 복소벡터공간을 복소내적공간이라 한다.

(만약 뒤에 있는 벡터에 켤레를 취해주지 않으면 노름 값이 0이나 음수가 나올 수가 있다. 때문에 뒤의 벡터에 켤레를 취해서 노름 값을 자연스럽게 만들어 줌. 엄밀히 말해주면 위의 연산이 내적공간의 연산이 기본이고, 실수벡터공간에서는 켤레를 취해줘도 의미가 없기 때문에 생략이 되었던 것)

성질

복소내적공간의 세 벡터 u, v, w 와 스칼라 k 에 대해 다음 성질이 만족한다.

  • <u, v> = \overline{<v, u>}
  • <u + v, w> = <u, w> + <v, w>
  • <u, v + w> = <u, v> + <u, w>
  • <ku, w> = k<u, w>
  • <u, kv> = \bar{k}<u, v>
  • v \neq \vec{0} 일 때 <v, v> > 0

고윳값과 벡터

정의

복소정사각행렬 A 에 대하여 고유방정식 det(\lambda I - A) = 0 의 복소해 \lambda A 의 복소고윳값이라 한다.

또한 Av = \lambda v 를 만족시키는 모든 벡터 v 의 집합을 A 의 고유공간, 고유공간의 영벡터가 아닌 벡터를 A 의 복소고유벡터라고 한다.

  • ex) A = \left( \begin{array}{rr} 2 & 1 \\ -5 & -2 \end{array} \right) 일 때
    • det(\lambda I_{2} - A) = det(\left( \begin{array}{rr} \lambda - 2 & -1 \\ 5 & \lambda + 2 \end{array} \right)) = \lambda^{2} + 1 = 0
    • \therefore \lambda = i or -i
    • \lambda = i 일 때
      • V = t \left( \begin{array}{rr} - {i + 2 \over 5} \\ 1 \end{array} \right)
      • 고유공간 =\{(- {i + 2 \over 5} , 1) \}
      • 고유벡터 =(- {i + 2 \over 5}t , t) (t \neq 0)

정리

\lambda 가 실 정사각행렬 A 의 고윳값이고 v 는 이에 대응하는 고유벡터이면, \bar{\lambda} 또한 A 의 고윳값이며 \bar{v} 는 이에 대응하는 고유벡터이다.

유니터리 대각화

용어의 정의

켤레전치행렬

복소행렬 A 의 전치행렬을 구한 다음 각 성분을 켤레인 복소수로 바꾼 행렬 A^{H} A 의 켤레전치행렬 또는 에르미트 전치행렬이라 한다.

스칼라 k m \times r 행렬 A r \times n 행렬 B 에 대해 다음이 성립한다.

  • (A^{H})^{H} = A
  • (A \pm B)^{H} = A^{H} \pm B^{H} (복부호 동순)
  • (kA)^{H} = \bar{k} A^{H}
  • (AB)^{H} = B^{H} A^{H}

에르미트행렬

A = A^{H} 가 성립하는 복소정사각행렬 A 를 에르미트행렬이라 한다.

유니터리행렬

복소정사각행렬 A 의 역행렬 A^{-1} 에 대하여 A^{-1} = A^{H} 가 성립하는 행렬 A 를 유니터리행렬이라 한다.

정규행렬

A A^{H} = A^{H} A 가 성립하는 복소정사각행렬 A 를 정규행렬이라 한다. 에르미트행렬, 유니터리행렬 등이 이에 해당한다.

유니터리 대각화

정의

P^{H}AP = D 가 복소대각행렬이 되는 유니터리행렬 P 가 존재하면 복소정사각행렬 A 는 유니터리 대각화가능하다고 한다.

또한 이러한 임의의 행렬 P A 를 유니터리 대각화한다고 한다.

정리

유니터리 대각화 가능한 행렬은 정규행렬이며, 그 역도 성립한다. 즉 정규행렬은 유니터리 대각화 가능하다.

에르미트행렬 A의 유티너리 대각화 과정

  1. A 의 모든 고유공간의 기저를 구한다.
  2. 고유공간의 정규직교기저를 구한다.
  3. 기저벡터를 열벡터로 하는 행렬 P 는 유니터리행렬이고, A 를 대각화 한다.

이상엽/ 고윳값과 대각화

고윳값과 벡터

  • 고윳값은 원어(독일어, eigenvalue)로는 특수한 값이라는 뜻이지 유일한 값이라는 뜻은 아니다.

정의

F 에 대한 벡터공간 V 위의 선형사상 L : V \to V 에 대하여 다음 두 조건

  1. v \neq \vec{0}
  2. L(v) = \lambda_{v}

를 만족하는 \lambda \in F v \in V 를 각각 고윳값과 고유벡터라고 한다.

  • ex) v = (2, 3), L \mapsto M = \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right)
    • L(v) \mapsto Mv = \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right) \left( \begin{array}{rr} 2 \\ 3 \end{array} \right) = \left( \begin{array}{rr} -4 \\ -6 \end{array} \right) = -2 \left( \begin{array}{rr} 2 \\ 3 \end{array} \right)
    • 이때 행렬 M 을 곱한 것과 동일한 결과를 가져오는 스칼라 -2가 고윳값이 되며 그때의 벡터가 고유벡터가 된다.

고유방정식

n \times n 행렬 M 에 대하여 \lambda M 의 고윳값이기 위한 필요충분조건은 다음 방정식

det(\lambda I_{n} - M) = 0

을 만족하는 것이다. 이 방정식을 고유방정식이라 하며, 좌변의 식을 고유다항식이라 한다. (단, I_{n} n \times n 단위 행렬)

  • ex) M = \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right), \lambda = -2 일 때,
    • det(\lambda I_{2} - M) = det(-2 \left( \begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array} \right) - \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right))
    • = det \left( \begin{array}{rr} -3 &  2 \\ -3 & 2 \end{array} \right) = -6 + 6 = 0
  • ex2) M = \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right) 의 고윳값 찾기
    • det(\lambda I_{2} - M) = det(\left( \begin{array}{rr} \lambda & 0 \\ 0 & \lambda \end{array} \right) - \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right))
    • = det \left( \begin{array}{rr} \lambda - 1 &  2 \\ -3 & \lambda + 4 \end{array} \right)
    • = \lambda^{2} + 3 \lambda +2 = (\lambda+2)(\lambda+1) = 0
    • \therefore \lambda = -2 or -1

고유공간

선형사상 \lambda I_{v} - L 의 핵을 \lambda 의 고유공간이라 한다. (단, I_{v} 는 항등사상)

따라서 고유공간의 영벡터가 아닌 벡터는 고유벡터이다.

또한 L 의 고유벡터들로 구성된 V 의 기저를 선형사상 L 의 고유기저라 한다.

  • ex) M = \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right), \lambda = -1 일 때,
    • (\lambda I_{n} - M) v = 0
    • \Leftrightarrow (-\left( \begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array} \right) - \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right)) \cdot \left( \begin{array}{rr} v_{1} \\ v_{2} \end{array} \right) = 0
    • \Leftrightarrow \left( \begin{array}{rr} -2 & 2 \\ -3 & 3 \end{array} \right) \cdot \left( \begin{array}{rr} v_{1} \\ v_{2} \end{array} \right) = 0
    • \therefore \begin{cases} v_{1} = s \\ v_{2} = s \end{cases}
    • v = s \left( \begin{array}{rr} 1 \\ 1 \end{array} \right)
    • 즉, 고유벡터는 (s, s) (s \neq 0) , 고유기저 = \{ (1, 1) \}
  • ex) M = \left( \begin{array}{rrr} 0 & 0 & -2 \\ 1 & 2 & 1 \\ 1 & 0 & 3 \end{array} \right) 의 고윳값, 고유벡터, 고유기저 구하기
    • 고윳값 구하기
      • det(\lambda I_{3} - M) = det \left( \begin{array}{rrr} \lambda & 0 & 2 \\ -1 & \lambda-2 & -1 \\ -1 & 0 & \lambda-3 \end{array} \right)
      • = \lambda (\lambda^{2} - 5 \lambda  + 6) + 2 (\lambda - 2)
      • = \lambda^{3} - 5 \lambda^{2} + 8 \lambda - 4 = (\lambda - 1)(\lambda-2)^{2} = 0 
      • \therefore \lambda = 1 or 2 
    • \lambda = 1 일 때 고유벡터 구하기 
      • (\lambda I_{3} - M) v = 0
      • \Leftrightarrow \left( \begin{array}{rrr} 1 & 0 & 2 \\ -1 & -1 & -1 \\ -1 & 0 & -2 \end{array} \right) \left( \begin{array}{rrr} v_{1} \\ v_{2} \\ v_{3} \end{array} \right) = 0
      • \therefore \begin{cases} v_{1} = -2s \\ v_{2} = s \\ v_{3} = s \end{cases}
      • v = s \cdot \left( \begin{array}{rrr} -2 \\ 1 \\ 1 \end{array} \right)
      • 즉, 고유벡터는 (-2s, s, s), (s \neq 0) , 고유기저 = \{ (-2, 1, 1) \}
    • \lambda = 2 일 때 고유벡터 구하기
      • (2 I_{3} - M) v = 0
      • \Leftrightarrow \left( \begin{array}{rrr} 2 & 0 & 2 \\ -1 & 0 & -1 \\ -1 & 0 & -1 \end{array} \right) \left( \begin{array}{rrr} v_{1} \\ v_{2} \\ v_{3} \end{array} \right) = 0
      • \therefore \begin{cases} v_{1} = -r \\ v_{2} = t \\ v_{3} = r \end{cases}
      • v = t \cdot \left( \begin{array}{rrr} 0 \\ 1 \\ 0 \end{array} \right) + r \cdot \left( \begin{array}{rrr} -1 \\ 0 \\ 1 \end{array} \right)
      • 즉, 고유벡터는 (-r, t, r), (s \neq 0, t \neq 0, r \neq 0) , 고유기저 = \{ (0, 1, 0), (-1, 0, 1) \}

대각화

대각화

정의

두 정사각행렬 A, B 에 대하여 방정식

B = P^{-1}AP

를 만족하는 대각행렬 B 와 가역행렬 P 가 존재하면 행렬 A 는 대각화 가능행렬이라고 한다. 또한 이 경우 행렬 P A 를 대각화한다고 한다.

  • ex) A = \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right), P = \left( \begin{array}{rr} 1 & 2 \\ 1 & 3 \end{array} \right) 일 때,
    • P^{-1} = \left( \begin{array}{rr} 3 & -2 \\ -1 & 1 \end{array} \right)
    • P^{-1}AP = \left( \begin{array}{rr} 3 & -2 \\ -1 & 1 \end{array} \right) \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right) \left( \begin{array}{rr} 1 & 2 \\ 1 & 3 \end{array} \right)
    • = \left( \begin{array}{rr} -1 & 0 \\ 0 & -2 \end{array} \right) = B
    • 이런 결과는 다시 생각해 보면 A 라는 선형사상(행렬)은 PBP^{-1} 이라는 선형사상으로 분해가 가능하다는 뜻이 되기도 한다.

정리

n \times n 행렬 A 에 대하여 다음 두 명제는 동치이다.

  1. A 는 대각화 가능 행렬이다.
  2. A n 개의 선형독립인 고유벡터를 갖는다.

대각화하는 방법

n \times n 행렬 A 에 대하여

  1. Step 1
    • n 개의 선형독립인 고유벡터를 찾아 대각화 가능 행렬인지 확인한다.
    • (고유벡터의 갯수가 n개가 안되면 대각화 가능하지 않음)
  2. Step 2
    • n 개의 고유벡터 v_{1}, v_{2}, ... , v_{n} 로부터 행렬 P = (v_{1}, v_{2}, ... , v_{n}) 를 만든다.
  3. Step 3
    • P^{-1}AP 는 대각행렬이 된다.
  • ex) A = \left( \begin{array}{rr} 2 & 1 \\ 0 & 2 \end{array} \right) 이 대각화 가능한지 확인
    • 고윳값 구하기
      • det(\lambda I_{2} - A) = det \left( \begin{array}{rr} \lambda - 2 & -1 \\ 0 & \lambda-2 \end{array} \right)
      • = (\lambda - 2)^{2} = 0
      • \therefore \lambda = 2 
    • 고유벡터 구하기
      • (2 I_{2} - A) v = 0
      • \Leftrightarrow \left( \begin{array}{rr} 0 & -1 \\ 0 & 0 \end{array} \right) \left( \begin{array}{rr} v_{1} \\ v_{2} \end{array} \right) = 0
      • v = s \cdot \left( \begin{array}{rr} 1 \\ 0 \end{array} \right)
      • 즉, 고유벡터는 (s, 0), (s \neq 0) , 고유기저 = \{ (1, 0) \}
      • 고유기저가 1개 밖에 안나오므로 A 는 대각화 불가능
  • ex2) A = \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right) 에 대한 P 찾기
    • \therefore \begin{cases} \lambda = -1 \Rightarrow (s, s) \to P_{1} = \left( \begin{array}{rr} 1 \\ 1 \end{array} \right) \\ \lambda = -2 \Rightarrow (2t, 3t) \to P_{2} = \left( \begin{array}{rr} 2 \\ 3 \end{array} \right) \end{cases}
    • \therefore P = (P_{1} P_{2}) = \left( \begin{array}{rr} 1 & 2 \\ 1 & 3 \end{array} \right)  

중복도

정의

\lambda_{0} n \times n 행렬 A 의 고윳값이면 이에 대응하는 고유공간의 차원을 \lambda_{0} 의 기하적 중복도라 한다.

또한 A 의 고유다항식에서 \lambda - \lambda_{0} 가 인수로 나타나는 횟수를 \lambda_{0} 의 대수적 중복도라 한다.

  • ex)
    • 기하적 중복도는 대수적 중복도보다 작거나 같음. 그 둘이 같을 때 그 행렬은 대각화 가능이 된다.

정리

정사각행렬 A 에 대하여 다음 두 명제는 동치이다.

  1. A 는 대각화 가능 행렬이다.
  2. A 의 모든 고윳값에 대해서 기하적 중복도와 대수적 중복도는 같다.

닮음 불변량

정의

두 정사각행렬 A, B 에 대하여 

B = P^{-1}AP

를 만족하는 가역행렬 P 가 존재하면 A, B 는 서로 닮은 행렬이라 하고 기호로 A \sim B 라 표현한다.

닮은 불변량

서로 닮은 두 행렬의 다음과 같은 성질들은 서로 일치한다.

  1. 행렬식
  2. 가역성
  3. rank
  4. nullity
  5. 고유다항식
  6. 고윳값
  7. 고유공간의 차원
  8. 대각성분들의 합
  9. 대수적 중복도
  10. 기하적 중복도

C-H 정리

임의의 정사각행렬 A 와 그 고유다항식

f(\lambda) = det(\lambda I - A) = \sum_{i=0}^{n} a_{i} \lambda^{i}

에 대하여 f(A) = 0 이 성립하며, 이를 케일리-해밀턴 정리라고 한다. (단, 0 는 영행렬)

  • ex) A = \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right) 일 때
    • f(\lambda) = det(\lambda I_{2} - A) = det( \left( \begin{array}{rr} \lambda - 1 & 2 \\ -3 & \lambda + 4 \end{array} \right))
    • = \lambda^{2} + 3 \lambda + 2
    • f(A) = \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right)^{2} + 3 \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right) + 2 \left( \begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array} \right) = 0

이상엽/ 선형사상

선형사상

선형사상

  • 사상이란 대수구조를 다루는 함수.
    • 엄밀히 말하면 함수보다 더 포괄적인 개념이지만, 둘이 흡사하기 때문에 혼용해서 사용함.
  • 선형사상이란 가산성(additivity)과 동차성(homogeneity)을 만족하는 사상

정의

F -벡터공간 V, W 에 대하여 V 의 성질을 보존하는 다음 두 조건을 만족하는 사상 L : V \to W

  • L(u+v) = L(u) + L(v) (u, v \in V)
    • 가산성
  • L(kv) = kL(v) (k \in F, v \in V)
    • 동차성
  • L은 선형사상이기 때문에 사용하는 기호로, L이 붙어 있으면 선형 사상이라고 보면 된다.

관련 용어

L : V \to W 가 선형사상일 때

  • 핵 (kernel): ker L = L^{-1}(\vec{0}) = \{ v \in V | L(v) = \vec{0} \}
    • 일종의 공역 개념
  • 상 (image): im L = L(V) = \{ L(v) \in W | v \in V \}
    • 일종의 치역 개념
  • 자기사상: V = W L
  • 단사사상: L(u) = L(v) \Rightarrow u = v L
  • 전사사상: L(V) = W L
  • 동형사상: 단사사상인 전사사상
  • 자기동형사상: 자기사상인 동형사상
  • 항등사상: L(v) = v L(=I_{v})
  • 사상의 합성: 두 선형사상 L_{1} : V \to U, L_{2} : U \to W 의 합성은 L_{2} \circ L_{1} : V \to W 로 쓴다.
  • 역사상
    • L_{2} \circ L_{1} = I_{v} 일 때, L_{2} L_{1} 의 왼쪽 역사상, L_{1} L_{2} 의 오른쪽 역사상이라 한다.
    • 왼쪽 역사상이자 오른쪽 역사상을 양쪽 역사상 또는 역사상이라 한다.

여러 선형사상

L : V \to W 가 선형사상이고 v \in V 일 때

  • L(v) = \vec{0} : 영사상
  • L(v) = v : 항등사상
  • L(v) = kv (단, k는 스칼라)
  • L(v) = Mv^{(T)} (단, M \in \mathcal{M}_{m \times n}(F), V = F^{n}, W = F^{m}  )
  • L(v) = <v, v_{0}> (단, $latex v_{0} \in V)

선형대수학의 기본정리

F -벡터공간 V, W 에 대하여 V 에서 W 로의 선형사상의 집합을 \mathcal{L}(V, W) 라 하고, 다음과 같이 \mathcal{L}(V, W) 위에 합과 스칼라배를 정의한다. (v \in V, k \in F )

  • (L_{1} + L_{2})(v) = L_{1}(v) + L_{2}(v)
  • (kL)(v) = kL(v)

이제 F 위의 m \times n 행렬들의 집합을 \mathcal{M}_{m \times n}(F) 라 하고, 두 사상 f, g 를 다음과 같이 정의한다.

  • f : \mathcal{L}(V, W) \to \mathcal{M}_{m \times n}(F)
    • f(L) = [L]_{B_{W}}^{B_{V}} = M
    • 선형사상에서 행렬로 가는 사상
  • g : \mathcal{M}_{m \times n}(F) \to \mathcal{L}(V, W)
    • g(M) = L_{M} ([L_{M}(v)]_{B_{W}} = M[v]_{B_{v}})
    • 행렬에서 선형사상으로 가는 사상
  • [기호 설명]
    • B_{V} 는 V B_{W} 는 W 의 순서기저, 즉, 기저의 원소들은 순서가 정해져있고 바뀌지 않는다.
      • ex) V = \mathbb{R}^{3} \Rightarrow B_{v} = \{ (1, 0, 0), (0, 1, 0), (0, 0, 1) \}
      • 이때 B_{v} V 의 순서기저가 된다.
    • v \in V, v = k_{1} v_{1} + k_{2} v_{2} + ... + k_{n} v_{n} 에 대해 [v]_{B_{V}} = (k_{1}, k_{2}, ... , k_{n})^{T}
      • ex) v \in V, v = 3v_{1} + v_{2} + 2v_{3} \Rightarrow (3, 2, 1)^{T} \Rightarrow [v]_{B_{v}}
      • 쉽게 말해 선형결합의 계수들을 모아 열벡터로 만든 것이다.
    • [L]_{B_{W}}^{B_{V}} = ([L(v_{1})]_{B_{W}}, [L(v_{2})]_{B_{W}}, ... , [L(v_{n})]_{B_{W}})
      • ex) L : \mathbb{R}^{2} \to \mathbb{R}^{3}, L(v) =  \left( \begin{array}{rrr} 1 & 1 \\ 2 & 2 \\ 3 & 3 \end{array} \right) \cdot v, B_{w} = \{ (1, 0, 0), (0, 1, 0), (0, 0, 1) \}
      • v_{1} = (1, 1) \in \mathbb{R}^{2}, v_{2} = (2, 2) \in \mathbb{R}^{2}, v_{3} = (3, 3) \in \mathbb{R}^{2} 
      • L(v_{1}) = \left( \begin{array}{rrr} 1 & 1 \\ 2 & 2 \\ 3 & 3 \end{array} \right) \cdot \left( \begin{array}{rr} 1 \\ 1 \end{array} \right) \Rightarrow [L(v_{1})]_{B_{w}} = \left( \begin{array}{rrr} 2 \\ 4 \\ 6 \end{array} \right) \in \mathbb{R}^{3}
      • L(v_{2}) = \left( \begin{array}{rrr} 1 & 1 \\ 2 & 2 \\ 3 & 3 \end{array} \right) \cdot \left( \begin{array}{rr} 2 \\ 2 \end{array} \right) \Rightarrow [L(v_{2})]_{B_{w}} = \left( \begin{array}{rrr} 4 \\ 8 \\ 12 \end{array} \right) \in \mathbb{R}^{3}
      • L(v_{3}) = \left( \begin{array}{rrr} 1 & 1 \\ 2 & 2 \\ 3 & 3 \end{array} \right) \cdot \left( \begin{array}{rr} 3 \\ 3 \end{array} \right) \Rightarrow [L(v_{3})]_{B_{w}} = \left( \begin{array}{rrr} 6 \\ 12 \\ 18 \end{array} \right) \in \mathbb{R}^{3}
      • \Rightarrow [L]_{B_{w}}^{B_{v}} = \left( \begin{array}{rrr} 2 & 4 & 6 \\ 4 & 8 & 12 \\ 6 & 12 & 18 \end{array} \right) = M \in \mathcal{M}_{3 \times 3}

그러면 f g 는 모두 동형사상이다. 또한 두 사상 f g 는 서로 역사상 관계이다.

  • 선형사상에서 행렬로 가는 사상과, 행렬에서 선형사상으로 가는 것이 동형사상이므로, 선형사상에 대해서는 그냥 행렬을 이용하면 된다.

위에 대한 증명)

선형사상에서 행렬로 가는 f 에 대해서

  • 선형사상 증명
    • 가산성 증명
      • \forall i \in \{ 1, 2, ... , n \}, \forall L_{1}, L_{2} \in \mathcal{L}(V, W)
      • (L_{1} + L_{2}) (v_{i}) = L_{1}(v_{i}) + L_{2}(v_{i}) (\because definition)
      • [(L_{1} + L_{2}) (v_{i})]_{B_{w}} = [L_{1}(v_{i})]_{B_{w}} + [L_{2}(v_{i})]_{B_{w}}
      • \Leftrightarrow [L_{1} + L_{2}]_{B_{w}}^{B_{v}} = [L_{1}]_{B_{w}}^{B_{v}} + [L_{2}]_{B_{w}}^{B_{v}}
      • \therefore f(L_{1} + L_{2}) = f(L_{1}) + f(L_{2})
    • 동차성 증명
      • \forall k \in F, \forall i \in \{ 1, 2, ... , n \}
      • [(kL)(v_{i})]_{B_{w}} = k \cdot [L(v_{i})]_{B_{w}}
      • \Rightarrow [kL]_{B_{w}}^{B_{v}} = k \cdot [L]_{B_{w}}^{B_{v}}
      • \therefore f(kL) = k \cdot f(L)
  • 동형사상 증명
    • 단사사상 증명
      • \forall L_{1}, L_{2} \in \mathcal{L}(V, W), f(L_{1}) = f(L_{2})
      • \Leftrightarrow [L_{1}(v_{i})]_{B_{w}} = [L_{2}(v_{i})]_{B_{w}} (\forall i \in {1, 2, ... , n})
      • \Leftrightarrow L_{1}(v_{i}) = L_{2}(v_{i})
      • 한편, \forall v \in V, \exists k_{1}, k_{2}, ... k_{n} \in F
      • s.t) v = k_{1} v_{1} + ... + k_{n} v_{n} = \sum_{i=1}^{n} k_{i} v_{i} (\because \{ v_{1},  ... , v_{n} \} = B_{v})
      • \therefore L_{1}(v_{i}) = L_{2}(v_{i})
      • \Rightarrow \sum_{i=1}^{n} k_{i} L_{1} (v_{i}) = \sum_{i=1}^{n} k_{i} L_{2} (v_{i})
      • \Rightarrow \sum_{i=1}^{n} L_{1} (k_{i} v_{i}) = \sum_{i=1}^{n} L_{2} (k_{i} v_{i})
      • \Rightarrow L_{1} (k_{1} v_{1}) + ... + L_{1} (k_{n} v_{n}) = L_{2} (k_{1} v_{1}) + ... + L_{2} (k_{n} v_{n})
      • \Rightarrow L_{1} (k_{1} v_{1} + ... + k_{n} v_{n}) = L_{2} (k_{1} v_{1} + ... + k_{n} v_{n})
      • \Rightarrow L_{1}(v) = L_{2}(v)
      • \therefore L_{1} = L_{2}
    • 전사사상 증명
      • \forall M \in \mathcal{M}_{m \times n}(F)
      • [M]^{i} := M i 번째 열
      • 이제 [L(v_{i})]_{B_{w}} := [M]^{i}
      • surely, [L]_{B_{w}}^{B_{v}} = M
      • \therefore f(L) = M
  • 위의 증명에 따라 선형사상에 적용되는 것은 모두 행렬에 대해 적용 가능

사상 g 에 대해서

  • 선형사상 증명
    • 가산성 증명
      • \forall M_{1}, M_{2} \in \mathcal{M}_{m \times n}(F), \forall v \in V
      • [L_{M_{1} +M_{2}}(v)]_{B_{W}} = (M_{1} + M_{2})[v]_{B_{V}}
      • = M_{1}[v]_{B_{V}} + M_{2}[v]_{B_{V}}
      • = [L_{M_{1}}(v)]_{B_{V}} + [L_{M_{2}}(v)]_{B_{V}}
      • \therefore L_{M_{1} +M_{2}} = L_{M_{1}} + L_{M_{2}}
      • 즉, g(M_{1} + M_{2}) = g(M_{1}) + g(M_{2})
    • 동차성 증명
      • \forall k \in F, \forall M \in \mathcal{M}_{m \times n}(F)
      • [L_{km}(v)]_{B_{W}} = (kM)[v]_{B_{W}}
      • = k \cdot M [v]_{B_{W}}
      • = k [L_{M}(v)]_{B_{W}}
      • \therefore g(kM) = k \cdot g(M)
  • 동형사상 증명
    • 단사사상 증명
      • g(M_{1}) = g(M_{2})
      • \Rightarrow [L_{M_{1}}(v)]_{B_{W}} = [L_{M_{2}}(v)]_{B_{W}}
      • \Rightarrow M_{1}[v]_{B_{W}} = M_{2}[v]_{B_{W}}
      • \Rightarrow [M_{1}]^{i} = [M_{2}]^{i}, (\forall i)
      • \Rightarrow M_{1} = M_{2}
    • 전사사상 증명
      • \forall L \in \mathcal{L}(V, W), M := ([L(V_{1})]_{B_{W}} [L(V_{i})]_{B_{W}})
      • Then, [L_{M}(v)]_{B_{W}} = [M]^{i} 
      • = [L(v_{i})]_{B_{W}} (\forall i) 
      • g(M) = L_{M} = L

f g 는 역사상 관계

  • \forall L \in \mathcal{L} (V, W), \forall v \in V
    • (g \circ f) (L) = g(f(L)) = g(M) = L_{M} = L
    • \therefore g \circ f 는 항등사상
  • \forall M \in \mathcal{M}_{m \times n} (F)
    • (f \circ g) (M) = f(g(M)) = f(L_{M}) = f(L) = M
    • \therefore f \circ g 는 항등사상
  • 고로 f g 는 역사상 관계

차원정리

차원정리

유한차원 벡터공간 V 와 선형사상 L : V \to W 에 대하여 다음이 성립한다.

dim(V) = dim(ker L) + dim(im L)

  • 증명)
    • B_{v} = \{ v_{1}, v_{2}, ... , v_{n} \}
    • ker L \subset V 이므로
    • B_{ker L} = \{ v_{1}, v_{2}, ... , v_{k} \} 
    • 목표 B_{imL} = \{ L(v_{k+1}), L(v_{k+2}), ... , L(v_{n}) \}
  • 생성 증명
    • \forall L(V) \in imL, V = c_{1} v_{1} + c_{2} v_{2} + ... + c_{n} v_{n}
    • L(v_{1}) + L(v_{2}) + ... + L(v_{k}) = \vec{0} + \vec{0} + .... + \vec{0}
    • \therefore L(V) = L(c_{1} v_{1} + c_{2} v_{2} + ... + c_{n} v_{n})
    • = L(c_{1} v_{1}) + L(c_{2} v_{2}) + ... + L(c_{n} v_{n})
    • = L(c_{k+1} v_{k+1}) + L(c_{k+2} v_{k+2}) + ... + L(c_{n} v_{n})
      • (\because L(v_{1}) + L(v_{2}) + ... + L(v_{k}) = \vec{0})
    • = c_{k+1}L(v_{k+1}) + c_{k+2}L(v_{k+2}) + ... + c_{n}L(v_{n}) \in imL
    • span\{ L(v_{k+1}), L(v_{k+2}), ... , L(v_{n}) \} = imL
  • 선형독립 증명
    • c_{k+1}L(v_{k+1}) + c_{k+2}L(v_{k+2}) + ... + c_{n}L(v_{n}) = \vec{0} 라 하자
    • = L(c_{k+1} v_{k+1} + c_{k+2} v_{k+2}) + ... + c_{n} v_{n})
    • \exists c_{1}, c_{2}, ... , c_{k}
    • s.t) c_{1} v_{1} + ... + c_{k} v_{k} = c_{k+1} v_{k+1} + ... + c_{n} v_{n}
    • \Leftrightarrow c_{1} v_{1} + ... + c_{k} v_{k} - c_{k+1} v_{k+1} - ... - c_{n} v_{n} = \vec{0}
    • \therefore c_{1} = c_{2} = ... = c_{n} = 0
    • \therefore L(v_{k+1}), L(v_{k+2}), ... , L(v_{n}) 은 선형독립

비둘기집 원리

따름정리

차원이 같은 두 유한 차원 벡터공간 V, W 사이에 선형사상 L 이 정의되어 있으면 다음이 성립한다.

L 은 전사 \Leftrightarrow L 은 단사 \Leftrightarrow L 은 전단사

  • 증명)
    • L 이 전사 \Rightarrow L 단사
      • Let) dim(V) = dim(W) = n
      • if L 이 전사
        • \Rightarrow dim(L(V)) = dim(imL) = n
        • \Rightarrow dim(kerL) = n - n = 0
        • \Leftrightarrow kerL = \{ \vec{0} \in V \}
        • L(v_{1}) = L(v_{2}), \forall v_{1}, v_{2} \in V
        • \Rightarrow L(v_{1}) - L(v_{2}) = \vec{0}
        • \Rightarrow L(v_{1} - v_{2}) = \vec{0} \in W
        • \Rightarrow v_{1} - v_{2} = \vec{0}
        • \Rightarrow v_{1} = v_{2}
    • L 이 단사 \Rightarrow L 전사
      • if L 이 단사
      • \Rightarrow dim(kerL) = 0
      • \Rightarrow dim(L(V)) = n
      • \therefore L(V) \subset W 이면서 dim(L(V)) = dim W
      • 따라서 L(V) = W = imL

비둘기집 원리

공집합이 아닌 두 유한집합 A, B 의 크기가 서로 같을 때, 함수 f : A \to B 는 다음을 만족한다.

f 은 전사 \Leftrightarrow f 은 단사 \Leftrightarrow f 은 전단사

계수정리

관련 용어

행렬 M \in \mathcal{M}_{m \times n}(F) 에 대하여

  • 열공간: M 의 열벡터들로 생성된 공간
  • 열계수: 열공간의 차원. col-rank M
  • 행공간: M 의 행벡터들로 생성된 공간
  • 행계수: 행공간의 차원. row-rank M
  • 영공간: 연립방정식 MX = 0 의 해공간
  • nullity M : M 의 영공간 차원

예)

  • M = \left( \begin{array}{rrr} 3 & 1 & 2 \\ 1 & 0 & -1 \end{array} \right) \in \mathcal{M}_{2 \times 3}(\mathbb{R})
    • 열공간
      • span\{(3, 1), (1, 0), (2, -1)\} = \mathbb{R}^{2}
      • col-rank M: dim(\mathbb{R}^{2}) = 2
    • 행공간
      • span\{(3, 1, 2), (1, 0, -1)\} = span\{ (1, 0, -1), (0, 1, 5) \}
      • = \{ (k, m, -k+5m) | k, m \in \mathbb{R} \}
      • row-rank M = 2
    • 영공간
      • MX = 0 \Leftrightarrow \left( \begin{array}{rrr} 3 & 1 & 2 \\ 1 & 0 & -1 \end{array} \right) \left( \begin{array}{rrr} x \\ y \\ z \end{array} \right) = \left( \begin{array}{rrr} 0 \\ 0 \\ 0 \end{array} \right) 
      • \Leftrightarrow \begin{cases} 3x + y + 2z = 0 \\ x - z = 0 \end{cases}
      • \Leftrightarrow \begin{cases} z = t \\ x = t \\ y = -5t \end{cases}
      • \therefore \left( \begin{array}{rrr} x \\ y \\ z \end{array} \right) = t \left( \begin{array}{rrr} 1 \\ -5 \\ 1 \end{array} \right)
      • nullity M = 1

계수정리

계수정리

행렬 M \in \mathcal{M}_{m \times n}(F) 에 대하여 다음이 성립한다.

col-rank M = row-rank M

이때 행렬 행렬 M 에 대하여의 행공간 및 열공간의 공통차원을 M 의 계수 rank M 이라 한다.

  • 증명) 행렬 A M 의 기약행사다리꼴 행렬이라 하자
    • \begin{cases} col-rank M = col-rank A \\ row-ran M = row-rank A \end{cases}
    • col-rank A : 선도 1을 포함하는 열의 개수 = 선도 1의 개수
    • row-rank A : 선도 1을 포함하는 행의 개수 = 선도 1의 개수
    • \therefore col-rank M = col-rank A = row-rank A = row-rank M

Rank-Nullity 정리

행렬 M \in \mathcal{M}_{m \times n}(F) 에 대하여 다음이 성립한다.

n = rank M + nullity M

  • 증명) 행렬 A M 의 기약행사다리꼴 행렬이라 하자
    • rank M = r (\leq n) 라 하면
    • \Rightarrow A 의 선도 1의 개수 = r
    • MX = 0 \Rightarrow 자유변수 개수 = n - r
    • nullity M = n - r
    • 즉, rank M + nullity M = r + (n - r) = n

Rank-Nullity를 선형사상으로 변환하면 다음과 같다.

  • \begin{cases} n = dim(V) \\ rank M = dim(imL) \\ nullity M = dim(kerL) \end{cases}
  • \therefore dim(V) = dim(imL) + dim(kerL)

이상엽/ 수학적 벡터 (벡터공간)

대수구조

대수구조

수 뿐만 아니라 수를 대신할 수 있는 모든 것을 대상으로 하는 집합과 그 집합에 부여된 연산이 여러 가지 공리로써 엮인 수학적 대상.

간단히 일련의 연산들이 주어진 집합을 대수구조라고 한다.

여러 대수구조

  • 집합: 아무런 연산이 부여되지 않은 대수구조
  • 반군: 집합과 그 위의 결합법칙을 따르는 하나의 이항 연산을 갖춘 대수구조
  • 모노이드: 항등원을 갖는 반군
  • 군: 역원을 갖는 모노이드
  • 아벨군(가환군): 교환법칙이 성립하는 군
    • 아벨군이 되면 1종류의 이항 연산에 대해 4개의 기본 연산을 만족하게 됨. (결합법칙/교환법칙/항등원/역원)
  • 환: 덧셈에 대하여 아벨군, 곱셈에 대하여 반군을 이루고 분배법칙이 성립하는 대수구조
    • 환부터는 2종류의 이항 연산이 부여 됨.
    • 1종류의 이항 연산은 아벨군을 만족해야 하고, 나머지 1종류의 이항 연산은 반군을 만족 시켜야 함.
  • 가군: 어떤 환의 원소에 대한 곱셈이 주어지며, 분배법칙이 성립하는 아벨군
    • 벡터공간은 가군의 한 종류
    • 가군은 환에서 원소를 받는게 기본이지만, 벡터공간은 보다 엄격하게 체에서 원소를 받아 온다.
  • 가환환: 곱셈이 교환법칙을 만족하는 환
    • 환 중에 반군을 만족 시키는 나머지 1종류의 연산이 추가로 교환 법칙을 만족. 하지만 항등원과 역원은 존재하지 않는다.
  • 나눗셈환: 0이 아닌 모든 원소가 역원을 가지며, 원소의 개수가 둘 이상인 환
    • 환 중에 반군을 만족 시키는 나머지 1종류의 연산이 항등원과 역원을 가짐. 하지만 교환 법칙은 만족하지 않는다.
  • 체: 가환환인 나눗셈환. 즉, 사칙연산이 자유로이 시행될 수 있고 산술의 잘 알려진 규칙들을 만족하는 대수구조
    • 2종류의 이항연산이 모두 4개의 기본연산을 만족 함.

(\mathbb{R}, *), (V, +, \cdot) -> 이런식으로 표기되면 대수구조가 된다. 대상이 되는 집합을 정의하고 그 집합에 적용되는 연산에 대한 정의가 되면 대수구조가 된다.

환 이전까지는 연산의 종류가 1종류이고 환 이후로 체까지는 연산의 종류가 2가지가 됨. 연산의 종류가 3개 이상인 경우도 있으나 여기서는 생략.

벡터공간

벡터공간

F 에 대한 가군 (V, +, \cdot) 을 벡터공간, V의 원소의 벡터라 한다.

이때 + 는 벡터의 덧셈이고, \cdot 는 벡터의 스칼라배이다.

  • 참고)
    • + : V \times V \to V 인 함수
    • \cdot : F \times V \to V 인 함수
  • (V, +) 는 아벨군이다. (u, v, w \in V)
    • (u + v) + w = u + (v + w)
    • u + v = v + u
    • u + \vec{0} = u \vec{0} V 에 존재한다.
    • u + (-u) = \vec{0} -u V 에 존재한다.
  • (V, +, \cdot) F 의 가군이다. (k, m \in F)
    • k \cdot (m \cdot u) = (km) \cdot u
    • F 의 곱셈 항등원 1에 대해 1 \cdot u = u
    • (k + m) \cdot (u + v) = k \cdot u + m \cdot u + k \cdot v + m \cdot v

수학적으로 벡터란 벡터공간의 원소를 의미함. 벡터공간이란 벡터 대수구조를 만족하는 것을 의미. –아래 예시와 같이 덧셈 연산을 곱셈으로, 곱셈 연산을 지수 연산으로 바꾸어도 벡터 대수구조를 만족하므로 벡터 공간이 된다. 고로 그 집합에 속하는 원소 또한 벡터가 됨–

방향 같은 개념은 수학적인 벡터의 고려 대상이 아님. 그러나 이와 같은 정의가 만족되면 물리적인 벡터에 대해서도 동일하게 적용이 가능. 물리적인 벡터 개념에서 엄밀한 개념만 남긴 것이 수학적 벡터 개념.

  • ex)
    • 벡터에 대한 집합과 다음과 같이 정의할 때
      • V = \{ x | x \in \mathbb{R}, x > 0 \}
      • F = \mathbb{R}
      • + : V \times V \to V, u + v = uv
        • +를 곱셈으로 정의
        • V의 원소와 V의 원소에 대한 +을 하면 그 결과가 V가 나온다.
      • \cdot = F \times V \to V, k \cdot u = u^{k}
        • \cdot 을 지수곱으로 정의
        • F의 원소와 V의 원소에 대한 \cdot 을 하면 그 결과가 V가 나온다.
    • 이와 같은 정의 또한 벡터공간의 대수구조를 만족하므로 벡터공간이라 할 수 있다.
      • (V, +) 는 아벨군이 되고, (V, +, \cdot) 은 가군이 된다.

선형생성

부분벡터공간

벡터공간 V 상에서 정의된 덧셈과 스칼라배에 대하여 그 자체로서 벡터공간이 되는 V 의 부분집합 W V 의 부분벡터공간 또는 부분공간이라 한다.

선형생성

벡터공간 V 의 공집합이 아닌 부분집합 S = \{ v_{1}, v_{2}, ... , v_{n} \} 내의 벡터들의 가능한 모든 선형결합으로 이루어진, V 의 부분벡터공간을 S 의 (선형)생성 span(S) 이라 한다. 즉,

span(S) = \{ \sum_{i = 1}^{n} k_{i} v_{i} | k_{i} \in F, v_{i} \in S \}

이때 S span(S) 을 (선형)생성한다 라고 한다.

  • ex)
    • S = { (1, 0), (0, 1) }, F = \mathbb{R} 라 할 때 –S는 (1, 0), (0, 1)의 벡터를 가진 집합
    • span(S) = \{ k(1, 0) + m(0, 1) | k, m \in F \} 
    • = \{ (k, m) | k, m \in F \}
    • = \mathbb{R}^{2}
    • S라는 집합은 2차원 실수 벡터 공간을 생성한다. (= (1, 0), (0, 1) 이라는 벡터 2개만 있으면 2차원 실수 벡터 공간을 만들 수 있다)

선형 독립

벡터공간 V 의 공집합이 아닌 부분집합 S = \{ v_{1}, v_{2}, ... , v_{n} \} 에 대하여

k_{1} v_{1} + k_{2} v_{2} + ... + k_{n} v_{n} = \vec{0} \\ \Rightarrow k_{1} = k_{2} = ... = k_{n} = 0

이면 S 가 선형독립이라고 한다. 만약 k_{1} = k_{2} = ... = k_{n} = 0 외의 다른 해가 존재하면 S가 선형종속이라고 한다.

  • ex)
    • S_{1} = { (1, 0), (0, 1), (1, 1) } 라 할 때
      • k_{1}(1, 0) + k_{2}(0, 1) + k_{3}(1, 1) = \vec{0} 를 만족하는 K의 값은
      • k_{1} = k_{2} = k_{3} = 0 \\ k_{1} = k_{2} = 1, k_{3} = -1 ... 과 같이 모든 k가 0이지 않은 해가 존재하므로 S_{1} 은 선형종속집합이 된다.
    • S_{2} = { (1, 0), (0, 1) } 라 할 때
      • k_{1}(1, 0) + k_{2}(0, 1) = \vec{0} 를 만족하는 K의 값은
      • k_{1} = k_{2} = 0 뿐이므로 S_{2} 은 선형독립집합이 된다.

여러 벡터공간

노름공간

노름이 부여된 K-벡터공간 (V, \|\cdot\|)

노름이란 \forall u, v \in V, \forall k \in K 에 대해 아래 세 조건을 만족시키는 함수

\|\cdot\| : V \to [0, \infty) 이다. (K \in \{ \mathbb{R}, \mathbb{C}\})

  • \|kv\| = |k|\|v\|
  • \|u + v\| \leq \|u\| + \|v\|
  • \|v\| = 0 \Leftrightarrow v = \vec{0}

내적공간

내적이 부여된 K-벡터공간 (V, <\cdot, \cdot>)

내적이란 \forall u, v, w \in V, \forall k \in K 에 대해 아래 네 조건을 만족시키는 함수

<\cdot, \cdot> : V \times V \to K 이다. (K \in \{ \mathbb{R}, \mathbb{C}\})

  • <u + v, w> = <u, w> + <u, w>
  • <ku, v> = k<v, u>
  • <u, v> = <\overline{v, u}>
    • (복소수체 일 때는 위에 바가 붙고, 실수에서는 붙지 않는다)
  • v \neq \vec{0} \Rightarrow <v, v> > 0

유클리드공간

음이 아닌 정수 n 에 대하여 n 차원 유클리드공간 R^{n} 은 실수집합 R n 번 곱집합이며, 이를 n 차원 실수 벡터공간으로써 정의하기도 한다.

이 위에 내적 <u, v> = \sum_{i=1}^{n} u_{i} v_{i} = u \cdot v 을 정의하면 점곱, 스칼라곱이라고도 한다.

기저와 차원

기저

벡터공간 V 의 부분집합 B 가 선형독립이고 V 를 생성할 때, B V 의 기저라 한다.

  • ex)
    • V = \mathbb{R}^{2}
    • B_{1} = \{ (1, 0), (0, 1) \} 일 때
      • \Rightarrow span(B_{1}) = \mathbb{R}^{2}  
      • \therefore B_{1} V 의 기저
    • B_{2} = \{ (1, 0), (1, 1) \} 일 때
      • (a, b) = k(1, 0) + m(1, 1) = (k+m, m)
      • \therefore m = b, k = a - b  
      • \therefore B_{2} V 를 생성할 수 있고 선형독립이므로 V 의 기저가 된다.
    • S = \{ (1, 0), (0, 1), (1, 1) \} 일 때
      • span(S) = \mathbb{R}^{2} 를 만족하지만, 선형독립이 아니므로 S V 의 기저가 안 된다.

차원

B 가 벡터공간 V 의 기저일 때 B 의 원소의 개수를 V 의 차원 dim(V) 라 한다.

  • ex)
    • 앞선 예에서 B_{1}, B_{2} V 의 기저이고 B_{1}, B_{2} 의 원소의 개수는 2개이므로 V 는 2차원이 된다.

정규기저

다음 조건을 만족하는 노름공간 V 의 기저 B 를 정규기저라 한다.

\forall b \in B, \|b\| = 1

직교기저

다음 조건을 만족하는 내적공간 V 의 기저 B 를 직교기저라 한다.

\forall b_{1}, b_{2} \in B, <b_{1}, b_{2}> = 0

정규직교기저

정규기저이자 직교기저인 내적공간의 기저를 정규직교기저라 한다.

특히 R^{n} 의 정규직교기저 

\{ (1, 0, ... , 0), (0, 1, ... , 0), ... , (0, 0, ... , 1) \}

를 표준기저라 한다.

  • ex) R^{2} 에 대하여
    • B_{1} = \{ (1, 0), (0, 1) \} 는 정규기저도 아니고 직교기저도 아니다.
    • B_{2} = \{ (1, 0), ({1 \over \sqrt{2}}, {1 \over \sqrt{2}}) \} 는 정규기저지만 직교기저는 아니다.
    • B_{3} = \{ (1, 1), (1, -1) \} 는 정규기저는 아니지만 직교기저이다.
    • B_{4} = \{ (1, 0), (0, 1) \} 는 정규기저이고 직교기저이다. 이를 특별히 표준기저라고 한다.

이상엽/ 물리적 벡터

벡터와 좌표계

평면벡터

R^{2} 에서 크기(스칼라)와 방향의 의미를 모두 포함하는 표현 도구

  • 벡터는 크기와 방향만 고려하므로 위치가 다르더라도 크기와 방향이 같으면 같은 것으로 인정한다. 고로 아래 이미지상 v와 동일한 벡터는 d가 된다.

공간벡터

R^{3} 에서 크기와 방향의 의미를 모두 포함하는 표현 도구

n차원 벡터

R^{n} 상의 벡터 v = (v_{1}, v_{2}, ... , v_{n}) = \vec{AB} = (b_{1} - a_{1}, b_{2} - a_{2}, ... , b_{n} - a_{n})

  • 영벡터 \vec{0} = 0 = (0, 0, ... , 0)
  • 두 벡터 v = (v_{1}, v_{2}, ... , v_{n}), w = (w_{1}, w_{2}, ... , w_{n}) 가 같다
    • \Leftrightarrow v_{1} = w_{1}, v_{2} = w_{2}, ... , v_{n} = w_{n}

벡터의 연산

노름

  • 벡터의 크기 (또는 길이) 라고 한다.
    • \|v\| = \sqrt{v_{1}^{2} + v_{2}^{2} + ... + v_{n}^{2}}
  • 노름이 1인 벡터를 단위벡터라고 한다.
    • 정규화: 벡터의 단위 벡터 (크기를 1)로 만드는 과정.
      • {v \over \|v\|} = \hat{v}
  • e_{1} = (1, 0, 0, ... , 0), e_{2} = (0, 1, 0, ... , 0) 등을 표준 단위벡터라고 한다.
    • 벡터를 표준단위 벡터를 이용하여 아래와 같이 표현 가능
    • v = (v_{1}, v_{2}, ... , v_{n}) = v_{1} e_{1} + v_{2} e_{2} + ... + v_{n} e_{n}

선형결합

  • 선형이라는 의미는 선으로 그려지는 것 보다는 –축소된 의미– ‘예측 가능한’ 이라는 의미로 이해하는 것이 좋다.
    • 역으로 비선형이라는 말은 ‘예측 불가능한’ (확률적인) 이라는 의미로 이해하는 것이 좋음.

벡터의 덧셈과 뺄셈

v \pm w = (v_{1} \pm w_{1}, v_{2} \pm w_{2} + ... + v_{n} \pm w_{n})

벡터의 실수배

kv = (kv_{1}, kv_{2}, ... , kv_{n})

선형(일차) 결합

R^{n} 의 벡터 w 가 임의의 실수 k_{1}, k_{2}, ... k_{r} 에 대하여

w = k_{1}v_{1}, k_{2}v_{2}, ... k_{r}v_{r} 의 형태로 쓰여지면 w v_{1}, v_{2}, ... v_{r} 의 선형(일차)결합이라 한다.

스칼라 곱

한 벡터가 다른 벡터의 방향에 대해 가한 힘에 의해 변화된 스칼라(크기), 점곱 또는 내적

  • 스칼라 결과를 얻어 내기 위한 벡터 곱
  • 점 곱(dot product) 또는 내적이라고도 한다.

v \cdot w = \|v\| \|w\| cos \theta = v{1}w_{1} + v_{2}w_{2} + ... + v_{n}w_{n}

(\theta 는 두 벡터 v, w 가 이루는 각)

  • 개념적으로 봤을 때 두 벡터의 스칼라 곱은 두 벡터의 크기를 곱한 것으로 정의한다.
  • 다만 벡터는 방향이라는 개념이 있기 때문에 단순 곱만이 아니라 추가적인 정의가 필요한데,
    • 일단 두 벡터 v, w가 같은 방향일 경우 스칼라 곱은 두 벡터의 곱으로 정의해 볼 수 있다.
      • \vec{v} \cdot \vec{w} = \|\vec{v}\| \times \|\vec{w}\|
    • 만일 두 벡터 v, w가 다른 방향일 경우, w를 v와 동일한 방향과 그렇지 않은 방향으로 분해해서 v와 곱할 수 있다.
      • 위 그림에서 w는 v와 일치하는 방향과 v와 수직인 방향으로 분해할 수 있는데, v와 일치하는 방향의 크기와 v를 곱한게 최종적인 벡터의 스칼라 곱으로 정의가 된다. (w의 크기보다 줄어드는데 이는 w의 수직 방향의 힘이 v와 같은 방향의 힘을 줄이기 때문이라고 이해할 수 있다.)
      • w를 v와 같은 방향의 벡터인 a와 v와 직교하는 방향의 벡터인 b로 분해하면 다음과 같은 수식으로 표현할 수 있다.
      • \vec{v} \cdot \vec{w} = \|\vec{v}\| \times \|\vec{a}\| = \|\vec{v}\| \times \|\vec{w}\| \times cos \theta
        • \vec{a} 의 크기는 \vec{w} 의 크기에 cos \theta 를 곱한 것과 같다.

벡터의 연산 성질

R^{n} 상의 벡터 u, v, w 와 스칼라 k, m 에 대하여 다음이 성립한다.

  • u + v = v + u
  • (u + v) + w = u + (v + w)
  • u + \vec{0} = \vec{0} + u = u
  • u + (-\vec{u}) = \vec{0}
  • k(u + v) = ku + kv
  • (k+m)u = ku + mu
  • k(mu) = (km)u
  • 1u = u
  • 0u = \vec{0}, k\vec{0} = \vec{0}
  • u \cdot v = v \cdot u
  • \vec{0} \cdot u = u \cdot \vec{0} = \vec{0}
  • u \cdot (v + w) = u \cdot v + u + \cdot w
  • (u + v) \cdot w = u \cdot w + v + \cdot w
  • k(u \cdot v) = (ku) \cdot v = u \cdot (kv)

벡터 곱

방향은 두 벡터에 동시에 수직이고 크기는 두 벡터의 평행사변형의 면적인 R^{3} 상의 벡터, 가위곱, 또는 외적

  • 벡터 결과를 얻어 내기 위한 벡터 곱
    • 같은 맥락에서 텐서 결과를 얻어 내기 위한 벡터 곱은 텐서 곱이라고 한다.
  • 가위 곱(cross product) 또는 외적 이라고도 한다.
    • 사실 외적이라는 표현은 적절하지 못한 표현인데, 텐서 곱이 외적이기 때문.
  • 벡터 곱은 오로지 3차원에서만 정의 되며, 2차원, 4차원 이상에서 정의 불가.
    • 반면 스칼라 곱은 N 차원에 대해 정의 가능.

v \times w = ( \left| \begin{array}{rr} v_{2} & v_{3} \\ w_{2} & w_{3} \end{array} \right|, -\left| \begin{array}{rr} v_{1} & v_{3} \\ w_{1} & w_{3} \end{array} \right|, \left| \begin{array}{rr} v_{1} & v_{2} \\ w_{1} & w_{2} \end{array} \right| )

  • 벡터 곱의 크기는 두 벡터의 크기의 곱이 되고 (평행사변형의 면적), 방향은 두 벡터에 동시에 수직인 방향이 된다.
    • 벡터 곱은 순서가 중요한데, 순서에 따라 벡터 곱의 방향이 바뀐다.
    • 위 예시에서 v \times w 는 위로, w \times v 는 아래로 가는 벡터가 된다.
  • 벡터 곱 연산은 두 벡터의 행렬식으로 계산된다.

벡터 곱의 성질

R^{3} 상의 벡터 u, v, w 와 스칼라 k 에 대하여 다음이 성립한다.

  • u \times v = -(v \times u)
    • 벡터 곱 순서를 바꾸면 방향이 반대가 된다.
  • u \times (v + w) = (u \times v) + (u \times w)
  • (u + v) \times w = (u \times w) + (v \times w)
  • k(u \times v) = (ku) \times v = u \times (kv)
  • u \times \vec{0} = \vec{0} \times u = \vec{0}
  • u \times u = \vec{0}
    • 자기 자신과 벡터 곱을 하면 영벡터가 된다.

벡터의 응용

직선의 표현

R^{2} 또는 R^{3} 에서 위치벡터가 a 인 점 A 를 지나며 방향벡터가 v 인 직선 상의 임의의 점 X 의 위치벡터 x

x = a + kv

을 만족한다. (단, k 는 임의의 실수)

  • 직선의 방정식이 아니라 벡터 –위치벡터와 방향벡터– 를 통해서도 직선을 표현할 수 있다는 뜻.
    • 위치벡터란 원점을 시점으로 하는 벡터를 뜻한다.
    • 방향벡터란 직선이 늘어나는 방향을 지시하는 벡터를 뜻한다.
  • y = x + 2 라는 직선의 방정식을 벡터를 이용해서 표현하면 (x, y) = (-1+k, 1+k) 의 꼴이 된다.

평면의 표현

R^{3} 에서 위치벡터가 a 인 점 A 를 지나며 법선벡터가 v 인 평면 상의 임의의 점 X 의 위치벡터 x

(x - a) \cdot v = 0

을 만족한다. 

  • 법선벡터는 평면상의 서로 다른 두 직선의 방향벡터들의 벡터 곱으로써 구하면 용이하다.
    • 법선벡터란 평면에 수직인 벡터를 뜻한다.

  • x - 2 + y + z = 0 라는 평면의 방정식을 벡터를 이용해서 표현하면 (x-2, y, z) 의 꼴이 된다.

이상엽/ 행렬과 행렬식

행렬

용어정리

용어 설명
성분 행렬 안에 배열된 구성원 (=항=원소)
행렬의 가로줄
행렬의 세로줄
m \times n 행렬 m 개의 행과 n 개의 열로 이루어진 행렬
주대각선 행렬의 왼쪽 위에서 오른쪽 아래를 가르는 선
대각성분

주대각선에 걸치는 행과 열의 지표수가 같은 성분 (i, i 성분)

대각성분으로만 이루어진 행렬을 대각행렬이라 한다.

ex) \left( \begin{array}{rrr} 1 & 0 & 0 \\ 0 & 2 & 0 \\ 0 & 0 & 3 \end{array} \right)

영행렬 모든 성분이 0인 행렬
전치행렬

(a_{ij}) 에 대하여 (a_{ji})  

i와 j의 자리를 바꾼 행렬

대칭행렬 A = A^{T} A
정사각행렬 행, 열의 개수가 같은 행렬
단위행렬 모든 대각성분이 1이고 그 외의 성분은 0인 정사각행렬

행렬의 연산

덧셈과 뺄셈

m \times n 행렬 A = (a_{ij}) , B = (b_{ij}) 에 대해

A \pm B = (a_{ij} \pm b_{ij})

상수배

m \times n 행렬 A = (a_{ij}) 에 대해

상수 c 에 대해 cA = (ca_{ij})

곱셈

m \times n 행렬 A = (a_{ij}) n \times r 행렬 B = (b_{jk}) 에 대해

AB = (c_{ik}) : m \times r 행렬

단, c_{ik} = \sum_{j = 1}^{n} a_{ij} b_{jk}

행렬의 곱셈은 교환법칙이 성립되지 않는다.

  • 행렬의 곱셈은 함수 합성과 비슷한 개념이다.
  • 두 함수가 f(x, y) = (ax+by, cx+dy), g(x, y) = (px+qy, rx+sy) 라고 할 때, 두 함수의 합성은 다음과 같다.
    • f \circ g \\ = (apx + aqy + brx + bsy, cpx + cgy + drx + dsy) \\ = ((ap+br)x + (aq+bs)y, (cp+dr)x + (cq+ds)y)
  • 두 행렬이 F = \left( \begin{array}{rr} a & b \\ c & d  \end{array} \right), G = \left( \begin{array}{rr} p & q \\ r & s  \end{array} \right) 라고 할 때, 두 행렬의 곱은 다음과 같다.
    • FG = \left( \begin{array}{rr} ap+br & aq+bs \\ cp+dr & cq+ds  \end{array} \right)
  • 결국 두 함수의 합성과 두 행렬의 곱이 결과가 같다.
    • 행렬의 곱의 규칙이 앞 행렬의 행과 뒤 행렬의 열을 곱하는 이유가 이러한 까닭.

연립일차방정식

행렬의 표현

예를 들어 \begin{cases} x + 2y = 5 \\ 2x + 3y = 8 \end{cases}

  1. \left( \begin{array}{rrr} 1 & 2 & 5 \\ 2 & 3 & 8 \end{array} \right) 는 가우스 조던 소거법
  2. \left( \begin{array}{rr} 1 & 2 \\ 2 & 3 \end{array} \right) \left( \begin{array}{r} x \\ y \end{array} \right) = \left( \begin{array}{r} 5 \\ 8 \end{array} \right) 은 역행렬을 이용

가우스 조던 소거법

다음 세 가지의 기본 행 연산을 통해 연립일차방정식의 첨가행렬을 기약 행사다리꼴로 변환하여 해를 구한다.

  1. 한 행을 상수배한다.
  2. 한 행을 상수배하여 다른 행에 더한다.
  3. 두 행을 맞바꾼다.

역행렬 이용

연립일차방정식 AX = B 에서 A 의 역행렬 A^{-1} 가 존재하면, X = A^{-1}B 이다

예를 들어

\left( \begin{array}{rr} 1 & 2 \\ 2 & 3 \end{array} \right) \left( \begin{array}{r} x \\ y \end{array} \right) = \left( \begin{array}{r} 5 \\ 8 \end{array} \right) \Leftrightarrow \left( \begin{array}{r} x \\ y \end{array} \right) = \left( \begin{array}{rr} 1 & 2 \\ 2 & 3 \end{array} \right)^{-1} \left( \begin{array}{r} 5 \\ 8 \end{array} \right)

행렬식

행렬식이란?

정사각행렬 A 를 하나의 수로써 대응시키는 특별한 함수. det A = |A|

  • 행렬식은 행렬보다 먼저 있었던 개념.

이때 A

0 \times 0 \Rightarrow det ( ) = 0

1 \times 1 \Rightarrow det (a) = a

2 \times 2 \Rightarrow det (\left( \begin{array}{rr} a_{11} & a_{12} \\ a_{21} & a_{22} \end{array} \right)) = a_{11} a_{22} - a_{12} a_{21}

3 \times 3 \Rightarrow det (\left( \begin{array}{rrr} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{array} \right)) \\ = a_{11} M_{11} - a_{12} M_{12} + a_{13} M_{13} \\ = a_{11} \left| \begin{array}{rr} a_{22} & a_{23} \\ a_{32} & a_{33} \end{array} \right| - a_{12} \left| \begin{array}{rr} a_{21} & a_{23} \\ a_{31} & a_{33} \end{array} \right| + a_{13} \left| \begin{array}{rr} a_{21} & a_{22} \\ a_{31} & a_{32} \end{array} \right| \\ = a_{11} a_{22} a_{33} + a_{12} a_{23} a_{31} + a_{13} a_{21} a_{32} - a_{13} a_{22} a_{31} - a_{11} a_{23} a_{32} - a_{12} a_{21} a_{33}  

  • M_{ij} 란 행렬 A 에서 i 행과 j 열을 제외한 나머지 행렬을 말함.
    • M은 Minor Matrix로 소행렬이라고 한다. (원래 행렬에서 일부를 제외한 나머지 행렬)
  • M은 꼭 1행을 기준으로 잡지 않아도 된다. 1열을 기준으로 하거나 다른 것을 기준으로 해도 결과는 같다.
    • 최종적으로 a_{11} a_{22} a_{33} + a_{12} a_{23} a_{31} + a_{13} a_{21} a_{32} - a_{13} a_{22} a_{31} - a_{11} a_{23} a_{32} - a_{12} a_{21} a_{33}   의 꼴이 나오기만 하면 되기 때문.
  • 사루스 법칙
    • 첫 번째 원소로부터 오른쪽 아래 대각선으로 그으면서 곱하여 더함. 모두 더한 후에는 가장 오른쪽 원소로부터 왼쪽 아래 대각선을 그으면서 앞의 값에서 뺀다.
    • 그러면 결국 a_{11} a_{22} a_{33} + a_{12} a_{23} a_{31} + a_{13} a_{21} a_{32} - a_{13} a_{22} a_{31} - a_{11} a_{23} a_{32} - a_{12} a_{21} a_{33}   의 꼴이 나옴.

4 \times 4 \Rightarrow det A = a_{11} M_{11} - a_{12} M_{12} + a_{13} M_{13} - a_{14} M_{14}

  • 행렬식의 계산은 위와 같이 일반화 된다.
    • 첫 행렬과 그 행렬이 포함된 행렬을 제외한 마이너 행렬을 곱한것을 차례로 더했다가 뺐다가를 반복하면 된다.
    • 이 계산을 일반화 하면 2×2 행렬에서 ad – bc가 되는 것도 같은 원리가 된다.

역행렬

행렬식이 0이면 역행렬이 존재하지 않는다. 즉, 행렬식이 0이 아닌 정사각 행렬 A 의 역행렬 A^{-1}

A^{-1} = { 1 \over det A } \left( \begin{array}{rrr} C_{11} & C_{22} & ... \\ C_{12} & C_{22} & ... \\ ... & ... & ... \end{array} \right) (단 C_{ij} = (-1)^{i+j} M_{ij} )

  • C 는 수반행렬이라고 한다.
  • C_{ij} M_{ij} 에 순서대로 +, -를 번갈아 붙인 값이 된다.
  • 수반행렬(C_{ij} ) 는 원래 행렬과 순서가 전치됨.

ex)

\left( \begin{array}{rr} a & b \\ c & d \end{array} \right)^{-1} = { 1 \over ad - bc } \left( \begin{array}{rr} d & -b \\ -c & a \end{array} \right)

  • 역행렬은 교환법칙이 성립한다.
    • AB = I \\ \Rightarrow BABB^{-1} = BIB^{-1} \\ \Rightarrow BAI = BB^{-1} \\ \Rightarrow BA = I

크래머 공식

연립일차방정식 AX = B 에서 A 가 행렬식이 0이 아닌 정사각행렬일 때,

x_{j} = { det A_{j} \over det A } = { \left| \begin{array}{rrrrr} a_{11} & ... & b_{1} & ... & a_{1n} \\ a_{21} & ... & b_{2} & ... & a_{2n} \\ ... & ... & ... & ... & ... \\ a_{n1} & ... & b_{n} & ... & a_{nn} \end{array} \right| \over \left| \begin{array}{rrrrr} a_{11} & ... & a_{1j} & ... & a_{1n} \\ a_{21} & ... & a_{2j} & ... & a_{2n} \\ ... & ... & ... & ... & ... \\ a_{n1} & ... & a_{nj} & ... & a_{nn} \end{array} \right| }

단, j = 1, ... , n 이고 A_{j} A j 번째 열을 B 의 원소로 바꾼 행렬이다.

  • 크래머 공식은 행렬 전체를 구하는게 아니라 그 중에 일부 원소에 대한 값만 빠르게 구할 수 있는 방법.
    • 행렬의 구조를 이용해서 정리한 내용이라 행렬 계산을 반복해서 보면 자명하게 이해된다.
    • 행렬 연산의 구조를 이용해서 이렇게 저렇게 짜맞추고 최종 결과를 이끌어 냄.

이상엽/ 선택공리

선택공리

선택함수

집합 X (\neq \emptyset) 의 부분집합들의 집합족을 \{ A_{i} \} 이라 할 때,

\forall i \in I, f(A_{i}) \in A_{i} f : \{ A_{i} \} \to X

선택공리

공집합이 아닌 임의의 집합에 대한 선택함수가 존재한다.

참고) 선택공리는 ‘공집합을 원소로 갖지 않는 서로소인 집합족 \mathcal{F} 의 원소들에서 하나씩 원소를 선택하여 갖는 집합이 존재한다’ 라고도 해석이 가능하다.

동치인 명제

극대원리

임의의 부분순서집합은 극대인 쇄를 갖는다.

조른의 원리

모든 쇄가 위로 유계인 부분순서집합의 극대원소를 갖는다.

정렬원리

모든 집합은 정렬가능하다.

즉, 모든 집합은 적당한 순서관계를 부여하여 정렬집합으로 만들 수 있다.

그 외의 명제들

  • 라그랑주 원리
  • 타르스키 원리
  • 티호노프 원리
  • 타이히뮐러-투키 원리
  • 임의의 두 기수의 비교가능원리
  • 모든 벡터공간의 기저존재원리

함의되는 명제

  • 괴델의 완전성 원리
  • 베르의 범주원리
  • 한-바나흐 원리
  • 바나흐-타르스키 역설
  • 닐센-슈라이어 원리
  • 모든 체의 대수적 폐포존재 원리

이상엽/ 집합의 순서

부분순서집합

정의

부분순서관계

반사적, 반대칭적, 추이적인 관계

  • ex 1) 두 집합 A, B 에 대하여 A \subseteq B
  • ex 2) 두 실수 x, y 에 대하여 x \leq x
  • ex 3) 두 자연수 n, m 에 대하여 n m 의 배수인 관계

부분순서집합

집합 A 상에 부분순서관계 \leq 가 주어진 경우 A 를 부분순서집합이라 하고 이를 (A, \leq) 로 나타내기도 한다.

  • 집합 A \leq 관계가 부여 됐을 뿐이지, 집합 A 의 모든 원소들이 순서 관계를 가져야 하는 것은 아니다.
  • ex) A = \{ \emptyset, \{ 1 \}, \{ 2 \}, \{ 1, 2 \} \} 일 때, 
    • 다음의 관계는 성립하지만
      • \emptyset \to \{ 1 \}  
      • \emptyset \to \{ 2 \}  
      • \emptyset \to \{ 1, 2 \}  
      • \{ 1 \} \to \{ 1, 2 \}  
      • \{ 2 \} \to \{ 1, 2 \}  
    • 다음의 관계는 성립하지 않는다.
      • \{ 1 \} \to \{ 2 \}
      • \{ 2 \} \to \{ 1 \}
    • 즉 모든 원소들이 부분순서 관계를 갖지는 않는다는 것.

극대원소와 극소원소

A 가 부분순서집합이라 할 때,

  • \forall x \in A, x \geq a \Rightarrow x = a 를 만족하는 A 의 원소 a 를 극대원소,
  • \forall x \in A, x \leq b \Rightarrow x = b 를 만족하는 A 의 원소 b 를 극소원소라 한다.
  • ex) 멱집합 P(X) 에서 \emptyset, X
  • 극대, 극소 원소는 유일하지 않다. 극대, 극소는 최대, 최소와는 다르다.
  • ex) 집합 A = \{ a, b, c, d, e \} 의 관계가 다음과 같다면
    • a \to c  
    • b \to c  
    • b \to d  
    • d \to e  
    • c, e는 극대원소가 되고
    • a, b는 극소원소가 된다.

최대원소와 최소원소

A 가 부분순서집합이라 할 때,

  • \forall x \in A, x \leq a 를 만족하는 A 의 원소 a 를 최대원소,
  • \forall x \in A, x \geq b 를 만족하는 A 의 원소 b 를 최소원소라 한다.
  • 극대, 극소와 달리 최대, 최소는 유일하다.

상한과 하한

  • 극대-극소, 최대-최소를 무한집합에 적용하기 어렵기 때문에 만들어진 개념이 상계-하계, 상한-하한
  • 해당 집합을 포함하는 집합을 더 큰 정의하고 그 더 큰 집합을 이용해서 상계-하계와 상한-하한을 정의함. 

상계와 하계

B 가 부분순서집합 A 의 부분집합이라 할 때,

  • \forall x \in B, x \leq a a \in A A 에서 B 의 상계,
  • \forall x \in B, x \geq b b \in A A 에서 B 의 하계라 한다.
  • 상계-하계는 항상 존재하지 않음.

상한과 하한

부분순서집합 A 의 부분집합 B 에 대하여

  • B 의 상계들의 집합이 최소 원소를 가질 때 이 원소를 A 에서 B 의 상한이라 하고, sup B 로 나타낸다.
  • B 의 하계들의 집합이 최대 원소를 가질 때 이 원소를 A 에서 B 의 하한이라 하고, inf B 로 나타낸다.
  • ex) A = [ 0, 1 ) \subset \mathbb{R} 에서 0, 1

절편과 절단

절편

부분순서집합 A 의 원소 a 에 대하여

  • S_{a} = \{ x \in A | x < a \}
    • 집합 아래에 표시된 숫자보다 작은 숫자들을 모은 집합이라고 생각하면 된다.
  • ex 1) \mathbb{R} 의 절편 S_{0} = (- \infty, 0)
  • ex 2) \mathbb{N} 의 절편 S_{3} = \{ 1, 2 \}

절단

  1. B \cap C = \emptyset, B \cup C = A
  2. x \in B \wedge y \leq x \Rightarrow y \in B
  3. x \in C \wedge x \leq y \Rightarrow y \in C

를 만족하는 부분순서집합 A 의 공집합이 아닌 부분집합들의 쌍 (B, C)

  • ex) \mathbb{R} 의 두 부분집합 M = (- \infty, 0), N = [0, \infty) 에 대하여 (M, N)
  • 일종의 분할과 비슷하다.

순서동형

순서보존함수

부분순서집합 A, B 에 대하여

  • 함수 f : A \to B 가 조건 \forall x, y \in A, x \leq y \Rightarrow f(x) \leq f(y) 을 만족하면
  • f 를 순서보존함수라 한다.
  • 순서만 보장되면 되기 때문에, 집합 A와 집합 B의 크기가 달라도 무방하다.

순서동형

부분순서집합 A, B 에 대하여

  • 함수 f : A \to B 가 전단사이고 \forall x, y \in A, x \leq y \Rightarrow f(x) \leq f(y) 이면 f 를 순서동형사상이라 한다.
  • 이때 A, B 는 순서동형이라 하고 A \simeq B 로 나타낸다.
  • ex) 항등함수 I_{A} : A \to A

전순서집합

전순서집합

비교가능

부분순서집합 A 의 두 원소 x, y x \leq y \vee y \leq x 이면 x, y 는 비교가능하다고 한다.

  • ex) 집합 A = \{ a, b, c, d \} 의 관계가 다음과 같을 때
    • a \to c  
    • b \to c  
    • c \to d  
    • 다른 원소들 간에는 비교가 가능하지만 a와 b는 비교가 불가능하다.

전순서집합

부분순서집합 A 의 임의의 두 원소가 비교가능하면 A 를 전순서집합이라고 한다.

  • 집합 내의 모든 원소가 비교 가능한 상태이면 전순서집합이 된다.

부분순서집합 A 의 전순서 부분집합 B A 에서의 쇄라고 한다.

  • ex) 집합 A = \{ a, b, c, d \} 의 관계가 다음과 같을 때
    • a \to c  
    • b \to c  
    • c \to d  
  •  A 는 전순서 집합이 아니지만, 만일 A 의 부분집합을  B = \{ a, c, d \} 로 잡으면 B 는 전순서집합이 되고, 이 때 B A 의 쇄라고 한다.

정렬집합

부분순서집합 A 의 공집합이 아닌 모든 부분집합 B 가 최소원소를 가지면, 그리고 그 때에만 집합  A 를 정렬집합이라 한다.

  • ex)
    • ((0, 1), \leq) 는 전순서집합이긴 하지만, 최소 원소를 갖고 있지 않기 때문에 정렬집합은 아니다.
    • (\mathbb{N}, \leq) 는 전순서집합이기도 하고 정렬집합이기도 하다.
  • 따라서 정렬집합이면 전순서집합이다. 그 역은 성립하지 않는다.

서수

서수의 개념

서수

집합의 길이를 나타내는 수

  1. 모든 정렬집합 A 에 대하여 서수가 존재하며, 모든 순서수 \alpha 에 대하여, o(A) = \alpha 인 정렬집합 A 가 존재한다.
    • 책에 따라 ord(A) 라고 표기하기도 함.
  2. A \approx B \Leftrightarrow o(A) = o(B)
  3. A = \emptyset \Leftrightarrow o(A) = 0
  4. A \approx \{ 1, 2, ... , k \} \Leftrightarrow o(A) = k
  • 기수와 서수의 가장 큰 차이는 구조가 들어가느냐 하는 것.

유한서수와 초한서수

유한서수란 유한정렬집합의 기수이고, 초한서수란 무한정렬집합의 서수이다.

  • <대표적인 초한서수>
    • \omega = o(\mathbb{N})

서수의 순서

정렬집합 A, B 에 대하여 o(A) = \alpha, o(B) = \beta 일 때,

  • A B 의 절편과 순서동형이면 \alpha \beta 보다 작거나 같다고 하며 \alpha \leqslant \beta 로 나타낸다.
  • 이때 특히 \alpha \neq \beta 이면 \alpha < \beta 로 나타낸다.

서수의 연산

서수 합

서로소인 두 집합 A, B 의 서수를 각각 \alpha, \beta 라고 할 때 \alpha + \beta = o(A \cup B)

  • ex) A = \{ 1 \}, B = \{ a, b \} 라면 
    • B B_{1} = \{ 2, 3 \} 로 변환한 후에
    • 그 둘을 합하여 A \cup B = \{ 1, 2, 3 \}   을 만든다.

서수 곱

서로소인 두 집합 A, B 의 서수를 각각 \alpha, \beta 라고 할 때\alpha \beta = o(B \times A)

  • 순서쌍의 순서는 앞의 것을 먼저, 뒤의 것을 그 다음에 보는 것이 자연스럽다 –사전식 순서
  • 뒤의 것을 앞으로 놓고 곱하는 것이 사전식 순서 결과를 만들 수 있기 때문에 서수곱은 뒤의 것을 먼저두는 식으로 한다. 이것은 일종의 수학적 약속.

연산 법칙

임의의 서수 \alpha, \beta, \gamma 에 대하여 다음이 성립한다.

  • 결합법칙
    • (\alpha + \beta) + \gamma = \alpha + (\beta + \gamma)
    • \alpha (\beta \gamma) = (\alpha \beta) \gamma
  • 분배법칙
    • \alpha (\beta + \gamma) = \alpha \beta + \alpha \gamma
    • 단 (\alpha + \beta) \gamma \neq \alpha \gamma + \beta \gamma
      • 좌측 분배 법칙은 성립하지만, 우측 분배 법칙은 성립하지 않는다.
      • 2 \cdot (\omega + 1) = 2 \cdot \omega + 2
      • (\omega + 1) \cdot 2 \neq \omega \cdot 2 + 2
  • 일반적으로 서수는 합과 곱에 대하여 교환법칙이 성립하지 않는다.
    • 1 + \omega \neq \omega + 1
    • 2 \cdot \omega \neq \omega \cdot 2
  1.