Tag Archives: 수학

이상엽/ 해석학/ 극한과 연속

함수의 극한

무한소와 극한

  • 무한소란 ‘무한히 작은 수’를 일컫는 직관적인 개념으로 고전적으로 미적분을 설명하기 위해 쓰였다.
    • 아르키메데스가 최초로 정립함. 이를 뉴턴과 라이프니츠가 이용해서 미적분학을 정립
    • 무한소는 미적분을 설명하는 도구이지만, 극한을 설명하는 동구는 아니다.
  • 실수체에는 무한소가 존재하지 않으며 \epsilon-\delta 논법으로 정의된 극한으로써 미적분을 설명한다.
    • 예전에는 무한소를 이용해서 미적분을 설명했지만 \epsilon-\delta 논법이 등장한 이후 극한으로 미적분을 설명함으로써 무한소는 수학계에서 사용되지 않음
  • 초실수체에서는 무한소로써 미적분을 설명 가능하다. (비표준 해석학)
    • 초실수체는 무한소를 공리로 받아들임. 초실수체는 순서체일 뿐 완비순서체가 아님. 조밀성이 성립하지 않음.
    • 비표준 해석학에서는 미적분을 무한소로 정의할 뿐. 극한으로 설명하지는 않는다. 무한소와 극한은 양립 불가능한 개념

극한의 정의

Def 1. [수렴과 극한(값)]

f : D \to \mathbb{R}, a \in D, L \in \mathbb{R} 라 하자

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, 0 < \| x - a \| < \delta \Rightarrow \|f(x) - L \| < \epsilon

이 성립하면 f x = a 에서 극한(값) L 로 수렴한다고 하고 \lim_{x \to a} f(x) = L 로 표기한다.

수렴하지 않는 경우엔 발산한다고 한다.

  • \| x - a \| 가 0이 되어버리면 f(a) 가 되어버리기 때문에 \| x - a \| 는 극한을 정의하기 위해서는 반드시 0보다 커야 함.
  • \forall \epsilon > 0  에 대하여 \| f(x) - L \| < \epsilon 가 성립하려면  \| f(x) - L \| 는 0이 되어야 한다.
  • 고로 극한값 L f(a) 의 값과 완전히 동일한다. L f(a) 에 다가가는 것이 아니다. 둘은 완전히 같다.

Def 2. [우극한과 좌극한]

f : D \to \mathbb{R}, a \in D, L \in \mathbb{R} 라 하자

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, 0 < x - a < \delta \Rightarrow \|f(x) - L \| < \epsilon

이 성립하면 f x = a 에서 우극한 L 을 갖는다고 하고 \lim_{x \to a^{+}} f(x) = f(a{+}) = L 로 표기한다.

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, 0 <  a - x < \delta \Rightarrow \|f(x) - L \| < \epsilon

이 성립하면 \lim_{x \to a^{-}} f(x) = f(a{-}) = L (좌극한)

  • 우극한은 x a 보다 큰거고, 좌극한은 x a 보다 작은 것

Def 3.

a, L \mathbb{R} 라 하자

  1. \forall \epsilon > 0, \exists N \in \mathbb{R}, s.t. x \geq N \Rightarrow \|f(x) - L\| < \epsilon 일 때 \lim_{x \to \infty} f(x) = L
  2. \forall M > 0, \exists \delta > 0, s.t. 0 < \|x - a|\ < \delta \Rightarrow f(x) > M 일 때 \lim_{x \to a} f(x) = \infty
  3. \forall M > 0, \exists N \in \mathbb{R}, s.t. x \geq N \Rightarrow f(x) > M 일 때 \lim_{x \to \infty} f(x) = \infty
  • 일반적으로 임의의 작은 양수는 \epsilon 을 쓰고 임의의 큰 양수는 M 을 쓴다.

극한의 연산

A, B \in \mathbb{R} 이고 f, g : D \to \mathbb{R} 이며 a \in D 라 하자.

\lim_{x \to a} f(x) = A, \lim_{x \to a} g(x) = B 이면 다음이 성립한다.

  1. \lim_{x \to a} { f(x) + g(x) } = A + B
  2. \lim_{x \to a} { f(x) - g(x) } = A - B
  3. \lim_{x \to a} f(x) g(x) = AB
  4. \lim_{x \to a} { f(x) \over g(x) } = {A \over B}
  • 삼각부등식
    • \| a + b \| \leq \|a\| + \|b\|
    • \| a - b \| \geq \|a\| - \|b\|

주요 정리

Thm 1. [극한의 유일성]

f : D \to \mathbb{R}, a \in D 일 때 \lim_{x \to a} f(x) 가 수렴하면 그 극한값은 유일하다.

Thm 2. [샌드위치 정리]

\forall x \in D, f(x) \leq g(x) \leq h(x) 이고

L \in \mathbb{R} 일 때 \lim_{x \to a} f(x) = \lim_{x \to a} h(x) = L 이면 \lim_{x \to a} g(x) = L 이다.

함수의 연속

  • 극한과 함수값이 같을 때 연속이라고 정의

연속의 정의

Def 1. [점 연속]

f : D \to \mathbb{R} 이고 a \in D 라 하자.

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, \|x-a\| < \delta \Rightarrow \|f(x) - f(a)\| < \epsilon

이 성립하면 f x = a 에서 연속이라 한다.

  • a \in D 라는 것이 f(a) 가 정의된다는 뜻
  • 극한과 다른 부분이 \|x-a\| < \delta 부분으로, 극한에서는 0보다 커야 하지만 연속에서는 0이 됨.
  • \|x-a\| < \delta \Rightarrow \|f(x) - f(a)\| < \epsilon f(a) = \lim_{x \to a} f(x) 와 동일한 의미. a 에서의 f(x) 의 극한 값이 f(a) 와 동일하다.

ex) D = \{ 0, 1, 2, 3 \} 일 때, f : D \to \mathbb{R}, f(x) = -x + 3 이면 f x = 2 에서 연속임을 증명하라

\forall \epsilon > 0, Let. \delta = { 1 \over 2 } ( > 0)

Then. \| x - 2 \| < \delta (= {1 \over 2}) \ \forall \epsilon > 0, let \delta = { 1 \over 2 } \Rightarrow x = 2 \in D \

\therefore \| f(x) - f(2) \| = |\ f(2) - f(2) | = 0 < \epsilon

위 정의역의 원소들은 불연속적이지만, x = 2 일때 연속임이 증명된다.

Def 2. [우연속과 좌연속]

f : D \to \mathbb{R} 이고 a \in D 라 하자.

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, 0 \leq x - a < \delta \Rightarrow \|f(x) - f(a)\|< \epsilon

이 성립하면 f x = a 에서 우연속이라 한다.

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, 0 \leq a - x < \delta \Rightarrow \|f(x) - f(a)\|< \epsilon

이 성립하면 f x = a 에서 좌연속이라 한다.

Def 3. [연속함수]

f : D \to \mathbb{R} 이고 X \subseteq D 라 하자.

  1. 만약 f X 의 모든 점에서 연속이면 f X 에서 연속이라 한다.
  2. 만약 f X 의 모든 점에서 연속이면 f 는 연속함수라 한다.
    • 모든 점에서 연속임을 증명 하는 방법
      1. x = a 에서 연속임을 보인다.
      2. a 가 정의역에서 임의의 점임을 보인다.

Def 4. [불연속점의 종류]

f : D \to \mathbb{R} 이고 a \in D 라 하자.

[제 1종 불연속점]

  1. \lim_{x \to a^{+}} f(x) = \lim_{x \to a^{-}} f(x) \neq f(a) x = a 를 제거 가능 불연속점이라 한다.
    • 그 한 점에서만 새로 정의를 해주면 연속으로 만들 수 있다.
    • 전체에서 문제가 되는 점이 한 점 뿐이라면 (수학에서도) 무시할 수 있다.
  2. \lim_{x \to a^{+}} f(x) \neq \lim_{x \to a^{-}} f(x) x = a 를 비약 불연속점이라 한다.

[제 2종 불연속점]

\lim_{x \to a^{+}} f(x) \lim_{x \to a^{-}} f(x) 중에 적어도 하나가 존재하지 않는다.

균등 연속 (uniformly continuous)

Def. [균등 연속]

f : D \to \mathbb{R} 이라 하자.

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x, y \in D, \|x-y\| < \delta \Rightarrow \|f(x) - f(y)\| < \epsilon

이 성립하면 f D 에서 균등 연속이라 한다.

Thm. f D 에서 균등 연속이면 연속이다.

연속함수의 연산

a \in D 이고 f, g : D \to \mathbb{R} x = a 에서 연속일 때 다음이 성립한다.

  1. f + g x = a 에서 연속이다.
  2. f - g x = a 에서 연속이다.
  3. fg x = a 에서 연속이다.
  4. g(a) \neq 0 이면 {f \over g} x = a 에서 연속이다.

주요 정리

Thm 1. [최대 최소정리]

f [a, b] 에서 연속

\Rightarrow \exists a_{0}, b_{0} \in [a, b] s.t. \forall x \in [a, b], f(a_{0}) \leq f(x) \leq f(b_{0})

  • 연속인 구간 내에서 반드시 최대, 최소를 정의할 수 있다.

Thm 2. [사잇값(중간값) 정리]

f [a, b] 에서 연속이고

f(a) < f(b) \Rightarrow \exists c \in (a, b) s.t. f(a) < p < f(b), f(c) = p

f(b) < f(a) 이면 f(b) < p < f(a)

  • 연속인 구간 내의 두 함수 값 사이에 반드시 값이 존재한다.

이상엽/ 해석학/ 실수체계

자연수

  • 자연수로부터 실수체계를 단계적으로 구성 가능하다는 것을 바이어슈트라스, 데데킨트가 증명 함

페아노 공리계

자연수는 다음의 다섯 가지 공리로 이루어진 페아노 공리계를 만족하는 수체계이다.

  1. 1 \in \mathbb{N}
  2. n \in \mathbb{N} \Rightarrow n' \in \mathbb{N}
  3. \forall n \in \mathbb{N}, 1 \neq n'
    • 1은 자연수의 최소원소
  4. \forall m \in \mathbb{N}, n' \neq m' \Rightarrow n = m
    • 자연수의 순서 구조가 순환하는 것을 방지하기 위한 공리
    • 만일 1 다음이 2, 2 다음이 3, 3 다음이 4, 4 다음이 2라는 집합이 있다면 1의 다음수와 4의 다음수가 같아져 버리는 경우가 발생. 그래서 다음 수가 같다면 두 수는 같다고 정의가 필요.
  5. 1 \in S \wedge (\forall n \in S, n' \in S) \Rightarrow \mathbb{N} \subseteq S
    • 집합 내에 1이 존재하고 집합 내 모든 원소가 다음 수를 갖는 집합은 자연수 집합을 포함한다.
    • 1 \in S \wedge (\forall n \in S, n' \in S) 을 만족하는 집합을 계승집합이라고 한다.
    • 자연수 집합은 가장 작은 계승집합이다.

‘1’과 ‘그 다음 수’는 무정의 용어이다. (primitive notion, 더는 정의를 할 수 없는 근본 원리)

Thm. [수학적 귀납법]

n' = n + 1 이라 정의할 때, 명제 P(n) 에 대하여 두 조건

  1. P(1) 이 참
  2. P(n) 이 참 P(n+1) 이 참

이 성립하면 P(n) 은 모든 자연수 n 에 대하여 참이다.

(수학적 귀납법의 이론적 근거가 페아노 공리계의 5번째 공리)

자연수의 성질

  1. 정렬성
    • 자연수집합 \mathbb{N} 의 공집합이 아닌 부분집합은 항상 최소원소를 갖는다.
  2. 자연수 집합 \mathbb{N} 은 위로 유계가 아니다.
  3. 아르키메데스 성질
    • \forall \epsilon > 0, \exists n \in \mathbb{N} s.t. {1 \over n} < \epsilon
    • 어떤 양수든 그보다 더 작은 유리수가 적어도 1개 존재한다
  • 정리란 참인 명제
  • 성질은 정리로부터 자연스럽게 파생되는 것들
  • 법칙은 연산의 규칙

유리수와 무리수

  • 바빌로니아인들이 유리수를 사용했다는 증거가 있음
  • 무리수는 기원전 500년경 등장

집합의 구성

  1. 정수 집합
    • \mathbb{Z} = (-\mathbb{N}) \cup \{ 0 \} \cup \mathbb{N}
  2. 유리수 집합
    • \mathbb{Q} = \{ {m \over n} | m, n \in \mathbb{Z}, n \neq 0 \}
  3. 무리수 집합
    • \mathbb{I} = \mathbb{R} - \mathbb{Q} 

(위는 간략한 표현일 뿐 엄밀한 정의는 아님)

조밀성

Thm 1. [유리수의 조밀성]

\forall a, b \in \mathbb{R}, a < b \Rightarrow \exists r \in \mathbb{Q} s.t. a < r < b

어떤 두 실수 사이에도 유리수가 적어도 1개 존재한다.

증명)

  • case 1) 0 < a < b
    • a < b \Leftrightarrow 0 < b - a \Rightarrow \exists n \in \mathbb{N} (s.t. {1 \over n} < b - a) (아르키메데스 성질)
    • Let. S = \{ m \subseteq \mathbb{N} | m > na \} Then. S \neq \phi (위로 유계 아님 성질)
    • \therefore S (\subseteq \mathbb{N}) 의 최소원소는 m (정렬성 성질)
    • m > na \Leftrightarrow a < {m \over n}
    • m - 1 \notin S \Rightarrow m - 1 \leq na \Rightarrow {m - 1 \over n} \leq a
    • \therefore a < {m \over n} = {m -1 \over n} + {1 \over n} \leq a + {1 \over n} < b
  • case 2) a < 0 < b
    • 0이 유리수이므로 자명 trivial
  • case 3) a < b < 0
    • \Rightarrow 0 < -b < -a
    • \Rightarrow 0 < -b < -a
    • \therefore r \in \mathbb{Q} (s.t. - b < r < -a, \because case 1)
    • \Rightarrow a < -r < b

Thm 2. [무리수의 조밀성]

\forall a, b \in \mathbb{R}, a < b \Rightarrow \exists s \in \mathbb{I} s.t. a < s < b

어떤 두 실수 사이에도 무리수가 적어도 1개 존재한다.

증명)

  • a < b
    • \Rightarrow a + \sqrt{2} < b + \sqrt{2}
    • \exists r \in \mathbb{Q} s.t. a + \sqrt{2} < r <  b + \sqrt{2}
      • (유리수 조밀성, 어떤 두 실수 사이에도 유리수가 유리수 r 이 존재)
    • Let. s = r - \sqrt{2} \in \mathbb{I}
    • Then. a + \sqrt{2} < r < b + \sqrt{2} \Rightarrow a < s < b

실수

  • 히파소스가 수론적인 접근이 아니라 직각 이등변 삼각형을 이용해서 무리수를 발견하자. 그 전까지는 수론적인 논의가 융성했던 수학 흐름이 기하학으로 넘어감.
  • 그러나 기하적인 수 체계의 정의는 직관에 기댄 것이기 때문에 현대 수학에 이르러 수학적 엄밀성을 위해 실수 체계에 대한 공리가 만들어짐.

체 공리

집합 S S 에 부여된 두 이항연산 +, \cdot 가 다음 9개의 공리를 만족하면, 대수구조 (S, + \cdot) 를 체라 한다.

  1. x, y \in S \Rightarrow x + y = y + x
    • 덧셈에 대한 교환법칙
  2. x, y, z \in S \Rightarrow x + (y + z) = (x + y) + z
    • 덧셈에 대한 결합법칙
  3. \forall x \in S, \exists 0 \in S s.t. 0 + x = x
    • 덧셈에 대한 항등원
  4. \forall x \in S, \exists -x \in S s.t. x + (-x) = 0
    • 덧셈에 대한 역원 (연산 결과가 항등원이 나오게 하는 것)
  5. x, y \in S \Rightarrow x \cdot y = y \cdot x
    • 곱셈에 대한 교환법칙
  6. x, y, z \in S \Rightarrow x \cdot (y \cdot z) = (x \cdot y) \cdot z
    • 곱셈에 대한 결합법칙
  7. \forall x \in S, \exists 1(\neq 0) S s.t. 1 \cdot x = x
    • 곱셈에 대한 항등원. 곱셈의 항등원과 덧셈의 항등원이 달라야 하는 것이 공리
  8. \forall x (\neq 0) \in S, \exists x^{-1} \in S s.t. x \cdot (x^{-1}) = 1
    • 곱셈에 대한 역원
  9. x, y, z \in S \Rightarrow x \cdot (y + z) = x \cdot y + x \cdot z
    • 덧셈과 곱셈에 대한 분배법칙

(\mathbb{Q}, +, \cdot) (\mathbb{R}, +, \cdot) 는 모두 체다. (유리수 체, 실수 체)

  • 체 공리는 실수의 대수적 성질에 대한 것
  • 집합에 연산을 부여한 것을 대수적 구조라고 한다.
  • 이항연산은 집합 내의 원소들에 대해 연산을 한 결과가 집합 내에 존내하는 연산을 의미 –닫혀있는 연산

순서공리

순서 공리

\mathbb{R} 에는 다음 두 조건을 만족하는 공집합이 아닌 부분집합 P 가 존재한다.

  1. \forall x, y \in P, x + y \in P \wedge xy \in P
    • 집합 원소 간 덧셈과 곱셈이 모두 집합 내에 존재. 덧셈과 곱셈에 대해 닫힌 집합
  2. 임의의 x \in \mathbb{R} 에 대하여 다음 중 단 하나만 성립한다.
    1. x \in P
    2. x = 0
    3. -x \in P

위 조건을 만족하면 P 는 양의 실수 집합이 됨

삼분성질

Def. [부등식의 정의]

임의의 a, b \in \mathbb{R} 에 대하여

  1. a - b \in P \Rightarrow a > b \vee b < a
  2. a - b \in P \cup \{ 0 \} \Rightarrow a \geq b \vee b \leq a

순서 공리로부터 부등식을 정리함. P 는 양의 실수 집합이기 때문에 위와 같이 됨.

Thm. [삼분성질]

임의의 a, b \in \mathbb{R} 에 대하여 다음 중 단 하나만 성립한다.

  1. a > b
  2. a = b
  3. a < b

완비성 공리

  • Completeness. 연속성 공리라고도 함. 유리수의 조밀성을 뛰어넘는 실수의 조밀성.

완비성 공리

\mathbb{R} 의 공집합이 아닌 부분집합이 위로 유계이면 그 부분집합은 상한을 갖는다. (완비성 공리를 만족한다는 것은 부분집합의 상한을 원래 집합 내에서 잡을 수 있다는 것)

Def. [상한] 부분순서집합 A 의 부분집합 B 의 상계들의 집합이 최소원소를 가질 때 그 최소원소를 B 의 상한이라 하고 sup B 로 나타낸다.

유리수 집합은 완비성 공리를 만족하지 못함

주요 정리

Thm 1. 상한은 유일하다.

Thm 2. s \in \mathbb{R} 가 집합 S 의 상계일 때 다음 세 명제는 동치이다.

  1. s = sup S
  2. \forall \epsilon > 0, \exists x \in S s.t. s - \epsilon < x \leq s
  3. \forall \epsilon > 0, S \cap ( s - \epsilon, s ] \neq \phi

Thm 3. \mathbb{Q} 는 완비성을 갖지 않는다.

완비성 공리로부터 ‘1. 자연수 > (2) 자연수의 성질 > 2’도 증명 가능하다.

완비성의 예 – 무한소수

위로 유계인 임의의 무한소수 부분집합을 A 라 하자 이제

a_{0} = max \{ x_{0} | x_{0}. x_{1} x_{2} x_{3} ... \in A \}

a_{1} = max \{ x_{1} | a_{0}. x_{1} x_{2} x_{3} ... \in A \}

...

a_{k} = max \{ x_{k} | a_{0}. a_{1} ... a_{k-1} x_{k} x_{k+1} ... \in A \}

라 하면, 무한소수 a_{0}. a_{1} a_{2} a_{3} ... 은 집합 A 의 상한이다. 즉, 무한소수의 집합은 완비성 공리를 만족한다.

실수는 완비성, 순서성을 만족하는 체. 완비순서체라고도 한다.

이상엽/ 해석학/ 집합론 복습

집합

  • 현대 수학은 공리 –약속된 명제– 들로부터 논리를 쌓아가는 학문.
  • 수학의 가장 기본이 되는 공리계인 ZFC가 10개의 집합에 대해 서술하고 있음.
  • 대부분의 수학적 대상은 모두 집합으로 정의가 됨.
    • 사칙연산은 함수의 일종이고 함수는 집합으로 정의가 됨.

정의

다음 성질들을 만족시키는 원소 x 들의 모임을 집합이라 한다. (아래는 소박한 정의, 현대적 정의는 공리계가 따로 있음)

  1. 집합에 속하거나 속하지 않거나 둘 중 하나로써 명확하다.
  2. 원소들끼리는 서로 다르다.
  3. 원소들끼리는 순서에 따른 구분이 없으며, 연산이 주어지지 않는다.
  • x 가 집합 X 의 원소이면 x \in X 로 표현하고 원소가 아니면 x \notin X 로 표현한다.
  • 집합 U 의 원소 중에서 명제 P 를 만족시키는 원소로 이루어진 집합 X 를 조건제시법으로 X = \{ x \in U | P(x) \} 라 표현하며, 이때 U 를 전체집합이라 한다.
  • 공집합은 아무런 원소를 가지지 않는 집합이며, 기호로 \phi 라 표현한다.

집합의 연산

합집합

집합 I = \{ 1, 2, ... , n \} 에 대하여 집합들 A_{i} (i \in I) 의 합집합은 (여기서 i 는 첨수라 하고 그 첨수들 모은 집합인 I 를 첨수족이라 한다)

\cup_{i \in I} A_{i} = \{ x | \exists i \in I s.t. x \in A_{i} \}

이고 특히 두 집합 A B 의 합집합을

A \cup B = \{ x | x \in A \vee x \in B \}

라 표현한다.

교집합

집합 I = \{ 1, 2, ... , n \} 에 대하여 집합들 A_{i} (i \in I) 의 교집합은

\cap_{i \in I} A_{i} = \{ x | \forall i \in I s.t. x \in A_{i} \}

이고 특히 두 집합 A B 의 교집합을

A \cap B = \{ x | x \in A \wedge x \in B \}

라 표현한다.

곱집합

집합 I = \{ 1, 2, ... , n \} 에 대하여 집합들 A_{i} (i \in I) 의 곱집합은 (데카르트곱 또는 카테시안곱이라고 한다. 카테시안은 데카르트의 라틴어 표현)

\Pi_{i \in I} A_{i} = \{ (x_{i})_{i \in I} | \forall i \in I s.t. x \in A_{i} \}

  • 여기서 (x_{i})_{i \in I} 는 튜플이라고 한다. 순서쌍이라고도 하는데 순서쌍은 원소가 2개짜리 튜플을 의미.
  • 튜플이란 여러 개 원소를 순서 있게 나열한 것.

이고 특히 두 집합 A B 의 곱집합을

A \times B = \{ (x_{1}, x_{2}) | x_{1} \in A \wedge x_{2} \in B \}

라 표현한다.

차집합

집합 A 에 속하지만 집합 B 에는 속하지 않는 원소의 집합을

A - B = \{ x | x \in A \wedge x \notin B \} = A \cap B^{c}

라 표현하며, A B 의 차집합이라 한다.

전체집합 U 에 대하여 U - A = A^{c} 라 표현하며 A 의 여집합이라 한다.

  • 다음이 성립한다.
    • 드모르간 법칙
      • (\cup_{i \in I} A_{i})^{c} = \cap_{i \in I} A_{i}^{c}
      • (\cap_{i \in I} A_{i})^{c} = \cup_{i \in I} A_{i}^{c}
    • 분배 법칙
      • A \cap (\cup_{i \in I} B_{i}) = \cup_{i \in I} (A \cap B)
      • A \cup (\cap_{i \in I} B_{i}) = \cap_{i \in I} (A \cup B)
      • A \times (B \cap C) = (A \times B) \cap (A \times C)
      • A \times (B \cup C) = (A \times B) \cup (A \times C)
      • A \times (B - C) = (A \times B) - (A \times C)

포함관계

  • 만약 집합 A 에 속하는 모든 원소가 집합 B 의 원소이기도 하면 A \subseteq B 라 표현하며, A B 의 부분집합이라 한다.
  • 만약 A \subseteq B 이면서 동시에 B \subseteq A 이면 A = B 라 표현하며, A B 가 서로 같다고 한다.
  • 만약 A \subseteq B 이면서 A \neq B 이면 A \subset B 라 표현하며, A B 의 진부분집합이라 한다.
  • 집합 A 의 모든 부분집합들의 집합을 P(A) 라 표현하며 A 의 멱집합이라 한다. (P는 Power Set)
  • 집합 기호
    • \mathbb{N} : 모든 자연수의 집합
    • \mathbb{Z} : 모든 정수의 집합
    • \mathbb{Q} : 모든 유리수의 집합
    • \mathbb{R} : 모든 실수의 집합
    • \mathbb{C} : 모든 복수수의 집합

함수

정의

두 집합 X, Y 에 대하여 아래 두 조건을 만족하는 X \times Y 의 부분집합 f 를 함수라 한다. (두 집합의 곱집합의 부분집합이 함수가 됨)

  • \forall x \in X, \exists y \in Y, s.t. (x, y) \in f
    • (모든 x y 값을 갖는다)
  • (x, y_{1}) \in f \wedge (x, y_{2}) \in f \Rightarrow y_{1} = y_{2}
    • (x y 값을 1개만 갖는다)

이때 함수를 f : X \to Y 라 표현하며, (x, y) \in f 이면 y = f(x) 라 표현한다.

  • 집합 A \subseteq X 및 함수 f : X \to Y 에 대하여 f(A) = \{ f(a) | a \in A \} A 의 상(Image)이라 한다.
  • 집합 B \subseteq Y 및 함수 f: : X \to Y 에 대하여 f^{-1}(B) = \{ x \in X | f(x) \in B \} B 의 원상(Pre Image)이라 한다.
  • f : X \to Y 에서 X 를 정의역(Domain) Dom(f) , Y 를 공역(Codomain) f(X) = \{ f(x) | x \in X \} 를 치역(Range) Rng(f) 라 한다.

함수의 종류

함수 f : X \to Y 에 대하여

  • 전사: Rng(f) = Y
    • (치역 = 공역, 남는 y 가 없다)
  • 단사: x_{1} \neq x_{2} \in X \Rightarrow f(x_{1}) \neq f(x_{2})
    • (y x 를 1개씩 갖는다)
  • 전단사: 전사이고 단사인 함수. 일대일대응이라고도 한다.

  • 1
    • Y 에 남는 값이 있기 때문에 전사가 아님
    • Y 에 2개의 화살을 받는 값이 있으므로 단사가 아님
    • 고로 전사도 단사도 아님
  • 2
    • Y 에 남는 값이 있기 때문에 전사가 아님
    • Y 에 2개의 화살을 받는 값이 없으므로 단사가 됨
    • 고로 단사지만 전사는 아님. 단사 함수.
  • 3
    • Y 에 남는 값이 없기 때문에 전사가 됨
    • Y 에 2개의 화살을 받는 값이 있으므로 단사가 아님
    • 고로 전사지만 단사는 아님. 전사 함수
  • 4
    • Y 에 남는 값이 없기 때문에 전사가 됨
    • Y 에 2개의 화살을 받는 값이 없으므로 단사가 됨
    • 고로 전단사(일대일 대응) 함수가 됨.

여러 가지 함수

  • 항등함수: \forall x \in X, I_{X}(x) = x
    • (자기 자신이 그대로 나오는 함수)
  • 상수함수: \exists y_{0} \in Y, f(X) = y_{0}
    • (어떠한 값을 넣어도 항상 상수가 나옴)
  • 역함수: 전단사인 f : X \to Y 에 대해 f^{-1} : Y \to X
    • (함수를 뒤집은 함수인데, 전단사여야만 역함수가 가능)
  • 합성함수: 두 함수 f : X \to Y, g : Y \to Z \forall x \in X, (g \circ f)(x) = g(f(x))

집합의 크기

정의

  • 집합의 크기란 집합의 원소 개수에 대한 척도이다.
  • 두 집합 X, Y 에 대하여 전단사함수 f : X \to Y 가 존재하면 X Y 는 동등이며, X \approx Y 라 표현한다.
  • 집합 X 의 적당한 진부분집합 Y X 와 동등하면 X 는 무한집합이다.
  • 무한집합이 아닌 집합을 유한집합이라 한다.
  • 집합 X X \approx \mathbb{N} 일 때 X 를 가부번집합이라 한다.
  • 유한집합이나 가부번집합을 가산집합이라 한다.
  • 가부번집합이 아닌 무한집합을 비가산집합이라 한다.

여러 가지 정리

  • \mathbb{N} \approx \mathbb{Z} \approx \mathbb{Q}
  • \mathbb{R} 는 비가부번집합이다.
  • \mathbb{R} \approx \mathbb{R} - \mathbb{Q} \approx \mathbb{C}
  • 칸토어의 정리: 공집합이 아닌 임의의 집합 X 에 대하여 P(X) 의 크기는 X 의 크기보다 크다.
  • P(\mathbb{N}) \approx \mathbb{R}

순서관계

  • (기본적인 집합에 연산구조, 순서구조, 위상구조 등을 부여할 수 있음)

순서집합

아래 조건들을 만족하는 집합 X 위의 이항 관계 \leq 를 부분순서관계라 한다.

  1. \forall x \in X, x \leq x
    • (반사적, reflexive)
  2. \forall x, y, z \in X, x \leq y \leq z \Rightarrow x \leq z
    • (추이적, transitive)
  3. \forall x, y \in X, x \leq y \leq x \Rightarrow x = y
    • (반대칭적, antisymmetric)
  • 부분순서관계 \leq 를 갖춘 집합을 부분순서집합이라 한다.
  • 부분순서집합 X 의 어떤 두 원소 x, y x \leq y \vee y \leq x 을 만족하면 x y 는 비교가능하다고 한다.
  • 부분순서집합 X 의 임의의 두 원소가 비교가능하면 X 를 전순서집합이라 한다.

상(하)계, 극대(소), 최대(소)

부분순서집합 X 의 부분집합 A 에 대하여

  • \forall a \in A, a \leq x 를 만족하는 x \in X A 의 상계(upper bound)라 한다.
  • 상계가 존재하는 A 를 ‘위로 유계(bounded)이다’라고 한다.
  • 위로 유계이면서 동시에 아래로 유계인 집합을 유계집합이라 한다.
  • a > m a \in A 가 존재하지 않을 때 m \in A A 의 극대원소라 한다.
  • \forall a \in A, a \leq g g \in A A 의 최대원소라 한다.

각 항목의 부등호 방향을 바꿔주면 각각 하계(lower bound), 아래로 유계, 유계집합, 극소원소, 최소원소의 정의가 된다.

  • 집합 A의
    • 상계: l, m, n
    • 최소상계: l
    • 하계: a, d, e, f
    • 최대하계: 없음
    • 극대: j, k
    • 극소: g
    • 최대: 없음
    • 최소: g

이상엽/ 선형대수학/ 자료의 처리

우선순위 평가

인접행렬

개념

요소간의 연결 관계를 나타내는 정사각 행렬

  • 참조한 (화살표가 나가는) 쪽은 행에, 참조된 (화살표를 받는) 쪽은 열에 쓴다.
    • 1은 2와 3으로 화살표를 쏘고 있으므로, 1행은 2열과 3열에 값이 있음.

권위벡터와 허브벡터

n \times n 인접행렬 A = (a_{ij}) 에 대하여

\left( \begin{array}{rrrr} \sum_{i = 1}^{n} a_{i1} \\ \sum_{i = 1}^{n} a_{i2} \\ ... \\ \sum_{i = 1}^{n} a_{in} \end{array} \right) \left( \begin{array}{rrrr} \sum_{j = 1}^{n} a_{1j} \\ \sum_{j = 1}^{n} a_{2j} \\ ... \\ \sum_{j = 1}^{n} a_{nj} \end{array} \right) 을 각각 A 의 권위벡터와 허브벡터라 하며, 각 벡터의 성분을 권위 가중치와 허브가중치라 한다.

  • 가중치로부터 중요도를 판단한다는게 아이디어
    • 권위 벡터(u_{0} )는 연관받은 (열) 데이터에 대한 벡터가 된다. 그 각각의 값은 권위 가중치가 된다.
    • 허브 벡터(v_{0} )는 연관한 (행) 데이터에 대한 벡터가 된다. 그 각각의 값은 허브 가중치가 된다.
  • 권위 벡터와 허브 벡터는 상호작용을 기반으로 계속 값이 업데이트 된다.
    • 업데이트 되는 와중에 어떤 기준선에 도달하여 값이 안정되면 최종적으로 그 벡터를 중요도 평가에 사용한다.

순위평가 원리

인접행렬 A 와 초기권위벡터 u_{0} 와 초기허브벡터 v_{0} 에 대하여

u_{k} = \begin{cases} u_{0} & k =0 \\ {A_{v_{k}}^{T} \over \|A_{v_{k}}^{T}\|} & k > 0 \end{cases},  v_{k} = \begin{cases} v_{0} & k =0 \\ {A_{v_{k-1}} \over \|A_{v_{k-1}}\|} & k > 0 \end{cases}

  • 현재 권위 벡터는 이전 허브 벡터의 값을 원본 행렬(의 전치 행렬)에 곱하여 구하고, 마찬가지로 현재 허브 벡터는 이전 권위 벡터의 값을 원본 행렬에 곱하여 구한다.
    • 이 곱을 반복하여 값을 업데이트 한다.
  • 다만 이것을 점화식을 이용해서 구성하면 자기 자신만 보면 되는 (권위 벡터는 권위 벡터만으로, 허브 벡터는 허브 벡터만으로) 해석적인 결과가 구성되고, 이를 컴퓨터에 넣어서 계속 돌리면 값이 나온다.

와 같이 새로운 정규화된 권위벡터 u_{k} 와 허브벡터 v_{k} 를 정의한다. (k 는 정수)

이때 u_{k}, v_{k} 를 연립하면 다음과 같이 정규화된 u_{k} v_{k} 의 점화식을 얻을 수 있다.

u_{k} = {A_{v_{k}}^{T} \over \|A_{v_{k}}^{T}\|} = {A^{T}({A_{u_{k-1}} \over \|A_{u_{k-1}}\|}) \over \|A^{T}({A_{u_{k-1}} \over \|A_{u_{k-1}}\|})\|} = {(A^{T}A)_{u_{k-1}} \over \|(A^{T}A)_{u_{k-1}}\|}

마찬가지로 v_{k} = {(AA^{T})_{v_{k-1}} \over \|(AA^{T})_{v_{k-1}}\|}

이 벡터들이 안정화가 되었다고 판단되는 상태로부터 각각 최종 중요도를 판별한다.

사례

10개의 인터넷 페이지(ㄱ~ㅊ)들 간의 인접행렬 $latex A &s=2가 다음과 같다고 하자.

앞에서 소개된 절차에 따라 $latex A &s=2의 정규화된 권위벡터가 안정화 될 때까지 반복계산한 결과는 다음과 같다.

  • 위 수식은 소숫점 4자리까지만 연산하는데, u_{9}, u_{10} 에 도달하면 값의 차이가 없기 때문에 더는 연산을 하지 않고 멈춘다.
    • 만일 소숫점 자리를 5자리 이상으로 보면 더 돌 수 있다.

따라서 $latex A &s=2 권위가중치로부터 페이지 ㄱ, ㅂ, ㅅ, ㅈ는 관련이 적고, 그 외의 페이지는 중요도가 높은 것부터 ㅁ > ㅇ > ㄴ > ㅊ > ㄷ = ㄹ 순서대로 검색엔진에서 노출되어야 함을 알 수 있다.

  • 요게 바로 구글 페이지 랭크 연산 방식
  • 주요 키워드) 거듭제곱법(power method), 우세 고유벡터/값(dominant eigen vector/value)

자료압축

특잇값 분해

분해

한 행렬을 여러 행렬들의 곱으로 표현하는 것

ex) QR  분해, LU 분해, LDU 분해, 고윳값 분해, 헤센버그 분해, 슈르 분해, 특잇값 분해 등

특잇값

m \times n 행렬 A 에 대하여 \lambda_{1}, \lambda_{2}, ... , \lambda_{n} A^{T}A 의 고윳값일 때

\sigma_{1} = \sqrt{\lambda_{1}}, \sigma_{2} = \sqrt{\lambda_{2}}, ... \sigma_{n} = \sqrt{\lambda_{n}}

A 의 특잇값이라 한다.

  • 고윳값을 만들려면 정사각 행렬이어야 한다. 반면 특잇값은 임의의 행렬에서도 만들어낼 수 있음.
    • 일반적인 행렬을 정사각 행렬로 만들기 위해  m \times n 행렬 A 에 대하여 A^{T}A 를 한 후 거기서 특이값을 추출한다.

ex) 행렬 A = \left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) 에 대하여

A^{T}A = \left( \begin{array}{rrr} 1 & 0 & 1 \\ 1 & 1 & 0 \end{array} \right) \left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) = \left( \begin{array}{rr} 2 & 1 \\ 1 & 2 \end{array} \right) 이므로

A^{T}A 의 고유방정식은 \lambda^{2} - 4 \lambda + 3 = (\lambda - 1)(\lambda - 3) = 0 이다

따라서 A 의 두 특잇값은 각각 \sqrt{3}, 1 이다.

특잇값 분해

영행렬이 아닌 임의의 m \times n 행렬 A 는 다음과 같이 나타낼 수 있다.

A = U \Sigma V^{T}

이때 U, V 는 직교행렬이며, A 는 주대각성분이 \Sigma 의 특잇값이고 나머지 성분들은 0 m \times n 행렬이다.

  • 여기서 \Sigma 는 합을 의미하는 것이 아니라 \sigma 의 대문자 형태이다. (벡터를 의미하는 \sigma 의 행렬 형태)

ex) 행렬 A = \left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) 는 다음과 같이 특잇값 분해된다.

\left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) = \left( \begin{array}{rrr} {\sqrt{6} \over 3} & 0 & - {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & -{\sqrt{2} \over 2} & {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & {\sqrt{2} \over 2} & {1 \over \sqrt{3}} \end{array} \right) \left( \begin{array}{rrr} \sqrt{3} & 0 \\ 0 & 1 \\ 0 & 0 \end{array} \right) \left( \begin{array}{rr} {\sqrt{2} \over 2} & {\sqrt{2} \over 2} \\ {\sqrt{2} \over 2} & -{\sqrt{2} \over 2} \end{array} \right)

축소된 특잇값 분해

특잇값 분해에서 0 인 성분들로만 이루어진, 대수적으로 무의미한 행 또는 열을 제거한 형태를 축소된 특잇값 분해라고 한다.

즉, A = U_{1} \Sigma_{1} V_{1}^{T} = (u_{1}, u_{2}, ... , u_{k}) \left( \begin{array}{rrrr} \sigma_{1} & 0 & ... & 0 \\ 0 & \sigma_{2} & ... & 0 \\ ... & ... & ... & ... \\ 0 & 0 & ... & \sigma_{k} \end{array} \right) \left( \begin{array}{rrrr} v_{1}^{T} \\ v_{2}^{T} \\ ... \\ v_{k}^{T} \end{array} \right)

또한 축소된 특잇값 분해를 이용하여 행렬 A 를 다음과 같이 전개한 것을 A 의 축소된 특잇값 전개라 한다.

A = \sigma_{1}u_{1}v_{1}^{T} + \sigma_{2}u_{2}v_{2}^{T} + ... + \sigma_{k}u_{k}v_{k}^{T} 

ex)

\left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) = \left( \begin{array}{rrr} {\sqrt{6} \over 3} & 0 & - {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & -{\sqrt{2} \over 2} & {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & {\sqrt{2} \over 2} & {1 \over \sqrt{3}} \end{array} \right) \left( \begin{array}{rrr} \sqrt{3} & 0 \\ 0 & 1 \\ 0 & 0 \end{array} \right) \left( \begin{array}{rr} {\sqrt{2} \over 2} & {\sqrt{2} \over 2} \\ {\sqrt{2} \over 2} & -{\sqrt{2} \over 2} \end{array} \right)

= \left( \begin{array}{rrr} {\sqrt{6} \over 3} & 0 \\ {\sqrt{6} \over 6} & -{\sqrt{2} \over 2} \\ {\sqrt{6} \over 6} & {\sqrt{2} \over 2} \end{array} \right) \left( \begin{array}{rr} \sqrt{3} & 0 \\ 0 & 1 \end{array} \right) \left( \begin{array}{rr} {\sqrt{2} \over 2} & {\sqrt{2} \over 2} \\ {\sqrt{2} \over 2} & -{\sqrt{2} \over 2} \end{array} \right)

= \sqrt{3}u_{1}v_{1}^{T} + u_{2}v_{2}^{T}

자료압축 원리

압축되지 않은 m \times n 행렬 A 를 위한 필요 저장 공간은 mn 이다.

A 를 축소된 특잇값 분해한 결과가 A = \sigma_{1}u_{1}v_{1}^{T} + \sigma_{2}u_{2}v_{2}^{T} + ... + \sigma_{k}u_{k}v_{k}^{T}  라면

이제 필요한 저장 공간은 k + km + kn = k(1 + m + n) (\sigma_{1} \geq \sigma_{2} \geq ... \geq \sigma_{k}) 이다.

  • k 는 특잇값 개수 = \Sigma 의 행개수 or 열개수
  • m U 의 행 개수 = u_{i} 의 성분개수
  • n V^{T} 의 열 개수 = v_{i}^{T} 의 성분개수

충분히 작다고 판단되는 \sigma_{r+1}, ... \sigma_{k} 에 대응하는 항들을 추가로 제거하면, 이때 필요한 저장 공간은 r(1 + m + n) 뿐이다.

이상엽/ 선형대수학/ 최적화 문제

곡선 적합

보간법

개념

주어진 특징 점들을 포함하는 함수를 구하는 방법

정리) 좌표평면에 있는 임의의 서로 다른 n 개의 점을 지나는 k 차 다항함수는 유일하게 존재한다. (단 k k < n 인 자연수)

사례

네 점 (1, 3), (2, -2), (3, -5), (4, 0) 을 모두 지나는 3차 함수

f(x) = a_{0} + a_{1} x + a_{2} x^{2} + a_{3} x^{3}

를 구하자. 우선 다음의 방정식을 세운다.

Step 1)

\left( \begin{array}{rrrr} 1 & x_{1} & x_{1}^{2} & x_{1}^{3} \\ 1 & x_{2} & x_{2}^{2} & x_{2}^{3} \\ 1 & x_{3} & x_{3}^{2} & x_{3}^{3} \\ 1 & x_{4} & x_{4}^{2} & x_{4}^{3} \end{array} \right) \left( \begin{array}{rrrr} a_{0} \\ a_{1} \\ a_{2} \\ a_{3} \end{array} \right) = \left( \begin{array}{rrrr} y_{1} \\ y_{2} \\ y_{3} \\ y_{4} \end{array} \right)

Step 2) 네 점을 대입하고 첨가행렬을 만든다.

\left( \begin{array}{rrrrr} 1 & 1 & 1 & 1 & 3 \\ 1 & 2 & 4 & 8 & -2 \\ 1 & 3 & 9 & 27 & -5 \\ 1 & 4 & 16 & 64 & 0 \end{array} \right)

Step 3) 첨가행렬을 가우스-조던 소거법을 이용하여 풀이한다.

\left( \begin{array}{rrrrr} 1 & 1 & 1 & 1 & 3 \\ 1 & 2 & 4 & 8 & -2 \\ 1 & 3 & 9 & 27 & -5 \\ 1 & 4 & 16 & 64 & 0 \end{array} \right) \Rightarrow \left( \begin{array}{rrrrr} 1 & 0 & 0 & 0 & 4 \\ 0 & 1 & 0 & 0 & 3 \\ 0 & 0 & 1 & 0 & -5 \\ 0 & 0 & 0 & 1 & 1 \end{array} \right)

Step 4) 

a_{0} = 4, a_{1} = 3, a_{2} = -5, a_{3} = 1 이므로 f(x) = 4 + 3 x - 5 x^{2} + x^{3} 이다.

  • 곡선 접합은 현재 가진 데이터에 대해 분석은 잘 할 수 있지만, 신규 데이터가 현재 그려 놓은 곡선 위에 존재한다는 보증이 없음. 유연성이 매우 떨어진다.
    • 애초에 데이터를 모두 포함하는 함수가 존재하지 않는 경우도 많음.

최소제곱법

  • 곡선 접합의 단점을 보완할 수 있는 방법.
  • 가우스가 창안한 방법으로 가우스는 이 방법을 통해 소행성 ‘세레스’ 의 궤도를 정확히 예측해 냄.

개념

특징 점들을 포함하는 함수를 특정 지을 수 없을 때, 실제 해와의 오차 제곱 합이 최소가 되는 근사적인 해를 구하는 방법

정리) 방정식 Ax = B 을 변형한 방정식 A^{T}Ax = A^{T}B (정규방정식)의 모든 해는 Ax = B 의 최소제곱해이다.

  • 요게 결국 선형회귀이다.
  • A^{T}Ax = A^{T}B (정규방정식)의 모든 해는 Ax = B 의 최소제곱해이라는 부분은 증명이 복잡하므로 강의 상에서는 생략.

사례

네 점 (0, 1), (1, 3), (2, 4), (3, 4) 에 근사하는 일차 함수 f(x) = a_{0} + a_{1} x 을 구하자. 우선 다음의 방정식을 세운다.

Step 1) Ax = B

\Leftrightarrow \left( \begin{array}{rrrr} 1 & x_{1} \\ 1 & x_{2} \\ 1 & x_{3} \\ 1 & x_{4} \end{array} \right) \left( \begin{array}{rr} a_{0} \\ a_{1} \end{array} \right) = \left( \begin{array}{rrrr} y_{1} \\ y_{2} \\ y_{3} \\ y_{4} \end{array} \right)

Step 2) 네 점을 대입하고 정규방정식 A^{T}Ax = A^{T}B 으로부터 방정식 x = (A^{T}A)^{-1} A^{T}B 을 구성한다.

A^{T}A = \left( \begin{array}{rr} 4 & 6 \\ 6 & 14  \end{array} \right) 이므로

(A^{T}A)^{-1} = \left( \begin{array}{rr} 4 & 6 \\ 6 & 14  \end{array} \right)^{-1} = {1 \over 10} \left( \begin{array}{rr} 7 & -3 \\ -3 & 2  \end{array} \right)  

\therefore x = {1 \over 10} \left( \begin{array}{rr} 7 & -3 \\ -3 & 2  \end{array} \right) \left( \begin{array}{rrrr} 1 & 1 & 1 & 1 \\ 0 & 1 & 2 & 3  \end{array} \right) \left( \begin{array}{rrrr} 1 \\ 3 \\ 4 \\ 4  \end{array} \right)

Step 3) x = \left( \begin{array}{rr} a_{0} \\ a_{1}  \end{array} \right) = \left( \begin{array}{rr} {2 \over 3} \\ 1 \end{array} \right) 이므로 구하고자 하는 함수는 f(x) = {3 \over 2} + x 이다.

n차 일반화

m 개의 자료점 (x_{1}, y_{1}), (x_{2}, y_{2}), ... , (x_{m}, y_{m}) 에 대해 n 차 다항식 y = a_{0} + a_{1} x + ... + a_{n} x^{n} 을 최소제곱법을 이용하여 근사하기 위해서는 Ax = B

A = \left( \begin{array}{rrrr} 1 & x_{1} & ... & x_{1}^{n} \\ 1 & x_{2} & ... & x_{2}^{n} \\ ... & ... & ... & ... \\ 1 & x_{m} & ... & x_{m}^{n} \end{array} \right), x = \left( \begin{array}{rrrr} a_{0} \\ a_{1} \\ ... \\ a_{n} \end{array} \right), B = \left( \begin{array}{rrrr} y_{1} \\ y_{2} \\ ... \\ y_{m} \end{array} \right)

로 설정하면 된다.

두 방법의 비교

  보간법 최소제곱법
목표 데이터를 모두 포함하는 함수 데이터의 경향을 반영하는 함수
데이터의 수 적을 수록 좋음 많아도 무방함
정밀도 매우 높음 상대적으로 낮음
신축성 조절이 어려움 조절이 자유로움

이차형식의 최적화

이차형식

가환환 K 위의 가군 V 에 대해 다음 세 조건을 만족시키는 함수 Q : V \to K

  • \forall k, l \in K, \forall u, v, w \in V
    • Q(kv) = k^{2} Q(v)
    • Q(u + v + w) = Q(u + v) + Q(v+w) + Q(u+w) - Q(u) - Q(v) - Q(w)
    • Q(kv + lv) = k^{2} Q(u) + l^{2} Q(v) + kl Q(u+v) - klQ(u) - klQ(v)

ex 1) R^{2} 상의 일반적인 이차형식은 다음과 같다.

a_{1}x_{1}^{2} + a_{2}x_{2}^{2} + 2a_{3}x_{1}x_{2} \Leftrightarrow \left( \begin{array}{rr} x_{1} & x_{2} \end{array} \right) \left( \begin{array}{rr} a_{1} & a_{3} \\ a_{3} & a_{2} \end{array} \right) \left( \begin{array}{rr} x_{1} \\ x_{2}  \end{array} \right)

ex 2) R^{3} 상의 일반적인 이차형식은 다음과 같다.

a_{1}x_{1}^{2} + a_{2}x_{2}^{2} + a_{3}x_{3}^{2} +  2a_{4}x_{1}x_{2} + 2a_{5}x_{1}x_{3} + 2a_{6}x_{2}x_{2}

\Leftrightarrow \left( \begin{array}{rrr} x_{1} & x_{2} & x_{3} \end{array} \right) \left( \begin{array}{rrr} a_{1} & a_{4} & a_{5} \\ a_{4} & a_{2} & a_{6} \\ a_{5} & a_{6} & a_{3} \end{array} \right) \left( \begin{array}{rrr} x_{1} \\ x_{2} \\ x_{3} \end{array} \right)

제약된 극값

개념

특정 제약 하에 결정되는 원하는 식의 최댓값 또는 최솟값

정리) n \times n 행렬 A 의 고윳값을 큰 순서대로 \lambda_{1}, \lambda_{2}, ... , \lambda_{n} 이라 하자. 이때 \|v\| = 1 제약 하에 v^{T}Av 의 최댓(솟)값은 \lambda_{1} (\lambda_{n}) 에 대응하는 단위고유벡터에서 존재한다.

사례

제약 x^{2} + y^{2} = 1 하에서

  • 위 제약 조건은 \vec{v} = (x, y) 로 정한 것과 같다. \|v\| = 1 이 된다.

z = 5 x^{2} + 5 y^{2} + 4xy

의 최댓값과 최솟값을 구하자. 우선 z 를 이차형식 v^{T} Av 형태로 변환한다.

Step 1) a_{1}x^{2} + a_{2}y^{2} + 2a_{3}xy

\Leftrightarrow \left( \begin{array}{rr} x & y \end{array} \right) \left( \begin{array}{rr} a_{1} & a_{3} \\ a_{3} & a_{2} \end{array} \right) \left( \begin{array}{rr} x \\ y \end{array} \right) = v^{T} A v

즉, z = \left( \begin{array}{rr} x & y \end{array} \right) \left( \begin{array}{rr} 5 & 2 \\ 2 & 5 \end{array} \right) \left( \begin{array}{rr} x \\ y \end{array} \right)

Step 2) 행렬 A = \left( \begin{array}{rr} 5 & 2 \\ 2 & 5 \end{array} \right) 의 고윳값과 고유벡터를 구한다.

\Rightarrow \begin{cases} \lambda_{1} = 7 & v_{1} = (1, 1) \\ \lambda_{2} = 3 & v_{2} = (-1, 1) \end{cases}

Step 3) 고유벡터를 정규화한다.

\Rightarrow \begin{cases} \lambda_{1} = 7 & v_{1} = ({1 \over \sqrt{2}}, {1 \over \sqrt{2}}) \\ \lambda_{2} = 3 & v_{2} = (-{1 \over \sqrt{2}}, {1 \over \sqrt{2}}) \end{cases}

Step 4) 따라서 (x, y) = ({1 \over \sqrt{2}}, {1 \over \sqrt{2}}) 일 때 z 는 최댓값 7을 갖고, (x, y) = (-{1 \over \sqrt{2}}, {1 \over \sqrt{2}}) 일 때 z 최솟값 3을 갖는다.

물론 v_{1} = (-1, -1), v_{2} = (1, -1)   등으로 설정해도 무방하며, 최댓(솟)값은 변하지 않는다.

이상엽/ 선형대수학/ 복소벡터공간

복소벡터공간

정의

복소수체 \mathbb{C} 에 대한 가군. 즉 적당한 집합 V 에 대해 벡터공간 (V, \mathbb{C}, +, \cdot) 을 복소벡터공간이라 한다.

((V, \mathbb{C}, +, \cdot) 에서 \mathbb{C} 는 스칼라를 복소수에서 가져왔다는 얘기다. 실수벡터공간에서는 스칼라를 어디서 가져왔는지를 생략해서 표기한 셈. 엄밀하게 쓰면 (V, \mathbb{R}, +, \cdot) 이 되지만 일반적으로 생략해서 표기한다.)

또한 모든 복소 n-튜플 (v_{1}, v_{2}, ... , v_{n}) 의 집합을 복수 n-공간이라 하고 \mathbb{C}^{n} 으로 표시한다.

복소켤레

\mathbb{C}^{n} 의 임의의 벡터

  • v = (v_{1}, v_{2}, ... , v_{n})
    • = (a_{1} + b_{1}i, a_{2} + b_{2}i, ... , a_{n} + b_{n}i)
    • = (a_{1}, a_{2}, ... , a_{n}) + i(b_{1}, b_{2}, ... , b_{n})
    • = Re(v) + i Im(v)

에 대하여 v 의 복소켤레 (복소수 부분의 부호만 바뀜)

  • \bar{v} = (\bar{v_{1}}, \bar{v_{2}}, ... , \bar{v_{n}}) = Re(v) - i Im(v)
  • ex 1) v = (1+i, -i, 3, 3i) 에 대하여 Re(v), Im(v), \bar{v} 를 구하시오
    • Re(v) = (1, 0, 3, 0)
    • Im(v) = (1, -1, 0, 3)
    • \bar{v} = Re(v) - i Im(v) = (1 - i, i, 3, -3i)
  • ex 2) A = \left( \begin{array}{rr} 1 - i & 2i \\ -1 & 3+2i \end{array} \right) 에 대하여 \bar{A}, det(\bar{A}) 를 구하시오
    • \bar{A} = \left( \begin{array}{rr} 1 + i & -2i \\ -1 & 3-2i \end{array} \right)
    • det(\bar{A}) = 3 - 2i + 3i + 2 - 2i = 5 - i 

대수적 성질

  • \mathbb{C}^{n} 의 벡터 u, v 와 스칼라 k 에 대해
    • \bar{\bar{u}} = u
    • \overline{ku} = \bar{k} \bar{u}
    • \overline{u \pm v} = \bar{u} \pm \bar{v}
  • m \times k 행렬 A k \times n 행렬 B 에 대해
    • \bar{\bar{A}} = A
    • (\overline{A^{T}}) = (\bar{A})^{T}
    • \overline{AB} = \bar{A} \bar{B}

복소내적공간

정의

복소벡터공간 (V, \mathbb{C}, +, \cdot) 의 두 벡터 u = (u_{1}, u_{2}, ... , u_{n}), v = (v_{1}, v_{2}, ... , v_{n}) 의 내적 <u, v> : V \times V \to \mathbb{C}

<u, v> = u \cdot v = u_{1} \bar{v_{1}} + u_{2} \bar{v_{2}} + ... + u_{n} \bar{v_{n}}

로 정의한다. 또한 내적이 정의되어 있는 복소벡터공간을 복소내적공간이라 한다.

(만약 뒤에 있는 벡터에 켤레를 취해주지 않으면 노름 값이 0이나 음수가 나올 수가 있다. 때문에 뒤의 벡터에 켤레를 취해서 노름 값을 자연스럽게 만들어 줌. 엄밀히 말해주면 위의 연산이 내적공간의 연산이 기본이고, 실수벡터공간에서는 켤레를 취해줘도 의미가 없기 때문에 생략이 되었던 것)

성질

복소내적공간의 세 벡터 u, v, w 와 스칼라 k 에 대해 다음 성질이 만족한다.

  • <u, v> = \overline{<v, u>}
  • <u + v, w> = <u, w> + <v, w>
  • <u, v + w> = <u, v> + <u, w>
  • <ku, w> = k<u, w>
  • <u, kv> = \bar{k}<u, v>
  • v \neq \vec{0} 일 때 <v, v> > 0

고윳값과 벡터

정의

복소정사각행렬 A 에 대하여 고유방정식 det(\lambda I - A) = 0 의 복소해 \lambda A 의 복소고윳값이라 한다.

또한 Av = \lambda v 를 만족시키는 모든 벡터 v 의 집합을 A 의 고유공간, 고유공간의 영벡터가 아닌 벡터를 A 의 복소고유벡터라고 한다.

  • ex) A = \left( \begin{array}{rr} 2 & 1 \\ -5 & -2 \end{array} \right) 일 때
    • det(\lambda I_{2} - A) = det(\left( \begin{array}{rr} \lambda - 2 & -1 \\ 5 & \lambda + 2 \end{array} \right)) = \lambda^{2} + 1 = 0
    • \therefore \lambda = i or -i
    • \lambda = i 일 때
      • V = t \left( \begin{array}{rr} - {i + 2 \over 5} \\ 1 \end{array} \right)
      • 고유공간 =\{(- {i + 2 \over 5} , 1) \}
      • 고유벡터 =(- {i + 2 \over 5}t , t) (t \neq 0)

정리

\lambda 가 실 정사각행렬 A 의 고윳값이고 v 는 이에 대응하는 고유벡터이면, \bar{\lambda} 또한 A 의 고윳값이며 \bar{v} 는 이에 대응하는 고유벡터이다.

유니터리 대각화

용어의 정의

켤레전치행렬

복소행렬 A 의 전치행렬을 구한 다음 각 성분을 켤레인 복소수로 바꾼 행렬 A^{H} A 의 켤레전치행렬 또는 에르미트 전치행렬이라 한다.

스칼라 k m \times r 행렬 A r \times n 행렬 B 에 대해 다음이 성립한다.

  • (A^{H})^{H} = A
  • (A \pm B)^{H} = A^{H} \pm B^{H} (복부호 동순)
  • (kA)^{H} = \bar{k} A^{H}
  • (AB)^{H} = B^{H} A^{H}

에르미트행렬

A = A^{H} 가 성립하는 복소정사각행렬 A 를 에르미트행렬이라 한다.

유니터리행렬

복소정사각행렬 A 의 역행렬 A^{-1} 에 대하여 A^{-1} = A^{H} 가 성립하는 행렬 A 를 유니터리행렬이라 한다.

정규행렬

A A^{H} = A^{H} A 가 성립하는 복소정사각행렬 A 를 정규행렬이라 한다. 에르미트행렬, 유니터리행렬 등이 이에 해당한다.

유니터리 대각화

정의

P^{H}AP = D 가 복소대각행렬이 되는 유니터리행렬 P 가 존재하면 복소정사각행렬 A 는 유니터리 대각화가능하다고 한다.

또한 이러한 임의의 행렬 P A 를 유니터리 대각화한다고 한다.

정리

유니터리 대각화 가능한 행렬은 정규행렬이며, 그 역도 성립한다. 즉 정규행렬은 유니터리 대각화 가능하다.

에르미트행렬 A의 유티너리 대각화 과정

  1. A 의 모든 고유공간의 기저를 구한다.
  2. 고유공간의 정규직교기저를 구한다.
  3. 기저벡터를 열벡터로 하는 행렬 P 는 유니터리행렬이고, A 를 대각화 한다.

이상엽/ 선형대수학/ 고윳값과 대각화

고윳값과 벡터

  • 고윳값은 원어(독일어, eigenvalue)로는 특수한 값이라는 뜻이지 유일한 값이라는 뜻은 아니다.

정의

F 에 대한 벡터공간 V 위의 선형사상 L : V \to V 에 대하여 다음 두 조건

  1. v \neq \vec{0}
  2. L(v) = \lambda_{v}

를 만족하는 \lambda \in F v \in V 를 각각 고윳값과 고유벡터라고 한다.

  • ex) v = (2, 3), L \mapsto M = \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right)
    • L(v) \mapsto Mv = \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right) \left( \begin{array}{rr} 2 \\ 3 \end{array} \right) = \left( \begin{array}{rr} -4 \\ -6 \end{array} \right) = -2 \left( \begin{array}{rr} 2 \\ 3 \end{array} \right)
    • 이때 행렬 M 을 곱한 것과 동일한 결과를 가져오는 스칼라 -2가 고윳값이 되며 그때의 벡터가 고유벡터가 된다.

고유방정식

n \times n 행렬 M 에 대하여 \lambda M 의 고윳값이기 위한 필요충분조건은 다음 방정식

det(\lambda I_{n} - M) = 0

을 만족하는 것이다. 이 방정식을 고유방정식이라 하며, 좌변의 식을 고유다항식이라 한다. (단, I_{n} n \times n 단위 행렬)

  • ex) M = \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right), \lambda = -2 일 때,
    • det(\lambda I_{2} - M) = det(-2 \left( \begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array} \right) - \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right))
    • = det \left( \begin{array}{rr} -3 &  2 \\ -3 & 2 \end{array} \right) = -6 + 6 = 0
  • ex2) M = \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right) 의 고윳값 찾기
    • det(\lambda I_{2} - M) = det(\left( \begin{array}{rr} \lambda & 0 \\ 0 & \lambda \end{array} \right) - \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right))
    • = det \left( \begin{array}{rr} \lambda - 1 &  2 \\ -3 & \lambda + 4 \end{array} \right)
    • = \lambda^{2} + 3 \lambda +2 = (\lambda+2)(\lambda+1) = 0
    • \therefore \lambda = -2 or -1

고유공간

선형사상 \lambda I_{v} - L 의 핵을 \lambda 의 고유공간이라 한다. (단, I_{v} 는 항등사상)

따라서 고유공간의 영벡터가 아닌 벡터는 고유벡터이다.

또한 L 의 고유벡터들로 구성된 V 의 기저를 선형사상 L 의 고유기저라 한다.

  • ex) M = \left( \begin{array}{rr} 1 &  -2 \\ 3 & -4 \end{array} \right), \lambda = -1 일 때,
    • (\lambda I_{n} - M) v = 0
    • \Leftrightarrow (-\left( \begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array} \right) - \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right)) \cdot \left( \begin{array}{rr} v_{1} \\ v_{2} \end{array} \right) = 0
    • \Leftrightarrow \left( \begin{array}{rr} -2 & 2 \\ -3 & 3 \end{array} \right) \cdot \left( \begin{array}{rr} v_{1} \\ v_{2} \end{array} \right) = 0
    • \therefore \begin{cases} v_{1} = s \\ v_{2} = s \end{cases}
    • v = s \left( \begin{array}{rr} 1 \\ 1 \end{array} \right)
    • 즉, 고유벡터는 (s, s) (s \neq 0) , 고유기저 = \{ (1, 1) \}
  • ex) M = \left( \begin{array}{rrr} 0 & 0 & -2 \\ 1 & 2 & 1 \\ 1 & 0 & 3 \end{array} \right) 의 고윳값, 고유벡터, 고유기저 구하기
    • 고윳값 구하기
      • det(\lambda I_{3} - M) = det \left( \begin{array}{rrr} \lambda & 0 & 2 \\ -1 & \lambda-2 & -1 \\ -1 & 0 & \lambda-3 \end{array} \right)
      • = \lambda (\lambda^{2} - 5 \lambda  + 6) + 2 (\lambda - 2)
      • = \lambda^{3} - 5 \lambda^{2} + 8 \lambda - 4 = (\lambda - 1)(\lambda-2)^{2} = 0 
      • \therefore \lambda = 1 or 2 
    • \lambda = 1 일 때 고유벡터 구하기 
      • (\lambda I_{3} - M) v = 0
      • \Leftrightarrow \left( \begin{array}{rrr} 1 & 0 & 2 \\ -1 & -1 & -1 \\ -1 & 0 & -2 \end{array} \right) \left( \begin{array}{rrr} v_{1} \\ v_{2} \\ v_{3} \end{array} \right) = 0
      • \therefore \begin{cases} v_{1} = -2s \\ v_{2} = s \\ v_{3} = s \end{cases}
      • v = s \cdot \left( \begin{array}{rrr} -2 \\ 1 \\ 1 \end{array} \right)
      • 즉, 고유벡터는 (-2s, s, s), (s \neq 0) , 고유기저 = \{ (-2, 1, 1) \}
    • \lambda = 2 일 때 고유벡터 구하기
      • (2 I_{3} - M) v = 0
      • \Leftrightarrow \left( \begin{array}{rrr} 2 & 0 & 2 \\ -1 & 0 & -1 \\ -1 & 0 & -1 \end{array} \right) \left( \begin{array}{rrr} v_{1} \\ v_{2} \\ v_{3} \end{array} \right) = 0
      • \therefore \begin{cases} v_{1} = -r \\ v_{2} = t \\ v_{3} = r \end{cases}
      • v = t \cdot \left( \begin{array}{rrr} 0 \\ 1 \\ 0 \end{array} \right) + r \cdot \left( \begin{array}{rrr} -1 \\ 0 \\ 1 \end{array} \right)
      • 즉, 고유벡터는 (-r, t, r), (s \neq 0, t \neq 0, r \neq 0) , 고유기저 = \{ (0, 1, 0), (-1, 0, 1) \}

대각화

대각화

정의

두 정사각행렬 A, B 에 대하여 방정식

B = P^{-1}AP

를 만족하는 대각행렬 B 와 가역행렬 P 가 존재하면 행렬 A 는 대각화 가능행렬이라고 한다. 또한 이 경우 행렬 P A 를 대각화한다고 한다.

  • ex) A = \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right), P = \left( \begin{array}{rr} 1 & 2 \\ 1 & 3 \end{array} \right) 일 때,
    • P^{-1} = \left( \begin{array}{rr} 3 & -2 \\ -1 & 1 \end{array} \right)
    • P^{-1}AP = \left( \begin{array}{rr} 3 & -2 \\ -1 & 1 \end{array} \right) \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right) \left( \begin{array}{rr} 1 & 2 \\ 1 & 3 \end{array} \right)
    • = \left( \begin{array}{rr} -1 & 0 \\ 0 & -2 \end{array} \right) = B
    • 이런 결과는 다시 생각해 보면 A 라는 선형사상(행렬)은 PBP^{-1} 이라는 선형사상으로 분해가 가능하다는 뜻이 되기도 한다.

정리

n \times n 행렬 A 에 대하여 다음 두 명제는 동치이다.

  1. A 는 대각화 가능 행렬이다.
  2. A n 개의 선형독립인 고유벡터를 갖는다.

대각화하는 방법

n \times n 행렬 A 에 대하여

  1. Step 1
    • n 개의 선형독립인 고유벡터를 찾아 대각화 가능 행렬인지 확인한다.
    • (고유벡터의 갯수가 n개가 안되면 대각화 가능하지 않음)
  2. Step 2
    • n 개의 고유벡터 v_{1}, v_{2}, ... , v_{n} 로부터 행렬 P = (v_{1}, v_{2}, ... , v_{n}) 를 만든다.
  3. Step 3
    • P^{-1}AP 는 대각행렬이 된다.
  • ex) A = \left( \begin{array}{rr} 2 & 1 \\ 0 & 2 \end{array} \right) 이 대각화 가능한지 확인
    • 고윳값 구하기
      • det(\lambda I_{2} - A) = det \left( \begin{array}{rr} \lambda - 2 & -1 \\ 0 & \lambda-2 \end{array} \right)
      • = (\lambda - 2)^{2} = 0
      • \therefore \lambda = 2 
    • 고유벡터 구하기
      • (2 I_{2} - A) v = 0
      • \Leftrightarrow \left( \begin{array}{rr} 0 & -1 \\ 0 & 0 \end{array} \right) \left( \begin{array}{rr} v_{1} \\ v_{2} \end{array} \right) = 0
      • v = s \cdot \left( \begin{array}{rr} 1 \\ 0 \end{array} \right)
      • 즉, 고유벡터는 (s, 0), (s \neq 0) , 고유기저 = \{ (1, 0) \}
      • 고유기저가 1개 밖에 안나오므로 A 는 대각화 불가능
  • ex2) A = \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right) 에 대한 P 찾기
    • \therefore \begin{cases} \lambda = -1 \Rightarrow (s, s) \to P_{1} = \left( \begin{array}{rr} 1 \\ 1 \end{array} \right) \\ \lambda = -2 \Rightarrow (2t, 3t) \to P_{2} = \left( \begin{array}{rr} 2 \\ 3 \end{array} \right) \end{cases}
    • \therefore P = (P_{1} P_{2}) = \left( \begin{array}{rr} 1 & 2 \\ 1 & 3 \end{array} \right)  

중복도

정의

\lambda_{0} n \times n 행렬 A 의 고윳값이면 이에 대응하는 고유공간의 차원을 \lambda_{0} 의 기하적 중복도라 한다.

또한 A 의 고유다항식에서 \lambda - \lambda_{0} 가 인수로 나타나는 횟수를 \lambda_{0} 의 대수적 중복도라 한다.

  • ex)
    • 기하적 중복도는 대수적 중복도보다 작거나 같음. 그 둘이 같을 때 그 행렬은 대각화 가능이 된다.

정리

정사각행렬 A 에 대하여 다음 두 명제는 동치이다.

  1. A 는 대각화 가능 행렬이다.
  2. A 의 모든 고윳값에 대해서 기하적 중복도와 대수적 중복도는 같다.

닮음 불변량

정의

두 정사각행렬 A, B 에 대하여 

B = P^{-1}AP

를 만족하는 가역행렬 P 가 존재하면 A, B 는 서로 닮은 행렬이라 하고 기호로 A \sim B 라 표현한다.

닮은 불변량

서로 닮은 두 행렬의 다음과 같은 성질들은 서로 일치한다.

  1. 행렬식
  2. 가역성
  3. rank
  4. nullity
  5. 고유다항식
  6. 고윳값
  7. 고유공간의 차원
  8. 대각성분들의 합
  9. 대수적 중복도
  10. 기하적 중복도

C-H 정리

임의의 정사각행렬 A 와 그 고유다항식

f(\lambda) = det(\lambda I - A) = \sum_{i=0}^{n} a_{i} \lambda^{i}

에 대하여 f(A) = 0 이 성립하며, 이를 케일리-해밀턴 정리라고 한다. (단, 0 는 영행렬)

  • ex) A = \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right) 일 때
    • f(\lambda) = det(\lambda I_{2} - A) = det( \left( \begin{array}{rr} \lambda - 1 & 2 \\ -3 & \lambda + 4 \end{array} \right))
    • = \lambda^{2} + 3 \lambda + 2
    • f(A) = \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right)^{2} + 3 \left( \begin{array}{rr} 1 & -2 \\ 3 & -4 \end{array} \right) + 2 \left( \begin{array}{rr} 1 & 0 \\ 0 & 1 \end{array} \right) = 0

이상엽/ 선형대수학/ 선형사상

선형사상

선형사상

  • 사상이란 대수구조를 다루는 함수.
    • 엄밀히 말하면 함수보다 더 포괄적인 개념이지만, 둘이 흡사하기 때문에 혼용해서 사용함.
  • 선형사상이란 가산성(additivity)과 동차성(homogeneity)을 만족하는 사상

정의

F -벡터공간 V, W 에 대하여 V 의 성질을 보존하는 다음 두 조건을 만족하는 사상 L : V \to W

  • L(u+v) = L(u) + L(v) (u, v \in V)
    • 가산성
  • L(kv) = kL(v) (k \in F, v \in V)
    • 동차성
  • L은 선형사상이기 때문에 사용하는 기호로, L이 붙어 있으면 선형 사상이라고 보면 된다.

관련 용어

L : V \to W 가 선형사상일 때

  • 핵 (kernel): ker L = L^{-1}(\vec{0}) = \{ v \in V | L(v) = \vec{0} \}
    • 일종의 공역 개념
  • 상 (image): im L = L(V) = \{ L(v) \in W | v \in V \}
    • 일종의 치역 개념
  • 자기사상: V = W L
  • 단사사상: L(u) = L(v) \Rightarrow u = v L
  • 전사사상: L(V) = W L
  • 동형사상: 단사사상인 전사사상
  • 자기동형사상: 자기사상인 동형사상
  • 항등사상: L(v) = v L(=I_{v})
  • 사상의 합성: 두 선형사상 L_{1} : V \to U, L_{2} : U \to W 의 합성은 L_{2} \circ L_{1} : V \to W 로 쓴다.
  • 역사상
    • L_{2} \circ L_{1} = I_{v} 일 때, L_{2} L_{1} 의 왼쪽 역사상, L_{1} L_{2} 의 오른쪽 역사상이라 한다.
    • 왼쪽 역사상이자 오른쪽 역사상을 양쪽 역사상 또는 역사상이라 한다.

여러 선형사상

L : V \to W 가 선형사상이고 v \in V 일 때

  • L(v) = \vec{0} : 영사상
  • L(v) = v : 항등사상
  • L(v) = kv (단, k는 스칼라)
  • L(v) = Mv^{(T)} (단, M \in \mathcal{M}_{m \times n}(F), V = F^{n}, W = F^{m}  )
  • L(v) = <v, v_{0}> (단, $latex v_{0} \in V)

선형대수학의 기본정리

F -벡터공간 V, W 에 대하여 V 에서 W 로의 선형사상의 집합을 \mathcal{L}(V, W) 라 하고, 다음과 같이 \mathcal{L}(V, W) 위에 합과 스칼라배를 정의한다. (v \in V, k \in F )

  • (L_{1} + L_{2})(v) = L_{1}(v) + L_{2}(v)
  • (kL)(v) = kL(v)

이제 F 위의 m \times n 행렬들의 집합을 \mathcal{M}_{m \times n}(F) 라 하고, 두 사상 f, g 를 다음과 같이 정의한다.

  • f : \mathcal{L}(V, W) \to \mathcal{M}_{m \times n}(F)
    • f(L) = [L]_{B_{W}}^{B_{V}} = M
    • 선형사상에서 행렬로 가는 사상
  • g : \mathcal{M}_{m \times n}(F) \to \mathcal{L}(V, W)
    • g(M) = L_{M} ([L_{M}(v)]_{B_{W}} = M[v]_{B_{v}})
    • 행렬에서 선형사상으로 가는 사상
  • [기호 설명]
    • B_{V} 는 V B_{W} 는 W 의 순서기저, 즉, 기저의 원소들은 순서가 정해져있고 바뀌지 않는다.
      • ex) V = \mathbb{R}^{3} \Rightarrow B_{v} = \{ (1, 0, 0), (0, 1, 0), (0, 0, 1) \}
      • 이때 B_{v} V 의 순서기저가 된다.
    • v \in V, v = k_{1} v_{1} + k_{2} v_{2} + ... + k_{n} v_{n} 에 대해 [v]_{B_{V}} = (k_{1}, k_{2}, ... , k_{n})^{T}
      • ex) v \in V, v = 3v_{1} + v_{2} + 2v_{3} \Rightarrow (3, 2, 1)^{T} \Rightarrow [v]_{B_{v}}
      • 쉽게 말해 선형결합의 계수들을 모아 열벡터로 만든 것이다.
    • [L]_{B_{W}}^{B_{V}} = ([L(v_{1})]_{B_{W}}, [L(v_{2})]_{B_{W}}, ... , [L(v_{n})]_{B_{W}})
      • ex) L : \mathbb{R}^{2} \to \mathbb{R}^{3}, L(v) =  \left( \begin{array}{rrr} 1 & 1 \\ 2 & 2 \\ 3 & 3 \end{array} \right) \cdot v, B_{w} = \{ (1, 0, 0), (0, 1, 0), (0, 0, 1) \}
      • v_{1} = (1, 1) \in \mathbb{R}^{2}, v_{2} = (2, 2) \in \mathbb{R}^{2}, v_{3} = (3, 3) \in \mathbb{R}^{2} 
      • L(v_{1}) = \left( \begin{array}{rrr} 1 & 1 \\ 2 & 2 \\ 3 & 3 \end{array} \right) \cdot \left( \begin{array}{rr} 1 \\ 1 \end{array} \right) \Rightarrow [L(v_{1})]_{B_{w}} = \left( \begin{array}{rrr} 2 \\ 4 \\ 6 \end{array} \right) \in \mathbb{R}^{3}
      • L(v_{2}) = \left( \begin{array}{rrr} 1 & 1 \\ 2 & 2 \\ 3 & 3 \end{array} \right) \cdot \left( \begin{array}{rr} 2 \\ 2 \end{array} \right) \Rightarrow [L(v_{2})]_{B_{w}} = \left( \begin{array}{rrr} 4 \\ 8 \\ 12 \end{array} \right) \in \mathbb{R}^{3}
      • L(v_{3}) = \left( \begin{array}{rrr} 1 & 1 \\ 2 & 2 \\ 3 & 3 \end{array} \right) \cdot \left( \begin{array}{rr} 3 \\ 3 \end{array} \right) \Rightarrow [L(v_{3})]_{B_{w}} = \left( \begin{array}{rrr} 6 \\ 12 \\ 18 \end{array} \right) \in \mathbb{R}^{3}
      • \Rightarrow [L]_{B_{w}}^{B_{v}} = \left( \begin{array}{rrr} 2 & 4 & 6 \\ 4 & 8 & 12 \\ 6 & 12 & 18 \end{array} \right) = M \in \mathcal{M}_{3 \times 3}

그러면 f g 는 모두 동형사상이다. 또한 두 사상 f g 는 서로 역사상 관계이다.

  • 선형사상에서 행렬로 가는 사상과, 행렬에서 선형사상으로 가는 것이 동형사상이므로, 선형사상에 대해서는 그냥 행렬을 이용하면 된다.

위에 대한 증명)

선형사상에서 행렬로 가는 f 에 대해서

  • 선형사상 증명
    • 가산성 증명
      • \forall i \in \{ 1, 2, ... , n \}, \forall L_{1}, L_{2} \in \mathcal{L}(V, W)
      • (L_{1} + L_{2}) (v_{i}) = L_{1}(v_{i}) + L_{2}(v_{i}) (\because definition)
      • [(L_{1} + L_{2}) (v_{i})]_{B_{w}} = [L_{1}(v_{i})]_{B_{w}} + [L_{2}(v_{i})]_{B_{w}}
      • \Leftrightarrow [L_{1} + L_{2}]_{B_{w}}^{B_{v}} = [L_{1}]_{B_{w}}^{B_{v}} + [L_{2}]_{B_{w}}^{B_{v}}
      • \therefore f(L_{1} + L_{2}) = f(L_{1}) + f(L_{2})
    • 동차성 증명
      • \forall k \in F, \forall i \in \{ 1, 2, ... , n \}
      • [(kL)(v_{i})]_{B_{w}} = k \cdot [L(v_{i})]_{B_{w}}
      • \Rightarrow [kL]_{B_{w}}^{B_{v}} = k \cdot [L]_{B_{w}}^{B_{v}}
      • \therefore f(kL) = k \cdot f(L)
  • 동형사상 증명
    • 단사사상 증명
      • \forall L_{1}, L_{2} \in \mathcal{L}(V, W), f(L_{1}) = f(L_{2})
      • \Leftrightarrow [L_{1}(v_{i})]_{B_{w}} = [L_{2}(v_{i})]_{B_{w}} (\forall i \in {1, 2, ... , n})
      • \Leftrightarrow L_{1}(v_{i}) = L_{2}(v_{i})
      • 한편, \forall v \in V, \exists k_{1}, k_{2}, ... k_{n} \in F
      • s.t) v = k_{1} v_{1} + ... + k_{n} v_{n} = \sum_{i=1}^{n} k_{i} v_{i} (\because \{ v_{1},  ... , v_{n} \} = B_{v})
      • \therefore L_{1}(v_{i}) = L_{2}(v_{i})
      • \Rightarrow \sum_{i=1}^{n} k_{i} L_{1} (v_{i}) = \sum_{i=1}^{n} k_{i} L_{2} (v_{i})
      • \Rightarrow \sum_{i=1}^{n} L_{1} (k_{i} v_{i}) = \sum_{i=1}^{n} L_{2} (k_{i} v_{i})
      • \Rightarrow L_{1} (k_{1} v_{1}) + ... + L_{1} (k_{n} v_{n}) = L_{2} (k_{1} v_{1}) + ... + L_{2} (k_{n} v_{n})
      • \Rightarrow L_{1} (k_{1} v_{1} + ... + k_{n} v_{n}) = L_{2} (k_{1} v_{1} + ... + k_{n} v_{n})
      • \Rightarrow L_{1}(v) = L_{2}(v)
      • \therefore L_{1} = L_{2}
    • 전사사상 증명
      • \forall M \in \mathcal{M}_{m \times n}(F)
      • [M]^{i} := M i 번째 열
      • 이제 [L(v_{i})]_{B_{w}} := [M]^{i}
      • surely, [L]_{B_{w}}^{B_{v}} = M
      • \therefore f(L) = M
  • 위의 증명에 따라 선형사상에 적용되는 것은 모두 행렬에 대해 적용 가능

사상 g 에 대해서

  • 선형사상 증명
    • 가산성 증명
      • \forall M_{1}, M_{2} \in \mathcal{M}_{m \times n}(F), \forall v \in V
      • [L_{M_{1} +M_{2}}(v)]_{B_{W}} = (M_{1} + M_{2})[v]_{B_{V}}
      • = M_{1}[v]_{B_{V}} + M_{2}[v]_{B_{V}}
      • = [L_{M_{1}}(v)]_{B_{V}} + [L_{M_{2}}(v)]_{B_{V}}
      • \therefore L_{M_{1} +M_{2}} = L_{M_{1}} + L_{M_{2}}
      • 즉, g(M_{1} + M_{2}) = g(M_{1}) + g(M_{2})
    • 동차성 증명
      • \forall k \in F, \forall M \in \mathcal{M}_{m \times n}(F)
      • [L_{km}(v)]_{B_{W}} = (kM)[v]_{B_{W}}
      • = k \cdot M [v]_{B_{W}}
      • = k [L_{M}(v)]_{B_{W}}
      • \therefore g(kM) = k \cdot g(M)
  • 동형사상 증명
    • 단사사상 증명
      • g(M_{1}) = g(M_{2})
      • \Rightarrow [L_{M_{1}}(v)]_{B_{W}} = [L_{M_{2}}(v)]_{B_{W}}
      • \Rightarrow M_{1}[v]_{B_{W}} = M_{2}[v]_{B_{W}}
      • \Rightarrow [M_{1}]^{i} = [M_{2}]^{i}, (\forall i)
      • \Rightarrow M_{1} = M_{2}
    • 전사사상 증명
      • \forall L \in \mathcal{L}(V, W), M := ([L(V_{1})]_{B_{W}} [L(V_{i})]_{B_{W}})
      • Then, [L_{M}(v)]_{B_{W}} = [M]^{i} 
      • = [L(v_{i})]_{B_{W}} (\forall i) 
      • g(M) = L_{M} = L

f g 는 역사상 관계

  • \forall L \in \mathcal{L} (V, W), \forall v \in V
    • (g \circ f) (L) = g(f(L)) = g(M) = L_{M} = L
    • \therefore g \circ f 는 항등사상
  • \forall M \in \mathcal{M}_{m \times n} (F)
    • (f \circ g) (M) = f(g(M)) = f(L_{M}) = f(L) = M
    • \therefore f \circ g 는 항등사상
  • 고로 f g 는 역사상 관계

차원정리

차원정리

유한차원 벡터공간 V 와 선형사상 L : V \to W 에 대하여 다음이 성립한다.

dim(V) = dim(ker L) + dim(im L)

  • 증명)
    • B_{v} = \{ v_{1}, v_{2}, ... , v_{n} \}
    • ker L \subset V 이므로
    • B_{ker L} = \{ v_{1}, v_{2}, ... , v_{k} \} 
    • 목표 B_{imL} = \{ L(v_{k+1}), L(v_{k+2}), ... , L(v_{n}) \}
  • 생성 증명
    • \forall L(V) \in imL, V = c_{1} v_{1} + c_{2} v_{2} + ... + c_{n} v_{n}
    • L(v_{1}) + L(v_{2}) + ... + L(v_{k}) = \vec{0} + \vec{0} + .... + \vec{0}
    • \therefore L(V) = L(c_{1} v_{1} + c_{2} v_{2} + ... + c_{n} v_{n})
    • = L(c_{1} v_{1}) + L(c_{2} v_{2}) + ... + L(c_{n} v_{n})
    • = L(c_{k+1} v_{k+1}) + L(c_{k+2} v_{k+2}) + ... + L(c_{n} v_{n})
      • (\because L(v_{1}) + L(v_{2}) + ... + L(v_{k}) = \vec{0})
    • = c_{k+1}L(v_{k+1}) + c_{k+2}L(v_{k+2}) + ... + c_{n}L(v_{n}) \in imL
    • span\{ L(v_{k+1}), L(v_{k+2}), ... , L(v_{n}) \} = imL
  • 선형독립 증명
    • c_{k+1}L(v_{k+1}) + c_{k+2}L(v_{k+2}) + ... + c_{n}L(v_{n}) = \vec{0} 라 하자
    • = L(c_{k+1} v_{k+1} + c_{k+2} v_{k+2}) + ... + c_{n} v_{n})
    • \exists c_{1}, c_{2}, ... , c_{k}
    • s.t) c_{1} v_{1} + ... + c_{k} v_{k} = c_{k+1} v_{k+1} + ... + c_{n} v_{n}
    • \Leftrightarrow c_{1} v_{1} + ... + c_{k} v_{k} - c_{k+1} v_{k+1} - ... - c_{n} v_{n} = \vec{0}
    • \therefore c_{1} = c_{2} = ... = c_{n} = 0
    • \therefore L(v_{k+1}), L(v_{k+2}), ... , L(v_{n}) 은 선형독립

비둘기집 원리

따름정리

차원이 같은 두 유한 차원 벡터공간 V, W 사이에 선형사상 L 이 정의되어 있으면 다음이 성립한다.

L 은 전사 \Leftrightarrow L 은 단사 \Leftrightarrow L 은 전단사

  • 증명)
    • L 이 전사 \Rightarrow L 단사
      • Let) dim(V) = dim(W) = n
      • if L 이 전사
        • \Rightarrow dim(L(V)) = dim(imL) = n
        • \Rightarrow dim(kerL) = n - n = 0
        • \Leftrightarrow kerL = \{ \vec{0} \in V \}
        • L(v_{1}) = L(v_{2}), \forall v_{1}, v_{2} \in V
        • \Rightarrow L(v_{1}) - L(v_{2}) = \vec{0}
        • \Rightarrow L(v_{1} - v_{2}) = \vec{0} \in W
        • \Rightarrow v_{1} - v_{2} = \vec{0}
        • \Rightarrow v_{1} = v_{2}
    • L 이 단사 \Rightarrow L 전사
      • if L 이 단사
      • \Rightarrow dim(kerL) = 0
      • \Rightarrow dim(L(V)) = n
      • \therefore L(V) \subset W 이면서 dim(L(V)) = dim W
      • 따라서 L(V) = W = imL

비둘기집 원리

공집합이 아닌 두 유한집합 A, B 의 크기가 서로 같을 때, 함수 f : A \to B 는 다음을 만족한다.

f 은 전사 \Leftrightarrow f 은 단사 \Leftrightarrow f 은 전단사

계수정리

관련 용어

행렬 M \in \mathcal{M}_{m \times n}(F) 에 대하여

  • 열공간: M 의 열벡터들로 생성된 공간
  • 열계수: 열공간의 차원. col-rank M
  • 행공간: M 의 행벡터들로 생성된 공간
  • 행계수: 행공간의 차원. row-rank M
  • 영공간: 연립방정식 MX = 0 의 해공간
  • nullity M : M 의 영공간 차원

예)

  • M = \left( \begin{array}{rrr} 3 & 1 & 2 \\ 1 & 0 & -1 \end{array} \right) \in \mathcal{M}_{2 \times 3}(\mathbb{R})
    • 열공간
      • span\{(3, 1), (1, 0), (2, -1)\} = \mathbb{R}^{2}
      • col-rank M: dim(\mathbb{R}^{2}) = 2
    • 행공간
      • span\{(3, 1, 2), (1, 0, -1)\} = span\{ (1, 0, -1), (0, 1, 5) \}
      • = \{ (k, m, -k+5m) | k, m \in \mathbb{R} \}
      • row-rank M = 2
    • 영공간
      • MX = 0 \Leftrightarrow \left( \begin{array}{rrr} 3 & 1 & 2 \\ 1 & 0 & -1 \end{array} \right) \left( \begin{array}{rrr} x \\ y \\ z \end{array} \right) = \left( \begin{array}{rrr} 0 \\ 0 \\ 0 \end{array} \right) 
      • \Leftrightarrow \begin{cases} 3x + y + 2z = 0 \\ x - z = 0 \end{cases}
      • \Leftrightarrow \begin{cases} z = t \\ x = t \\ y = -5t \end{cases}
      • \therefore \left( \begin{array}{rrr} x \\ y \\ z \end{array} \right) = t \left( \begin{array}{rrr} 1 \\ -5 \\ 1 \end{array} \right)
      • nullity M = 1

계수정리

계수정리

행렬 M \in \mathcal{M}_{m \times n}(F) 에 대하여 다음이 성립한다.

col-rank M = row-rank M

이때 행렬 행렬 M 에 대하여의 행공간 및 열공간의 공통차원을 M 의 계수 rank M 이라 한다.

  • 증명) 행렬 A M 의 기약행사다리꼴 행렬이라 하자
    • \begin{cases} col-rank M = col-rank A \\ row-ran M = row-rank A \end{cases}
    • col-rank A : 선도 1을 포함하는 열의 개수 = 선도 1의 개수
    • row-rank A : 선도 1을 포함하는 행의 개수 = 선도 1의 개수
    • \therefore col-rank M = col-rank A = row-rank A = row-rank M

Rank-Nullity 정리

행렬 M \in \mathcal{M}_{m \times n}(F) 에 대하여 다음이 성립한다.

n = rank M + nullity M

  • 증명) 행렬 A M 의 기약행사다리꼴 행렬이라 하자
    • rank M = r (\leq n) 라 하면
    • \Rightarrow A 의 선도 1의 개수 = r
    • MX = 0 \Rightarrow 자유변수 개수 = n - r
    • nullity M = n - r
    • 즉, rank M + nullity M = r + (n - r) = n

Rank-Nullity를 선형사상으로 변환하면 다음과 같다.

  • \begin{cases} n = dim(V) \\ rank M = dim(imL) \\ nullity M = dim(kerL) \end{cases}
  • \therefore dim(V) = dim(imL) + dim(kerL)

이상엽/ 선형대수학/ 수학적 벡터 (벡터공간)

대수구조

대수구조

수 뿐만 아니라 수를 대신할 수 있는 모든 것을 대상으로 하는 집합과 그 집합에 부여된 연산이 여러 가지 공리로써 엮인 수학적 대상.

간단히 일련의 연산들이 주어진 집합을 대수구조라고 한다.

여러 대수구조

  • 집합: 아무런 연산이 부여되지 않은 대수구조
  • 반군: 집합과 그 위의 결합법칙을 따르는 하나의 이항 연산을 갖춘 대수구조
  • 모노이드: 항등원을 갖는 반군
  • 군: 역원을 갖는 모노이드
  • 아벨군(가환군): 교환법칙이 성립하는 군
    • 아벨군이 되면 1종류의 이항 연산에 대해 4개의 기본 연산을 만족하게 됨. (결합법칙/교환법칙/항등원/역원)
  • 환: 덧셈에 대하여 아벨군, 곱셈에 대하여 반군을 이루고 분배법칙이 성립하는 대수구조
    • 환부터는 2종류의 이항 연산이 부여 됨.
    • 1종류의 이항 연산은 아벨군을 만족해야 하고, 나머지 1종류의 이항 연산은 반군을 만족 시켜야 함.
  • 가군: 어떤 환의 원소에 대한 곱셈이 주어지며, 분배법칙이 성립하는 아벨군
    • 벡터공간은 가군의 한 종류
    • 가군은 환에서 원소를 받는게 기본이지만, 벡터공간은 보다 엄격하게 체에서 원소를 받아 온다.
  • 가환환: 곱셈이 교환법칙을 만족하는 환
    • 환 중에 반군을 만족 시키는 나머지 1종류의 연산이 추가로 교환 법칙을 만족. 하지만 항등원과 역원은 존재하지 않는다.
  • 나눗셈환: 0이 아닌 모든 원소가 역원을 가지며, 원소의 개수가 둘 이상인 환
    • 환 중에 반군을 만족 시키는 나머지 1종류의 연산이 항등원과 역원을 가짐. 하지만 교환 법칙은 만족하지 않는다.
  • 체: 가환환인 나눗셈환. 즉, 사칙연산이 자유로이 시행될 수 있고 산술의 잘 알려진 규칙들을 만족하는 대수구조
    • 2종류의 이항연산이 모두 4개의 기본연산을 만족 함.

(\mathbb{R}, *), (V, +, \cdot) -> 이런식으로 표기되면 대수구조가 된다. 대상이 되는 집합을 정의하고 그 집합에 적용되는 연산에 대한 정의가 되면 대수구조가 된다.

환 이전까지는 연산의 종류가 1종류이고 환 이후로 체까지는 연산의 종류가 2가지가 됨. 연산의 종류가 3개 이상인 경우도 있으나 여기서는 생략.

벡터공간

벡터공간

F 에 대한 가군 (V, +, \cdot) 을 벡터공간, V의 원소의 벡터라 한다.

이때 + 는 벡터의 덧셈이고, \cdot 는 벡터의 스칼라배이다.

  • 참고)
    • + : V \times V \to V 인 함수
    • \cdot : F \times V \to V 인 함수
  • (V, +) 는 아벨군이다. (u, v, w \in V)
    • (u + v) + w = u + (v + w)
    • u + v = v + u
    • u + \vec{0} = u \vec{0} V 에 존재한다.
    • u + (-u) = \vec{0} -u V 에 존재한다.
  • (V, +, \cdot) F 의 가군이다. (k, m \in F)
    • k \cdot (m \cdot u) = (km) \cdot u
    • F 의 곱셈 항등원 1에 대해 1 \cdot u = u
    • (k + m) \cdot (u + v) = k \cdot u + m \cdot u + k \cdot v + m \cdot v

수학적으로 벡터란 벡터공간의 원소를 의미함. 벡터공간이란 벡터 대수구조를 만족하는 것을 의미. –아래 예시와 같이 덧셈 연산을 곱셈으로, 곱셈 연산을 지수 연산으로 바꾸어도 벡터 대수구조를 만족하므로 벡터 공간이 된다. 고로 그 집합에 속하는 원소 또한 벡터가 됨–

방향 같은 개념은 수학적인 벡터의 고려 대상이 아님. 그러나 이와 같은 정의가 만족되면 물리적인 벡터에 대해서도 동일하게 적용이 가능. 물리적인 벡터 개념에서 엄밀한 개념만 남긴 것이 수학적 벡터 개념.

  • ex)
    • 벡터에 대한 집합과 다음과 같이 정의할 때
      • V = \{ x | x \in \mathbb{R}, x > 0 \}
      • F = \mathbb{R}
      • + : V \times V \to V, u + v = uv
        • +를 곱셈으로 정의
        • V의 원소와 V의 원소에 대한 +을 하면 그 결과가 V가 나온다.
      • \cdot = F \times V \to V, k \cdot u = u^{k}
        • \cdot 을 지수곱으로 정의
        • F의 원소와 V의 원소에 대한 \cdot 을 하면 그 결과가 V가 나온다.
    • 이와 같은 정의 또한 벡터공간의 대수구조를 만족하므로 벡터공간이라 할 수 있다.
      • (V, +) 는 아벨군이 되고, (V, +, \cdot) 은 가군이 된다.

선형생성

부분벡터공간

벡터공간 V 상에서 정의된 덧셈과 스칼라배에 대하여 그 자체로서 벡터공간이 되는 V 의 부분집합 W V 의 부분벡터공간 또는 부분공간이라 한다.

선형생성

벡터공간 V 의 공집합이 아닌 부분집합 S = \{ v_{1}, v_{2}, ... , v_{n} \} 내의 벡터들의 가능한 모든 선형결합으로 이루어진, V 의 부분벡터공간을 S 의 (선형)생성 span(S) 이라 한다. 즉,

span(S) = \{ \sum_{i = 1}^{n} k_{i} v_{i} | k_{i} \in F, v_{i} \in S \}

이때 S span(S) 을 (선형)생성한다 라고 한다.

  • ex)
    • S = { (1, 0), (0, 1) }, F = \mathbb{R} 라 할 때 –S는 (1, 0), (0, 1)의 벡터를 가진 집합
    • span(S) = \{ k(1, 0) + m(0, 1) | k, m \in F \} 
    • = \{ (k, m) | k, m \in F \}
    • = \mathbb{R}^{2}
    • S라는 집합은 2차원 실수 벡터 공간을 생성한다. (= (1, 0), (0, 1) 이라는 벡터 2개만 있으면 2차원 실수 벡터 공간을 만들 수 있다)

선형 독립

벡터공간 V 의 공집합이 아닌 부분집합 S = \{ v_{1}, v_{2}, ... , v_{n} \} 에 대하여

k_{1} v_{1} + k_{2} v_{2} + ... + k_{n} v_{n} = \vec{0} \\ \Rightarrow k_{1} = k_{2} = ... = k_{n} = 0

이면 S 가 선형독립이라고 한다. 만약 k_{1} = k_{2} = ... = k_{n} = 0 외의 다른 해가 존재하면 S가 선형종속이라고 한다.

  • ex)
    • S_{1} = { (1, 0), (0, 1), (1, 1) } 라 할 때
      • k_{1}(1, 0) + k_{2}(0, 1) + k_{3}(1, 1) = \vec{0} 를 만족하는 K의 값은
      • k_{1} = k_{2} = k_{3} = 0 \\ k_{1} = k_{2} = 1, k_{3} = -1 ... 과 같이 모든 k가 0이지 않은 해가 존재하므로 S_{1} 은 선형종속집합이 된다.
    • S_{2} = { (1, 0), (0, 1) } 라 할 때
      • k_{1}(1, 0) + k_{2}(0, 1) = \vec{0} 를 만족하는 K의 값은
      • k_{1} = k_{2} = 0 뿐이므로 S_{2} 은 선형독립집합이 된다.

여러 벡터공간

노름공간

노름이 부여된 K-벡터공간 (V, \|\cdot\|)

노름이란 \forall u, v \in V, \forall k \in K 에 대해 아래 세 조건을 만족시키는 함수

\|\cdot\| : V \to [0, \infty) 이다. (K \in \{ \mathbb{R}, \mathbb{C}\})

  • \|kv\| = |k|\|v\|
  • \|u + v\| \leq \|u\| + \|v\|
  • \|v\| = 0 \Leftrightarrow v = \vec{0}

내적공간

내적이 부여된 K-벡터공간 (V, <\cdot, \cdot>)

내적이란 \forall u, v, w \in V, \forall k \in K 에 대해 아래 네 조건을 만족시키는 함수

<\cdot, \cdot> : V \times V \to K 이다. (K \in \{ \mathbb{R}, \mathbb{C}\})

  • <u + v, w> = <u, w> + <u, w>
  • <ku, v> = k<v, u>
  • <u, v> = <\overline{v, u}>
    • (복소수체 일 때는 위에 바가 붙고, 실수에서는 붙지 않는다)
  • v \neq \vec{0} \Rightarrow <v, v> > 0

유클리드공간

음이 아닌 정수 n 에 대하여 n 차원 유클리드공간 R^{n} 은 실수집합 R n 번 곱집합이며, 이를 n 차원 실수 벡터공간으로써 정의하기도 한다.

이 위에 내적 <u, v> = \sum_{i=1}^{n} u_{i} v_{i} = u \cdot v 을 정의하면 점곱, 스칼라곱이라고도 한다.

기저와 차원

기저

벡터공간 V 의 부분집합 B 가 선형독립이고 V 를 생성할 때, B V 의 기저라 한다.

  • ex)
    • V = \mathbb{R}^{2}
    • B_{1} = \{ (1, 0), (0, 1) \} 일 때
      • \Rightarrow span(B_{1}) = \mathbb{R}^{2}  
      • \therefore B_{1} V 의 기저
    • B_{2} = \{ (1, 0), (1, 1) \} 일 때
      • (a, b) = k(1, 0) + m(1, 1) = (k+m, m)
      • \therefore m = b, k = a - b  
      • \therefore B_{2} V 를 생성할 수 있고 선형독립이므로 V 의 기저가 된다.
    • S = \{ (1, 0), (0, 1), (1, 1) \} 일 때
      • span(S) = \mathbb{R}^{2} 를 만족하지만, 선형독립이 아니므로 S V 의 기저가 안 된다.

차원

B 가 벡터공간 V 의 기저일 때 B 의 원소의 개수를 V 의 차원 dim(V) 라 한다.

  • ex)
    • 앞선 예에서 B_{1}, B_{2} V 의 기저이고 B_{1}, B_{2} 의 원소의 개수는 2개이므로 V 는 2차원이 된다.

정규기저

다음 조건을 만족하는 노름공간 V 의 기저 B 를 정규기저라 한다.

\forall b \in B, \|b\| = 1

직교기저

다음 조건을 만족하는 내적공간 V 의 기저 B 를 직교기저라 한다.

\forall b_{1}, b_{2} \in B, <b_{1}, b_{2}> = 0

정규직교기저

정규기저이자 직교기저인 내적공간의 기저를 정규직교기저라 한다.

특히 R^{n} 의 정규직교기저 

\{ (1, 0, ... , 0), (0, 1, ... , 0), ... , (0, 0, ... , 1) \}

를 표준기저라 한다.

  • ex) R^{2} 에 대하여
    • B_{1} = \{ (1, 0), (0, 1) \} 는 정규기저도 아니고 직교기저도 아니다.
    • B_{2} = \{ (1, 0), ({1 \over \sqrt{2}}, {1 \over \sqrt{2}}) \} 는 정규기저지만 직교기저는 아니다.
    • B_{3} = \{ (1, 1), (1, -1) \} 는 정규기저는 아니지만 직교기저이다.
    • B_{4} = \{ (1, 0), (0, 1) \} 는 정규기저이고 직교기저이다. 이를 특별히 표준기저라고 한다.

이상엽/ 선형대수학/ 물리적 벡터

벡터와 좌표계

평면벡터

R^{2} 에서 크기(스칼라)와 방향의 의미를 모두 포함하는 표현 도구

  • 벡터는 크기와 방향만 고려하므로 위치가 다르더라도 크기와 방향이 같으면 같은 것으로 인정한다. 고로 아래 이미지상 v와 동일한 벡터는 d가 된다.

공간벡터

R^{3} 에서 크기와 방향의 의미를 모두 포함하는 표현 도구

n차원 벡터

R^{n} 상의 벡터 v = (v_{1}, v_{2}, ... , v_{n}) = \vec{AB} = (b_{1} - a_{1}, b_{2} - a_{2}, ... , b_{n} - a_{n})

  • 영벡터 \vec{0} = 0 = (0, 0, ... , 0)
  • 두 벡터 v = (v_{1}, v_{2}, ... , v_{n}), w = (w_{1}, w_{2}, ... , w_{n}) 가 같다
    • \Leftrightarrow v_{1} = w_{1}, v_{2} = w_{2}, ... , v_{n} = w_{n}

벡터의 연산

노름

  • 벡터의 크기 (또는 길이) 라고 한다.
    • \|v\| = \sqrt{v_{1}^{2} + v_{2}^{2} + ... + v_{n}^{2}}
  • 노름이 1인 벡터를 단위벡터라고 한다.
    • 정규화: 벡터의 단위 벡터 (크기를 1)로 만드는 과정.
      • {v \over \|v\|} = \hat{v}
  • e_{1} = (1, 0, 0, ... , 0), e_{2} = (0, 1, 0, ... , 0) 등을 표준 단위벡터라고 한다.
    • 벡터를 표준단위 벡터를 이용하여 아래와 같이 표현 가능
    • v = (v_{1}, v_{2}, ... , v_{n}) = v_{1} e_{1} + v_{2} e_{2} + ... + v_{n} e_{n}

선형결합

  • 선형이라는 의미는 선으로 그려지는 것 보다는 –축소된 의미– ‘예측 가능한’ 이라는 의미로 이해하는 것이 좋다.
    • 역으로 비선형이라는 말은 ‘예측 불가능한’ (확률적인) 이라는 의미로 이해하는 것이 좋음.

벡터의 덧셈과 뺄셈

v \pm w = (v_{1} \pm w_{1}, v_{2} \pm w_{2} + ... + v_{n} \pm w_{n})

벡터의 실수배

kv = (kv_{1}, kv_{2}, ... , kv_{n})

선형(일차) 결합

R^{n} 의 벡터 w 가 임의의 실수 k_{1}, k_{2}, ... k_{r} 에 대하여

w = k_{1}v_{1}, k_{2}v_{2}, ... k_{r}v_{r} 의 형태로 쓰여지면 w v_{1}, v_{2}, ... v_{r} 의 선형(일차)결합이라 한다.

스칼라 곱

한 벡터가 다른 벡터의 방향에 대해 가한 힘에 의해 변화된 스칼라(크기), 점곱 또는 내적

  • 스칼라 결과를 얻어 내기 위한 벡터 곱
  • 점 곱(dot product) 또는 내적이라고도 한다.

v \cdot w = \|v\| \|w\| cos \theta = v_{1}w_{1} + v_{2}w_{2} + ... + v_{n}w_{n}

(\theta 는 두 벡터 v, w 가 이루는 각)

  • 개념적으로 봤을 때 두 벡터의 스칼라 곱은 두 벡터의 크기를 곱한 것으로 정의한다.
  • 다만 벡터는 방향이라는 개념이 있기 때문에 단순 곱만이 아니라 추가적인 정의가 필요한데,
    • 일단 두 벡터 v, w가 같은 방향일 경우 스칼라 곱은 두 벡터의 곱으로 정의해 볼 수 있다.
      • \vec{v} \cdot \vec{w} = \|\vec{v}\| \times \|\vec{w}\|
    • 만일 두 벡터 v, w가 다른 방향일 경우, w를 v와 동일한 방향과 그렇지 않은 방향으로 분해해서 v와 곱할 수 있다.
      • 위 그림에서 w는 v와 일치하는 방향과 v와 수직인 방향으로 분해할 수 있는데, v와 일치하는 방향의 크기와 v를 곱한게 최종적인 벡터의 스칼라 곱으로 정의가 된다. (w의 크기보다 줄어드는데 이는 w의 수직 방향의 힘이 v와 같은 방향의 힘을 줄이기 때문이라고 이해할 수 있다.)
      • w를 v와 같은 방향의 벡터인 a와 v와 직교하는 방향의 벡터인 b로 분해하면 다음과 같은 수식으로 표현할 수 있다.
      • \vec{v} \cdot \vec{w} = \|\vec{v}\| \times \|\vec{a}\| = \|\vec{v}\| \times \|\vec{w}\| \times cos \theta
        • \vec{a} 의 크기는 \vec{w} 의 크기에 cos \theta 를 곱한 것과 같다.

벡터의 연산 성질

R^{n} 상의 벡터 u, v, w 와 스칼라 k, m 에 대하여 다음이 성립한다.

  • u + v = v + u
  • (u + v) + w = u + (v + w)
  • u + \vec{0} = \vec{0} + u = u
  • u + (-\vec{u}) = \vec{0}
  • k(u + v) = ku + kv
  • (k+m)u = ku + mu
  • k(mu) = (km)u
  • 1u = u
  • 0u = \vec{0}, k\vec{0} = \vec{0}
  • u \cdot v = v \cdot u
  • \vec{0} \cdot u = u \cdot \vec{0} = \vec{0}
  • u \cdot (v + w) = u \cdot v + u + \cdot w
  • (u + v) \cdot w = u \cdot w + v + \cdot w
  • k(u \cdot v) = (ku) \cdot v = u \cdot (kv)

벡터 곱

방향은 두 벡터에 동시에 수직이고 크기는 두 벡터의 평행사변형의 면적인 R^{3} 상의 벡터, 가위곱, 또는 외적

  • 벡터 결과를 얻어 내기 위한 벡터 곱
    • 같은 맥락에서 텐서 결과를 얻어 내기 위한 벡터 곱은 텐서 곱이라고 한다.
  • 가위 곱(cross product) 또는 외적 이라고도 한다.
    • 사실 외적이라는 표현은 적절하지 못한 표현인데, 텐서 곱이 외적이기 때문.
  • 벡터 곱은 오로지 3차원에서만 정의 되며, 2차원, 4차원 이상에서 정의 불가.
    • 반면 스칼라 곱은 N 차원에 대해 정의 가능.

v \times w = ( \left| \begin{array}{rr} v_{2} & v_{3} \\ w_{2} & w_{3} \end{array} \right|, -\left| \begin{array}{rr} v_{1} & v_{3} \\ w_{1} & w_{3} \end{array} \right|, \left| \begin{array}{rr} v_{1} & v_{2} \\ w_{1} & w_{2} \end{array} \right| )

  • 벡터 곱의 크기는 두 벡터의 크기의 곱이 되고 (평행사변형의 면적), 방향은 두 벡터에 동시에 수직인 방향이 된다.
    • 벡터 곱은 순서가 중요한데, 순서에 따라 벡터 곱의 방향이 바뀐다.
    • 위 예시에서 v \times w 는 위로, w \times v 는 아래로 가는 벡터가 된다.
  • 벡터 곱 연산은 두 벡터의 행렬식으로 계산된다.

벡터 곱의 성질

R^{3} 상의 벡터 u, v, w 와 스칼라 k 에 대하여 다음이 성립한다.

  • u \times v = -(v \times u)
    • 벡터 곱 순서를 바꾸면 방향이 반대가 된다.
  • u \times (v + w) = (u \times v) + (u \times w)
  • (u + v) \times w = (u \times w) + (v \times w)
  • k(u \times v) = (ku) \times v = u \times (kv)
  • u \times \vec{0} = \vec{0} \times u = \vec{0}
  • u \times u = \vec{0}
    • 자기 자신과 벡터 곱을 하면 영벡터가 된다.

벡터의 응용

직선의 표현

R^{2} 또는 R^{3} 에서 위치벡터가 a 인 점 A 를 지나며 방향벡터가 v 인 직선 상의 임의의 점 X 의 위치벡터 x

x = a + kv

을 만족한다. (단, k 는 임의의 실수)

  • 직선의 방정식이 아니라 벡터 –위치벡터와 방향벡터– 를 통해서도 직선을 표현할 수 있다는 뜻.
    • 위치벡터란 원점을 시점으로 하는 벡터를 뜻한다.
    • 방향벡터란 직선이 늘어나는 방향을 지시하는 벡터를 뜻한다.
  • y = x + 2 라는 직선의 방정식을 벡터를 이용해서 표현하면 (x, y) = (-1+k, 1+k) 의 꼴이 된다.

평면의 표현

R^{3} 에서 위치벡터가 a 인 점 A 를 지나며 법선벡터가 v 인 평면 상의 임의의 점 X 의 위치벡터 x

(x - a) \cdot v = 0

을 만족한다. 

  • 법선벡터는 평면상의 서로 다른 두 직선의 방향벡터들의 벡터 곱으로써 구하면 용이하다.
    • 법선벡터란 평면에 수직인 벡터를 뜻한다.

  • x - 2 + y + z = 0 라는 평면의 방정식을 벡터를 이용해서 표현하면 (x-2, y, z) 의 꼴이 된다.