Category Archives: 배우기

이상엽/ 해석학/ 극한과 연속

함수의 극한

무한소와 극한

  • 무한소란 ‘무한히 작은 수’를 일컫는 직관적인 개념으로 고전적으로 미적분을 설명하기 위해 쓰였다.
    • 아르키메데스가 최초로 정립함. 이를 뉴턴과 라이프니츠가 이용해서 미적분학을 정립
    • 무한소는 미적분을 설명하는 도구이지만, 극한을 설명하는 동구는 아니다.
  • 실수체에는 무한소가 존재하지 않으며 \epsilon-\delta 논법으로 정의된 극한으로써 미적분을 설명한다.
    • 예전에는 무한소를 이용해서 미적분을 설명했지만 \epsilon-\delta 논법이 등장한 이후 극한으로 미적분을 설명함으로써 무한소는 수학계에서 사용되지 않음
  • 초실수체에서는 무한소로써 미적분을 설명 가능하다. (비표준 해석학)
    • 초실수체는 무한소를 공리로 받아들임. 초실수체는 순서체일 뿐 완비순서체가 아님. 조밀성이 성립하지 않음.
    • 비표준 해석학에서는 미적분을 무한소로 정의할 뿐. 극한으로 설명하지는 않는다. 무한소와 극한은 양립 불가능한 개념

극한의 정의

Def 1. [수렴과 극한(값)]

f : D \to \mathbb{R}, a \in D, L \in \mathbb{R} 라 하자

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, 0 < \| x - a \| < \delta \Rightarrow \|f(x) - L \| < \epsilon

이 성립하면 f x = a 에서 극한(값) L 로 수렴한다고 하고 \lim_{x \to a} f(x) = L 로 표기한다.

수렴하지 않는 경우엔 발산한다고 한다.

  • \| x - a \| 가 0이 되어버리면 f(a) 가 되어버리기 때문에 \| x - a \| 는 극한을 정의하기 위해서는 반드시 0보다 커야 함.
  • \forall \epsilon > 0  에 대하여 \| f(x) - L \| < \epsilon 가 성립하려면  \| f(x) - L \| 는 0이 되어야 한다.
  • 고로 극한값 L f(a) 의 값과 완전히 동일한다. L f(a) 에 다가가는 것이 아니다. 둘은 완전히 같다.

Def 2. [우극한과 좌극한]

f : D \to \mathbb{R}, a \in D, L \in \mathbb{R} 라 하자

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, 0 < x - a < \delta \Rightarrow \|f(x) - L \| < \epsilon

이 성립하면 f x = a 에서 우극한 L 을 갖는다고 하고 \lim_{x \to a^{+}} f(x) = f(a{+}) = L 로 표기한다.

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, 0 <  a - x < \delta \Rightarrow \|f(x) - L \| < \epsilon

이 성립하면 \lim_{x \to a^{-}} f(x) = f(a{-}) = L (좌극한)

  • 우극한은 x a 보다 큰거고, 좌극한은 x a 보다 작은 것

Def 3.

a, L \mathbb{R} 라 하자

  1. \forall \epsilon > 0, \exists N \in \mathbb{R}, s.t. x \geq N \Rightarrow \|f(x) - L\| < \epsilon 일 때 \lim_{x \to \infty} f(x) = L
  2. \forall M > 0, \exists \delta > 0, s.t. 0 < \|x - a|\ < \delta \Rightarrow f(x) > M 일 때 \lim_{x \to a} f(x) = \infty
  3. \forall M > 0, \exists N \in \mathbb{R}, s.t. x \geq N \Rightarrow f(x) > M 일 때 \lim_{x \to \infty} f(x) = \infty
  • 일반적으로 임의의 작은 양수는 \epsilon 을 쓰고 임의의 큰 양수는 M 을 쓴다.

극한의 연산

A, B \in \mathbb{R} 이고 f, g : D \to \mathbb{R} 이며 a \in D 라 하자.

\lim_{x \to a} f(x) = A, \lim_{x \to a} g(x) = B 이면 다음이 성립한다.

  1. \lim_{x \to a} { f(x) + g(x) } = A + B
  2. \lim_{x \to a} { f(x) - g(x) } = A - B
  3. \lim_{x \to a} f(x) g(x) = AB
  4. \lim_{x \to a} { f(x) \over g(x) } = {A \over B}
  • 삼각부등식
    • \| a + b \| \leq \|a\| + \|b\|
    • \| a - b \| \geq \|a\| - \|b\|

주요 정리

Thm 1. [극한의 유일성]

f : D \to \mathbb{R}, a \in D 일 때 \lim_{x \to a} f(x) 가 수렴하면 그 극한값은 유일하다.

Thm 2. [샌드위치 정리]

\forall x \in D, f(x) \leq g(x) \leq h(x) 이고

L \in \mathbb{R} 일 때 \lim_{x \to a} f(x) = \lim_{x \to a} h(x) = L 이면 \lim_{x \to a} g(x) = L 이다.

함수의 연속

  • 극한과 함수값이 같을 때 연속이라고 정의

연속의 정의

Def 1. [점 연속]

f : D \to \mathbb{R} 이고 a \in D 라 하자.

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, \|x-a\| < \delta \Rightarrow \|f(x) - f(a)\| < \epsilon

이 성립하면 f x = a 에서 연속이라 한다.

  • a \in D 라는 것이 f(a) 가 정의된다는 뜻
  • 극한과 다른 부분이 \|x-a\| < \delta 부분으로, 극한에서는 0보다 커야 하지만 연속에서는 0이 됨.
  • \|x-a\| < \delta \Rightarrow \|f(x) - f(a)\| < \epsilon f(a) = \lim_{x \to a} f(x) 와 동일한 의미. a 에서의 f(x) 의 극한 값이 f(a) 와 동일하다.

ex) D = \{ 0, 1, 2, 3 \} 일 때, f : D \to \mathbb{R}, f(x) = -x + 3 이면 f x = 2 에서 연속임을 증명하라

\forall \epsilon > 0, Let. \delta = { 1 \over 2 } ( > 0)

Then. \| x - 2 \| < \delta (= {1 \over 2}) \ \forall \epsilon > 0, let \delta = { 1 \over 2 } \Rightarrow x = 2 \in D \

\therefore \| f(x) - f(2) \| = |\ f(2) - f(2) | = 0 < \epsilon

위 정의역의 원소들은 불연속적이지만, x = 2 일때 연속임이 증명된다.

Def 2. [우연속과 좌연속]

f : D \to \mathbb{R} 이고 a \in D 라 하자.

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, 0 \leq x - a < \delta \Rightarrow \|f(x) - f(a)\|< \epsilon

이 성립하면 f x = a 에서 우연속이라 한다.

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x \in D, 0 \leq a - x < \delta \Rightarrow \|f(x) - f(a)\|< \epsilon

이 성립하면 f x = a 에서 좌연속이라 한다.

Def 3. [연속함수]

f : D \to \mathbb{R} 이고 X \subseteq D 라 하자.

  1. 만약 f X 의 모든 점에서 연속이면 f X 에서 연속이라 한다.
  2. 만약 f X 의 모든 점에서 연속이면 f 는 연속함수라 한다.
    • 모든 점에서 연속임을 증명 하는 방법
      1. x = a 에서 연속임을 보인다.
      2. a 가 정의역에서 임의의 점임을 보인다.

Def 4. [불연속점의 종류]

f : D \to \mathbb{R} 이고 a \in D 라 하자.

[제 1종 불연속점]

  1. \lim_{x \to a^{+}} f(x) = \lim_{x \to a^{-}} f(x) \neq f(a) x = a 를 제거 가능 불연속점이라 한다.
    • 그 한 점에서만 새로 정의를 해주면 연속으로 만들 수 있다.
    • 전체에서 문제가 되는 점이 한 점 뿐이라면 (수학에서도) 무시할 수 있다.
  2. \lim_{x \to a^{+}} f(x) \neq \lim_{x \to a^{-}} f(x) x = a 를 비약 불연속점이라 한다.

[제 2종 불연속점]

\lim_{x \to a^{+}} f(x) \lim_{x \to a^{-}} f(x) 중에 적어도 하나가 존재하지 않는다.

균등 연속 (uniformly continuous)

Def. [균등 연속]

f : D \to \mathbb{R} 이라 하자.

\forall \epsilon > 0, \exists \delta > 0, s.t. \forall x, y \in D, \|x-y\| < \delta \Rightarrow \|f(x) - f(y)\| < \epsilon

이 성립하면 f D 에서 균등 연속이라 한다.

Thm. f D 에서 균등 연속이면 연속이다.

연속함수의 연산

a \in D 이고 f, g : D \to \mathbb{R} x = a 에서 연속일 때 다음이 성립한다.

  1. f + g x = a 에서 연속이다.
  2. f - g x = a 에서 연속이다.
  3. fg x = a 에서 연속이다.
  4. g(a) \neq 0 이면 {f \over g} x = a 에서 연속이다.

주요 정리

Thm 1. [최대 최소정리]

f [a, b] 에서 연속

\Rightarrow \exists a_{0}, b_{0} \in [a, b] s.t. \forall x \in [a, b], f(a_{0}) \leq f(x) \leq f(b_{0})

  • 연속인 구간 내에서 반드시 최대, 최소를 정의할 수 있다.

Thm 2. [사잇값(중간값) 정리]

f [a, b] 에서 연속이고

f(a) < f(b) \Rightarrow \exists c \in (a, b) s.t. f(a) < p < f(b), f(c) = p

f(b) < f(a) 이면 f(b) < p < f(a)

  • 연속인 구간 내의 두 함수 값 사이에 반드시 값이 존재한다.

21세기 자본/ 성장: 환상과 현실

  • 부유한 국가와 가난한 국가들 사이의 격차는 좁혀지고 있지만, 이는 부유한 국가들이 가난한 국가들에 투자한 결과라고 보기는 어렵다.
    • 과거 경험을 미루어 볼 때 가난한 나라가 스스로 투자할 능력이 있을 때 좋은 성과를 낼 가능성이 높다.
  • 내가 여기서 강조하고 싶은 점은 21세기가 저성장 체제로 되돌아가는 것을 보게 되리라는 것이다.
    • 더 정확히 말하면 우리가 알게 될 사실은 예외적인 시기나 따라잡기가 이뤄지는 시기를 제외하면 성장은 늘 비교적 느리게 진행되어 왔다는 것이다.
    • 게다가 모든 징후가 앞으로 성장이 더 둔화될 것임을 보여주고 있다.
  • 성장은 항상 순수한 인구적 요인과 순수한 경제적 요인을 포함하는데, 후자만이 생활수준의 개선을 가능케 해준다.

아주 오랜 기간에 걸친 성장

  • 아주 오랜 기간에 걸쳐 성장률 추이를 나타내는 아래 표를 보면 몇 가지 중요한 사실이 드러난다.
    • 첫째, 18세기에 시작된 성장 초기 단계는 비교적 완만한 연간 성장률을 나타낸다.
    • 둘째 성장에 대한 인구 요인과 경제적 요인의 기여도는 대체로 비슷했다. 가능한 최선의 추정치에 따르면 세계 GDP 성장률은 1700년부터 2012년까지 연평균 1.6%였는데, 그중 0.8%는 인구 증가를 반영하는 것이고, 나머지 0.8%는 1인당 생산 증가에 따른 것이다.

  • 이 같은 성장률은 오늘날에 비해 낮다고 생각할 수 있다. 하지만 실제로는 인구와 1인당 생산 모두 한 해 1%씩 성장하는 것은 1700년 이후 그래왔던 것처럼 아주 오랜 기간 지속된다면 굉장히 빠른 성장이다.
    • 산업혁명 이전 수백 년 동안은 성장률이 사실상 제로 수준이나 다름없었다는 사실과 비교하면 더욱 그렇다.
    • 실제로 매디슨의 계산에 따르면 0년과 1700년 사이의 인구증가율과 경제성장률은 0.1%이하였다. (더 정확히 말하면 인구 증가는 0.06%, 1인당 생산은 0.02%이다)
  • 추정치가 미덥지 못하기는 하지만 고대부터 산업혁명에 이르기까지 성장 속도가 연간 0.1-0.2% 이하로 매우 느렸다는 것은 의심할 여지가 없다.
    • 성장률리 그보다 높았다면 이는 인구가 극소수에 불과했더나 당시 생활수준이 일반적으로 받아들여지는 생존 수준에도 한참 못 미쳤다는 있을 수 없는 사실을 의미하기 때문이다.
  • 적어도 인구 요인을 보면 다가오는 여러 세기에도 성장률이 매우 낮은 수준으로 되돌아갈 가능성이 높다.

누적 성장의 법칙

  • 아주 오랜 기간에 걸친 낮은 연간 성장률이 상당한 발전을 가져올 수 있다는 의미에서 ‘누적 성장의 법칙’이라 부른다.
    • 구체적으로 1700-2012년 세계 인구는 불과 연평균 0.8% 증가하는데 그쳤지만, 이 같은 증가가 3세기에 걸쳐 이뤄졌다는 것은 세계 인구가 10배 이상으로 늘어났음을 의미한다.
  • 연간 성장률이 1%이면 30년 뒤에는 1.35배, 한 세기 뒤에는 3배, 3세기 뒤에는 20배, 1000년 뒤에는 2만 배 이상으로 인구가 늘어난다.
    • 고로 연 1-1.5%를 초과하는 인구증가율은 무한히 지속할 수 없다는 극히 단순한 결론을 얻어낼 수 있다.

  • 어떤 기간을 선택하느냐에 따라 성장과정에 대해 상반된 인식이 가능하다. 1년에 1% 성장은 거의 인식할 수 없을만큼 매우 낮은 성장이다.
    • 그러나 만약 기간을 한 세대, 즉 사회 변화를 평가하는데 가장 적당한 기간인 30년 정도로만 확장해도 그 같은 성장률이 경제 규모를 1/3이나 키우는 결과를 낳으며, 이는 굉장히 커다란 변화다.
    • 이는 각 세대의 인구가 이전 세대와 비교해서 2배로 증가하는 연 2-2.5%의 성장률에 비하면 덜 인상적인 수치지만 사회를 주기적으로 또 심층적으로 바꿔놓고, 아주 오랜 기간에 걸쳐서는 사회를 근본적으로 변화시키기에 충분하다.

인구 증가의 단계

  • 0-1700년의 평균 인구증가율은 0.2% 보다는 분명히 낮았고, 거의 확실히 0.1%보다 낮았을 것이다.
  • 널리 퍼져 있는 믿음과 달리 맬서스 이론상 매우 낮은 인구 증가 체제가 완전한 인구 정체는 아니었다.
    • 그래도 세계 인구는 0-1000년 사이에 1/4, 1000-1500년 사이에 절반이 늘어났고, 1500-1700년 사이에 또 다시 절반이 증가한 것으로 보이며, 이 기간 인구증가율은 연평균 0.2%에 가까웠다.
    • 인구 증가는 1700년 이후 가속화되어 18세기에 연평균 약 0.4%, 19세기에 연평균 약 0.6%의 증가율을 기록했다.
  • 1700-1913년 가장 급격한 인구 증가 추세를 보였던 유럽은 20세기에 상황이 반전되었는데, 1820-1913년 0.8%에서 1923-2012년 0.4%로 감소했다.
    • 이는 인구 변천(demographic trasition)이라고 알려진 현상인데, 기대수명이 계속 늘더라도 춘산율 저하를 상쇄하기에는 충분치 않아서 인구 증가 속도가 점점 더 낮은 수준으로 하락하는 것을 말한다.
  • 아시아와 아프리카는 유럽보다 더 오랫동안 높은 출산율을 유지했는데, 그 결과 20세기 인구 증가는 아찔할 정도로 치솟았다.
    • 이 지역의 인구는 한 해에 1.5-2%씩 증가했는데, 이는 한 세기 동안 인구가 5배 이상으로 늘어났다는 이야기다.
  • 흥미로운 것은 20세기 아시아와 아프리카에 나타난 연 1.5-2%의 인구증가율은 19세기와 20세기에 미국에 나타난 증가율과 거의 같았다는 점이다.
    • 신대륙의 인구 증가는 다른 대륙 (특히 유럽)에서 온 이민자 때문이라면 아시아와 아프리카의 증가는 오로지 자연적 증가에 기인한 점이라는 차이가 있다.
  • 이러한 인구 증가 가속화의 결과 18-19세기 0.4-0.6%였던 세계 인구증가율이 20세기에는 1.4%라는 기록적인 수준에 이르렀다.

  • 중요한 점은 이처럼 인구 증가가 무한정 가속화되는 시기가 끝나가고 있다는 점이다.
    • 1970-1990년 세계 인구는 여전히 1.8%씩 늘어났는데, 1990-2012년 연평균 증가율은 1.3%로 떨어졌다.
  • 공식적인 예측에 따르면 현재 전 세계 인구 변천이 더 빨리 진행되고 있으며, 이는 결국 지구촌 인구의 안정화로 이어질 것이다.
    • 유엔의 예측에 따르면 인구 증가율은 2030년대까지 0.4%로 떨어지고 2070년대에는 약 0.1%를 기록할 것이다.
    • 이 예측이 맞아떨어지면 세계는 1700년 이전의 매우 낮은 인가 증가 체제로 돌아갈 것이다.
    • 그렇게 되면 1700-2100년 사이의 세계 인구 증가율은 1950-1990년에 정점을 이루는 벨 커브 형태를 띄게 될 것이다.
    • 21세기 후반 인구가 다소 증가할 것으로 예상되는 이유는 전적으로 아프리카 대륙의 인구증가율(연 1%)라는 점을 유의하자. 그 밖의 세 대륙에서 인구는 정체되거나 감소할 것이다.

마이너스 인구 증가?

  • 인구 변화의 역사가 우리에게 가르쳐주는 것은 출산에 관한 결정이 대체로 예측 불가능하다는 점이다.
    • 출산율 같은 복잡한 문제를 결정할 때 심리적 혹은 문화적 설명을 처음부터 배재할 수는 없다.
  • 그럼에도 불구하고 현재 우리의 지식으로 판단해 보건데, 유엔의 중심 시나리오가 가능성이 높다고 할 수 있다.
    • 수 세기 뒤 세계 인구 증가율은 0.8% 보다 훨씬 더 적은 수치가 될 것이고, 장기적으로 볼 때 인구 증가율이 0.1-0.2% 될 것이라는 공식 전망은 그럴듯한 추론이다.

평등화 요인으로서 ‘성장’

  • 인구 증가는 각국의 발전과 상대적 국력을 좌우하기도 하지만, 불평등 구조에도 중요한 시사점을 준다.
    • 다른 조건이 같다면 견조한 인구 증가는 상속 받는 부의 중요성을 감소시키기 때문에 일조으이 평등화 역할을 하는 경향이 있다.
    • 이 경우 모든 세대는 어떤 의미에서는 스스로 부를 쌓아야 한다.
  • 나는 견조한 인구 증가의 효과에 대한 통찰을 인구 증가 뿐만 아니라 매우 급속한 경제성장을 이룬 사회에도 어느 정도 일반화 할 수 있음을 보여줄 것이다.
    • 예컨대 1인당 생산이 한 세대에 10배씩 증가하는 사회에서는 한 사람이 스스로의 노동으로 얼마나 돈을 벌고 저축할 수 있는지 따져보는 것이 더 낫다.
    • 이전 세대의 소득은 현재 소득에 비해 매우 적어서 부모와 조부모가 쌓은 재산은 가치가 크지 않을 것이기 때문이다.
  • 반대로 인구가 정체되거나 감소하면 이전 세대에 축적된 자본의 영향력이 늘어난다. 경제가 정체될 때도 마찬가지다. 더욱이 저성장 체제에서는 자본수익률이 경제성장률을 크게 웃돌 가능성이 상당히 높다.
    • 이런 상황은 장기적으로 부의 분배를 심각한 불평등으로 몰아가는 중요 요인이다.
    • 대체로 상속된 부에 따라 결정되는 계층 구조를 지닌, 자본이 지배하는 과거와 같은 사회는 낮은 성장 체제에서만 생겨나고 존속될 수 있다.
  • 성장이 불평등의 감소나 적어도 엘리트 집단의 빠른 교체에 기여할 수 있는 또 다른 메커니즘이 있는데, 이는 반드시 논의해야 할 주제다.
    • 성장이 제로거나 매우 낮을 때는 직업의 유형 뿐만 아니라 여러 경제적, 사회적 기능이 한 세대에서 다음 세대로 거의 아무런 변화 없이 재생산 된다.
    • 반면 끊임 없는 성장은 그것이 연 0.5%-1.5%에 지나지 않을지라도 모든 세대애세 새로운 역할이 계속 창조되고 새로운 기술을 필요로 한다는 것을 의미한다.
    • 한 세대의 판단력과 재능이 부분적으로 다음 세대로 이전되는 한 경제성장은 이전 세대에서 엘리트 층에 속하지 않은 부모를 둔 개인들의 사회적 이동성을 늘릴 수 있다.
    • 이러한 사회적 신분 상승의 가능성이 반드시 소득불평등을 감소시키는 것은 아니지만 이론적으로 부의 불평등의 재생산과 확대를 제한하므로 장기적인 안목으로 볼 때 이는 소득불평등도 어느 정도 제한하게 된다.
  • 현대의 경제성장이 개인의 능력과 재능을 발현시켜주는 경이로운 수단이라는 통념은 경계해야 한다.
    • 이런 관점은 어느 정도 옳지만, 이런 생각이 19세기 초 이후 온갖 불평등을 정당화 하는데 이용되었으며, 동시에 상상 가능한 온갖 미덕을 들어 새로운 산업경제의 승자들을 미화하는데 이용되었다.

경제성장의 단계

  • 부유한 국가들의 경우 1인당 월소득이 1700년에 불과 100유로에 불과했지만 2012년에는 2500유로 이상으로 올랐다.
    • 생산성, 즉 노동시간당 생산은 더 큰 폭으로 늘어났는데, 이는 각 개인의 평균 노동시간이 극적으로 줄어들었기 때문이다.
    • 선진국들은 더 부유해질 수록 더 많은 자유시간을 얻기 위해 더 적게 일하기로 결정했다.
  • 이같은 놀라운 성장은 대부분 20세기에 일어났다.
  • 그런데 구매력이 20배, 10배, 6배가 된다는 것은 무엇을 의미할까? 이는 분명 2012년의 유럽인들이 1913년에 생산되고 소비된 것보다 6배 많은 상품과 서비스를 생산하고 소비했다는 뜻은 아니다.
    • 유럽 뿐만 아니라 다른 곳에서도 장기간의 구매력과 생활수준의 향상은 무엇보다 소비 구조의 변화에 의해 좌우된다.
    • 주로 식품류로 가득 찼던 소비자 장바구니가 점차 공산품과 서비스 품목이 골고루 섞인 훨씬 더 다양한 내용의 장바구니로 바뀌었다.

구매력 10배 성장은 무엇을 의미하는가

  • 산업 혁명 이후 생활 수준의 놀라운 성장을 정확하게 측정하는 유일한 길은 현재의 화폐가치로 소득 수준을 환산하고, 이를 여러 다른 시기의 다양한 상품 및 서비스의 가격 수준과 비교하는 것이다.
  • 상품과 서비스는 다음 세 가지 유형으로 구분하는 것이 표준화된 방법이다.
    • 공산품의 경우 생산성 증가가 전체적인 경제성장보다 빨랐다. 그러므로 이 부문의 가격은 모든 가격의 평균보다 상대적으로 더 많이 떨어졌다.
    • 식품류의 생산성은 장기간에 걸쳐 꾸준하게 상당한 폭으로 증가했다. 그러므로 그 어느 때보다 소수의 사람이 크게 증가한 인구를 먹일 수 있게 되고 많은 일손이 여유시간을 갖게 되어 다른 일에 종사하는 것이 가능해졌다.
    • 서비스 부문의 생산성 향상은 일반적으로 낮아서 서비스 부문의 가격은 모든 가격의 평균보다 더 빠르게 상승했다.
  • 한 가지 지표로 모든 변화를 요약하려는 시도가 얼마나 헛되고 지나친 단순화인지 알지만, 어쨌건 그 어느 것도 오늘날의 실제적인 성장에 이의를 제기하지는 않는다.
    • 산업혁명 이래 전 세계 사람들이 더 잘 먹고 입고 여행하고 의료 서비스를 받을 수 있도록 삶의 물질적 조건이 놀랄만큼 개선된 것은 사실이다.

성장: 다양해지는 생활양식

  • 서비스 부문의 생산성 증가는 다른 부문보다 빠르지 않이 이 부문에서 본 구매력은 증가 폭이 훨씬 낮았다.
    • 전형적인 예로 수 세기 동안 기술 혁신의 덕을 별로 보지 못한 ‘순수한’ 서비스인 이발이 자주 언급된다.
    • 머리를 깎는데는 지금도 한 세기 전과 같은 시간이 걸리므로 이발 요금은 이발사의 임금과 같은 속도로 높아졌고, 이발사의 임금은 평균 임금 그리고 평균 소득과 같은 속도로 높아졌다.
    • 다시 말해 21세기 전형적인 임금노동자가 한 시간 일해서 구매할 수 있는 이발 서비스는 100년 전에 한 시간 일해서 구매할 수 있는 서비스와 같으므로 이발 서비스로 표시한 구매력은 커지지 않았다. (아마 실제로는 약간 줄어들었을 것이다)
  • (서비스업에 대한 여러 설명 생략)

성장의 종말?

  • 과거의 성장은 언제나 연 1-1.5%를 넘지 않는 비교적 느린 속도로 이루어졌다.
    • 역사적으로 이보다 더 뚜렷이 빠른 성장(3-4%이상)을 보인 사례는 다른 나라를 급속하게 따라잡고 있던 나라들에서만 나타났다.
    • 이 같은 급성장은 본질적으로 따라잡기가 이뤄지고 나면 끝나는 것이고, 따라서 제한된 기간 동안 나타나는 과도기적인 것일 수밖에 없다.
  • 세계적으로 1인당 생산 증가율은 1700-2012년에 연평균 0.8%를 기록했는데, 이를 기간별로 나누면 1700-1820년에 0.1%, 1820-1913년에 0.9%, 1913-2012년에 1.6%를 기록했다.
    • 1700-2012년 세계 인구증가율도 똑같이 0.8%를 기록했다.
  • 다음 표는 시기별, 대륙별 경제성장률을 보여준다.
    • 이 표의 핵심은 역사적으로 볼 때 세계적인 첨단 기술을 보유한 국가라 하더라도 오랜 기간에 걸쳐 연평균 1.5%를 넘는 1이낭 생산 증가율을 기록한 사례는 없다는 점이다.
    • 최근 수십 년을 보면 가장 부유한 국가들은 그보다 더 낮은 증가율을 보였다.
    • 아직도 성장률이 3-4%는 되어야 한다고 생각하는 사람들이 많은데, 이는 역사와 논리 모두 환상임을 보여준다.

  • 로버트 고든(Robert Gordon)과 같은 경제학자들은 1인당 생산 증가율이 미국을 비롯한 대부분의 선진국에서 둔화될 수 밖에 없으며, 2050-2100년에는 연 0.5% 이하로 떨어질 수 있다고 본다.
    • 고든의 분석은 증기기관과 전기의 발명 이후 계속된 여러 혁신의 물결을 비교하고 가장 최근의 물결이 이전에 비해 성장 잠재력이 훨씬 더 낮다는 연구 결과에 기초한 것이다.
    • 최근의 혁신은 기존의 생산 방식을 크게 바꾸지도 못할 뿐더라 경제 전반의 생산성을 크게 향상 시키지도 못했기 때문이다.

중대한 사회적 변화를 내포한 연 1% 성장

  • 내가 보기에 1인당 생산 증가율이 연 1%라는 것은 사실 대단히 빠른 것이며, 많은 사람이 생각하는 것보다 훨씬 더 빠른 성장이다.
    • 30년이라는 한 세대가 지나면 연 1%의 성장률은 35% 이상의 누적 성장을 가져오며, 1.5%의 성장률은 누적으로 50% 이상이 된다.
    • 실제로 이는 생활양식과 고용에 중요한 변화가 생긴다는 것을 의미한다.
    • 1980년대에는 인터넷, 휴대전화도 없었고 비행기 여행도 활성화 되지 못하고 첨단 의학기술이 발달하지도 못했고, 소수의 사람만이 대학을 다녔다.
  • 이는 오늘날의 사회가 18세기와 같이 연간 성장률이 제로에 가깝거나 0.1%에 그쳤던 과거 사회와는 매우 다르다는 것을 뜻한다.
    • 연간 성장률이 0.1-0.2%에 그치는 사회는 변화가 거의 없거나 전혀 없이 한 세대에서 다음 세대로 넘어가는 과정을 되풀이 한다.
    • 19세기 초 이후의 선진국에서처럼 연 1%의 성장률을 기록하는 곳은 심층적이고 지속적인 변화를 거듭하는 사회다. 이는 사회적 불평등 구조와 부의 분배의 동학에 중요한 영향을 미친다.
    • 성장은 새로운 형태의 불평등을 낳을 수 있다. 하지만 이와 동시에 이전 세대로부터 물려 받은 부의 불평등을 퇴색시킴으로써 상속된 부가 결정적인 요인이 될 가능성을 줄여준다.

전후 시대의 후손: 대서양 연안 국가들의 뒤엉킨 운명

  • 유럽 대륙, 특히 프랑스는 이례적으로 빠른 경제성장을 이룩한 영광의 30년에 대해 짙은 향수를 품고 있다.
    • 사실 역사적인 관점에서 보면 전후 30년은 예외적인 시기였는데, 이는 한 마디로 유럽이 1914-1945년 시기 미국에 크게 뒤졌지만 영광의 30년 기간에 빠르게 따라잡았기 때문이다.
    • 일단 이 따라잡기가 끝나자 유럽과 미국은 둘 다 세계적인 기술 선도국이 되었고, 선도국 경제의 속성상 두 곳 모두 비교적 느린 속도로 성장하기 시작했다.
  • 미국의 1인당 생산은 1820-2012년 내내 연간 1.5-2%로 거의 같은 성장세를 보였다.
    • 서유럽은 1950-1970년에 성장의 황금기를 경험했지만, 이후 수십년 간 성장률은 정점에서 1/2, 1/3으로 낮아졌다.
  • 1980년경 시작된 경제자유화나 1945년에 시작된 정부개입주의는 칭찬이나 비난을 받을만하지 않다.
    • 프랑스, 독일, 일본은 1914-1945년 전쟁으로 몰락한 이후 각각 어떤 정책을 택했건 이와 상관없이 영국과 미국을 따라잡았을 가능성이 높다.

글로벌 성장의 이중 벨 커브

  • 요약하자면 지난 3세기에 걸친 글로벌 성장은 매우 높은 정점을 보여주는 종형 곡선으로 나타낼 수 있다.
    • 인구 증가와 1인당 생산 증가는 18세기와 19세기에, 특히 20세기에 점차 가속화 되었고, 이제 21세기의 남은 기간에는 훨씬 더 낮은 수준으로 다시 내려갈 가능성이 높다.
  • 그러나 인구 증가와 생산 증가를 나타내는 두 벨 커브에는 뚜렷한 차이가 있다.
    • 인구 증가 곡선을 보면 증가율의 상승이 훨씬 더 이른 시기인 18세기에 나타났고 감소도 훨씬 더 빨리 시작되었다. 이것은 인구 변천이 이미 대체로 완료되었음을 보여준다.
    • 세계 인구 증가율은 1950-1970년에 연간 약 2%로 정점을 찍었고 이후 지속적으로 줄어들었다.
    • 누구도 확신할 수는 없지만 이런 과정은 계속 되어 세계 인구증가율이 21세기 후반에는 거의 제로로 떨어질 가능성이 높다.
  • 1인당 생산 성장률을 놓고 보면 문제는 더 복잡해진다.
    • ‘경제적으로’ 성장이 시작되기까지는 더 오랜 시간이 걸렸다. 성장률은 18세기 내내 제로에 가까웠으며 19세기에 이르러서야 약간 올라가기 시작했고, 20세기가 되기 전까지는 사람들이 인식할 만한 현실이 되지 못했다.
    • 세계의 1인당 생산 성장률은 1950-1990년 유럽의 따라잡기 과정 덕분에, 그리고 1990-2012년 아시아, 특히 중국의 따라잡기 과정 덕분에 2%를 넘어섰다.
  • 아래 그림은 2012년 이후 경제 성장 예측치 중 ‘중간값(median)’을 보여주는 데 이는 비교적 낙관적인 예상이다.
    • 이 낙관적인 중간값 시나리오에 따르면 세계 1인당 생산 성장률은 2012-2030년과 2030-2050년에 연 2.5%를 약간 웃돌 것이고, 그 이후에는 1.5% 이하로 떨어졌다가 2070년 이후에는 다시 1.2%로 떨어질 것이다.

  • 세계의 1인당 생산 성장률을 보여주는 이 벨 커브를 인구증가율을 타나태는 벨 커브와 비교해 보면 다음 두 가지 특징이 나타난다.
    • 첫째, 인구증가율 벨 커브 보다 훨씬 더 늦게 정점에 다다른다.
    • 둘째 이 벨커브에 나타난 성장률은 제로나 제로 가까이 하락하는 것이 아니라 1%가 약간 넘는 연간 성장률을 보이는데, 이는 전통사회의 성장률보다 훨씬 높은 수치다.
  • 이 두 곡선을 합하면 세계 총생산 성장률을 나타내는 아래 곡선을 얻게 된다.
    • 세계 총생산 성장률은 1950년 이전까지 항상 연 2% 미만이었다가 1950-1990년에 4%로 치솟았는데, 이는 역사상 유례없이 높았던 인구증가율과 1인당 생산 성장률이 합쳐져서 나타난 결과였다.
    • 그리고는 다시 떨어지기 시작해 1990-2012년 신흥국들, 특히 중국의 극히 높은 성장률에도 불구하고 3.5% 이하로 떨여졌다.
    • 중간값 시나리오를 따를 경우, 이러한 추세는 2030년까지 계속되다가 2030-2050년에 3%, 21세기 후반에 이르면 약 1.5%로 떨어질 전망이다.

인플레이션 문제

  • 어떤 이들은 인플레이션이 순전히 화폐에 관한 현상이므로 신경 쓸 필요가 없다고 말할 것이다. 지금까지 논의한 모든 성장률은 이른바 실질 성장률을 가리키는 것으로 명목성장률에서 인플레이션율을 뺀 것이다.
  • 실제 인플레이션은 이 연구에서 핵심적인 역할을 한다.
  • 희소성의 원칙에 바탕을 둔 리카도의 이론에서 상대가격 변동은 더 결정적인 역할을 할 수 있다.
    • 만약 어떤 가격 예컨대 토지, 건물 혹은 석유의 가격이 장기간에 걸쳐 아주 많이 오른다면, 이는 우연히 이들 희소 자원의 최초 소유자가 된 이들에게 유리하도록 부의 분배를 영원히 바꿔 놓을 수 있다.
  • 상대가격의 문제 외에 인플레이션은 그 자체도 부의 분배의 동학에 중요한 역할을 할 수 있다.
    • 실제로 2차 대전 직후 선진국들이 지고 있던 공공부채를 없애는데 인플레이션이 큰 역할을 했다.
    • 인플레이션은 또한 20세기 내내 종종 혼란스럽고 무질서한 방식으로 사회집단 간에 다양한 재분배의 결과를 낳았다.
    • 반면 18세기와 19세기에 번성했던 부에 기초한 사회는 장기간 통화 가치가 매우 안정적으로 지속되었다는 것과 불가분의 관계를 맺고 있었다.

18-19세기의 통화가치 안정

  • 무엇보다 기억해야 할 중요한 사실은 인플레이션이 20세기 특유의 현상이라는 것이다.
    • 그 이전 1차대전 때까지 인플레이션은 제로이거나 혹은 제로에 가까웠다. 물가는 수년간 혹은 길면 수십 년간 이따금 급상승하거나 급락한 적은 있어도 일반적으로 이 같은 간헐적 물가 변동은 결국 안정을 되찾았다.
    • 이런 현상은 우리가 장기간의 물가 자료를 보유하고 있는 모든 나라에서 공통적으로 발견된다.

고전 문학에 나타난 돈의 의미

  • (소설에서 등장한 돈의 가치에 이야기 생략)

20세기 화폐의 지위 약화

  • 통화 가치가 안정된 세계는 1차대전 발발과 함께 영원히 무너졌다.
    • 전쟁 비용을 대느라 그리고 군인들과 그들에게 사용하는 갈수록 더 비싸고 복잡해지는 무기의 비용을 조달하느라 정부는 빚의 수렁에 빠지고 말았다.
    • 1914년 8월에 이미 주요 참전국들은 자국 통화의 금태환을 끝냈다.
    • 전쟁 후 각국은 정도의 차이는 있지만 하나같이 엄청난 공공부채를 처리하기 위해 지폐를 찍어내는 인쇄기에 의존하게 되었다.
  • 1920년대 금본위제를 부활시키려는 시도가 있었지만, 1930년대 경제위기로 무산되었다.
    • 2차대전 이후 금본위제 역시 조금도 더 강건하지 않았는데, 이 체제는 1946년에 시작되어 달러의 금태환이 중지된 1971년에 끝났다.
  • 전쟁이 촉발한 인플레이션 과정이 결코 진정으로 끝나지 않은 것을 보면 모든 국가에서 1914-1945년의 충격이 전쟁 전에 누렸던 세계의 화폐가치에 대한 확신을 크게 뒤흔들어 놓았음을 분명하다.

21세기 자본/ 소득과 생산

  • 전통사회에서 사회적 불평등의 기초와 반란의 가장 흔한 원인은 지주와 소작인의 갈등 –토지를 소유한 자와 노동력으로 토지를 경작한 자들 간 혹은 지대를 받는자와 지대를 지불하는 자들 사이의 갈등– 이었는데, 산업혁명은 자본-노동 간의 갈등을 악화시켰다.
  • 부의 분배에는 두 가지 차원이 존재한다.
    • 첫 번째는 ‘요소 간’ 분배로 여기서 노동과 자본은 추상적으로 동질적 존재인 ‘생산요소’로 취급된다.
    • 두 번째는 ‘개인 간’ 분배인데, 여기서는 노동과 자본으로 얻은 소득의 불평등을 개인적 수준에서 고려한다.
    • 이 둘은 근본적으로 중요하며 이 둘 모두를 분석하지 않고서는 분배 문제를 만족스럽게 이해하는 것은 불가능하다.
  • 자본-노동 간의 소득 분배가 그토록 많은 갈등을 일으킨다면 그것은 자본의 소유가 지나치게 편중되어 있기 때문이다.
    • 부의 불평등은 언제나 노동소득의 불평등보다 훨씬 더 크다.

장기적으로 본 자본-노동 간 분배의 불안정성

  • 자본-노동 간 분배는 20세기를 거치면서 광범위한 변화를 겪었다.
    • 1차대전, 볼셰비키 혁명, 대공황, 2차대전 그 이후 자본통제와 더불어 시행된 규제와 세금 정책 등은 1950년대에 소득에서 자본이 가져가는 몫을 역사적인 최저 수준으로 낮춰놓았다.
  • 하지만 자본은 곧바로 스스로 재건하기 시작했는데, 마가릿 대처 총리와 로널드 레이건 대통령 집권과 함께 자본이 차지하는 몫의 증가는 가속화 되었다.
    • 이어 구소련 붕괴와 90년대 금융의 세계와, 탈규제화는 2010년이 되자 2008년 금융 위기에도 불구하고 1913년 이후 경험해 보지 못한 수준으로 자본이 번창하게 만들었다.
  • 20세기를 넘어서 매우 장기적인 시각에서 볼 때 자본-노동 간의 분배가 안정적이라는 생각에 더해 자본 자체의 성격이 근본적으로 변화했다는 사실을 고려해야 한다.
    • 이런 변화를 이해하는 가장 효과적인 방법은 자본-노동 간 분배(소득 중 자본과 노동에 분배되는 몫)에만 집중하기 보다 자본/소득 비율(연간 소득에 대한 자본총량의 비율)의 변화를 분석하는 것이다.

국민소득이란 무엇인가?

  • 국민소득은 소득의 종류에 상관없이 국민이 1년간 벌어들이는 모든 소득의 총합이다.
    • 국민소득은 국내총생산(GDP)와 밀접하게 관련있지만, 두 가지 중요한 차이가 있다.
    • 국민소득을 계산하려면 GDP에서 생산을 가능하게 해주는 자본의 소모분(depreciation)을 빼야 한다. 이 소모분은 대부분의 나라에서 GDP의 약 10% 정도를 차지하며 소득과 관련이 없다.
    • GDP에서 자본 소모를 뺀 후에 해외에서 벌어들인 순소득(net income)을 더해야 한다.
  • 현 단계에서 부유한 국가든 신흥 국가든 대부분의 국가에서 국민소득은 국내생산과 1-2% 정도의 차이를 보인다.
  • 현실적으로 자본 소유의 불평등은 국제적이기 보다는 국내적 사안의 성격을 띈다.
    • 이러한 불평등은 국가 사이보다 국가 내부의 부자와 빈자 사이에 훨씬 더 심각한 갈등을 야기한다.

자본이란 무엇인가

  • 자본이란 무엇인가? 이 책 전반에 걸쳐 별도의 설명 없이 ‘자본’이라 하면 그것은 경제학자들이 종종 말하는 개인의 노동력과 기술 및 능력으로 구성된 ‘인적자본’을 제외한 의미이다.
    • 즉, 이 책에서 자본은 시장에서 소유와 교환이 가능한 비인적자산(nonhuman assets)의 총계로 정의된다.
    • 자본에는 온갖 종류의 부동산과 금융자본 그리고 기업과 정부 기관들이 사용하는 사업 자본등이 포함된다.
  • 자본을 정의할 때 인적자본을 제외하는 이유는 여러가지인데, 그중 가장 분명한 이유는 인적자본은 다른 사람이 소유하거나 시장에서 거래될 수 없기 때문이다.
    • 물론 우리는 노동계약을 통해 노동력을 돈 주고 쓸 수 있지만, 현대의 모든 법률 제도에서 그러한 계약은 시간과 범위에 제한을 둔다. 물론 노예 사회에서는 그렇지 않다.
  • 이 책에서 ‘자본’이라 부르는 비인적자본은 개인 혹은 개인들로 이루어진 집단이 소유하고, 시장에서 영구적으로 양도와 거래가 가능한 모든 형태의 부(wealth)를 포함한다.
    • 현실에서 자본은 개인들이 소유하거나 정부 및 기관들이 소유할 수 있다.

자본과 부

  • 설명의 단순화를 위해 나는 ‘자본’과 ‘부’를 마치 동의어처럼 사용하고 있지만, 다른 정의에 따르면 ‘자본’이라는 단어는 인간이 축적해온 여러 형태의 부를 지칭하는 용도로 쓰는 것이 더 적합할 것이다.
    • 이때 인간이 축적해야 할 필요 없이 그저 소유하고 있는 토지와 천연자원은 제외된다. 따라서 토지는 부의 구성 요소가 되기는 해도 자본이 되지는 못한다.
    • 물론 건물의 가치와 그 건물이 지어져 있는 토지의 가치를 구분하기 쉽지 않듯 명확한 구분은 어렵다.
  • 거주용 부동산이 ‘비생산적’이라는 이유로 자본에서 제외해야 한다는 의견이 있지만 받아 들이지 않았다. 거주용 부동산은 ‘주거 서비스’를 제공하고 임대료로 그 가치가 평가되는 자본 자산으로 간주될 수 있기 때문이다.
  • 나는 국부(national wealth) 내지 국민총자본(national capital)을 특정 시점에 특정 국가 거주자들과 정부가 소유하고 시장에서 거래가 가능한 모든 것의 총시장가치(total market value)라고 정의한다.
    • 정의상 국부는 민간부문의 부와 공공부문의 부의 합이다.
    • 대부분의 선진국에서 공공의 부는 현재 미미한 수준이다. 공공부채(public debt)가 공공자산(public asset)을 초과하는 국가에서는 마이너스가 되기도 한다.
  • 나는 자본의 개념에서 인적자본을 배제했지만 이는 물적 자본만을 한정해서 말하는 것은 아니다. 여기에는 비금융자산이나 금융자산 중 하나로 간주되는 특허권과 기타 지식재산권 같은 ‘무형’ 자본도 포함된다. 좀 더 광범위하게는 기업 주식의 가치 평가를 통해 많은 형태의 무형 자본이 자본으로서 고려된다.
  • 국부 총액은 항상 국내자본과 해외자본으로 나눌 수 있다.

자본/소득 비율

  • 소득은 유량(flow) 변수로 특정 기간(주로 1년) 중에 생산되고 분배되는 상품과 서비스의 총액을 말한다.
  • 자본은 저량(stock) 변수로 특정 시점에 소유되는 부의 총액을 말하며, 여기에는 지금까지 사유화하거나 축적한 기존의 모든 부가 포함된다.
  • 특정 국가의 자본저량, 즉 자본총량을 측정하는 가장 자연스럽고 유용한 방법은 그 총량을 연간 소득으로 나누는 것이다. 이렇게 하면 자본/소득 비율이 나오며 나는 이 비율을 그리 문자 베타(β)로 표시했다.
    • 예컨대 한 나라의 자본총량이 6년 동안 국민소득과 맞먹는다면 β = 6 (혹은 β = 600%)이다.
  • 오늘날 선진국들에서 일반적으로 자본/소득 비율이 5와 6 사이를 오간다.
    • 여기서 자본총량은 거의 전적으로 민간자본으로 이루어져 있다.
    • 일본과 이탈리아에서는 β가 6보다 큰 반면, 미국과 독일은 5보다 작다.
  • 소득 격차가 생기는 원인은 불평등한 임금 때문이기도 하고, 이보다 훨씬 더 불평등한 자본소득 때문이기도 하다.
  • 한 국가 전체의 자본/소득 비율은 그 국가의 불평등에 대해 아무것도 말해주지 못한다.
    • 그러나 β는 사회 안에서 자본이 차지하는 전체적인 중요성을 측정하기 때문에 이것의 분석은 불평등 연구를 위한 첫 단계이다.

자본주의 제 1기본법칙: α = r x β

  • 자본/소득 비율 β는 국민소득에서 자본소득이 차지하는 몫을 지칭하는 α, 즉 자본소득 분배율과 간단한 방식으로 관련되어 있다.
    • α = r x β
    • 여기서 r은 자본수익률(rate or return on capital)을 말한다.
  • 예컨대 β = 600%이고 r = 5%이면 α = r x β = 30% 이다
    • 다시 말해 국부가 6년간 벌어들인 국민소득에 해당되고, 연간 자본수익률이 5%라면 국민소득에서 자본이 차지하는 몫은 30%이다.
  • 자본수익률은 많은 경제 이론에서 핵심 개념이다.
    • 특히 마르크스주의자들의 분석은 이윤율 저하 문제를 강조하는데, 이 분석에는 흥미로운 통찰이 담겨 있긴 하지만, 역사적으로 잘못된 예측으로 드러났다.
  • 자본수익률은 투자 유형에 따라 크게 다르다.
    • 1년에 10% 넘게 수익률을 올리는 회사가 있는가 하면 수익률이 마이너스인 회사도 있다.
    • 많은 국가에서 장깆거 주식투자 수익률은 7-8%, 부동산과 채권투자 수익률은 3-4% 정도이고, 국공채에 투자해서 벌 수 있는 실질이자율은 가끔 이보다 훨씬 낮다.
  • 농촌사회의 평균 토지수익률이 일반적으로 약 4-5% 정도 였음을 주목할 필요있다.
    • 자본투자 수익률이 5%정도라는 사실은 토지의 가치가 20년 동안의 임대소득과 같다는 뜻이다. 21세기 초반인 현재 부동산 수익률은 19세기와 비슷한 4-5%이거나 약간 낮다.
    • 사업에 투자된 자본은 위험성이 훨씬 크므로 평균 수익률이 더 높다. 다양한 국가에서 상장기업들의 주식 시가총액은 보통 12-15년치 연간 이윤에 해당하며, 이들 기업 주식에 대한 연간 투자수익률은 6-8% 정도이다.
  • 어느나라에서나 β, α, r의 크기는 큰 차이를 보인다. 어떤 산업들은 다른 산업들에 비해 더 자본집약적이다.
    • 예컨대 금속과 에너지는 섬유나 식품가공보다 더 자본집약적이고, 제조업은 서비스 분야보다 더 자본집약적이다.
    • 특정 국가의
    • β, α, r 수준도 전체 자본에서 거주용 부동산과 천연자원이 차지하는 상대적인 몫에 따라 달라진다.

국민계정: 진화하는 사회적 개념

  • 국민소득과 자본을 측정해보려는 최초의 시도는 17세기말과 18세기초에 시작 됨
    • 당시 연구자들은 토지의 총가치를 계산한 다음 토지로 이루어진 부의 양을 농업 생산 및 지대의 수준과 관련짓는 것이었음.
    • 18세기 말에는 앙투안 라부아지에(Antoine Lavoisier)가 <프랑스 왕국 영토의 부>(La Richesse territoriale du Royaume de France)라는 저서에서 소득과 부를 추정함.
    • 국가의 부에 대한 추정치가 본격적으로 나온 것은 19세기가 들어서면서 였음. 로버트 기펜(Robert Giffen)은 영국의 국민총자본의 총량 추정치를 계산함.
  • 국민계정이 연간 기준으로 확립되기 시작한 것은 두 차례 세계대전 사이의 시기였음.
    • 1930년대 주요 통계자료가 개선되면서 국민소득 데이터의 연간 자료 구축이 처음으로 가능해짐.
    • 2차대전 이후 각국 통계청은 경제학자들을 충원하고 매년 국내총생산과 국민소득에 대한 공식 통계를 작성해 발표하기 시작했고 이는 지금까지 지속되고 있음.

글로벌 생산의 분배

  • 1900년대부터 1980년까지 전 세계 상품과 서비스 생산의 70-80%는 유럽과 미국에 집중됨.
    • 1970-1980년대 이후 이러한 경향은 약화되기 시작해서 2010년이 되자 유럽과 미국이 생산에서 차지하는 비중은 1860년대 수준인 약 50%로 떨어짐.
    • 21세기 어느 시점에서는 20-30%로 떨어질 가능성이 높은데, 이는 19세기 들어서기 전까지 유지되던 수준으로 전세계 인구에서 유럽과 미국이 차지하는 비중과 일치함.

  • 산업혁명 당시 유럽과 미국기 경제적 패권을 쥐게 됨에 따라 두 지역의 1인당 생산이 전 세계 평균에 비해 2-3배 커졌기 때문에 전 세계 인구에서 차지하는 비중보다 2-3배 더 큰 생산 비중을 차지했음.
    • 모든 자료를 종합해 볼 때 이와 같은 1인당 생산의 차이가 벌어지는 단계는 끝나고, 이 차이가 좁혀지는 수렴 시기로 접어듬.

대륙 블록에서 지역 블록으로

  • 대체로 전 세계적 불평등은 대륙보다는 지역별로 나눌 때 더 잘 분석할 수 있다.
  • (유럽 내에서의 국가별 차이가 있고 아메리카 대륙도 마찬가지라는 이야기 생략)

글로벌 불평등: 월소득 150유로에서 3000유로까지

  • 전세계 불평등은 1인당 월소득이 150-250 유로 정도인 지역에서부터 1인당 월소득이 2500-3000유로에 이르는 지역까지 다양하게 나타난다.
    • 전세계 평균은 중국의 평균과 비슷한 600-800 유로정도다.
  • 구매력평가가 아니라 시장환율을 적용하면 글로벌 불평등은 현저하게 더 커질 것이다.
    • 매달 1000 유로의 소득이 있는 유럽인은 (당시 환율 기준) 1300 달러로 교환할 수 있는데, 국제비교프로그램에 따르면 유럽의 물가는 미국 물가보다 10% 더 비싸므로 유럽인이 미국에서 쓴 것과 같은 금액을 유럽에서 쓸 경우 그의 구매력은 미국인의 1200달러 소득과 비슷하다.
    • 따라서 나는 미국과 다른 국가들의 GDP를 유로로 전환하면서 시장환율 방식 대신 구매력평가 방식을 적용했다.
    • 다시 말해 우리는 해외보다 자국에서 소득을 지출하는 국민의 실제 구매력에 기초하여 각 국가의 GDP를 비교하고 있다.
  • 구매력평가환율 방식의 또 다른 장점은 더 안정적이라는데 있다.
    • 실제로 시장환율은 각 국가의 상품과 서비스의 수요 및 공급 뿐만 아니라 예측 불가능한 통화정책은 물론이고, 국제 투자자들의 갑작스런 투자 전략 변화 그리고 국가의 정치적, 경제적 안정성에 대한 급변하는 평가를 반영한다.
    • 단 ICP에 관련된 국제기구들이 아무리 애를 써도 다소 불확실하다는 사실만큼은 피할 수 없다.
    • 가난한 국가들의 구매력평가 방식에 따른 수정 폭이 훨씬 더 크다.
  • 시장환율과 구매력평가환율을 둘러싼 불확실성 때문에 앞서 언급한 월평균 소득은 수학적으로 확실한 수치라기 보다는 근사치로 이해해야 한다.
  • 하지만 1970년대 이후로 부유한 국가들에 돌아가는 소득 비중이 꾸준히 떨어져온 것은 변함이 없다. 어떤 방식을 사용하든 부유한 국가들과 가난한 국가들의 소득이 수렴되는 단계로 접어든 것으로 보인다.

글로벌 소득 분배가 생산 분배보다 더 불평등하다

  • 소득과 생산은 전 세계적 차원에서만 동일하고 국가나 대륙 차원에서는 동일하지 않다고 보는 편이 타당하다. 일반적으로 전 세계 소득 분배는 생산 분배보다 더 불공평하다.
    • 그 이유는 1인당 생산이 가장 높은 국가들은 다른 국가들의 자본 일부를 소유함으로써 1인당 생산이 낮은 국가들에서 생기는 자본소득을 취할 수 있기 때문이다.
    • 다시 말해 부유한 국가들은 자국 내에서 더 많이 생산하고, 해외로 더 많이 투자함으로써 2배로 부유해지기 때문에 그들의 1인당 국민소득은 1인당 생산보다 더 크다.
    • 가난한 국가들은 이와 반대다.
  • 대륙 차원에서 총소득은 보통 0.5% 범위 내에서 총생산과 거의 일치한다.
  • 이런 균형 상태를 이루지 못하는 유일한 대륙이 아프리카인데, 이곳에서는 자본의 상당 부분을 외국인이 소유하고 있다.
    • 국제기구들이 발표한 국제수지 자료에 따르면 아프리카는 소득이 생산보다 약 5% 적다.
    • 소득에서 차지하는 몫이 약 30%에 이르는 상황에서 이는 아프리카 자본의 거의 20%를 외국인이 소유한다는 것을 뜻한다.
  • 더 과거로 돌아가면 더 뚜렷한 국제적 불균형을 찾아볼 수 있다.
    • 1차대전 발발 직전 세계 1위 투자국이었던 영국의 국민소득은 국내생산보다 약 10% 더 높았다.
    • 전반적으로 봤을 때 1913년 유럽 강대국들은 아시아와 아프리카 국내 자본의 1/3에서 절반을, 산업자본의 3/4 이상을 소유했던 것으로 추정된다.

어떤 힘들이 수렴을 유발하는가

  • 이론적으로 부유한 국가들이 가난한 국가들의 자본 일부를 소유한다는 사실은 수렴을 촉진하여 선순환 효과를 낼 수 있다.
    • 부유한 국가들의 저축과 자본이 넘쳐나서 신규 주택을 짓거나 새 기계류를 구입할 이유가 별로 없다면 (이런 경우 경제학자들은 ‘자본의 한계생산성(marginal productivity of capital)’, 즉 새로운 자본 한 단위의 증가가 가져오는 추가적인 생산의 증가가 매우 낮다고 말한다) 국내 저축을 해외의 가난한 국가들에 일부 투자할 경우 양측 모두에게 효율적일 수 있다.
    • 따라서 부유한 국가들, 다시 말하면 잉여자본을 소유한 부유한 국가의 국민은 해외로 투자해 더 높은 투자수익률을 올리고, 가난한 국가들은 생산성 제고를 통해 그들과 부유한 국가 사이의 격차를 줄일 수 있을 것이다.
    • 고전파 경제학 이론에 따르면 자본의 자유로운 흐름과 자본의 한계생산성 균등화에 기초한 이러한 메커니즘은 부유한 국가와 가난한 국가를 서로 수렴시키며, 궁극적으로 시장의 힘과 경쟁을 통해 불평등을 감소시켜야 한다.
  • 하지만 이런 낙관적인 이론에는 두 가지 중대한 오류가 있다.
    • 첫째 엄격하게 논리적인 관점에서 봤을 때, 균등화 메커니즘이 1인당 소득의 전세계적인 수렴을 보장하지는 않는다. 기껏해야 1인당 생산의 수렴을 가져올 수 있을 뿐이다.
    • 다만 이때 자본이 완전하게 이동해야 하고, 더 중요하게는 국가 사이에 기술 수준과 인적자본이 완전히 동일해야 한다는 전제가 뒤따르는데 이는 결코 사소한 가정일 수 없다.
    • 어쨌든 1인당 생산이 수렴될 가능성이 있다고 해서 1인당 소득도 수렴된다는 뜻은 아니다.
    • 부유한 국가들이 가난한 이웃 국가들에 투자한 뒤 그것들을 무한정 계속 소유해, 실제로 그들이 소유한 비중이 상당한 수준까지 늘어날 수도 있다.
    • 그 결과 부유한 국가들의 1인당 국민소득은 가난한 국가들의 그것에 비해 영구히 높은 상태로 남게 된다.
    • 가난한 국가들 입장에서는 외국인에게 자국민이 생산한 것의 상당한 몫을 계속해저 지불해야 한다.
    • 이러한 상황이 발생할 가능성이 얼마나 되는지 판단하기 위해 우리는 가난한 국가들이 부유한 국가들에게 지불해야 하는 자본수익률과 부유한 국가와 가난한 국가의 경제성장률을 비교해봐야 한다.
  • 역사적 기록을 살펴보면 자본의 이동성(capital mobility)이 부유한 국가들과 가난한 국가들의 수렴을 촉진하는 주요 요인이었던 것 같지는 않다.
    • 일본, 한국, 대만, 중국 등 최근 선진국 코앞까지 쫓아온 아시아 국가들 중 그 어느 곳도 대규모 외국인 투자로 수혜를 입지 않았다.
    • 본래 이들 국가는 모두 물적자본과 인적자본의 투자에 필요한 재원을 스스로 조달했는데, 최근 나온 연구들은 이들 국가의 장기적 성장에서 인적자본이 핵심적이라고 주장한다.
    • 이와 반대로 아프리카는 예전이건 오늘날이건 큰 성공을 거두지 못했다. 그들은 미래의 발전 가능성이 크지 않은 분야에 집중하는 경향을 보였고, 만성적으로 정치적 불안에 시달렸다는 사실이다.
  • 세계 경제에 참여한다는 것 자체가 부정적이라는 뜻은 아니다. ‘자급자족 경제’가 번영을 촉진한 적은 결코 없었다.
    • 아시아 국가들 역시 외국인 투자를 받아들임으로써 혜택을 입었다. 그러나 그들은 그로 인한 자유로운 해외자본의 흐름보다 상품과 서비스 시장의 개방 및 유리한 교역 조건으로 인해 훨씬 더 큰 혜택을 입었다.
  • 요컨대 역사적 경험으로 비추어볼 때 국내 뿐만 아니라 국제적 차원에서 수렴의 주요한 메커니즘은 지식의 확신이다.
    • 다시 말해 가난한 국가들은 부유한 국가들의 소유가 되는 것이 아니라 부유한 국가들과 똑같은 수준의 전문적인 노하우, 기술, 교육 수준을 확보하는 만큼 부유한 국가들을 따라잡을 수 있다.
    • 지식의 확산은 하늘에서 내려준 만나(manna)가 아니다. 그것은 종종 국제적 개방과 무역에 의해 가속화 된다.
    • 무엇보다 지식의 확산은 다양한 경제 주체가 믿고 의지할 수 있는 안정된 법적 ‘틀’을 보장하면서 자국민의 교육과 훈련에 대한 대규모 투자를 촉진하는 국가의 자금 조달 능력과 제도에 달려 있다.
    • 따라서 지식의 확산은 효율적인 정부를 만들어내는 문제와 밀접한 관련이 있다.
    • 요약하자면 이것들이 글로벌 성장과 국제적 불평등에 대해 역사가 가르쳐주는 주요 교훈이다.

21세기 자본/ 서장

  • 부가 마르크스가 얘기한 것처럼 자본 축적의 역할(dynamics)으로 인해 소수에게 집중할 것인지, 쿠즈네츠가 이야기한 것처럼 성장, 경쟁, 기술 진보에 따라 불평등이 줄어들지를 탐구하는 것이 이 책의 목표
  • 자본 수익률이 생산과 소득의 성장률을 넘어설 때 자본주의는 자의적이고 견딜 수 없는 불평등을 자동적으로 양상하게 된다.
    • 이런 불평등은 민주주의 사회의 토대를 이루는 능력주의 가치들을 근본적으로 침식한다.

맬서스, 영 그리고 프랑스 혁명

  • 18세기 말과 19세기 초에 인구 증가, 농촌 인구의 대탈출, 산업혁명이 일어나던 시기 영국과 프랑스에서 고전파 정치경제학이 탄생했고, 이때 분배 문제가 이미 핵심이었다.
  • <인구론> (Essay on the Principle of Population) 을 출판한 맬서스(Thomas Robert Malthus)가 보기에 가장 큰 위협은 인구 과잉이었다.
    • 맬서스는 아서 영의 에세이에 영향을 받았는데, 영 보다 더 과격한 결론에 이르렀다.
    • 맬서스는 영국에서 프랑스 혁명과 비슷한 격변 일어나지 않기 위해 가난한 이들을 위한 모든 복지를 중단해야 하며, 빈곤층의 출산을 엄격히 통제 해야 한다고 주장했음.

리카도: 희소성의 원리

  • 리카도(David Ricardo)와 마르크스(Karl Marx)는 19세기에 가장 영향력이 컸던 경제학자들로, 둘 다 소수의 사회집단 –리카도는 지주, 마르크스는 산업자본가들– 이 필연적으로 생산과 소득의 점점 더 많은 몫을 차지하게 될 것이라고 믿었다.
  • <정치경제학과 조세의 원리>(Principles of Political Economy and Taxation) 을 펴낸 리카도에게 가장 중요한 관심사는 토지 가격과 지대의 장기적인 변화였다.
    • 맬서스와 마찬가지로 그는 통계라고 할 만한 자료는 거의 갖지 못했지만, 그 시대 자본주의에 대해 깊은 지식을 갖고 있었다.
    • 리카도는 맬서스의 모형으로부터 영향을 받아 논리를 더 밀고 나갔다.
    • 인구와 생산이 모두 꾸준히 늘어나기 시작하면 토지는 다른 상품들에 비해 점점 더 희귀해지는 경향이 있다. 그러면 수요와 공급의 법칙에 따라 토지 가격이 지속적으로 지주에게 내는 지대도 상승할 것이다.
    • 이에 따라 지주들이 국민소득 가운데 갈수록 더 많은 몫을 차지하면서 나머지 인구에게 돌아갈 몫은 줄어들 것이고, 결국 사회적 균형에 혼란이 일어날 것이다.
    • 리카도가 볼 때 정치적으로 받아들일 수 잇는 유일한 해법은 토지 임대소득에 대해 점점 더 많은 세금을 물리는 것이었다.
  • 그의 예언은 틀린 것으로 드러났는데, 지대는 장기간에 걸쳐 분명 높은 수준에 머물렀지만, 국민소득 중 농업의 비중이 줄어들면서 농경지의 가치는 다른 형태의 재산에 비해 상대적으로 하락했다.
  • 그러나 토지 가격에 대한 그의 통찰은 흥미로운데, 그의 주장의 기초였던 ‘희소성의 원리’는 어떤 가격들이 수십 년에 걸쳐 매우 높은 수준으로 오를 수 있다는 것을 의미했다. 이는 사회 전체를 흔들어 놓기에 충분한 것이었다.
  • 21세기 세계적인 부의 분배를 이해하는데 희소성의 원리의 중요성을 무시하는 것은 심각한 잘못이 될 것이다.
    • 도심 부동산 가격이나, 석유 가격의 예
  • 원론적으로 수요 공급의 원리가 균형을 되찾게 해주지만, 그 과정이 수십 년 이 걸릴 수 있다. 그리고 그 사이 부동산과 유전 소유자들은 나머지 인구에 비해 엄청난 자산을 축적할 수 있다.

마르크스: 무한 축적의 원리

  • <자본> (Capital) 1권이 출간되었을 때 경제적, 사회적 현실은 리카도 때와는 심층적으로 변모한 상태였다. 이제 더는 토지 가격 보다 산업자본주의의 동학을 어떻게 이해할 것인가가 중요한 문제로 부상했다.
  • 당시 가장 놀라운 실상은 산업 프롤레타리아트들의 비참한 생활이었다.
    • 경제성장에도 불구하고, 노동자들은 도시 빈민가로 쇄도해 왔다. 노동 시간은 길었고 임금은 매우 낮았다.
    • 도시의 빈곤은 어떤면에서는 구체제의 농촌 지역에서 보았던 빈곤보다 더 극단적이었다. 8세 이상 어린이만 공장에서 일할 수 있도록 하거나, 10세 이상만 광산에서 일할 수 있도록 제한하는 법이 실제로 있었던 예
  • 오늘날 우리가 이용할 수 있는 모든 역사적 자료는 19세기 후반 또는 19세기 마지막 1/3에 해당하는 시기에 가서야 구매력 면에서 임금의 의미 있는 상승이 나타난다는 것을 보여준다.
    • 1850년대까지 노동자들의 임금은 매우 낮은 –18세기와 그 이전 수준에 가깝거나 심지어 더 낮은– 수준에 정체되어 있었다.
  • 프랑스 뿐만 아니라 영궁에서도 관찰되는 이 오랜 임금 정체 국면은 바로 이 기간에 경제성장은 도리어 가속화 되었다는 사실과 비교할 때 더욱 두드러져 보인다.
    • 이 두 국가의 국민 소득에서 자본이 차지하는 몫은 19세기 전반에 크게 늘어났다. 19세기 마지막 수십 년간 임금이 어느 정도 성장률을 따라 잡으면서 자본가의 몫은 조금 줄어들게 된다.
    • 그러나 1차 대전 이전에는 구조적 불평등이 결코 줄어들지 않았다. 1870-1914년 기간에는 기껏해야 불평등이 극히 높은 수준에서 굳어져 버린 것을 볼 수 있다.
    • 그리고 어떤 면에서는 부가 더 소수에게 집중되면서 불평등이 끊임없이 활대되는 악순환을 볼 수 있다.
  • 어찌되었든 1840년대 노동소득이 정체되는 가운데 자본은 융성했고 산업 이윤은 늘어났다. 이것이 최초의 공산주의와 사회주의 운동이 전개된 맥락이 되었다.
    • 그들의 핵심적인 질문은 단순한 것이었다. 반세기 동안 산업적 성장을 이룬 다음에도 대중의 삶이 비참하다면 산업 발전은 무엇을 위한 것이며 기술 혁신과 인구 이동은 도대체 무엇을 위한 것인가? 기존 경제와 정치 체제의 파산은 명백해 보였다.
  • 마르크스는 <공산당선언>을 발표한 이후 20년 동안 자본주의와 그 붕괴에 대한 최초의 과학적인 분석을 내놓기 위해 방대한 저작을 집필했는데, 이 작업은 미완으로 남았다.
    • 마르크스는 <자본>의 1권만 출간한 뒤 사망했고, 그의 사후에 엥겔스가 원고를 짜맞춰서 출간했다.
  • 마르크스도 자본주의 체제 내부의 논리적 모순에 대한 분석을 바탕으로 했다.
    • 부르지아 경제학자들은 시장을 자기조절적 시스템으로 보아서 시장은 스스로 균형을 찾아갈 것이라고 보았다.
    • 마르크스는 자본의 가격과 희소성의 원리에 관한 리카도 모형을 자본주의 동학에 대한 더 철저한 분석의 바탕으로 삼았다.
    • 그 시대에 자본은 토지 관련 부동산이 아니라 주로 산업자본이었으며, 따라서 기본적으로 축저할 수 있는 자본의 양에는 아무런 제한이 없었다.
    • 그의 주요 결론은 ‘무한 축적의 원리(principle of infinite accumulation)’ 라고 일컬을 만한 것이었다. 즉 자본은 계속 축적되면서 갈수록 소수의 손에 집중되는 움직일 수 없는 경향이 있으며, 그 과정에 아무런 자연적 제약이 없다는 것이었다.
    • 이것이 마르크스가 자본주의의 파멸을 예언한 근거다. 자본의 수익률이 끊임없이 감소하거나 국민소득 가운데 자본가의 몫이 무한히 증가해 결국 자본주의는 최후를 맞는다는 것이다. 어느 쪽이든 안정된 사회경제적, 정치적 균형은 불가능한다.
  • 마르크스의 예언이 리카도의 것보다 현실로 나타날 가능성은 더 높지 않았다. 19세기 마지막 1/3에 해당하는 기간에 임금은 마침내 올라가기 시작했고, 노동자들의 구매력 향상은 모든 곳으로 확산되었다.
    • 노동자의 구매력 증가는 상황을 근본적으로 바꾸어 놓았다.
    • 공산주의 혁명은 유럽에서 가장 낙후된 러시아에서 발생했는데, 유럽의 가장 발전한 국가들은 사회민주주의라는 다른 길을 모색하고 있었다.
  • 그보다 앞선 연구자들처럼 마르크스도 지속적인 기술 진보와 꾸준한 생산성 향상이 이뤄질 가능성을 완전히 무시했다. 기술 진보와 생산성 향상은 민간자본의 축적과 집중화 과정에서 어느 정도는 균형을 잡아주는 힘이다.

마르크스부터 쿠즈네츠까지 또는 종말론에서 동화로

  • 20세기 사이먼 쿠즈네츠(Simon Smith Kuznets)의 이론에 따르면 자본주의의 더 높은 발전 단계에서는 소득불평등이 경제 정책 선태깅나 국가 사이의 다른 차이와 무관하게 결국 납득할 수 있는 수준에서 안정될 때까지 자동적으로 감소하게 된다.
    • 1955년 제시된 이 이론은 1945-1975까지 이어진 프랑스에서 ‘영광의 30년’ 이라고 일컬어지는 전후의 황홀한 시대에 정확히 부합하는 이론이었다.
    • 쿠즈네츠가 보기에 머지않아 성장이 모든 이에게 이득이 될 터이므로 참고 기다리는 것으로 충분했다. 그 당시 철학은 다음 문장과 같다 ‘성장은 모든 배를 뜨게 하는 밀물이다’
    • 1956년 로버트 솔로가 경제의 ‘균형성장 경로(balanced growth path)’ 달성에 필요한 조건을 분선한데서도 비슷한 낙관론을 찾아볼 수 있다.
    • 이 경로는 모든 변수가 같은 속도로 움직이는 성장의 궤적이다. 이에 따르면 모든 사회집단이 성장으로부터 같은 수준의 혜택을 보며 정상 궤도에서 크게 벗어나는 경우는 없다.
    • 쿠즈네츠의 견해는 불평등의 악순환에 관한 리카도와 마르크스의 생각에 반대되는 것이다.
  • 쿠즈네츠의 이론이 1980-1990년대 발휘했고, 오늘날에도 어느 정도 영향력이 있는 사실을 이해하려면 이런 종류의 이론들 가운데 처음으로 철저한 통계 작업에 기초한 것이라는 점을 이해해야 한다.
    • 사실 20세기 중반까지도 최초의 역사적인 소득분배 시계열 자료가 나오지 않았고 1953년 쿠즈네츠의 <소득과 저축에서 소득 상위 계층이 차지하는 비중>(Shares of Upper Income Groups in Income and Saving)이라는 기념비적인 저서가 출간되고 나서야 비로소 이런 통계를 이용할 수 있게 된 것이다.
  • 쿠즈네츠가 수집한 자료는 미국의 소득계층 구조에서 상위 몇 퍼센트나 각 십분위 계층이 전체 국민소득에서 차지하는 비중의 변화를 계산할 수 있도록 해주었다.
    • 그는 1913년과 1948년 사이에 미국의 소득불평등이 급격히 감소 했다는 사실을 확인했다.

쿠즈네츠 곡선: 냉전 한복판에서의 희소식

  • 사실 쿠즈네츠 자신은 1913년부터 1948년까지 미국의 소득 격차가 줄어든 것이 대개는 우연적인 성격을 지닌다는 사실을 잘 알고 있었다.
    • 불평등이 줄어든 원인은 대부분 1930년대 대공황과 2차대전이 촉발한 충격이 겹친데 따른 것으로, 자연적이거나 자동적인 과정과는 거의 아무런 관련이 없었다.
    • 1953년 연구에서 그는 자신의 시계열 자료를 상세히 분석했고, 독자들에게 성급한 일반화를 하지 말라고 경고했다.
  • 그러나 1954년 쿠즈네츠는 미국경제학회에서 자신의 연구 결과에 대해 53년 보다 더 낙관적인 해석을 제시했고 이날 강연 내용은 1955년 <경제성장과 소득불평등>이라는 논문으로 출간되었다.
    • ‘쿠즈네츠 곡선(Kuznets curve)’ 이론이 부상한 것은 바로 그 강연에서였다.
    • 이 이론에 따르면 모든 불평등은 ‘벨 커브(bell curve)’를 따를 것으로 예상할 수 있다. 다시 말해 초기에는 불평등이 커지다가 산업화와 경제발전이 진전되면서 줄어든다는 것이다.
    • 쿠즈네츠에 따르면 산업화 초기 단계에 자연히 불평등이 늘어나는 첫 번째 국면이 지나가면 불평등이 급속히 줄어드는 국면이 찾아온다.
  • 그러나 쿠즈네츠 곡선 이론은 많은 부분 잘못된 논거들로 이루어져 있으며, 그 실증적 토대는 극히 취약했다.

분배 문제를 경제학적 분석의 중심으로 되돌리기

  • 1970년대 이후 선진국들에서 소득불평등은 크게 증가했다. 특히 미국에서는 2000년대 들어 소득 집중도가 1910년대 수준으로 되돌아갔다.
  • 19세기 경제학자들은 분배의 문제를 경제 분석의 중심에 놓고 장기적인 경향들을 연구하려 한 커다란 공적을 인정받을 만하다.
    • 그들의 답이 언제나 만족스러웠던 것은 아니지만 적어도 그들이 던진 질문은 훌륭한 것이었다.
    • 성장이 자동적으로 균형을 찾을 것이라고 믿어야 할 근본적인 이유는 아무것도 없다.
    • 너무 오랫동안 경제학자들은 부의 분배를 소홀히 했는데, 이는 한편으로는 쿠즈네츠의 낙관적인 결론 때문이며, 다른 한편으로는 경제학자들이 이른바 대표적 경제주체모형(representative agent model)에 바탕을 둔 극히 단순한 수학적 모형들에 지나치게 의존했기 때문이다.

이 책에서 활용한 자료

  • 이 책은 주로 두 가지 유형의 자료에 바탕을 두고 있는데, 하나는 소득과 그 분배의 불평등과 관련되어 있으며, 다른 하나는 부의 분배, 부와 소득의 관계와 관련되어 있다.
  • 소득에 관한 자료부터 설명하면 내 연구는 쿠즈네츠의 혁신적이고 선구적인 연구를 공간적, 시간적으로 광범위하게 확장한 것에 불과하다.
    • 이런 식으로 나는 쿠즈네츠가 확인한 변화들을 더욱 잘 조망할 수 있었고, 경제발전과 부의 분배에 관한 그의 낙관적인 견해에 근본적인 의문을 제기할 수 있었다.
  • 이 책의 두 번째 중요한 자료는 부, 부의 분배, 부와 소득의 관계에 관한 것이다.
    • 실제로 솓그은 두 가지 요소로 구성된다. 노동에서 나오는 소득과 자본에서 나오는 소득이 그것이다.

연구의 주요 결과

  • 이 자료들을 통해 내가 얻게된 결론은 다음과 같다. 첫째 부의 분배 역사는 언제나 매우 정치적인 것이었으며, 순전히 경제적인 케머니즘으로 환원될 수는 없다.
    • 특히 대부분의 선진국에서 1910년에서 1950년 사이 불평등이 줄어든 결과는 무엇보다 전쟁의 충격을 극복하기 위해 채택한 정책들이 불러온 결과다.
    • 이와 비슷하게 1980년 이후 불평등이 다시 커진 것은 대체로 지난 수십 년 간 나타난 정치적 변화, 특히 조세 및 금융과 관련한 변화에 따른 것이다.
    • 불평등의 역사는 경제적, 사회적, 정치적 행위자들이 무엇이 정당하고 무엇이 부당한지에 대해 형성한 표상들, 이 행위자들 사이의 역학관계, 그리고 이로부터 도출되는 집합적 선택들에 의존한다. 불평등의 역사는 관련되는 모든 행위자가 함께 만든 합작품이다.
  • 두 번째 결론은 부의 분배의 동학이 수렴과 양극화가 번갈아 나타나도록 하는 강력함 메커니즘을 가동시킨다는 것, 그리고 불안정하고 불평등한 힘이 지속적으로 승리하는 것을 막는 자연적이고 자생적인 과정은 없다는 것이다.

수렴의 힘, 양극화의 힘

  • 지식과 기술 확산의 힘이, 특히 국가 사이의 수렴을 촉진하는 힘이 아무리 강력하다손 치더라도, 어쨌거나 그 힘의 반대 방향으로 작용하는, 즉 더 큰 불평등을 초래하는 엄청난 힘에 의해 압도당하고 좌절될 수 있다. 바로 이것이 결정적인 사실이다.
    • 훈련에 대한 적절한 투자가 없으면 일부 사회집단은 경제성장의 혜택에서 완전히 소외될 수 있다는 사실은 명백하다.
    • 성장은 어떤 집단에는 득이 되지만 어떤 집단에는 해가 될 수 있다. (중국 노동자들 때문에 일자리를 잃는 선진국 노동자들 예)
  • 요컨대 수렴으로 가는 주된 힘, 즉 지식의 확산은 언제나 당연하고 자동적인 것은 아니다. 이는 또한 교육 정책, 적합한 기술 습득과 교육 기회에 대한 접근성, 관련 제도에 크게 좌우 된다.
  • 나는 이 연구에서 어떤 염려스러운 양극화 요인들에 특히 주의를 기울일 것이다.
    • 심지어 기술 훈련에 대한 적절한 투자가 이루어지고 ‘시장 효율성’의 모든 조건이 충족된 것으로 보이는 세계에서도 그런 요인들이 존재한다는 점에서 특히 염려스럽다는 말이다.
  • 양극화의 요인들은 무엇인가? 첫째, 가장 많은 돈을 버는 이들은 나머지 사람들과 격차를 빠르게벌려갈 수 있다. 더 중요한 것은 성장이 미약하고 자본수익률이 높을 때 부의 축적 및 집중화 과정과 관련된 일련의 양극화 요인들이 있다는 점이다.
  • 두 번째 과정은 첫 번째 것보다 잠재적으로 더 큰 불안정을 초래하는 것이며, 이는 틀림없이 장기적으로 부의 평등한 분배에 주된 위협이 되는 것이다.
  • 다음 도표 1, 2는 양극화 과정의 중요성을 담고 있다.
    • 둘 다, U자 곡선을 그리는데, 한동안 불평등이 줄어들다가 나중에 다시 늘어난다.
    • 두 그래프가 나타내는 현실은 비슷하다고 생각할 수 있지만, 사실은 그렇지 않다. 다양한 곡선들이 보여주는 현상은 상당히 다른 것이며, 서로 다른 경제적, 사회적, 정치적 메커니즘과 관련된다.
    • 도표 1의 곡선은 미국의 소득불평등을 나타내는데 비해 도표 2는 몇몇 유럽 국가의 자본 / 소득 비율을 표시한다. (일본은 그래프에 표시하지 않았지만 그 추이는 비슷하다)
    • 21세기에 결국 동일한 국가에서 이 두 가지 양극화 요인들이 한꺼번에 나타날 가능성은 확실히 배제할 수 없는 것이다.
    • 사실 우리는 이미 이것이 부분적으로 현실화된 것을 목도하고 있다. 만약 이러한 현상이 세계적인 수준에서 실현된다면, 불평등 구조가 근본적으로 바뀔 뿐만 안리ㅏ 전에 볼 수 없었던 수준으로 불평등이 증가하게 될 것이다.
    • 그러나 지금까지는 이 놀라운 패턴들은 본질적으로 별개인 두 가지 현상을 반영하는 것이다.
  • 도표 1은 1910-2010년 미국 국민 소득 계층 구조에서 상위 10%의 몫이 어떻게 달라졌는지를 나타내는 것이다.

양극화의 근본 요인: r > g

  • 도표 2에서 보여주는 두 번째 패턴은 더 단순하고 투명하며, 부의 분배의 장기적인 변화에 더 큰 영향력을 발휘하는 양극화 메커니즘을 반영한다.
  • 도표 2는 1870-2010년 기간 중 영국, 프랑스, 독일의 민간 부문 자산(부동산, 금융자산, 사업자본, 부채를 뺀 금액)의 총가치가 한 해 국민 소득의 몇 배인지를 보여준다.
  • 이 커다란 U자 곡선은 이 연구에서 광범위하게 보여줄 절대적으로 중요한 변화를 나타낸다.
    • 나는 특히 지난 수십 년간 자본 / 소득 비율이 높은 수준으로 회복된 것은 대부분 경제가 상대적인 저성장 체제로 되돌아간 사실로 설명할 수 있다.
    • 느리게 성장하는 경제에서는 당연히 과거의 부가 지나치게 큰 중요성을 갖게 된다. 새로운 저축을 조금만 투입해도 새로운 부의 총량을 꾸준히 그리고 크게 늘릴 수 있기 때문이다.
    • 더욱이 자본수익률이 오랜 기간 성장률을 크게 웃돌면 부의 분배에서 양극화 위험이 매우 커진다.

  • 내가 r > g 라는 부등식으로 표현할 이 근본적인 불평등은 이 책에서 결정적인 역할을 할 것이다.
    • r은 연평균 자본수익률을 뜻하며, 자본에서 얻는 이윤, 배당금, 이자, 임대료, 기타 소득을 자본 총액에 대한 비율로 나타낸 것이다.  g는 경제성장률, 즉 소득이나 생산의 연간 증가율을 의미한다.
  • 19세기 이전의 역사에서 대부분 그랬고, 21세기에 다시 그렇게 될 가능성이 크듯이 자본수익률이 경제성장률을 크게 웃돌 때는, 논리적으로 상속재산이 생산이나 소득보다 더 빠르게 늘어난다고 할 수 있다.
    • 물려 받은 재산을 가진 사람들은 자본에서 얻는 소득의 일부만 저축해도전체 경제보다 더 빠른 속도로 자본을 늘릴 수 있다.
    • 이런 상황에서는 필연적으로 상속재산이 노동으로 평생 동안 쌓은 부를 압도할 것이고 자본의 집중도는 극히 높은 수준에 이를 것이다. 이런 수준의 집중도는 능력주의의 가치, 현대 민주주의의 근본이 되는 사회정의의 원칙과 맞지 않을 수도 있다.
  • 부가 축적되고 분배되는 과정에는 양극화나 높은 수준의 불평등을 불러오는 강력한 요인들이 있다. 또한 수렴을 촉진하는 요인들도 존재하는데, 특정 국가에서나 특정 기간에는 이 요인들이 우세할지 모르지만, 양극화의 힘이 언제라도 우위를 되찾을 수 있다.
    • 그것이 21세기가 시작되는 지금 우리가 마주하고 있는 현실이며, 향후 수십 년간 인구증가율과 경제성장률이 예상대로 낮아지면 더욱 염려스러운 상황이 올 수 있다.

(이하 연구 자료 수집이나 자신에 대한 소개 생략)

이상엽/ 해석학/ 실수체계

자연수

  • 자연수로부터 실수체계를 단계적으로 구성 가능하다는 것을 바이어슈트라스, 데데킨트가 증명 함

페아노 공리계

자연수는 다음의 다섯 가지 공리로 이루어진 페아노 공리계를 만족하는 수체계이다.

  1. 1 \in \mathbb{N}
  2. n \in \mathbb{N} \Rightarrow n' \in \mathbb{N}
  3. \forall n \in \mathbb{N}, 1 \neq n'
    • 1은 자연수의 최소원소
  4. \forall m \in \mathbb{N}, n' \neq m' \Rightarrow n = m
    • 자연수의 순서 구조가 순환하는 것을 방지하기 위한 공리
    • 만일 1 다음이 2, 2 다음이 3, 3 다음이 4, 4 다음이 2라는 집합이 있다면 1의 다음수와 4의 다음수가 같아져 버리는 경우가 발생. 그래서 다음 수가 같다면 두 수는 같다고 정의가 필요.
  5. 1 \in S \wedge (\forall n \in S, n' \in S) \Rightarrow \mathbb{N} \subseteq S
    • 집합 내에 1이 존재하고 집합 내 모든 원소가 다음 수를 갖는 집합은 자연수 집합을 포함한다.
    • 1 \in S \wedge (\forall n \in S, n' \in S) 을 만족하는 집합을 계승집합이라고 한다.
    • 자연수 집합은 가장 작은 계승집합이다.

‘1’과 ‘그 다음 수’는 무정의 용어이다. (primitive notion, 더는 정의를 할 수 없는 근본 원리)

Thm. [수학적 귀납법]

n' = n + 1 이라 정의할 때, 명제 P(n) 에 대하여 두 조건

  1. P(1) 이 참
  2. P(n) 이 참 P(n+1) 이 참

이 성립하면 P(n) 은 모든 자연수 n 에 대하여 참이다.

(수학적 귀납법의 이론적 근거가 페아노 공리계의 5번째 공리)

자연수의 성질

  1. 정렬성
    • 자연수집합 \mathbb{N} 의 공집합이 아닌 부분집합은 항상 최소원소를 갖는다.
  2. 자연수 집합 \mathbb{N} 은 위로 유계가 아니다.
  3. 아르키메데스 성질
    • \forall \epsilon > 0, \exists n \in \mathbb{N} s.t. {1 \over n} < \epsilon
    • 어떤 양수든 그보다 더 작은 유리수가 적어도 1개 존재한다
  • 정리란 참인 명제
  • 성질은 정리로부터 자연스럽게 파생되는 것들
  • 법칙은 연산의 규칙

유리수와 무리수

  • 바빌로니아인들이 유리수를 사용했다는 증거가 있음
  • 무리수는 기원전 500년경 등장

집합의 구성

  1. 정수 집합
    • \mathbb{Z} = (-\mathbb{N}) \cup \{ 0 \} \cup \mathbb{N}
  2. 유리수 집합
    • \mathbb{Q} = \{ {m \over n} | m, n \in \mathbb{Z}, n \neq 0 \}
  3. 무리수 집합
    • \mathbb{I} = \mathbb{R} - \mathbb{Q} 

(위는 간략한 표현일 뿐 엄밀한 정의는 아님)

조밀성

Thm 1. [유리수의 조밀성]

\forall a, b \in \mathbb{R}, a < b \Rightarrow \exists r \in \mathbb{Q} s.t. a < r < b

어떤 두 실수 사이에도 유리수가 적어도 1개 존재한다.

증명)

  • case 1) 0 < a < b
    • a < b \Leftrightarrow 0 < b - a \Rightarrow \exists n \in \mathbb{N} (s.t. {1 \over n} < b - a) (아르키메데스 성질)
    • Let. S = \{ m \subseteq \mathbb{N} | m > na \} Then. S \neq \phi (위로 유계 아님 성질)
    • \therefore S (\subseteq \mathbb{N}) 의 최소원소는 m (정렬성 성질)
    • m > na \Leftrightarrow a < {m \over n}
    • m - 1 \notin S \Rightarrow m - 1 \leq na \Rightarrow {m - 1 \over n} \leq a
    • \therefore a < {m \over n} = {m -1 \over n} + {1 \over n} \leq a + {1 \over n} < b
  • case 2) a < 0 < b
    • 0이 유리수이므로 자명 trivial
  • case 3) a < b < 0
    • \Rightarrow 0 < -b < -a
    • \Rightarrow 0 < -b < -a
    • \therefore r \in \mathbb{Q} (s.t. - b < r < -a, \because case 1)
    • \Rightarrow a < -r < b

Thm 2. [무리수의 조밀성]

\forall a, b \in \mathbb{R}, a < b \Rightarrow \exists s \in \mathbb{I} s.t. a < s < b

어떤 두 실수 사이에도 무리수가 적어도 1개 존재한다.

증명)

  • a < b
    • \Rightarrow a + \sqrt{2} < b + \sqrt{2}
    • \exists r \in \mathbb{Q} s.t. a + \sqrt{2} < r <  b + \sqrt{2}
      • (유리수 조밀성, 어떤 두 실수 사이에도 유리수가 유리수 r 이 존재)
    • Let. s = r - \sqrt{2} \in \mathbb{I}
    • Then. a + \sqrt{2} < r < b + \sqrt{2} \Rightarrow a < s < b

실수

  • 히파소스가 수론적인 접근이 아니라 직각 이등변 삼각형을 이용해서 무리수를 발견하자. 그 전까지는 수론적인 논의가 융성했던 수학 흐름이 기하학으로 넘어감.
  • 그러나 기하적인 수 체계의 정의는 직관에 기댄 것이기 때문에 현대 수학에 이르러 수학적 엄밀성을 위해 실수 체계에 대한 공리가 만들어짐.

체 공리

집합 S S 에 부여된 두 이항연산 +, \cdot 가 다음 9개의 공리를 만족하면, 대수구조 (S, + \cdot) 를 체라 한다.

  1. x, y \in S \Rightarrow x + y = y + x
    • 덧셈에 대한 교환법칙
  2. x, y, z \in S \Rightarrow x + (y + z) = (x + y) + z
    • 덧셈에 대한 결합법칙
  3. \forall x \in S, \exists 0 \in S s.t. 0 + x = x
    • 덧셈에 대한 항등원
  4. \forall x \in S, \exists -x \in S s.t. x + (-x) = 0
    • 덧셈에 대한 역원 (연산 결과가 항등원이 나오게 하는 것)
  5. x, y \in S \Rightarrow x \cdot y = y \cdot x
    • 곱셈에 대한 교환법칙
  6. x, y, z \in S \Rightarrow x \cdot (y \cdot z) = (x \cdot y) \cdot z
    • 곱셈에 대한 결합법칙
  7. \forall x \in S, \exists 1(\neq 0) S s.t. 1 \cdot x = x
    • 곱셈에 대한 항등원. 곱셈의 항등원과 덧셈의 항등원이 달라야 하는 것이 공리
  8. \forall x (\neq 0) \in S, \exists x^{-1} \in S s.t. x \cdot (x^{-1}) = 1
    • 곱셈에 대한 역원
  9. x, y, z \in S \Rightarrow x \cdot (y + z) = x \cdot y + x \cdot z
    • 덧셈과 곱셈에 대한 분배법칙

(\mathbb{Q}, +, \cdot) (\mathbb{R}, +, \cdot) 는 모두 체다. (유리수 체, 실수 체)

  • 체 공리는 실수의 대수적 성질에 대한 것
  • 집합에 연산을 부여한 것을 대수적 구조라고 한다.
  • 이항연산은 집합 내의 원소들에 대해 연산을 한 결과가 집합 내에 존내하는 연산을 의미 –닫혀있는 연산

순서공리

순서 공리

\mathbb{R} 에는 다음 두 조건을 만족하는 공집합이 아닌 부분집합 P 가 존재한다.

  1. \forall x, y \in P, x + y \in P \wedge xy \in P
    • 집합 원소 간 덧셈과 곱셈이 모두 집합 내에 존재. 덧셈과 곱셈에 대해 닫힌 집합
  2. 임의의 x \in \mathbb{R} 에 대하여 다음 중 단 하나만 성립한다.
    1. x \in P
    2. x = 0
    3. -x \in P

위 조건을 만족하면 P 는 양의 실수 집합이 됨

삼분성질

Def. [부등식의 정의]

임의의 a, b \in \mathbb{R} 에 대하여

  1. a - b \in P \Rightarrow a > b \vee b < a
  2. a - b \in P \cup \{ 0 \} \Rightarrow a \geq b \vee b \leq a

순서 공리로부터 부등식을 정리함. P 는 양의 실수 집합이기 때문에 위와 같이 됨.

Thm. [삼분성질]

임의의 a, b \in \mathbb{R} 에 대하여 다음 중 단 하나만 성립한다.

  1. a > b
  2. a = b
  3. a < b

완비성 공리

  • Completeness. 연속성 공리라고도 함. 유리수의 조밀성을 뛰어넘는 실수의 조밀성.

완비성 공리

\mathbb{R} 의 공집합이 아닌 부분집합이 위로 유계이면 그 부분집합은 상한을 갖는다. (완비성 공리를 만족한다는 것은 부분집합의 상한을 원래 집합 내에서 잡을 수 있다는 것)

Def. [상한] 부분순서집합 A 의 부분집합 B 의 상계들의 집합이 최소원소를 가질 때 그 최소원소를 B 의 상한이라 하고 sup B 로 나타낸다.

유리수 집합은 완비성 공리를 만족하지 못함

주요 정리

Thm 1. 상한은 유일하다.

Thm 2. s \in \mathbb{R} 가 집합 S 의 상계일 때 다음 세 명제는 동치이다.

  1. s = sup S
  2. \forall \epsilon > 0, \exists x \in S s.t. s - \epsilon < x \leq s
  3. \forall \epsilon > 0, S \cap ( s - \epsilon, s ] \neq \phi

Thm 3. \mathbb{Q} 는 완비성을 갖지 않는다.

완비성 공리로부터 ‘1. 자연수 > (2) 자연수의 성질 > 2’도 증명 가능하다.

완비성의 예 – 무한소수

위로 유계인 임의의 무한소수 부분집합을 A 라 하자 이제

a_{0} = max \{ x_{0} | x_{0}. x_{1} x_{2} x_{3} ... \in A \}

a_{1} = max \{ x_{1} | a_{0}. x_{1} x_{2} x_{3} ... \in A \}

...

a_{k} = max \{ x_{k} | a_{0}. a_{1} ... a_{k-1} x_{k} x_{k+1} ... \in A \}

라 하면, 무한소수 a_{0}. a_{1} a_{2} a_{3} ... 은 집합 A 의 상한이다. 즉, 무한소수의 집합은 완비성 공리를 만족한다.

실수는 완비성, 순서성을 만족하는 체. 완비순서체라고도 한다.

이상엽/ 해석학/ 집합론 복습

집합

  • 현대 수학은 공리 –약속된 명제– 들로부터 논리를 쌓아가는 학문.
  • 수학의 가장 기본이 되는 공리계인 ZFC가 10개의 집합에 대해 서술하고 있음.
  • 대부분의 수학적 대상은 모두 집합으로 정의가 됨.
    • 사칙연산은 함수의 일종이고 함수는 집합으로 정의가 됨.

정의

다음 성질들을 만족시키는 원소 x 들의 모임을 집합이라 한다. (아래는 소박한 정의, 현대적 정의는 공리계가 따로 있음)

  1. 집합에 속하거나 속하지 않거나 둘 중 하나로써 명확하다.
  2. 원소들끼리는 서로 다르다.
  3. 원소들끼리는 순서에 따른 구분이 없으며, 연산이 주어지지 않는다.
  • x 가 집합 X 의 원소이면 x \in X 로 표현하고 원소가 아니면 x \notin X 로 표현한다.
  • 집합 U 의 원소 중에서 명제 P 를 만족시키는 원소로 이루어진 집합 X 를 조건제시법으로 X = \{ x \in U | P(x) \} 라 표현하며, 이때 U 를 전체집합이라 한다.
  • 공집합은 아무런 원소를 가지지 않는 집합이며, 기호로 \phi 라 표현한다.

집합의 연산

합집합

집합 I = \{ 1, 2, ... , n \} 에 대하여 집합들 A_{i} (i \in I) 의 합집합은 (여기서 i 는 첨수라 하고 그 첨수들 모은 집합인 I 를 첨수족이라 한다)

\cup_{i \in I} A_{i} = \{ x | \exists i \in I s.t. x \in A_{i} \}

이고 특히 두 집합 A B 의 합집합을

A \cup B = \{ x | x \in A \vee x \in B \}

라 표현한다.

교집합

집합 I = \{ 1, 2, ... , n \} 에 대하여 집합들 A_{i} (i \in I) 의 교집합은

\cap_{i \in I} A_{i} = \{ x | \forall i \in I s.t. x \in A_{i} \}

이고 특히 두 집합 A B 의 교집합을

A \cap B = \{ x | x \in A \wedge x \in B \}

라 표현한다.

곱집합

집합 I = \{ 1, 2, ... , n \} 에 대하여 집합들 A_{i} (i \in I) 의 곱집합은 (데카르트곱 또는 카테시안곱이라고 한다. 카테시안은 데카르트의 라틴어 표현)

\Pi_{i \in I} A_{i} = \{ (x_{i})_{i \in I} | \forall i \in I s.t. x \in A_{i} \}

  • 여기서 (x_{i})_{i \in I} 는 튜플이라고 한다. 순서쌍이라고도 하는데 순서쌍은 원소가 2개짜리 튜플을 의미.
  • 튜플이란 여러 개 원소를 순서 있게 나열한 것.

이고 특히 두 집합 A B 의 곱집합을

A \times B = \{ (x_{1}, x_{2}) | x_{1} \in A \wedge x_{2} \in B \}

라 표현한다.

차집합

집합 A 에 속하지만 집합 B 에는 속하지 않는 원소의 집합을

A - B = \{ x | x \in A \wedge x \notin B \} = A \cap B^{c}

라 표현하며, A B 의 차집합이라 한다.

전체집합 U 에 대하여 U - A = A^{c} 라 표현하며 A 의 여집합이라 한다.

  • 다음이 성립한다.
    • 드모르간 법칙
      • (\cup_{i \in I} A_{i})^{c} = \cap_{i \in I} A_{i}^{c}
      • (\cap_{i \in I} A_{i})^{c} = \cup_{i \in I} A_{i}^{c}
    • 분배 법칙
      • A \cap (\cup_{i \in I} B_{i}) = \cup_{i \in I} (A \cap B)
      • A \cup (\cap_{i \in I} B_{i}) = \cap_{i \in I} (A \cup B)
      • A \times (B \cap C) = (A \times B) \cap (A \times C)
      • A \times (B \cup C) = (A \times B) \cup (A \times C)
      • A \times (B - C) = (A \times B) - (A \times C)

포함관계

  • 만약 집합 A 에 속하는 모든 원소가 집합 B 의 원소이기도 하면 A \subseteq B 라 표현하며, A B 의 부분집합이라 한다.
  • 만약 A \subseteq B 이면서 동시에 B \subseteq A 이면 A = B 라 표현하며, A B 가 서로 같다고 한다.
  • 만약 A \subseteq B 이면서 A \neq B 이면 A \subset B 라 표현하며, A B 의 진부분집합이라 한다.
  • 집합 A 의 모든 부분집합들의 집합을 P(A) 라 표현하며 A 의 멱집합이라 한다. (P는 Power Set)
  • 집합 기호
    • \mathbb{N} : 모든 자연수의 집합
    • \mathbb{Z} : 모든 정수의 집합
    • \mathbb{Q} : 모든 유리수의 집합
    • \mathbb{R} : 모든 실수의 집합
    • \mathbb{C} : 모든 복수수의 집합

함수

정의

두 집합 X, Y 에 대하여 아래 두 조건을 만족하는 X \times Y 의 부분집합 f 를 함수라 한다. (두 집합의 곱집합의 부분집합이 함수가 됨)

  • \forall x \in X, \exists y \in Y, s.t. (x, y) \in f
    • (모든 x y 값을 갖는다)
  • (x, y_{1}) \in f \wedge (x, y_{2}) \in f \Rightarrow y_{1} = y_{2}
    • (x y 값을 1개만 갖는다)

이때 함수를 f : X \to Y 라 표현하며, (x, y) \in f 이면 y = f(x) 라 표현한다.

  • 집합 A \subseteq X 및 함수 f : X \to Y 에 대하여 f(A) = \{ f(a) | a \in A \} A 의 상(Image)이라 한다.
  • 집합 B \subseteq Y 및 함수 f: : X \to Y 에 대하여 f^{-1}(B) = \{ x \in X | f(x) \in B \} B 의 원상(Pre Image)이라 한다.
  • f : X \to Y 에서 X 를 정의역(Domain) Dom(f) , Y 를 공역(Codomain) f(X) = \{ f(x) | x \in X \} 를 치역(Range) Rng(f) 라 한다.

함수의 종류

함수 f : X \to Y 에 대하여

  • 전사: Rng(f) = Y
    • (치역 = 공역, 남는 y 가 없다)
  • 단사: x_{1} \neq x_{2} \in X \Rightarrow f(x_{1}) \neq f(x_{2})
    • (y x 를 1개씩 갖는다)
  • 전단사: 전사이고 단사인 함수. 일대일대응이라고도 한다.

  • 1
    • Y 에 남는 값이 있기 때문에 전사가 아님
    • Y 에 2개의 화살을 받는 값이 있으므로 단사가 아님
    • 고로 전사도 단사도 아님
  • 2
    • Y 에 남는 값이 있기 때문에 전사가 아님
    • Y 에 2개의 화살을 받는 값이 없으므로 단사가 됨
    • 고로 단사지만 전사는 아님. 단사 함수.
  • 3
    • Y 에 남는 값이 없기 때문에 전사가 됨
    • Y 에 2개의 화살을 받는 값이 있으므로 단사가 아님
    • 고로 전사지만 단사는 아님. 전사 함수
  • 4
    • Y 에 남는 값이 없기 때문에 전사가 됨
    • Y 에 2개의 화살을 받는 값이 없으므로 단사가 됨
    • 고로 전단사(일대일 대응) 함수가 됨.

여러 가지 함수

  • 항등함수: \forall x \in X, I_{X}(x) = x
    • (자기 자신이 그대로 나오는 함수)
  • 상수함수: \exists y_{0} \in Y, f(X) = y_{0}
    • (어떠한 값을 넣어도 항상 상수가 나옴)
  • 역함수: 전단사인 f : X \to Y 에 대해 f^{-1} : Y \to X
    • (함수를 뒤집은 함수인데, 전단사여야만 역함수가 가능)
  • 합성함수: 두 함수 f : X \to Y, g : Y \to Z \forall x \in X, (g \circ f)(x) = g(f(x))

집합의 크기

정의

  • 집합의 크기란 집합의 원소 개수에 대한 척도이다.
  • 두 집합 X, Y 에 대하여 전단사함수 f : X \to Y 가 존재하면 X Y 는 동등이며, X \approx Y 라 표현한다.
  • 집합 X 의 적당한 진부분집합 Y X 와 동등하면 X 는 무한집합이다.
  • 무한집합이 아닌 집합을 유한집합이라 한다.
  • 집합 X X \approx \mathbb{N} 일 때 X 를 가부번집합이라 한다.
  • 유한집합이나 가부번집합을 가산집합이라 한다.
  • 가부번집합이 아닌 무한집합을 비가산집합이라 한다.

여러 가지 정리

  • \mathbb{N} \approx \mathbb{Z} \approx \mathbb{Q}
  • \mathbb{R} 는 비가부번집합이다.
  • \mathbb{R} \approx \mathbb{R} - \mathbb{Q} \approx \mathbb{C}
  • 칸토어의 정리: 공집합이 아닌 임의의 집합 X 에 대하여 P(X) 의 크기는 X 의 크기보다 크다.
  • P(\mathbb{N}) \approx \mathbb{R}

순서관계

  • (기본적인 집합에 연산구조, 순서구조, 위상구조 등을 부여할 수 있음)

순서집합

아래 조건들을 만족하는 집합 X 위의 이항 관계 \leq 를 부분순서관계라 한다.

  1. \forall x \in X, x \leq x
    • (반사적, reflexive)
  2. \forall x, y, z \in X, x \leq y \leq z \Rightarrow x \leq z
    • (추이적, transitive)
  3. \forall x, y \in X, x \leq y \leq x \Rightarrow x = y
    • (반대칭적, antisymmetric)
  • 부분순서관계 \leq 를 갖춘 집합을 부분순서집합이라 한다.
  • 부분순서집합 X 의 어떤 두 원소 x, y x \leq y \vee y \leq x 을 만족하면 x y 는 비교가능하다고 한다.
  • 부분순서집합 X 의 임의의 두 원소가 비교가능하면 X 를 전순서집합이라 한다.

상(하)계, 극대(소), 최대(소)

부분순서집합 X 의 부분집합 A 에 대하여

  • \forall a \in A, a \leq x 를 만족하는 x \in X A 의 상계(upper bound)라 한다.
  • 상계가 존재하는 A 를 ‘위로 유계(bounded)이다’라고 한다.
  • 위로 유계이면서 동시에 아래로 유계인 집합을 유계집합이라 한다.
  • a > m a \in A 가 존재하지 않을 때 m \in A A 의 극대원소라 한다.
  • \forall a \in A, a \leq g g \in A A 의 최대원소라 한다.

각 항목의 부등호 방향을 바꿔주면 각각 하계(lower bound), 아래로 유계, 유계집합, 극소원소, 최소원소의 정의가 된다.

  • 집합 A의
    • 상계: l, m, n
    • 최소상계: l
    • 하계: a, d, e, f
    • 최대하계: 없음
    • 극대: j, k
    • 극소: g
    • 최대: 없음
    • 최소: g

이상엽/ 선형대수학/ 자료의 처리

우선순위 평가

인접행렬

개념

요소간의 연결 관계를 나타내는 정사각 행렬

  • 참조한 (화살표가 나가는) 쪽은 행에, 참조된 (화살표를 받는) 쪽은 열에 쓴다.
    • 1은 2와 3으로 화살표를 쏘고 있으므로, 1행은 2열과 3열에 값이 있음.

권위벡터와 허브벡터

n \times n 인접행렬 A = (a_{ij}) 에 대하여

\left( \begin{array}{rrrr} \sum_{i = 1}^{n} a_{i1} \\ \sum_{i = 1}^{n} a_{i2} \\ ... \\ \sum_{i = 1}^{n} a_{in} \end{array} \right) \left( \begin{array}{rrrr} \sum_{j = 1}^{n} a_{1j} \\ \sum_{j = 1}^{n} a_{2j} \\ ... \\ \sum_{j = 1}^{n} a_{nj} \end{array} \right) 을 각각 A 의 권위벡터와 허브벡터라 하며, 각 벡터의 성분을 권위 가중치와 허브가중치라 한다.

  • 가중치로부터 중요도를 판단한다는게 아이디어
    • 권위 벡터(u_{0} )는 연관받은 (열) 데이터에 대한 벡터가 된다. 그 각각의 값은 권위 가중치가 된다.
    • 허브 벡터(v_{0} )는 연관한 (행) 데이터에 대한 벡터가 된다. 그 각각의 값은 허브 가중치가 된다.
  • 권위 벡터와 허브 벡터는 상호작용을 기반으로 계속 값이 업데이트 된다.
    • 업데이트 되는 와중에 어떤 기준선에 도달하여 값이 안정되면 최종적으로 그 벡터를 중요도 평가에 사용한다.

순위평가 원리

인접행렬 A 와 초기권위벡터 u_{0} 와 초기허브벡터 v_{0} 에 대하여

u_{k} = \begin{cases} u_{0} & k =0 \\ {A_{v_{k}}^{T} \over \|A_{v_{k}}^{T}\|} & k > 0 \end{cases},  v_{k} = \begin{cases} v_{0} & k =0 \\ {A_{v_{k-1}} \over \|A_{v_{k-1}}\|} & k > 0 \end{cases}

  • 현재 권위 벡터는 이전 허브 벡터의 값을 원본 행렬(의 전치 행렬)에 곱하여 구하고, 마찬가지로 현재 허브 벡터는 이전 권위 벡터의 값을 원본 행렬에 곱하여 구한다.
    • 이 곱을 반복하여 값을 업데이트 한다.
  • 다만 이것을 점화식을 이용해서 구성하면 자기 자신만 보면 되는 (권위 벡터는 권위 벡터만으로, 허브 벡터는 허브 벡터만으로) 해석적인 결과가 구성되고, 이를 컴퓨터에 넣어서 계속 돌리면 값이 나온다.

와 같이 새로운 정규화된 권위벡터 u_{k} 와 허브벡터 v_{k} 를 정의한다. (k 는 정수)

이때 u_{k}, v_{k} 를 연립하면 다음과 같이 정규화된 u_{k} v_{k} 의 점화식을 얻을 수 있다.

u_{k} = {A_{v_{k}}^{T} \over \|A_{v_{k}}^{T}\|} = {A^{T}({A_{u_{k-1}} \over \|A_{u_{k-1}}\|}) \over \|A^{T}({A_{u_{k-1}} \over \|A_{u_{k-1}}\|})\|} = {(A^{T}A)_{u_{k-1}} \over \|(A^{T}A)_{u_{k-1}}\|}

마찬가지로 v_{k} = {(AA^{T})_{v_{k-1}} \over \|(AA^{T})_{v_{k-1}}\|}

이 벡터들이 안정화가 되었다고 판단되는 상태로부터 각각 최종 중요도를 판별한다.

사례

10개의 인터넷 페이지(ㄱ~ㅊ)들 간의 인접행렬 $latex A &s=2가 다음과 같다고 하자.

앞에서 소개된 절차에 따라 $latex A &s=2의 정규화된 권위벡터가 안정화 될 때까지 반복계산한 결과는 다음과 같다.

  • 위 수식은 소숫점 4자리까지만 연산하는데, u_{9}, u_{10} 에 도달하면 값의 차이가 없기 때문에 더는 연산을 하지 않고 멈춘다.
    • 만일 소숫점 자리를 5자리 이상으로 보면 더 돌 수 있다.

따라서 $latex A &s=2 권위가중치로부터 페이지 ㄱ, ㅂ, ㅅ, ㅈ는 관련이 적고, 그 외의 페이지는 중요도가 높은 것부터 ㅁ > ㅇ > ㄴ > ㅊ > ㄷ = ㄹ 순서대로 검색엔진에서 노출되어야 함을 알 수 있다.

  • 요게 바로 구글 페이지 랭크 연산 방식
  • 주요 키워드) 거듭제곱법(power method), 우세 고유벡터/값(dominant eigen vector/value)

자료압축

특잇값 분해

분해

한 행렬을 여러 행렬들의 곱으로 표현하는 것

ex) QR  분해, LU 분해, LDU 분해, 고윳값 분해, 헤센버그 분해, 슈르 분해, 특잇값 분해 등

특잇값

m \times n 행렬 A 에 대하여 \lambda_{1}, \lambda_{2}, ... , \lambda_{n} A^{T}A 의 고윳값일 때

\sigma_{1} = \sqrt{\lambda_{1}}, \sigma_{2} = \sqrt{\lambda_{2}}, ... \sigma_{n} = \sqrt{\lambda_{n}}

A 의 특잇값이라 한다.

  • 고윳값을 만들려면 정사각 행렬이어야 한다. 반면 특잇값은 임의의 행렬에서도 만들어낼 수 있음.
    • 일반적인 행렬을 정사각 행렬로 만들기 위해  m \times n 행렬 A 에 대하여 A^{T}A 를 한 후 거기서 특이값을 추출한다.

ex) 행렬 A = \left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) 에 대하여

A^{T}A = \left( \begin{array}{rrr} 1 & 0 & 1 \\ 1 & 1 & 0 \end{array} \right) \left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) = \left( \begin{array}{rr} 2 & 1 \\ 1 & 2 \end{array} \right) 이므로

A^{T}A 의 고유방정식은 \lambda^{2} - 4 \lambda + 3 = (\lambda - 1)(\lambda - 3) = 0 이다

따라서 A 의 두 특잇값은 각각 \sqrt{3}, 1 이다.

특잇값 분해

영행렬이 아닌 임의의 m \times n 행렬 A 는 다음과 같이 나타낼 수 있다.

A = U \Sigma V^{T}

이때 U, V 는 직교행렬이며, A 는 주대각성분이 \Sigma 의 특잇값이고 나머지 성분들은 0 m \times n 행렬이다.

  • 여기서 \Sigma 는 합을 의미하는 것이 아니라 \sigma 의 대문자 형태이다. (벡터를 의미하는 \sigma 의 행렬 형태)

ex) 행렬 A = \left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) 는 다음과 같이 특잇값 분해된다.

\left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) = \left( \begin{array}{rrr} {\sqrt{6} \over 3} & 0 & - {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & -{\sqrt{2} \over 2} & {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & {\sqrt{2} \over 2} & {1 \over \sqrt{3}} \end{array} \right) \left( \begin{array}{rrr} \sqrt{3} & 0 \\ 0 & 1 \\ 0 & 0 \end{array} \right) \left( \begin{array}{rr} {\sqrt{2} \over 2} & {\sqrt{2} \over 2} \\ {\sqrt{2} \over 2} & -{\sqrt{2} \over 2} \end{array} \right)

축소된 특잇값 분해

특잇값 분해에서 0 인 성분들로만 이루어진, 대수적으로 무의미한 행 또는 열을 제거한 형태를 축소된 특잇값 분해라고 한다.

즉, A = U_{1} \Sigma_{1} V_{1}^{T} = (u_{1}, u_{2}, ... , u_{k}) \left( \begin{array}{rrrr} \sigma_{1} & 0 & ... & 0 \\ 0 & \sigma_{2} & ... & 0 \\ ... & ... & ... & ... \\ 0 & 0 & ... & \sigma_{k} \end{array} \right) \left( \begin{array}{rrrr} v_{1}^{T} \\ v_{2}^{T} \\ ... \\ v_{k}^{T} \end{array} \right)

또한 축소된 특잇값 분해를 이용하여 행렬 A 를 다음과 같이 전개한 것을 A 의 축소된 특잇값 전개라 한다.

A = \sigma_{1}u_{1}v_{1}^{T} + \sigma_{2}u_{2}v_{2}^{T} + ... + \sigma_{k}u_{k}v_{k}^{T} 

ex)

\left( \begin{array}{rrr} 1 & 1 \\ 0 & 1 \\ 1 & 0 \end{array} \right) = \left( \begin{array}{rrr} {\sqrt{6} \over 3} & 0 & - {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & -{\sqrt{2} \over 2} & {1 \over \sqrt{3}} \\ {\sqrt{6} \over 6} & {\sqrt{2} \over 2} & {1 \over \sqrt{3}} \end{array} \right) \left( \begin{array}{rrr} \sqrt{3} & 0 \\ 0 & 1 \\ 0 & 0 \end{array} \right) \left( \begin{array}{rr} {\sqrt{2} \over 2} & {\sqrt{2} \over 2} \\ {\sqrt{2} \over 2} & -{\sqrt{2} \over 2} \end{array} \right)

= \left( \begin{array}{rrr} {\sqrt{6} \over 3} & 0 \\ {\sqrt{6} \over 6} & -{\sqrt{2} \over 2} \\ {\sqrt{6} \over 6} & {\sqrt{2} \over 2} \end{array} \right) \left( \begin{array}{rr} \sqrt{3} & 0 \\ 0 & 1 \end{array} \right) \left( \begin{array}{rr} {\sqrt{2} \over 2} & {\sqrt{2} \over 2} \\ {\sqrt{2} \over 2} & -{\sqrt{2} \over 2} \end{array} \right)

= \sqrt{3}u_{1}v_{1}^{T} + u_{2}v_{2}^{T}

자료압축 원리

압축되지 않은 m \times n 행렬 A 를 위한 필요 저장 공간은 mn 이다.

A 를 축소된 특잇값 분해한 결과가 A = \sigma_{1}u_{1}v_{1}^{T} + \sigma_{2}u_{2}v_{2}^{T} + ... + \sigma_{k}u_{k}v_{k}^{T}  라면

이제 필요한 저장 공간은 k + km + kn = k(1 + m + n) (\sigma_{1} \geq \sigma_{2} \geq ... \geq \sigma_{k}) 이다.

  • k 는 특잇값 개수 = \Sigma 의 행개수 or 열개수
  • m U 의 행 개수 = u_{i} 의 성분개수
  • n V^{T} 의 열 개수 = v_{i}^{T} 의 성분개수

충분히 작다고 판단되는 \sigma_{r+1}, ... \sigma_{k} 에 대응하는 항들을 추가로 제거하면, 이때 필요한 저장 공간은 r(1 + m + n) 뿐이다.

이상엽/ 선형대수학/ 최적화 문제

곡선 적합

보간법

개념

주어진 특징 점들을 포함하는 함수를 구하는 방법

정리) 좌표평면에 있는 임의의 서로 다른 n 개의 점을 지나는 k 차 다항함수는 유일하게 존재한다. (단 k k < n 인 자연수)

사례

네 점 (1, 3), (2, -2), (3, -5), (4, 0) 을 모두 지나는 3차 함수

f(x) = a_{0} + a_{1} x + a_{2} x^{2} + a_{3} x^{3}

를 구하자. 우선 다음의 방정식을 세운다.

Step 1)

\left( \begin{array}{rrrr} 1 & x_{1} & x_{1}^{2} & x_{1}^{3} \\ 1 & x_{2} & x_{2}^{2} & x_{2}^{3} \\ 1 & x_{3} & x_{3}^{2} & x_{3}^{3} \\ 1 & x_{4} & x_{4}^{2} & x_{4}^{3} \end{array} \right) \left( \begin{array}{rrrr} a_{0} \\ a_{1} \\ a_{2} \\ a_{3} \end{array} \right) = \left( \begin{array}{rrrr} y_{1} \\ y_{2} \\ y_{3} \\ y_{4} \end{array} \right)

Step 2) 네 점을 대입하고 첨가행렬을 만든다.

\left( \begin{array}{rrrrr} 1 & 1 & 1 & 1 & 3 \\ 1 & 2 & 4 & 8 & -2 \\ 1 & 3 & 9 & 27 & -5 \\ 1 & 4 & 16 & 64 & 0 \end{array} \right)

Step 3) 첨가행렬을 가우스-조던 소거법을 이용하여 풀이한다.

\left( \begin{array}{rrrrr} 1 & 1 & 1 & 1 & 3 \\ 1 & 2 & 4 & 8 & -2 \\ 1 & 3 & 9 & 27 & -5 \\ 1 & 4 & 16 & 64 & 0 \end{array} \right) \Rightarrow \left( \begin{array}{rrrrr} 1 & 0 & 0 & 0 & 4 \\ 0 & 1 & 0 & 0 & 3 \\ 0 & 0 & 1 & 0 & -5 \\ 0 & 0 & 0 & 1 & 1 \end{array} \right)

Step 4) 

a_{0} = 4, a_{1} = 3, a_{2} = -5, a_{3} = 1 이므로 f(x) = 4 + 3 x - 5 x^{2} + x^{3} 이다.

  • 곡선 접합은 현재 가진 데이터에 대해 분석은 잘 할 수 있지만, 신규 데이터가 현재 그려 놓은 곡선 위에 존재한다는 보증이 없음. 유연성이 매우 떨어진다.
    • 애초에 데이터를 모두 포함하는 함수가 존재하지 않는 경우도 많음.

최소제곱법

  • 곡선 접합의 단점을 보완할 수 있는 방법.
  • 가우스가 창안한 방법으로 가우스는 이 방법을 통해 소행성 ‘세레스’ 의 궤도를 정확히 예측해 냄.

개념

특징 점들을 포함하는 함수를 특정 지을 수 없을 때, 실제 해와의 오차 제곱 합이 최소가 되는 근사적인 해를 구하는 방법

정리) 방정식 Ax = B 을 변형한 방정식 A^{T}Ax = A^{T}B (정규방정식)의 모든 해는 Ax = B 의 최소제곱해이다.

  • 요게 결국 선형회귀이다.
  • A^{T}Ax = A^{T}B (정규방정식)의 모든 해는 Ax = B 의 최소제곱해이라는 부분은 증명이 복잡하므로 강의 상에서는 생략.

사례

네 점 (0, 1), (1, 3), (2, 4), (3, 4) 에 근사하는 일차 함수 f(x) = a_{0} + a_{1} x 을 구하자. 우선 다음의 방정식을 세운다.

Step 1) Ax = B

\Leftrightarrow \left( \begin{array}{rrrr} 1 & x_{1} \\ 1 & x_{2} \\ 1 & x_{3} \\ 1 & x_{4} \end{array} \right) \left( \begin{array}{rr} a_{0} \\ a_{1} \end{array} \right) = \left( \begin{array}{rrrr} y_{1} \\ y_{2} \\ y_{3} \\ y_{4} \end{array} \right)

Step 2) 네 점을 대입하고 정규방정식 A^{T}Ax = A^{T}B 으로부터 방정식 x = (A^{T}A)^{-1} A^{T}B 을 구성한다.

A^{T}A = \left( \begin{array}{rr} 4 & 6 \\ 6 & 14  \end{array} \right) 이므로

(A^{T}A)^{-1} = \left( \begin{array}{rr} 4 & 6 \\ 6 & 14  \end{array} \right)^{-1} = {1 \over 10} \left( \begin{array}{rr} 7 & -3 \\ -3 & 2  \end{array} \right)  

\therefore x = {1 \over 10} \left( \begin{array}{rr} 7 & -3 \\ -3 & 2  \end{array} \right) \left( \begin{array}{rrrr} 1 & 1 & 1 & 1 \\ 0 & 1 & 2 & 3  \end{array} \right) \left( \begin{array}{rrrr} 1 \\ 3 \\ 4 \\ 4  \end{array} \right)

Step 3) x = \left( \begin{array}{rr} a_{0} \\ a_{1}  \end{array} \right) = \left( \begin{array}{rr} {2 \over 3} \\ 1 \end{array} \right) 이므로 구하고자 하는 함수는 f(x) = {3 \over 2} + x 이다.

n차 일반화

m 개의 자료점 (x_{1}, y_{1}), (x_{2}, y_{2}), ... , (x_{m}, y_{m}) 에 대해 n 차 다항식 y = a_{0} + a_{1} x + ... + a_{n} x^{n} 을 최소제곱법을 이용하여 근사하기 위해서는 Ax = B

A = \left( \begin{array}{rrrr} 1 & x_{1} & ... & x_{1}^{n} \\ 1 & x_{2} & ... & x_{2}^{n} \\ ... & ... & ... & ... \\ 1 & x_{m} & ... & x_{m}^{n} \end{array} \right), x = \left( \begin{array}{rrrr} a_{0} \\ a_{1} \\ ... \\ a_{n} \end{array} \right), B = \left( \begin{array}{rrrr} y_{1} \\ y_{2} \\ ... \\ y_{m} \end{array} \right)

로 설정하면 된다.

두 방법의 비교

  보간법 최소제곱법
목표 데이터를 모두 포함하는 함수 데이터의 경향을 반영하는 함수
데이터의 수 적을 수록 좋음 많아도 무방함
정밀도 매우 높음 상대적으로 낮음
신축성 조절이 어려움 조절이 자유로움

이차형식의 최적화

이차형식

가환환 K 위의 가군 V 에 대해 다음 세 조건을 만족시키는 함수 Q : V \to K

  • \forall k, l \in K, \forall u, v, w \in V
    • Q(kv) = k^{2} Q(v)
    • Q(u + v + w) = Q(u + v) + Q(v+w) + Q(u+w) - Q(u) - Q(v) - Q(w)
    • Q(kv + lv) = k^{2} Q(u) + l^{2} Q(v) + kl Q(u+v) - klQ(u) - klQ(v)

ex 1) R^{2} 상의 일반적인 이차형식은 다음과 같다.

a_{1}x_{1}^{2} + a_{2}x_{2}^{2} + 2a_{3}x_{1}x_{2} \Leftrightarrow \left( \begin{array}{rr} x_{1} & x_{2} \end{array} \right) \left( \begin{array}{rr} a_{1} & a_{3} \\ a_{3} & a_{2} \end{array} \right) \left( \begin{array}{rr} x_{1} \\ x_{2}  \end{array} \right)

ex 2) R^{3} 상의 일반적인 이차형식은 다음과 같다.

a_{1}x_{1}^{2} + a_{2}x_{2}^{2} + a_{3}x_{3}^{2} +  2a_{4}x_{1}x_{2} + 2a_{5}x_{1}x_{3} + 2a_{6}x_{2}x_{2}

\Leftrightarrow \left( \begin{array}{rrr} x_{1} & x_{2} & x_{3} \end{array} \right) \left( \begin{array}{rrr} a_{1} & a_{4} & a_{5} \\ a_{4} & a_{2} & a_{6} \\ a_{5} & a_{6} & a_{3} \end{array} \right) \left( \begin{array}{rrr} x_{1} \\ x_{2} \\ x_{3} \end{array} \right)

제약된 극값

개념

특정 제약 하에 결정되는 원하는 식의 최댓값 또는 최솟값

정리) n \times n 행렬 A 의 고윳값을 큰 순서대로 \lambda_{1}, \lambda_{2}, ... , \lambda_{n} 이라 하자. 이때 \|v\| = 1 제약 하에 v^{T}Av 의 최댓(솟)값은 \lambda_{1} (\lambda_{n}) 에 대응하는 단위고유벡터에서 존재한다.

사례

제약 x^{2} + y^{2} = 1 하에서

  • 위 제약 조건은 \vec{v} = (x, y) 로 정한 것과 같다. \|v\| = 1 이 된다.

z = 5 x^{2} + 5 y^{2} + 4xy

의 최댓값과 최솟값을 구하자. 우선 z 를 이차형식 v^{T} Av 형태로 변환한다.

Step 1) a_{1}x^{2} + a_{2}y^{2} + 2a_{3}xy

\Leftrightarrow \left( \begin{array}{rr} x & y \end{array} \right) \left( \begin{array}{rr} a_{1} & a_{3} \\ a_{3} & a_{2} \end{array} \right) \left( \begin{array}{rr} x \\ y \end{array} \right) = v^{T} A v

즉, z = \left( \begin{array}{rr} x & y \end{array} \right) \left( \begin{array}{rr} 5 & 2 \\ 2 & 5 \end{array} \right) \left( \begin{array}{rr} x \\ y \end{array} \right)

Step 2) 행렬 A = \left( \begin{array}{rr} 5 & 2 \\ 2 & 5 \end{array} \right) 의 고윳값과 고유벡터를 구한다.

\Rightarrow \begin{cases} \lambda_{1} = 7 & v_{1} = (1, 1) \\ \lambda_{2} = 3 & v_{2} = (-1, 1) \end{cases}

Step 3) 고유벡터를 정규화한다.

\Rightarrow \begin{cases} \lambda_{1} = 7 & v_{1} = ({1 \over \sqrt{2}}, {1 \over \sqrt{2}}) \\ \lambda_{2} = 3 & v_{2} = (-{1 \over \sqrt{2}}, {1 \over \sqrt{2}}) \end{cases}

Step 4) 따라서 (x, y) = ({1 \over \sqrt{2}}, {1 \over \sqrt{2}}) 일 때 z 는 최댓값 7을 갖고, (x, y) = (-{1 \over \sqrt{2}}, {1 \over \sqrt{2}}) 일 때 z 최솟값 3을 갖는다.

물론 v_{1} = (-1, -1), v_{2} = (1, -1)   등으로 설정해도 무방하며, 최댓(솟)값은 변하지 않는다.

머신 러닝 교과서/ 컴퓨터는 데이터에서 배운다

데이터를 지식으로 바꾸는 지능적인 시스템 구축

  • 20세기 후반 데이터에서 지식으 추출하여 예측하는 자가 학습(self-learning) 알고리즘과 관련된 인공 지능의 하위 분야로 머신 러닝이 출현했다.
    • 사람이 수동으로 대량의 데이터를 분석하여 규칙을 유도하고 모델을 만드는 대신, 머신 러닝이 데이터에서 더 효율적으로 지식을 추출하여 예측 모델과 데이터 기반의 의사 결정 성능을 점진적으로 향상시킬 수 있게 됨.

머신 러닝의 세 가지 종류

  • 머신 러닝은 3가지 종류로 구분해 볼 수 있다.
    • 지도 학습 (supervised learning)
    • 비지도 학습 (unsupervised learning)
    • 강화 학습 (reinforcement learning)

지도 학습으로 미래 예측

  • 지도 학습의 주요 목적은 레이블(label) 된 훈련 데이터에서 모델을 학습하여 본 적 없는 미래 데이터에 대해 예측을 만드는 것. 
    • 지도(supervised)는 희망하는 출력 신호(레이블)가 있는 일련의 샘플을 의미한다.
  • 지도 학습은 다시 데이터를 범주(category)를 구분하는 분류(classification)와 연속적인 값을 출력하는 회귀(regression)으로 구분할 수 있다.

분류: 클래스 레이블 예측

  • 분류는 과거의 관측을 기반으로 새로운 샘플의 범주형 클래스 레이블을 예측하는 것이 목적.
    • 클래스  레이블은 이산적(discrete)이고 순서가 없어 샘플이 속한 그룹으로 이해할 수 있다.
    • 스팸 이메일 감지는 전형적인 이진 분류(binary classification) 작업의 예이다.
  • 두 개 이상의 클래스 레이블을 가진 경우 지도 학습 알고리즘으로 학습한 예측 모델은 훈련 데이터셋에 있는 모든 클래스 레이블을 새로운 샘플에 할당할 수 있다.
    • 이런 다중 분류(multiclass classification)의 전형 적인 예는 손글씨 인식 문제.
  • 아래 그림은 30개의 훈련 샘플이 있는 이진 분류 작업의 개념을 나타낸다.
    • 15개의 샘플은 음성 클래스(negative class)로 레이블(뺄셈 기호)되어 있고, 다른 15개의 샘플은 양성 클래스(positive class)로 레이블(덧셈 기호) 되어 있다.
    • 각 샘플이 두 개의 x_{1}, x_{2} 값에 연관되어 있으므로 2차원 데이터 셋이다.
    • 지도 학습 알고리즘을 사용하여 두 클래스를 구분할 수 있는 규칙을 학습한다. 이 규칙은 점선으로 나타난 결정 경계(decision boundary)이다.
    • 새로운 데이터의 x_{1}, x_{2} 값이 주어지면 두 개의 범주 중 하나로 분류한다.

회귀: 연속적인 출력 값 예측

  • 회귀는 예측 변수(predictor variable)(또는 설명 변수(explanatory variable), 입력(input))와 연속적인 반응 변수(response variable) (또는 출력(outcome), 타겟(target)) 가 주어졌을 때 출력 값을 예측하는 두 변수 사이의 관계를 찾는다.
    • 학생들의 수학 점수를 예측하는 것이 그 예
  • 아래 그림은 선형 회귀(linear regression)의 개념으로 입력 x 와 타깃 y 가 주어지면 샘플과 직선 사이 거리가 최소가 되는 직선을 그을 수 있다. 
    • 일반적으로 평균 제곱 거리를 사용한다.
    • 이렇게 데이터에서 학습한 직선의 기울기와 절편(intercept)을 사용하여 새로운 데이터의 출력 값을 예측한다.

강화 학습으로 반응형 문제 해결

  • 강화 학습은 환경과 상호 작용하여 시스템(에이전트(agent))의 성능을 향상하는 것이 목적이다.
    • 환경의 현재 상태 정보는 보상(reward) 신호를 포함하기 때문에 강화 학습을 지도 학습과 관련된 분야로 생각할 수 있다.
    • 강화 학습의 피드백은 정답(ground truth) 레이블이나 값이 아니라 보상 함수로 얼마나 좋은지를 측정한 값이다.
    • 에이전트는 환경과 상호 작용하여 보상이 최대화 되는 일련의 행동을 강화 학습으로 학습한다.
    • 탐험적인 시행착오(trial and error) 방식이나 신중하게 세운 계획을 사용한다.
    • 강화 학습의 대표적인 예는 체스이다.

  • 강화 학습에는 여러 하위 분류가 있는데, 일반적인 구조는 강화 학습 에이전트가 환경과 상호작용하여 보상을 최대화 하는 것이다.
    • 각 상태는 양의 보상이나 음의 보상과 연관된다. 보상은 체스 게임의 승리나 패배처럼 전체 목표를 달성하는 것으로 정의할 수 있다.

비지도 학습으로 숨겨진 구조 발견

  • 지도 학습에서는 모델을 훈련할 때 사전에 옳은 답을 알고 있고, 강화 학습에서는 에이전트의 특정 행동을 어떻게 보상할지 그 측정 방법을 정의하는 반면, 비지도 학습에서는 레이블되지 않거나 구조를 알 수 없는 데이터를 다룬다.
    • 비지도 학습을 사용하면 알려진 출력 값이나 보상 함수의 도움을 받지 않고 의미 있는 정보를 추출하기 위해 데이터 구조를 탐색할 수 있다.

군집: 서브그룹 찾기

  • 군집(clustering)은 사전 정보 없이 쌓여 있는 그룹 정보를 의미 있는 서브그룹(subgroup) 또는 클러스터(cluster)로 조직하는 탐색적 데이터 분석 기법이다.
    • 분석 과정에서 만든 각 클러스터는 어느 정도 유사성을 공유하고 다른 클러스터와는 비슷하지 않은 샘플 그룹을 형성한다. 군집을 비지도 분류(unsupervised classification)이라고 하는 이유가 여기에 있다.
    • 클러스터링은 정보를 조직화하고 데이터에서 의미 있는 관계를 유도하는 도구이다.
    • 마케터가 관심사를 기반으로 고객 그룹을 나누는 것이 그 예

차원 축소: 데이터 압축

  • 비지도 학습의 또 다른 하위 분야는 차원 축소(dimensionality reduction)이다.
    • 고차원의 데이터를 다루어야 하는 경우 하나의 관측 샘플에 많은 측정 지표가 존재하는데, 이로 인해 머신 러닝 알고리즘의 계산 성능과 저장 공간의 한계에 맞닥뜨릴 수 있다.
    • 비지도 차원 축소는 잡음(noise) 데이터를 제거하기 위해 특성 전처리 단계에서 종종 적용하는 방법이다. 이런 잡음 데이터는 특정 알고리즘의 예측 성능을 감소시킬 수 있다.
    • 차원 축소는 관련 있는 정보를 대부분 유지하면서 더 작은 차원의 부분 공간(subspace)으로 데이터를 압축한다.
  • 차원 축소는 데이터 시각화에도 유리하다. 아래 그림은 고차원 특성을 1, 2, 3차원 특성공간으로 시각화하는 예

기본 용어와 표기법 소개

  • 아래 그림 1-8의 표는 머신 러닝 분야의 고전적인 예제인 붓꽃(Iris) 데이터셋 일부를 보여준다. 붓꽃 데이터 셋은 Setosa, Versicolor, Virginica 세 종류 150개의 붓꽃 샘플을 담고 있다.
    • 각 붓꽃 샘플은 데이터셋에서 하나의 행(row)으로 표현된다.
    • 센티미터 단위의 측정값은 열(column)에 저장되어 있으며, 데이터셋의 특성(feature)라고도 한다.

  • 데이터는 선형대수학(linear algebra)을 사용하여 행렬(matrix)과 벡터(vector) 표기로 데이터를 표현한다.
    • 일반적인 관례에 따라 샘플은 특성 행렬 X 에 있는 행으로 나타내고, 특성은 열을 따라 저장한다.
    • 150개의 샘플과 네 개의 특성을 가진 붓꽃 데이터셋은 150 x 4 크기의 행렬 X \in \mathbb{R}^{150 \times 4} 로 쓸 수 있다.

\left[ \begin{array}{rrrr} x_{1}^{(1)} & x_{2}^{(1)} & x_{3}^{(1)} & x_{4}^{(1)} \\ x_{1}^{(2)} & x_{2}^{(2)} & x_{3}^{(2)} & x_{4}^{(2)} \\ ... & ... & ... & ... \\ x_{1}^{(150)} & x_{2}^{(150)} & x_{3}^{(150)} & x_{4}^{(150)} \end{array} \right]

  • 기호 설명)
    • 위 첨자 i는 i번째 훈련 샘플을(지수가 아니다 주의), 아래 첨자 j는 데이터셋의 j번째 차원을 나타낸다.
    • 굵은 소문자는 벡터 (x \in \mathbb{R}^{n \times 1} )를 나타내고 굵은 대문자는 행렬 (X \in \mathbb{R}^{n \times m} )을 나타낸다.
    • 벡터나 행렬에 있는 하나의 원소를 나타낼 때는 이탤릭체를 사용한다. x^{n} 또는 x_{m}^{n}
    • 예컨대 x_{1}^{150} 은 150번째 샘플의 1번째 차원인 꽃받침 길이를 나타낸다. 특성 행렬의 각 행은 하나의 꽃 샘플을 나타내고 4차원 행 벡터 x^{i} \in \mathbb{R}^{1 \times 4} 로 쓸 수 있다. 

x_{i} = \left[ \begin{array}{rrrr} x_{1}^{(i)} & x_{2}^{(i)} & x_{3}^{(i)} & x_{4}^{(i)} \end{array} \right]

  • 각 특성 차원은 150차원의 열 벡터 x_{j} \in \mathbb{R}^{150 \times 1} 이다. 예컨대 다음과 같다.

x_{j} = \left[ \begin{array}{rrrr} x_{j}^{(1)} \\ x_{j}^{(2)} \\ ... \\ x_{j}^{(150)} \end{array} \right]

  • 비슷하게 타깃 변수(여기서는 클래스 레이블)를 150차원의 열 벡터로 저장한다.

y = \left[ \begin{array}{rrrr} y^{1} \\ y^{2} \\ ... \\ y^{150} \end{array} \right] (y \in \{ Setosa, Versicolor, Virginica \})

  •  

머신 러닝 시스템 구축 로드맵

  • 아래 그림은 예측 모델링에 머신 러닝을 사용하는 전형적인 작업 흐름을 보여준다.

전처리: 데이터 형태 갖추기

  • 데이터 전처리는 모든 머신 러닝 어플리케이션에서 가장 중요한 단계이다.
    • 많은 머신 러닝 알고리즘에서 최적의 성능을 내려면 선택된 특성이 같은 스케일을 가져야 한다. 특성을 [0, 1] 범위로 변환하거나 평균이 0이고 단위 분산을 가진 표준 정규 분포(standard normal distribution)로 변환하는 경우가 많다.
    • 일부 선택된 특성은 매우 상관관계가 높아 어느 정도 중복된 정보를 가질 수 있다. 이때는 차원 축소 기법을 사용하여 특성을 저차원 부분 공간으로 압축한다. 특성 공간의 차원을 축소하면 저장 공간이 덜 필요하고 학습 알고리즘을 더 빨리 실행할 수 있다.
    • 어떤 경우에는 차원 축소가 모델의 예측 성능을 높이기도 한다. 데이터셋에 관련 없는 특성(또는 잡음)이 매우 많을 경우, 즉 신호 대 잡음비(Signal-to-Noise Ratio, SNR)가 낮은 경우이다.
  • 머신 러닝 알고리즘이 훈련 데이터셋에서 잘 작동하고 새로운 데이터에서도 잘 일반화 되는지 확인하려면 데이터셋을 랜덤하게 훈련 세트와 테스트 세트로 나눠야 한다. 
    • 훈련 세트에서 머신 러닝 모델을 훈련하고 최적화 한다. 테스트 세트는 별도로 보관하고 최종 모델을 평가하는 맨 마지막에 사용한다.

예측 모델 훈련과 선택

  • 분류 알고리즘은 저마다 태생적인 편향이 존재한다. 작업에서 아무런 가정도 하지 않는다면 어떤 하나의 분류 모델이 더 우월하다고 말할 수 없다.
    • 현실에서 가장 좋은 모델을 훈련하고 선택하기 위해 최소한 몇 가지 알고리즘을 비교해야 한다.
  • 여러 모델을 비교하기 전에 먼저 성능을 측정할 지표를 결정해야 한다. 분류에서 널리 사용되는 지표는 정확도(accuracy)이다. 정확도는 정확히 분류된 샘플 비율이다.
  • 모델 선택에 테스트 세트를 사용하지 않고 최종 모델을 평가하려고 따로 보관한다면 테스트 세트와 실제 데이터에서 어떤 모델이 잘동작할지를 어떻게 알 수 있을까?
    • 이 질문에 나온 이슈를 해결하기 위해 다양한 교차 검증 기법을 사용한다.
    • 이 기법은 모델의 일반화 성능을 예측하기 위해 훈련 데이터를 훈련 세트와 검증 세트로 더 나눈다.
  • 또 머신 러닝 라이브럴리들에서 제공하는 알고리즘의 기본 하이퍼파라미터가 현재 작업에 최적이라고 기대할 수는 없다. 이어지는 장에서는 모델 성능을 상세하게 조정하기 위해 하이퍼파라미터 최적화 기법을 사용할 것이다.
    • 하이퍼파라미터(hyperparameter)는 데이터에서 학습하는 파라미터가 아니라 모델 성능을 향상하기 위해 사용하는 다이얼로 생각할 수 있다.

모델을 평가하고 본 적 없는 샘플로 예측

  • 훈련 세트에서 최적의 모델을 선택한 후에는 테스트 세트를 사용하여 이전에 본 적 없는 데이터에서 얼마나 성능을 내는지 예측하여 일반화 오차를 예상한다.
    • 이 성능에 만족한다면 이 모델을 사용하여 새로운 데이터를 예측할 수 있다.
    • 이전에 언급한 특성 스케일 조정과 차원 축소 같은 단계에서 사용한 파라미터는 훈련 세트만 사용하여 얻은 것임을 주목해야 한다. 나중에 동일한 파라미터를 테스트 세트는 물론 새로운 모든 샘플을 변환하는데 사용한다.
    • 그렇지 않으면 테스트 세트에서 측정한 성능은 과도하게 낙관적인 결과가 된다. 

머신 러닝을 위한 파이썬

  • (이하 파이썬 설치에 대한 내용 생략)

이상엽/ 선형대수학/ 복소벡터공간

복소벡터공간

정의

복소수체 \mathbb{C} 에 대한 가군. 즉 적당한 집합 V 에 대해 벡터공간 (V, \mathbb{C}, +, \cdot) 을 복소벡터공간이라 한다.

((V, \mathbb{C}, +, \cdot) 에서 \mathbb{C} 는 스칼라를 복소수에서 가져왔다는 얘기다. 실수벡터공간에서는 스칼라를 어디서 가져왔는지를 생략해서 표기한 셈. 엄밀하게 쓰면 (V, \mathbb{R}, +, \cdot) 이 되지만 일반적으로 생략해서 표기한다.)

또한 모든 복소 n-튜플 (v_{1}, v_{2}, ... , v_{n}) 의 집합을 복수 n-공간이라 하고 \mathbb{C}^{n} 으로 표시한다.

복소켤레

\mathbb{C}^{n} 의 임의의 벡터

  • v = (v_{1}, v_{2}, ... , v_{n})
    • = (a_{1} + b_{1}i, a_{2} + b_{2}i, ... , a_{n} + b_{n}i)
    • = (a_{1}, a_{2}, ... , a_{n}) + i(b_{1}, b_{2}, ... , b_{n})
    • = Re(v) + i Im(v)

에 대하여 v 의 복소켤레 (복소수 부분의 부호만 바뀜)

  • \bar{v} = (\bar{v_{1}}, \bar{v_{2}}, ... , \bar{v_{n}}) = Re(v) - i Im(v)
  • ex 1) v = (1+i, -i, 3, 3i) 에 대하여 Re(v), Im(v), \bar{v} 를 구하시오
    • Re(v) = (1, 0, 3, 0)
    • Im(v) = (1, -1, 0, 3)
    • \bar{v} = Re(v) - i Im(v) = (1 - i, i, 3, -3i)
  • ex 2) A = \left( \begin{array}{rr} 1 - i & 2i \\ -1 & 3+2i \end{array} \right) 에 대하여 \bar{A}, det(\bar{A}) 를 구하시오
    • \bar{A} = \left( \begin{array}{rr} 1 + i & -2i \\ -1 & 3-2i \end{array} \right)
    • det(\bar{A}) = 3 - 2i + 3i + 2 - 2i = 5 - i 

대수적 성질

  • \mathbb{C}^{n} 의 벡터 u, v 와 스칼라 k 에 대해
    • \bar{\bar{u}} = u
    • \overline{ku} = \bar{k} \bar{u}
    • \overline{u \pm v} = \bar{u} \pm \bar{v}
  • m \times k 행렬 A k \times n 행렬 B 에 대해
    • \bar{\bar{A}} = A
    • (\overline{A^{T}}) = (\bar{A})^{T}
    • \overline{AB} = \bar{A} \bar{B}

복소내적공간

정의

복소벡터공간 (V, \mathbb{C}, +, \cdot) 의 두 벡터 u = (u_{1}, u_{2}, ... , u_{n}), v = (v_{1}, v_{2}, ... , v_{n}) 의 내적 <u, v> : V \times V \to \mathbb{C}

<u, v> = u \cdot v = u_{1} \bar{v_{1}} + u_{2} \bar{v_{2}} + ... + u_{n} \bar{v_{n}}

로 정의한다. 또한 내적이 정의되어 있는 복소벡터공간을 복소내적공간이라 한다.

(만약 뒤에 있는 벡터에 켤레를 취해주지 않으면 노름 값이 0이나 음수가 나올 수가 있다. 때문에 뒤의 벡터에 켤레를 취해서 노름 값을 자연스럽게 만들어 줌. 엄밀히 말해주면 위의 연산이 내적공간의 연산이 기본이고, 실수벡터공간에서는 켤레를 취해줘도 의미가 없기 때문에 생략이 되었던 것)

성질

복소내적공간의 세 벡터 u, v, w 와 스칼라 k 에 대해 다음 성질이 만족한다.

  • <u, v> = \overline{<v, u>}
  • <u + v, w> = <u, w> + <v, w>
  • <u, v + w> = <u, v> + <u, w>
  • <ku, w> = k<u, w>
  • <u, kv> = \bar{k}<u, v>
  • v \neq \vec{0} 일 때 <v, v> > 0

고윳값과 벡터

정의

복소정사각행렬 A 에 대하여 고유방정식 det(\lambda I - A) = 0 의 복소해 \lambda A 의 복소고윳값이라 한다.

또한 Av = \lambda v 를 만족시키는 모든 벡터 v 의 집합을 A 의 고유공간, 고유공간의 영벡터가 아닌 벡터를 A 의 복소고유벡터라고 한다.

  • ex) A = \left( \begin{array}{rr} 2 & 1 \\ -5 & -2 \end{array} \right) 일 때
    • det(\lambda I_{2} - A) = det(\left( \begin{array}{rr} \lambda - 2 & -1 \\ 5 & \lambda + 2 \end{array} \right)) = \lambda^{2} + 1 = 0
    • \therefore \lambda = i or -i
    • \lambda = i 일 때
      • V = t \left( \begin{array}{rr} - {i + 2 \over 5} \\ 1 \end{array} \right)
      • 고유공간 =\{(- {i + 2 \over 5} , 1) \}
      • 고유벡터 =(- {i + 2 \over 5}t , t) (t \neq 0)

정리

\lambda 가 실 정사각행렬 A 의 고윳값이고 v 는 이에 대응하는 고유벡터이면, \bar{\lambda} 또한 A 의 고윳값이며 \bar{v} 는 이에 대응하는 고유벡터이다.

유니터리 대각화

용어의 정의

켤레전치행렬

복소행렬 A 의 전치행렬을 구한 다음 각 성분을 켤레인 복소수로 바꾼 행렬 A^{H} A 의 켤레전치행렬 또는 에르미트 전치행렬이라 한다.

스칼라 k m \times r 행렬 A r \times n 행렬 B 에 대해 다음이 성립한다.

  • (A^{H})^{H} = A
  • (A \pm B)^{H} = A^{H} \pm B^{H} (복부호 동순)
  • (kA)^{H} = \bar{k} A^{H}
  • (AB)^{H} = B^{H} A^{H}

에르미트행렬

A = A^{H} 가 성립하는 복소정사각행렬 A 를 에르미트행렬이라 한다.

유니터리행렬

복소정사각행렬 A 의 역행렬 A^{-1} 에 대하여 A^{-1} = A^{H} 가 성립하는 행렬 A 를 유니터리행렬이라 한다.

정규행렬

A A^{H} = A^{H} A 가 성립하는 복소정사각행렬 A 를 정규행렬이라 한다. 에르미트행렬, 유니터리행렬 등이 이에 해당한다.

유니터리 대각화

정의

P^{H}AP = D 가 복소대각행렬이 되는 유니터리행렬 P 가 존재하면 복소정사각행렬 A 는 유니터리 대각화가능하다고 한다.

또한 이러한 임의의 행렬 P A 를 유니터리 대각화한다고 한다.

정리

유니터리 대각화 가능한 행렬은 정규행렬이며, 그 역도 성립한다. 즉 정규행렬은 유니터리 대각화 가능하다.

에르미트행렬 A의 유티너리 대각화 과정

  1. A 의 모든 고유공간의 기저를 구한다.
  2. 고유공간의 정규직교기저를 구한다.
  3. 기저벡터를 열벡터로 하는 행렬 P 는 유니터리행렬이고, A 를 대각화 한다.