이상엽/ 해석학/ 리만적분

리만적분

  • (사실 리만 적분은 다르부의 적분과 동일하고, 오히려 다르부 적분이 더 간편하기 때문에 일반적으로 다르부 적분을 이용해서 적분을 다루지만 안타깝게도 리만이 더 유명하기 때문에 리만 적분이라고 부른다.)

리만적분의 정의

Def 1. [분할과 세분]

[a, b] 가 유계인 폐구간이고 a = x_{0} < x_{1} < x_{2} < ... < x_{n} = b 일 때 \mathcal{P} = \{ x_{0}, x_{1}, ... , x_{n} \} [a, b] 의 분할이라 한다.

[a, b] 의 분할 \mathcal{P} \mathcal{P}* 에 대하여 \mathcal{P} \subset \mathcal{P}* 이면 \mathcal{P}* \mathcal{P} 의 세분이라 한다.

Def 2. [상합과 하합]

f [a, b] 에서 유계일 때

\mathcal{P} = \{ x_{0}, x_{1}, ... , x_{n} \} 에 대해

\Delta x_{i} = x_{i} - x_{i - 1}

M_{i} = \sup \{ f(x) | x_{i-1} \leq x \leq x_{i} \}

m_{i} = \inf \{ f(x) | x_{i-1} \leq x \leq x_{i} \} 로 나타내자

이때

  1. U(\mathcal{P}, f) = \sum_{i=1}^{n} M_{i} \Delta x_{i}
  2. L(\mathcal{P}, f) = \sum_{i=1}^{n} m_{i} \Delta x_{i}

을 각각 [a, b] 에서 f 의 상합과 하합이라 한다.

  • (M_{i} 는 구간 내에서 가장 큰 사각형의 면적이고 이것들의 합이 상합 (아래 그림의 왼쪽) m_{i} 은 구간 내에서 가장 작은 사각형의 면적이고 이것들의 합이 하합이다. (아래 그림의 오른쪽))
  • (실제 구간의 면적은 상합과 하합 사이의 값이 되고, 그 구간의 간격을 극한으로 보내면 상합과 하합의 면적의 차이를 줄일 수 있고 최종적으로 그 줄어든 값이 면적이 된다.)

Def 3. [상적분과 하적분]

f [a, b] 에서 유계일 때 [a, b] 의 분할 \mathcal{P} 에 대해

  1. \overline{\int_{a}^{b}} f(x) dx = \overline{\int_{a}^{b}} f = inf \{ U(\mathcal{P}, f) \}
  2. \underline{\int_{a}^{b}} f(x) dx = \underline{\int_{a}^{b}} f = sup \{ L(\mathcal{P}, f) \}

을 각각 [a, b] 에서 f 의 상적분과 하적분이라 한다.

  • (구할 수 있는 상합들 중에서 하한이 상적분, 구할 수 있는 하합들 중에서 상한이 하적분이 된다.)

Thm.

다음 명제들이 성립한다.

  1. \mathcal{P}* [a, b] 의 분할 \mathcal{P} 의 세분이면
    • L(\mathcal{P}, f) \leq L(\mathcal{P}*, f) \leq U(\mathcal{P}, f) \leq U(\mathcal{P}, f) 
    • (원래 분할 보다 더 세분화 시킨 것(세분)의 하합과 상합은 원래 분할의 하합과 상합의 사이에 온다.)
  2. [a, b] 의 임의의 두 분할 \mathcal{P}_{1}, \mathcal{P}_{2} 에 대하여 L(\mathcal{P}_{1}, f) \leq U(\mathcal{P}_{2}, f) 이다.
    • (임의의 두 분할에서 한쪽 분할의 상합은 다른쪽 분할의 하합 보다 항상 크다.)
  3. f [a, b] 에서 유계이면
    • \underline{\int_{a}^{b}} f \leq \overline{\int_{a}^{b}} f

Def 4. [리만적분가능성]

f [a, b] 에서 유계일 때

\underline{\int_{a}^{b}} f = \overline{\int_{a}^{b}} f

이면 f [a, b] 에서 리만적분가능하다고 하며

\int_{a}^{b} f(x) dx = \int_{a}^{b} f = \underline{\int_{a}^{b}} f = \overline{\int_{a}^{b}} f

로 표현한다. 또한 [a, b] 에서 유계인 리만적분가능한 함수 f 들의 집합을 \mathfrak{R} [a, b] 로 나타낸다 (f \in \mathfrak{R} [a, b] )

  • (상적분 값과 하적분 값이 같게 되면 리만적분 가능하다고 한다. 둘이 같게 되지 않은 경우도 있음.)
  • (리만적분이 불가능하다고 해서 적분 자체가 안되는 것은 아니다. 다른 적분법을 이용하면 적분이 가능할 수 있음.)

주요 정리

Thm 1. [리만적분 판별법]

f [a, b] 에서 유계일 때 다음이 성립한다. (\mathcal{P} [a, b] 의 분할)

f \in \mathfrak{R} [a, b]

\Leftrightarrow \forall \epsilon > 0, \exists \mathcal{P} s.t. U(\mathcal{P}, f) - L(\mathcal{P}, f) < \epsilon

  • (상합과 하합의 차이가 \epsilon 보다 작아지면 리만적분 가능하다 = 상적분과 하적분의 값이 같다.)

Thm 2. [연속성과 리만적분가능성]

f [a, b] 에서 연속이면 f \in \mathfrak{R} [a, b] 이다.

  • (연속이면 리만적분 가능하다. 연속이라고 미분은 안되는데, 연속이면 적분이 됨)
  • (불연속이어도 리만적분 가능한 경우가 있다)

Thm 3. [적분의 평균값 정리]

f [a, b] 에서 연속이면

\int_{a}^{b} f = f(c)(b-a) c \in (a, b) 가 존재한다.

리만적분의 연산

  • f, g \in \mathfrak{R} [a, b] 이면 다음이 성립한다.
    • \int_{a}^{b} (f \pm g) = \int_{a}^{b} f \pm \int_{a}^{b} g (복부호동순)
  • f \in \mathfrak{R} [a, b] 
    • \Leftrightarrow \forall c \in (a, b), f \in \mathfrak{R}[a, c] \wedge f \in \mathfrak{R}[c, b]
    • with \int_{a}^{b} f = \int_{a}^{c} f  + \int_{c}^{b} f

미적분학의 기본정리

제 1 기본정리

Def. [부정적분]

f \in \mathfrak{R} [a, b] 일 때 x \in [a, b] 에 대하여

F(x) = \int_{a}^{x} f(t) dt

로 정의한 함수 F [a, b] 에서 f 의 부정적분이라 한다.

Thm. [미적분학의 제 1 기본정리]

f \in \mathfrak{R} [a, b] 이면 f [a, b] 에서 f 의 부정적분 F 에 대하여 다음이 성립한다.

  1. F [a, b] 에서 균등연속이다.
  2. f [a, b] 에서 연속이면 F [a, b] 에서 미분가능하고 \forall x \in [a, b], F'(x) = f(x) 이다.
  • (미분과 적분의 연산이 역관계를 갖는다는 의미)
  • (이를 최초로 발견한 사람은 이탈리아 수학자였던 토리첼리. 이를 좀 더 일반화한 사람이 뉴턴의 스승이었던 아이작 배로)

제 2 기본정리

Def. [역도함수]

D 가 구간이고 f, F : D \to \mathbb{R} 가 모든 x \in D 에 대하여 F'(x) = f(x) 이면 F f 의 역도함수라 한다.

Thm. [미적분학의 제 2 기본정리]

f \in \mathfrak{R} [a, b] 이고 F : [a, b] \to \mathbb{R} [a, b] 에서 연속이고 (a, b) 에서 미분가능하다고 하자. 이때 F f 의 역도함수이면 다음이 성립한다.

\int_{a}^{b} f = F(b) - F(a)

따름정리

Thm 1. [치환적분법]

g [a, b] 에서 미분가능하고 g' \in \mathfrak{R} [a, b] 이며 f g([a, b]) 에서 연속이면 다음이 성립한다.

\int_{a}^{b} f(g(t))g'(t) dt = \int_{g(a)}^{g(b)} f(x) dx

Thm 2. [부분적분법]

f, g: [a, b] \to \mathbb{R} [a, b] 에서 연속이고 (a, b) 에서 미분가능하며 f', g' \in \mathfrak{R} [a, b] 이면 다음이 성립한다.

\int_{a}^{b} f' g = \{ f(b)g(b) - f(a)g(a) \} - \int_{a}^{b} f g'

리만적분의 확장

  • (리만적분으로는 면적을 구할 수 없는 경우가 많아서 수학자들이 새로 방법을 정의한 것들이 다른적분 방법들)

특이적분

  • (이상 적분이라고도 함. 적분 구간이 유계인 폐구간이 아니거나 f가 유계가 아닌 경우에도 사용할 수 있는 적분 방법)

Def 1. [(a, b] 또는 [a, b) 의 경우]

  1. f : (a, b] \to \mathbb{R} 가 임의의 c \in (a, b) 에 대하여 f \in \mathfrak{R} [c, b] 이면 (a, b] 에서 f 의 특이적분은 \int_{a}^{b} f = \lim_{c \to a+} \int_{c}^{b} f 로 정의한다.
    • f : [a, b) \to \mathbb{R} 의 경우 \int_{a}^{b} f = \lim_{c \to b-} \int_{a}^{c} f
  2. 1에서 우변의 극한이 존재하면 각 구간에 대해 f 는 특이적분가능하다고 한다.
  3. f : [a, b] - \{ c \} \to \mathbb{R} [a, c) (c, b] 에서 특이적분가능하면 f [a, b] 에서 특이적분가능하다고 하고 \int_{a}^{b} f = \lim_{p \to c-} \int_{a}^{p} f + \lim_{q \to c+} \int_{q}^{b} f 로 정의한다.
  • (폐구간이 아니기 때문에 중간에 폐구간이 되는 점을 잡고 그 점을 개구간으로 향하는 극한을 취함)

Def 2. [[a, \infty) 또는 (-\infty, b] 의 경우]

  1. f : [a, \infty) \to \mathbb{R} a < c 인 임의의 c \in \mathbb{R} 에 대하여 f \in \mathfrak{R} [a, c] 이면 [a, \infty) 에서 f 의 특이적분은 \int_{a}^{\infty} f = \lim_{c \to \infty} \int_{a}^{c} f 로 정의한다.
    • f : (-\infty, b] \to \mathfrak{R} 의 경우 \int_{-\infty}^{b} f = \lim_{c \to -\infty} \int_{c}^{b} f
  2. 1에서 우변의 극한이 존재하면 각 구간에 대해 f 는 특이적분가능하다고 한다.
  3. f 가 적당한 p \in \mathbb{R} 에 대하여 (-\infty, p] [p, \infty) 에서 특이적분가능하면 f \mathbb{R} 에서 특이적분가능하다고 하고 \int_{-\infty}^{\infty} f = \int_{-\infty}^{p} f + \int_{p}^{\infty} f 로 정의한다.
  • (위와 비슷하게 정의. 폐구간 점보다 큰 임의의 점을 잡아서 적분 가능한지 확인하고 그 임의의 점을 무한으로 향하는 극한을 취함)

스틸체스적분

  • (\int f(x) dg(x) 의 꼴로 표현되는 형태로 g(x) 는 증가함수로 정의됨)
  • (g(x) x 가 되면 리만적분의 형태가 되기 때문에 리만적분의 일반화된 버전으로 생각할 수 있다.)
  • (리만적분은 연속이어야 가능하지만, 스틸체스적분은 불연속적인 것에 대해서도 적분이 가능하다. g(x) 를 불연속적인 함수로 잡으면 되기 때문)

Def 1. [스틸체스 상합과 하합]

[a, b] 에서 유계인 함수 f 와 증가함수 \alpha, [a, b] 의 분할 \mathcal{P} = \{ x_{0}, x_{1}, ... , x_{n} \} \Delta \alpha_{i} = \alpha(x_{i}) - \alpha(x_{i-1} 에 대하여

  1. U(\mathcal{P}, f, \alpha) = \sum_{i = 1}^{n} M_{i} \Delta \alpha_{i}
  2. L(\mathcal{P}, f, \alpha) = \sum_{i = 1}^{n} M_{i} \Delta \alpha_{i}

을 각각 \alpha 에 관한 f 의 스틸체스상합, 스틸체스하합이라 한다. (i = 1, 2, ... , n )

Def 2. [스틸체스 상적분과 하적분]

[a, b] 에서 유계인 함수 f 와 증가함수 \alpha, [a, b] 의 분할 \mathcal{P} 에 대하여

  1. \overline{\int_{a}^{b}} f d\alpha = \inf \{ U(\mathcal{P}, f, \alpha) \}
  2. \underline{\int_{a}^{b}} f d\alpha = \sup \{ L(\mathcal{P}, f, \alpha) \}

을 각각 \alpha 에 관한 f 의 스틸체스 상적분과 스틸체스 하적분이라 한다.

Def 3. [스틸체스 적분 가능성]

f [a, b] 에서 유계이고 \alpha [a, b] 에서 증가함수 일 때

\overline{\int_{a}^{b}} f d\alpha = \underline{\int_{a}^{b}} f d\alpha

이면 f [a, b] 에서 \alpha 에 관하여 스틸체스적분가능하다고 하며

\int_{a}^{b} f d\alpha = \overline{\int_{a}^{b}} f d\alpha = \underline{\int_{a}^{b}} f d\alpha

로 표현하고 이를 \alpha 에 관한 f 의 스틸체스적분이라 한다. (f \in \mathfrak{R}_{\alpha} [a, b] )

Thm.

f \in \mathfrak{R} [a, b] 이고 \alpha [a, b] 에서 증가하고 미분가능한 함수이며 \alpha ' \in \mathfrak{R}_{\alpha} [a, b] 이면 f \in \mathfrak{R}_{\alpha} [a, b] 이고 다음이 성립한다.

\int_{a}^{b} f d \alpha = \int_{a}^{b} f(x) \alpha '(x) dx

  • (리만 적분은 스틸체스 적분의 \alpha = x 인 지점이므로 \int_{a}^{b} f(x) x' dx 이 되고 x' = 1 이므로 결과적으로 \int_{a}^{b} f(x) dx 의 꼴이 된다)

머신 러닝 교과서/ 간단한 분류 알고리즘 훈련

인공 뉴런: 초기 머신러닝의 간단한 역사

  • 1943년 워런 맥컬록과 월터 피츠는 처음으로 간소화된 뇌의 뉴런 개념을 발표함. 이를 맥컬록-피츠(MCP) 뉴런이라고 한다.
    • 맥컬록과 피츠는 신경 세포를 이진 출력을 내는 간단한 논리 회로로 표현했다. 수상 돌기에 여러 신호가 도착하면 세포체에 합쳐지고 합쳐진 신호가 특정 임계값을 넘으면 출력 신호가 생성되고 축삭 돌기를 이용해서 전달 됨
  • 몇 년 후 프랑크 로젠블라트는 MCP 뉴런 모델을 기반으로 퍼셉트론 학습 개념을 처음 발표함.
    • 퍼셉트론 규칙에서 로젠블라트는 자동으로 최적의 가중치를 학습하는 알고리즘을 제안함.
    • 이 가중치는 뉴런의 출력 신호를 낼지 말지를 결정하기 위해 입력 특성에 곱하는 계수.
    • 지도 학습과 분류 개념으로 말하면 이 알고리즘으로 샘플이 한 클래스에 속하는지 아닌지를 예측할 수 있다.

인공 뉴런의 수학적 정의

  • 인공 뉴런(artifical neuron) 아이디어를 두 개의 클래스가 있는 이진 분류(binary classification) 작업으로 볼 수 있다.
    • 두 클래스는 간단하게 1(양성)과 -1(음성)으로 나타낸다. 그 다음 입력값 x 와 이에 상응하는 가중치 벡터 w 의 선형 조합으로 결정함수(\phi(z) )를 정의한다.
    • 최종 입력(net input)인 z z = w_{1} + x_{1} + ... + w_{m} x_{m} 이다.

w = \left[ \begin{array}{rrr} w_{1} \\ ... \\ w_{m} \end{array} \right], x = \left[ \begin{array}{rrr} x_{1} \\ ... \\ x_{m} \end{array} \right]

  • 이제 특정 샘플 x^{(i)} 의 최종 입력이 사전에 정의된 임계 값 \theta 보다 크면 클래스 1로 예측하고 그렇지 않으면 클래스 -1로 예측한다.
    • 퍼셉트론 알고리즘에서 결정함수 \phi(\cdot) 는 단위 계단 함수(unit step function)를 변형한 것이다.

\phi(z) = \begin{cases} 1 & z \geq \theta \\ -1 & else \end{cases}

  • 식을 간단하게 만들기 위해 임계 값 \theta 를 식의 왼조긍로 옮겨 w_{0} = -\theta x_{0} = 1 인 0번째 가중치를 정의한다. 이렇게 하면 z 를 좀 더 간단하게 쓸 수 있다.

z = w_{0}x_{0} + w_{1}x_{1} + ...  + w_{m}x_{m} = w^{T}x

  • 결정 함수는 다음과 같다.

\phi(z) = \begin{cases} 1 & z \geq \theta \\ -1 & else \end{cases}

  • 머신 러닝 분야에서 음수 임계 값 또는 가중치 w_{0} = -\theta 를 절편이라고 한다.
  • 그림 2-2는 퍼셉트론 결정함수로 최종 입력 z = w^{T}x 가 이진 출력 (-1 또는 1)으로 압축되는 방법(왼쪽)과 이를 사용하여 선형 분리가 가능한 두 개의 클래스 사이를 구별하는 방법(오른쪽)을 나타낸다.

퍼셉트론 학습 규칙

  • MCP 뉴런과 로젠블라트의 임계 퍼셉트론 모델 이면에 있는 전반적인 아이디어는 뇌의 뉴런 하나가 작동하는 방식을 흉내내려는 환원주의(reductionism) 접근 방식을 사용한 것이다.
    • 즉 출력을 내거나 내지 않는 두 가지 경우만 있다. 따라서 로젠블라트의 초기 퍼셉트론 학습 규칙을 요약하면 다음과 같다.
      1. 가중치를 0 또는 랜덤한 작은 값으로 초기화 한다.
      2. 각 훈련 샘플 x^{(i)} 에서 다음 작업을 한다.
        1. 출력값 \hat{y} 를 계산한다.
        2. 가중치를 업데이트 한다.
  • 여기서 출력 값은 앞서 정의한 단위 계단 함수로 예측한 클래스 레이블이다. 가중치 벡터 w 에 있는 개별 가중치 w_{j} 가 동시에 업데이트 되는 것을 다음과 같이 쓸 수 있다.

w_{j} := w_{j} + \Delta w_{j}

  • 가중치 w_{j} 를 업데이트 하는데 사용되는 \Delta w_{j} 값은 퍼셉트론 학습 규칙에 따라 계산된다.

\Delta w_{j} = \eta (y^{(i)} - \hat{y}^{(i)}) x_{j}^{(i)}

  • 여기서 \eta (eta)는 학습률(learning rate)이다. (일반적으로 0.0에서 1.0 사이의 값)
    • y^{(i)} i 번째 훈련 샘플의 진짜 클래스 레이블이다.
    • \hat{y}^{(i)} 는 예측 클래스 레이블이다.
  • 가중치 벡터의 모든 가중치를 동시에 업데이트 한다는 점이 중요하다. 즉, 모든 가중치 \Delta w_{j} 를 업데이트 하기 전에 \hat{y}^{(i)} 를 다시 계산하지 않는다.
  • 구체적으로 2차원 데이터셋에서는 다음과 같이 업데이트 된다.

\Delta w_{0} = \eta (y^{(i)} - output^{(i)})

\Delta w_{1} = \eta (y^{(i)} - output^{(i)}) x_{1}^{i}

\Delta w_{2} = \eta (y^{(i)} - output^{(i)}) x_{2}^{i}

  • 퍼셉트론 규칙이 어떻게 작동하는지 알아보자.
  • 퍼셉트론이 클래스 레이블을 정확히 예측한 다음의 두 경우는 가중치가 변경되지 않고 그대로 유지된다.

\Delta w_{j} = \eta (1 - 1) x_{j}^{i} = 0

\Delta w_{j} = \eta ((-1) - (-1)) x_{j}^{i} = 0

  • 잘못 예측했을 때는 가중치를 양성 또는 음성 타깃 클래스 방향으로 이동시킨다.

\Delta w_{j} = \eta (1 - (-1)) x_{j}^{i} = \eta(2)x_{j}^{(i)}

\Delta w_{j} = \eta (-1 - 1) x_{j}^{i} = \eta(-2)x_{j}^{(i)}

  • 곱셈 계수인 x_{j}^{(i)} 를 좀 더 잘 이해하기 위해 다른 예를 살펴보겠다.

y^{(i)} = 1, \hat{y}_{j}^(i) = -1, \eta = 1

  •  x_{j}^{(i)} = 0.5 일 때 이 샘플을 -1로 잘못 분류했다고 가정한다.
    • 이때 가중치가 1 만큼 증가되어 다음 번에 이 샘플을 만났을 때 최종 입력 x_{j}^{(i)} \times w_{j}^{(i)} 가 더 큰 양수가 된다.
    • 단위 계단 함수의 임계 값보다 커져 샘플이 +1로 분류될 가능성이 높아질 것이다.

\Delta w_{j}^{(i)} = (1 - (-1)) 0.5 = (2) 0.5 = 1

  • 가중치 업데이트는 x_{j}^{(i)} 값에 비례한다. 예컨대 다른 샘플 x_{j}^{(i)} = 2 를 -1로 잘못 분류했다면 이 샘플을 다음번에 올바르게 분류하기 위해 더 크게 결정 경게를 움직인다.

\Delta w_{j}^{(i)} = (1 - (-1)) 2 = (2) 2 = 4

  • 퍼셉트론은 두 클래스가 선형적으로 구분되고 학습률이 충분히 작을 때만 수렴이 보장된다.
    • 두 클래스를 선형 결정 경계로 나눌 수 없다면 훈련 데이터셋을 반복할 최대 횟수(에포크(epoch))를 지정하고 분류 허용 오차를 지정할 수 있다. 그렇지 않으면 퍼셉트론 가중치 업데이트를 멈추지 않는다.

  • 그림 2-4는 퍼셉트론이 샘플 x_{j}^{(i)} 를 입력으로 받아 가중치 x_{j}^{(i)} 를 연결하여 최종 입력을 계산하는 방법을 보여준다.
    • 그 다음 최종 입력은 임계 함수로 전달되어 샘플의 예측 클래스 레이블인 -1 또는 +1의 이진 출력을 만든다.
    • 학습 단계에서 이 출력을 사용하여 예측 오차를 계산하고 가중치를 업데이트 한다.

파이썬으로 퍼셉트론 학습 알고리즘 구현

객체 지향 퍼셉트론 API

  • 객체 지향 방식을 사용하여 퍼셉트론 인터페이스를 가진 파이썬 클래스를 정의
    • Perceptron 객체를 초기화한 후 fit 메서드로 데이터에서 학습하고, 별도의 predict 메서드로 예측을 만든다.
    • 관례에 따라 초기화 과정에서 생성하지 않고 다른 메서드를 호출하여 만든 속성에는 밑줄(_)을 추가한다. ex) self.w_
import numpy as np

class Perceptron(object):

    """ 퍼셉트론 분류기

    매개변수
   ----------
   eta : float
       학습률 (0.0과 1.0사이)
    n_iter : int
       훈련 데이터셋 반복 횟수
    random_state : int
       가중치 무작위 초기화를 위한 난수 생성기 시드

   속성
   ---------
   w_ : 1d-array
       학습된 가중치
    errors_ : list
       에포크마다 누적된 분류 오류
    """

   def __init__(self, eta=0.01, n_iter=50, random_state=1):
       self.eta = eta
       self.n_iter = n_iter
       self.random_state = random_state

    def fit(self, X, y):
        """ 훈련 데이터 학습

        매개변수
       ----------
       X : {array-like}, shape = [n_samples, n_features]
            n_samples개의 샘플과 n_features개의 특성으로 이루어진 훈련 데이터
       y : array-like, shape = [n_samples]
           타겟 값       

        반환값
       ---------
        self : object
        """

       rgen = np.random.RandomState(self.random_state)
        self.w_ = rgen.normal(loc = 0.0, scale = 0.1, size = 1 + X.Shape[1])
        self.errors_ = []

       for _ in range(self.n_iter):
            errors = 0

           for xi, target in zip(X, y):
               update = self.eta * (target - self.predict(xi))
                self.w_[1:] += update * xi
                self.w_[0] += update
                errors += int(update != 0.0)

            self.errors_.append(errors)

        return self

    def net_input(self, X):
       """ 최종 입력 계산 """
        return np.dot(X, self.w_[1:]) + self.w_[0]

    def predict(self, X):
       """ 단위 계단 함수를 사용하여 클래스 레이블을 반환합니다 """
       return np.where(self.net_input(X) >= 0.0, 1, -1)
  • 이 퍼셉트론 구현을 사용하여 학습률 eta와 에포크 횟수(훈련 데이터를 반복하는 횟수) n_iter로 새로운 Perceptron 객체를 초기화 한다.
    • fit 메서드에서 self.w_ 가중치를 벡터 \mathbb{R}^{m + 1} 로 초기화한다.
    • 여기서 m은 데이터셋에 있는 차원(특성) 개수이다.
    • 벡터의 첫 번째 원소인 절편을 위해 1을 더했다. 즉 이 벡터의 첫 번째 원소 self.w_[0]는 앞서 언급한 절편이다.
  • 이 벡터는 rgen.normal(loc = 0.0, scale = 0.01, size = 1 + X.shape[1])을 사용하여 표준 편차가 0.01인 정규 분포에서 뽑은 랜덤한 작은 수를 담고 있다.
    • 여기서 rgen은 넘파이 난수 생성기로 사용자가 지정한 랜덤 시드(seed)로 이전과 동일한 결과를 재현할 수 있다.
  • 가중치를 0으로 초기화 하지 않는 이유는 가중치가 0이 아니어야 학습률 \eta 가 분류 결과에 영향을 주기 때문이다.
    • 가중치가 0으로 초기화되어 있다면 학습률 파라미터 eta는 가중치 벡터의 방향이 아니라 크기에만 영향을 미친다.
  • fit 메서드는 가중치를 초기화한 후 훈련 세트에 있는 모든 개개의 샘플을 반복 순회하면서 이전 절에서 설명한 퍼셉트론 학습 규칙에 따라 가중치를 업데이트 한다.
    • 클래스 레이블은 predict 메서드에서 예측한다.
    • fit 메서드에서 가중치를 업데이트하기 위해 predict 메서드를 호출하여 클래스 레이블에 대한 예측을 얻는다.
    • predict 메서드는 모델이 학습되고 난 후 새로운 데이터의 클래스 레이블을 예측하는데도 사용할 수 있다.
  • 에포크마다 self.errors_ 리스트에 잘못 분류된 횟수를 기록한다. 나중에 훈련하는 동안 얼마나 퍼셉트론을 잘 수행했는지 분석할 수 있다.

붓꽃 데이터셋에서 퍼셉트론 훈련

  • 앞서 만든 퍼셉트론 구현을 테스트 하기 위해 붓꽃 데이터셋에서 Setosa, Versicolor 두 개의 클래스만 사용한다.
    • 퍼셉트론 알고리즘은 다중 클래스 분류로 확장이 가능한데, 일대다(one-versus-all, OvA) 전략 등을 사용하면 된다.
  • pandas 라이브러리를 사용하여 붓꽃 데이터셋을 DataFrame 형식으로 읽고 꽃받침 길이와 꽃잎 길이를 추출하여 2차원 산점도를 그리면 그림 2-6과 같다.
import matplotlib.pyplot as plt
import numpy as np

# setosa와 versicolor를 선택
y = df.iloc[0:100, 4].values
y = np.where(y == 'Iris-setosa', -1, 1)

# 꽃받침 길이와 꽃잎 길이를 추출
X = df.iloc[0:100, [0,2]].values

# 산점도를 그린다.
plt.scatter(X[:50, 0], X[:50, 1], color='red', marker='o', label='setosa')
plt.scatter(X[50:100, 0], X[50:100, 1], color='blue', marker='x', label='versicolor')
plt.xlabel('sepal length [cm]')
plt.ylabel('petal length [cm]')
plt.legend(loc='upper left')
plt.show()

  • 이 데이터셋에서 추출한 일부 데이터를 이용하여 퍼셉트론 알고리즘을 훈련하고 에포크 대비 잘못 분류된 오차를 그래프로 그리면 다음과 같다.
ppn = Perceptron(eta=0.1, n_iter=10)
ppn.fit(X, y)
plt.plot(range(1, len(ppn.errors_) + 1), ppn.errors_, marker='o')
plt.xlabel('Epochs')
plt.ylabel('Number of errors')
plt.show()

  • 퍼셉트론은 6번째 에포크 이후에 수렴했고 훈련 샘플을 완벽하게 분류했다.
  • 최종적으로 데이터셋의 결정 경계를 시각화 하면 아래 그림과 같다.
from matplotlib.colors import ListedColormap

def plot_decision_regions(X, y, classifier, resolution=0.02):
    # 마커와 컬러맵을 설정
   markers = ('s', 'x', '0', '^', 'v')
   colors = ('red', 'blue', 'lightgreen', 'gray', 'cyan')
   cmap = ListedColormap(colors[:len(np.unique(y))])
    # 결정 경계를 그린다.
   x1_min, x1_max = X[:, 0].min() - 1, X[:, 0].max() + 1
   x2_min, x2_max = X[:, 1].min() - 1, X[:, 1].max() + 1
    xx1, xx2 = np.meshgrid(np.arange(x1_min, x1_max, resolution), np.arange(x2_min, x2_max, resolution))
    Z = classifier.predict(np.array([xx1.ravel(), xx2.ravel()]).T)
   Z = Z.reshape(xx1.shape)
   plt.contourf(xx1, xx2, Z, alpha=0.3, cmap=cmap)
    plt.xlim(xx1.min(), xx1.max())
   plt.ylim(xx2.min(), xx2.max())
    # 샘플의 산점도를 그린다.
   for idx, cl in enumerate(np.unique(y)):
        plt.scatter(x=X[y == cl, 0], y=X[y == cl, 1], alpha = 0.8, c = colors[idx], marker = markers[idx], label = cl, edgecolor = 'black')

plot_decision_regions(X, y, classifier=ppn)
plt.xlabel('sepal length [cm]')
plt.ylabel('petal length [cm]')
plt.legend(loc = 'upper left')
plt.show()

적응형 선형 뉴런과 학습의 수렴

  • 이 절에서는 단일층 신경망의 또 다른 종류인 적응형 선형 뉴런(Adaptive Linear Neuron, ADALINE)을 살펴보겠다.
    • 버나드 위드로우와 테드 호프는 프랑크 로젠블라트의 퍼셉트론 알고리즘 이 후 몇 년 지나지 않아 아달린(Adaline)을 발표했는데, 이는 퍼셉트론의 향상된 버전으로 볼 수 있다.
    • 아달린은 연속 함수(continous function)으로 비용 함수를 정의하고 최소화하는 핵심 개념을 보여주기 때문에 흥미롭다.
  • 아달린 규칙(위드로우-호프 규칙이라고도 함)과 로젠블라트 퍼셉트론의 가장 큰 차이점은 가중치를 업데이트 하는데 퍼셉트론처럼 단위 계단 함수 대신 선형 활성화 함수를 사용한다는 것이다.
    • 아달린에서 선형 활성화 함수 \phi(z) 는 최종 입력과 동일한 함수이다.

\phi (w^{T}x) = w^{T} x

  • 선형 활성화 함수가 가중치 학습에 사용되지만 최종 예측을 만드는데 여전히 임계 함수를 사용하는데, 이는 앞서 보았던 단위 계단 함수와 비슷하다.
    • 퍼셉트론과 아달린 알고리즘의 차이는 아래 그림과 같다.

  • 아달린 알고리즘은 진짜 클래스 레이블과 선형 활성화 함수의 실수 출력 값을 비교하여 모델의 오차를 계산하고 가중치를 업데이트 한다.
    • 반면 퍼셉트론은 진짜 클래스 레이블과 예측 클래스 레이블을 비교한다.

경사 하강법으로 비용 함수 최소화

  • 지도 학습 알고리즘의 핵심 구성 요소는 학습 과정 동안 최적화 하기 위해 정의한 목적 함수(object function)이다.
    • 종종 최소화하려는 비용 함수가 목적 함수가 된다.
    • 아달린은 계산된 출력과 진짜 클래스 레이블 사이의 제곱 오차합(Sum of Squared Errors, SSE)으로 가중치를 학습할 비용 함수 J 를 정의한다.

J(w) = {1 \over 2} \sum_{i} (y^{(i)} - \phi(z^{(i)}))^{2}

  • 1/2 항은 그래디언트(gradient)를 간소하게 만들려고 편의상 추가한 것이다.
  • 단위 계단 함수 대신 연속적인 선형 활성화 함수를 사용하는 장점은 비용 함수가 미분 가능해진다는 것이다.
    • 이 비용 함수의 또 다른 장점은 볼록 함수라는 것이다. 간단하지만 강력한 최적화 알고리즘인 경사 하강법(gradient descent)을 적용하여 붓꽃 데이터셋의 샘플을 분류하도록 비용 함수를 최소화하는 가중치를 찾을 수 있다.
  • 아래 그림에서는 경사 하강법 이면에 있는 핵심 아이디어를 지역 또는 전역 최솟값에 도달할 때까지 언덕을 내려오는 것으로 묘사한다.
    • 각 반복에서 경사의 반대 방향으로 진행한다.
    • 진행 크기는 경사의 기울기와 학습률로 결정한다.

  • 경사 하강법을 사용하면 비용 함수 J(w) 의 그래디언트 \nabla J(w) 반대 방향으로 조금씩 가중치를 업데이트 한다.

w := w + \Delta w

  • 가중치 변화량 \Delta w 는 음수의 그래디언트에 학습률 \eta 를 곱한 것으로 정의한다.

\Delta w = - \eta \nabla J(w)

  • 비용 함수의 그래디언트를 계산하려면 각 가중치 w_{j} 에 대한 편도 함수를 계산해야 한다.

{\partial J \over \partial w_{j}} = - \sum_{i} (y^{(i)} - \phi(z^{(i)})) x_{j}^{(i)}

  • 따라서 가중치 w_{j} 의 업데이트 공식을 다음과 같이 쓸 수 있다.

\Delta w_{j} = - \eta {\partial J \over \partial w_{j}} = \eta \sum_{i} (y^{(i)} - \phi(z^{(i)})) x_{j}^{(i)}

  • 모든 가중치가 동시에 업데이트 되기 때문에 아달린 학습 규칙은 다음과 같다.

w := w + \Delta w

  • 아달린 학습 규칙이 퍼셉트론 규칙과 동일하게 보이지만 z^{(i)} = w^{T} x^{(i)} \phi(z^{(i)}) 는 정수 클래스로 레이블이 아니고 실수이다.
    • 또 훈련 세트에 있는 모든 샘플을 기반으로 가중치 업데이트를 계산한다.
    • 이 방식을 배치 경사 하강법(batch gradient descent)라고도 한다.

파이썬으로 아달린 구현

  • 퍼셉트론 규칙과 아달린이 매우 비슷하기 때문에 앞서 정의한 퍼셉트론 구현에서 fit 메서드를 바꾸어 경사 하강법으로 비용 함수가 최소화 되도록 가중치를 업데이트 한다.
import numpy as np

class AdalineGD(object):
   """ 적응형 선형 뉴런 분류기
    매개변수
   ----------
   eta : float
       학습률 (0.0과 1.0사이)
    n_iter : int
       훈련 데이터셋 반복 횟수
    random_state : int
        가중치 무작위 초기화를 위한 난수 생성기 시드

    속성
   ---------
   w_ : 1d-array
       학습된 가중치
    errors_ : list
       에포크마다 누적된 분류 오류
    """

    def __init__(self, eta = 0.01, n_iter = 50, random_state = 1):
       self.eta = eta
       self.n_iter = n_iter
        self.random_state= random_state

    def fit(self, X, y):
       """ 훈련 데이터 학습
        매개변수
       ----------
       X : {array-like}, shape = [n_samples, n_features]
            n_samples개의 샘플과 n_features개의 특성으로 이루어진 훈련 데이터
       y : array-like, shape = [n_samples]
           타겟 값       

        반환값
       ---------
       self : object
        """

       rgen = np.random.RandomState(self.random_state)
        self.w_ = rgen.normal(loc = 0.0, scale = 0.01, size = 1 + X.shape[1])
       self.cost_ = []

       for i in range(self.n_iter):
           net_input = self.net_input(X)
           output = self.activation(net_input)
            errors = (y - output)
           self.w_[1:] += self.eta * X.T.dot(errors)
            self.w_[0] += self.eta * errors.sum()
           cost = (errors**2).sum() / 2.0
           self.cost_.append(cost)       

        return self

   def net_input(self, X):
       """ 최종 입력 계산 """
        return np.dot(X, self.w_[1:]) + self.w_[0]

    def activation(self, X):
       """ 선형 활성화 계산 """
        return X

   def predict(self, X):
       """ 단위 계단 함수를 사용하여 클래스 레이블을 반환합니다 """
       return np.where(self.net_input(X) >= 0.0, 1, -1)
  • 퍼셉트론처럼 개별 훈련 샘플마다 평가한 후 가중치를 업데이트 하지 않고, 전체 훈련 데이터셋을 기반으로 그래디언트를 계산한다.
    • 절편(0번째 가중치)은 self.eta * errors.sum() 이고 가중치 1에서 m까지는 self.eta * X.T.dot(errors)이다.
    • 여기서 X.T.dot(errors)는 특성 행렬과 오차 벡터 간의 행렬-벡터 곰셈이다.
  • 이 코드의 activation 메서드는 단순한 항등 함수(identity function)이기 때문에 아무런 영향을 미치지 않는다.
    • 단일층 신경망을 통해 정보가 어떻게 흘러가는지를 표시하려고 추가했다.
  • 입력 데이터의 특성에서 최종 입력, 활성화, 출력 순으로 진행된다.
    • 다음 장에서는 항등 함수가 아니고 비선형 활성화 함수를 사용하는 로지스틱 회귀 분류기를 다룰 것인데, 로지스틱 회귀 모델은 활성화 함수와 비용 함수만 다르고 아달린과 매우 비슷하다.
fit, ax = plt.subplots(nrows=1, ncols=2, figsize=(10,4))

ada1 = AdalineGD(n_iter=10, eta=0.01).fit(X, y)

ax[0].plot(range(1, len(ada1.cost_) + 1), np.log10(ada1.cost_), marker='o')
ax[0].set_xlabel('Epochs')
ax[0].set_ylabel('log(Sum-squared-error)')
ax[0].set_title('Adaline - Learning rate 0.01')

ada2 = AdalineGD(n_iter=10, eta=0.0001).fit(X, y)

ax[1].plot(range(1, len(ada2.cost_) + 1), ada2.cost_, marker='o')
ax[1].set_xlabel('Epochs')
ax[1].set_ylabel('Sum-squared-error')
ax[1].set_title('Adaline - Learning rate 0.0001')

plt.show()
  • 출력된 비용 함수 그래프에서 볼 수 있 듯 두 개의 다른 문제가 발생한다.
    • 아래 그림 2-11 왼쪽 그래프는 학습률이 너무 클 때 발생한다.
    • 비용 함수를 최소화 하지 못하고 오차는 에포크마다 점점 더 커진다. 전역 최솟값을 지나쳤기 때문이다.
    • 반면 오른쪽 그래프에서는 비용이 감소하지만 학습률 \eta = 0.0001 은 너무 작기 때문에 알고리즘이 전역 최솟값에 수렴하려면 아주 많은 에포크가 필요하다.

  • 아래 그림 2-12는 비용 함수 J 를 최소화하려고 특정 가중치 값을 바꾸었을 때 어떤 일이 일어나는지 보여준다.
    • 왼쪽 그림은 적절하게 선택한 학습률의 경우로, 비용이 점차 감소하여 전역 최솟값 방향으로 이동한다.
    • 오른쪽 그림은 너무 큰 학습률을 선택하여 전역 최솟값을 지나친다.

특성 스케일을 조정하여 경사 하강법 결과 향상

  • 책에서 살펴볼 머신 러닝 알고리즘들은 최적의 성능을 위해 어떤 식으로든 특성 스케일을 조정하는 것이 필요하다. 이는 3, 4장에서 살펴보겠다.
  • 경사 하강법은 특성 스케일을 조정하여 혜택을 볼 수 있는 많은 알고리즘 중 하나이다. 이 절에서는 표준화(standardization)라고 하는 특성 스케일 방법을 사용하겠다.
    • 데이터에 표준 정규 분포의 성질을 부여하여 경사 하강법 학습이 좀 더 빠르게 수렴되도록 돕는다.
    • 표준화는 각 특성의 평균을 0에 맞추고 특성의 표준 편차를 1로 만든다.
    • 예컨대 j 번째 특성을 표준화 하려면 모든 샘플에서 평균 \mu_{j} 을 빼고 표준 편차 \sigma_{j} 로 나누면 된다.

x'_{j} = {x_{j} - \mu_{j} \over \sigma_{j}}

  • 여기서 x_{j} n 개의 모든 훈련 샘플에서 j 번째 특성 값을 포함한 벡터이다.
    • 표준화 기법을 데이터셋의 각 특성 j 에 적용한다.
    • 표준화가 경사 하강법 학습에 도움이 되는 이유 중 하나는 그림 2-13에 나온 것처럼 더 적은 단계를 거쳐 최적 혹은 좋은 솔루션을 찾기 때문이다.
    • 그림 2-13은 2차원 분류 문제에서 모델의 가중치에 따른 비용 함수의 등고선을 보여준다.

  • 표준화를 적용한 결과는 아래 그림 2-14와 같다.
    • 이 그래프에서 볼 수 있듯이 학습률 \eta = 0.01 을 사용하고 표준화된 특성에서 훈련하니 아달린 모델이 수렴했다.
    • 모든 샘플이 완벽하게 분류되더라도 SSE가 0이 되지는 않는다.
# 표준화
X_std = np.copy(X)
X_std[:,0] = (X[:,0] - X[:,0].mean()) / X[:,0].std()
X_std[:,1] = (X[:,1] - X[:,1].mean()) / X[:,1].std()

ada = AdalineGD(n_iter=15, eta=0.01)
ada.fit(X_std, y)

plot_decision_regions(X_std, y, classifier=ada)

plt.title('Adaline - Gradient Descent')
plt.xlabel('sepal length [standardized]')
plt.ylabel('petal length [standardized]')
plt.legend(loc='upper left')
plt.tight_layout()
plt.show()

plt.plot(range(1, len(ada.cost_) + 1), ada.cost_, marker='o')
plt.xlabel('Epochs')
plt.ylabel('Sum-squared-error')
plt.show()

대규모 머신 러닝과 확률적 경사 하강법

  • 전체 훈련 세트에서 계산한 그래디언트 반대 방향으로 한 걸음씩 진행하여 비용 함수를 최소화 하는 방식을 배치 경사 하강법이라고도 부른다.
    • 수백 만개의 데이터셋이 존재하는 경우 배치 경사 하강법을 사용하면 계산 비용이 매우 많이 든다. 전역 최솟값으로 나아가는 단계마다 매번 전체 훈련 데이터셋을 다시 평가해야 하기 때문이다.
  • 확률적 경사 하강법(stochastic gradient descent)은 배치 경사 하강법의 다른 대안으로 인기가 높다. 이따금 반복 또는 온라인 경사 하강법이라고도 부른다.
    • 다음 첫 번째 수식처럼 모든 샘플 x^{(i)} 에 대하여 누적된 오차의 합을 기반으로 가중치를 업데이트하는 대신 두 번째 수식처럼 각 훈련 샘플에 대해서 조금씩 가중치를 업데이트 한다.

\Delta w = \eta \sum_{i} (y^{(i)} - \phi(z^{(i)})) x^{(i)}

\Delta w = \eta (y^{(i)} - \phi(z^{(i)})) x^{(i)}

  • 확률적 경사 하강법을 경사 하강법의 근사로 생각할 수 있지만 가중치가 더 자주 업데이트 되기 때문에 수렴 속도가 훨씬 빠르다.
    • 그래디언트가 하나의 훈련 샘플을 기반으로 계산되므로 오차의 궤적은 배치 경사 하강법보다 훨씬 어지럽다.
    • 비선형 비용 함수를 다룰 때 얕은 지역 최솟값을 더 쉽게 탈출할 수 있어 장점이 되기도 한다.
    • 확률적 경사 하강법에서 만족스러운 결과를 얻으려면 훈련 샘플 순서를 무작위하게 주입하는 것이 중요하다.
    • 또 순환되지 않도록 에포크마다 훈련 세트를 섞는 것이 좋다.
  • 확률적 경사 하강법의 또 다른 장점은 온라인 학습(online learning)으로 사용할 수 있다는 것이다.
    • 온라인 학습에서 모델은 새로운 훈련 데이터가 도착하는대로 훈련된다. 많은 양의 훈련 데이터가 있을 때도 유용하다.
    • 예컨대 고객 데이터를 처리하는 웹 애플리케이션에서 온라인 학습을 사용해서 시스템은 변화에 즉시 적응할 수 있다.
  • 확률적 경사 하강법으로 소스를 고치면 다음과 같다.
import numpy as np

class AdalineSGD(object):
   """ 적응형 선형 뉴런 분류기
    매개변수
   ----------
   eta : float
       학습률 (0.0과 1.0사이)
    n_iter : int
       훈련 데이터셋 반복 횟수
    random_state : int
        가중치 무작위 초기화를 위한 난수 생성기 시드

    속성
   ---------
   w_ : 1d-array
       학습된 가중치
    errors_ : list
        에포크마다 누적된 분류 오류
    """

    def __init__(self, eta = 0.01, n_iter = 50, shuffle=True, random_state = None):
       self.eta = eta
       self.n_iter = n_iter
       self.w_initialized = False
        self.shuffle = shuffle
        self.random_state= random_state

    def fit(self, X, y):
       """ 훈련 데이터 학습
        매개변수
       ----------
       X : {array-like}, shape = [n_samples, n_features]
            n_samples개의 샘플과 n_features개의 특성으로 이루어진 훈련 데이터
       y : array-like, shape = [n_samples]
           타겟 값       

        반환값
       ---------
        self : object

        """

       self._initialize_weights(X.shape[1])
        self.cost_ = []

       for i in range(self.n_iter):
            if self.shuffle:
               X, y = self._shuffle(X, y)           

            cost = []

           for xi, target in zip(X, y):
                cost.append(self._update_weights(xi, target))

            avg_cost = sum(cost) / len(y)
           self.cost_.append(avg_cost)       

        return self

    def partial_fit(self, X, y):
        """ 가중치를 다시 초기화하지 않고 훈련 데이터를 학습합니다 """
       if not self.w_initialized:
           self.w_initialized_weights(X.shape[1])      

        if y.ravel().shape[0] > 1:
           for xi, target in zip(X, y):
               self._update_weights(xi, target)       
        else:
           self._update_weights(X, y)       

        return self

   def _shuffle(self, X, y):
       """ 훈련 데이터를 섞습니다 """
       r = self.rgen.permutation(len(y))
        return X[r], y[r]

   def _initialize_weights(self, m):
       """ 랜덤한 작은 수로 가중치를 초기화 합니다 """
       self.rgen = np.random.RandomState(self.random_state)
        self.w_ = self.rgen.normal(loc=0.0, scale=0.01, size=1+m)
        self.w_initialized = True

   def _update_weights(self, xi, target):
       """ 아달린 학습 규칙을 적용하여 가중치를 업데이트 합니다 """
        output = self.activation(self.net_input(xi))
        error = (target - output)
       self.w_[1:] += self.eta * xi.dot(error)
        self.w_[0] += self.eta * error
        cost = 0.5 * error ** 2

        return cost

    def net_input(self, X):
       """ 최종 입력 계산 """
        return np.dot(X, self.w_[1:]) + self.w_[0]

    def activation(self, X):
       """ 선형 활성화 계산 """
        return X

   def predict(self, X):
       """ 단위 계단 함수를 사용하여 클래스 레이블을 반환합니다 """
        return np.where(self.net_input(X) >= 0.0, 1, -1)
  • 확률적 경사 하강법을 이용해 분류기를 훈련하고 결과를 그래프로 그리면 아래 그림 2-15와 같다.
ada = AdalineSGD(n_iter=15, eta=0.01, random_state=1)
ada.fit(X_std, y)

plot_decision_regions(X_std, y, classifier=ada)

plt.title('Adaline - Stochastic Gradient Descent')
plt.xlabel('sepal length [standardized]')
plt.ylabel('petal length [standardized]')
plt.legend(loc='upper left')
plt.tight_layout()
plt.show()

plt.plot(range(1, len(ada.cost_) + 1), ada.cost_, marker='o')
plt.xlabel('Epochs')
plt.ylabel('Average Cost')
plt.show()

과학의 새로운 언어, 정보

과학의 새로운 언어, 정보

과학사에 주요한 키워드로 자리 잡은 ‘정보’에 대해 어떻게 정의를 내려야 할지에 대한 저자의 생각을 담은 책.

정보라는 개념은 과학자들이 주요한 개념으로 인식한 것은 조금 됐지만 ‘에너지’나 ‘엔트로피’도 개념도 과학적으로 엄밀히 정의되는데는 100년 이상의 시간이 걸렸기 때문에 아직은 보다 시간이 필요한 단계로 보인다.

일반적으로 정보 개념을 유용하게 정의한 것은 섀년으로부터 출발하지만, 섀년도 정보를 다루는 것을 정의했을 뿐 그 자체를 정의한 것은 아니고, 정보를 다루는데 사용한 엔트로피 개념도 그 수식이 흥미롭게도 기존의 열역학에서 사용하던 것과 유사할 뿐이기 때문에 아직은 정보를 엄밀하게 –정보를 엔트로피라고 할 수는 없지 않은가[1]– 정의하기는 어려운 단계다.

책 자체에서도 여러 시도 –최종적으로는 양자역학의 개념을 차용한– 가 이루어지지만 명쾌한 결론에 도달하지는 않는다. 그래도 그 과정에서 여러 흥미로운 논의가 많이 다뤄지고 있기 때문에 –물론 내가 전문 과학자는 아니라서 이해하지 못한 내용이 많지만– 정보에 관심이 있다면 읽어 볼만한 책이라 생각 함.

[1] 물론 아인슈타인이 중력과 가속도는 사실 동일한 것이라고 알아낸 것처럼 후대에는 그 둘이 동일한 것이라고 밝혀질 수 있을 수도 있겠다. 그렇다면 정보는 증가하는 방향으로 가지 감소하는 방향으로는 가지 않는 것인가? 그런데 우리는 우리에게 유용한 무언가 질서가 잡힌 것을 정보라고 이해하는데, 엔트로피는 무질서 함의 정도인데 그 둘을 같다고 하기는 직관적으로는 무리가 있다. 차라리 노이즈가 엔트로피라고 하면 직관적으로는 이해가 가능할 듯. 세상의 노이즈는 증가하는 방향으로 가고 우리에게 유용하다고 판단되는 정보는 그 노이즈 가운데서 우리에게 쓸모가 있는 것.

발칙한 현대미술사

발칙한 현대미술사

인상주의 화가들에서부터 시작하여 –엄밀히 말하면 가장 앞에는 뒤샹이 있지만– 현대미술까지의 미술의 다양한 사조를 짚고 해설 하는 책. 점점 대중이 직관적으로 이해할 수 있는 영역에서 멀어져 가고 있는 현대 미술에 대한 설명 담겨 있다. –개인적으로 좋아하는 미술가를 꼽으라고 한다면 고흐, 몬드리안, 에셔인데 책에서 에셔는 다뤄지지 않아서 아쉬웠음.

저자의 설명에 대해 납득이 되는 부분도 있지만, 사실 현대 미술에 가까워지면서 납득하기 어려운 –나에게는 그저 어떻게든 갖다 붙일 수 있는 해설– 부분이 많아지는데, 특히나 작가가 어떤 좋은 학교를 나오고 등의 설명은 –이렇게 좋은 학교에서 좋은 성적을 거둔 작가이므로 사기가 아니다는 식의– 적어도 나는 안하니만 못한 설명으로 느껴졌다. 세상에는 명문대 나온 사기꾼이 얼마나 많은가?

오히려 그런식으로 밖에 설명할 수 없는 작품이라고 하면 현대 미술은 점점 더 대중에서 멀어질 것이고, 종결에는 미술이라는 분야가 독립적인 예술 분야로 남기는 어려워지지 않을까 싶었다. 우리는 여전히 음악이나 문학 작품을 즐기고 납득할 수 있지만 현대의 미술은 그것과 거리가 먼 방향으로 가고 있지 않은가?

물론 미술사 전체로 보아 현재의 그것들이 일종의 ‘시도’였고, 이후의 미술가들 스스로도 그것이 납득이 안되어서 다시 대중의 납득 시킬 수 있는 형태 –카메라로는 포착할 수 없는 아름다움을 추구하는– 로 변해간다면 지금의 시대는 ‘카메라’라는 강력한 기술이 등장한 이후 생존을 위해 변화를 추구하는 미술의 시기라고 남을 수는 있을 것이다 –물론 공장 노동자들은 그것을 못해서 결국 일자리를 잃었지만

20.02.15

디지털시대 교육 최고과제는? “주의력 잃지 않는 힘”

디지털 기기는 학습용만이 아니라 다양한 용도로 활용되며 멀티태스킹이 학생들의 주의산만과 중독으로 이어진다는 지적은 오래된 우려다. <지식 격차> 저자인 나탈리 웩슬러는 지난해 12월 <엠아이티(MIT) 테크놀로지 리뷰> 기고에서 심층적 이유를 지목했다. 에듀테크의 효과가 부정적으로 나타난 이유엔 기술 사용이 학습에서 동기 부여와 상호작용을 저해하기 때문이라고 주장한다. 

교육은 교사와 학생, 학생과 학생들 사이의 관계와 상호작용이 무엇보다 중요한데, 에듀테크는 개인별 맞춤화한 지식 전달 기능에 특화돼 있어 결과적으로 부정적 효과를 낳았다고 본다. 웩슬러는 특히 미국에서 저소득층일수록 학습과 교육 환경에서 디지털 기기에 더 오랜 시간 노출되고 있다며 사회적 격차 확대로 이어지는 점을 지적했다. 미국의 부유층 거주지역에서는 자녀들의 디지털 기기 사용을 제한하고 컴퓨터 없이 교육하는 학교를 선호하고 있는 현실이 자주 보도되었다. 국가 차원의 대응도 있다. 프랑스 정부는 2018년 7월 교실에서 전화기 사용을 금지하는 법을 제정했다.

나도 한 때 교육용 소프트웨어를 만들겠다고 했던 경험에 의하면, 우려되는 부분은 맞다. 교육은 결국 학습자의 학습 역량 –집중력, 사고력 등– 을 이끌어 내는 것인데, 소프트웨어로 그것을 얼마나 해낼 수 있을지는 의문임. 그저 지식 전달에 불과할 뿐.

퍼블릭 클라우드 쓰다 돌아오는 기업들도 많다

온프레미스로의 회귀는 클라우드의 효과를 체감하지 못한다는 것을 의미한다.  김 지사장은 “2~3년 사용한 고객들로부터 들어보면 비용이 만만치 않다고 한다. 워크로드 자체가 퍼블릭에 올라갈 필요가 없는 것들도 있다. 예측 가능한 워크로드가 많으면 굳히 퍼블릭으로 갈 필요가 없다”라고 지적했다.

김 지사장이 반복해서 강조하는 엔터프라이즈 클라우드의 미래는 하이브리드 클라우드다. 그런만큼, 국내 몇몇 대기업들이 퍼블릭 클라우드 중심의 디지털 전환을 추진하는 것에 대해서도 생각이 좀 다른 것 같다. 그는 “해외의 경우도 퍼블릭 중심으로 먼저 갔다가 이런저런 문제들에 과거로 뉴턴하는 기업들이 적지 않았다”라고 전했다.

IT 업계의 유행은 패션 업계에 비견할만하다고 했던가, 본인의 비즈니스가 그것이 아닌 이상 신기술에 대해서는 다소 기다림이 필요한 것 같다. 마치 처음 신기술을 도입하면 모든 것이 해결 될 것 같지만, 그 문제점에 대해서는 충분히 검증된 상태가 아니니까. 무턱대고 도입했다가 손실만 날 가능성이 높음.

박테리아벽돌, 세포로봇…사물과 생물이 융합한다

미국항공우주국은 나아가 균사체로 화성이나 달 기지를 만드는 방법을 연구하고 있다. 휴면 상태의 균사체를 우주로 가져간 뒤 기본 구조물에 물만 추가하면 균사체가 스스로 구조물을 완성해가는 건축 방식이다. 물은 현지 조달이다. 아직 초기 단계지만 성공할 경우 우주건축의 새 경지를 개척할 것으로 기대된다.

재미있는 내용이라 정리

 

21세기 자본/ 자본/소득 비율의 장기 추이

  • 장기적으로 살펴봤을 때 부의 성격은 완전히 변했다. 농경지 형태의 자본이 점진적으로 산업 및 금융자본, 도시의 부동산으로 대체되었다.
    • 그러나 가장 두드러진 사실은 이러한 변화에도 불구하고 국민소득의 배수로 측정되는 자본총량에는 아주 오랜 기간 그리 큰 변화가 나타나지 않은 것 같다는 점이다.
    • 영국과 프랑스의 경우 현재 국민총자본이 국민소득의 5-6배 수준에 달하는데, 이는 18세기와 19세기, 1차대전 바로 직전까지 집계된 부의 수준(국민총자본이 국민소득의 약 6-7배)보다 약간 낮다.
    • 1950년대 이후 자본/소득 비율이 꾸준히 크게 증가해왔음을 감안하면, 향후 수십 년 동안 이러한 증가세가 계속 이어질지 그리하여 21세기가 끝나기 전에 자본/소득 비율이 과거 수준을 되찾거나 능가할 수 있을지 궁금해지는 것은 당연한 일이다.
  • 1914-1945년에 발생한 충격은 미국보다는 유럽에 훨씬 더 큰 영향을 미쳤기 때문에 1920년대부터 1980년대까지 자본/소득 비율이 미국보다 낮았다.
    • 그러나 전쟁과 그 여파로 인해 영향을 받은 긴 기간을 제외하면 자본/소득 비율은 항상 유럽에서 더 높은 경향을 보여왔다는 점이 발견된다.
    • 19세기와 20세기 초에도 그리고 20세기 후반과 21세기 초에도 마찬가지다. 1990년대 초에 유럽의 민간자산 규모가 다시 미국을 넘어섰고, 현재 유럽의 자본/소득 비율은 6배에 가깝다. 이에 비해 미국은 4배를 약간 넘는다.
  • 왜 유럽에서 자본/소득 비율이 사상 최고치를 회복했는가? 그리고 왜 유럽의 자본/소득 비율이 미국보다 구조적으로 더 높아야 하는가?
    • 자본/소득 비율의 균형 수준이 존재하기는 하는가? 그렇다면 균형 수준은 어떻게 결정되고 자본 수익률에 어떤 영향을 미치는가?
    • 자본/소득 비율의 균형은, 국민소득에서 노동과 자본이 차지하는 비율과 어떤 관계를 맺는가? 이러한 질문에 답하기 위해 나는 먼저 한 경제의 자본/소득 비율과 저축률 및 성장률을 연결시킬 수 있게 해주는 동태적 법칙을 제시하며 논의를 시작하겠다.

자본주의의 제2기본법칙: \beta = s / g

  • 다음 공식에 따르면 장기적으로 자본/소득 비율의 \beta 와 저축률 s , 성장률 g 의 관계는 단순하고 명백하다.
    • \beta = s / g
    • 예컨대 s = 12\%, g = 2\% 이면 \beta =  s / g = 600\% 이다.
    • 즉, 한 국가가 매년 소득의 12%를 저축하고 국민소득 성장률이 연간 2%라면 장기적으로 자본/소득 비율은 600%가 될 것이다. 따라서 그 국가는 국민소득의 6배에 해당하는 자본을 축적하게 될 것이다.
  • 자본주의 제2기본법칙으로 간주될 수 있는 이 공식은 분명하면서도 중요한 점을 반영하고 있다. 즉 저축을 많이 하고 느리게 성장하는 국가는 장기적으로 (소득에 비해 상대적으로) 거대한 자본총량을 축적할 것이고, 이는 사회 구조와 부의 분배에 중요한 영향을 미칠 수 있다.
    • 다시 말해 거의 정체되어 있는 사회에서는 과거에 축적된 부가 필연적으로 엄청난 중요성을 띠게 될 것이다.
  • 18, 19세기에 근접할 정도로 21세기에 자본/소득 비율이 구조적으로 높은 수준으로 회귀한 것은 저성장 체제로의 회귀로 설명될 수 있다.
    • 이처럼 성장 둔화, 특히 인구 성장의 둔화는 자본이 회귀하는 원인이다.
  • 기본적인 요점은 성장률에 작은 변화가 생겨도 장기적으로 자본/소득 비율에 아주 큰 영향을 미칠 수 있다는 것이다.
    • 예컨대 저축률이 똑같이 12%라면 성장률이 연간 1.5%로 하락할 경우 장기적으로 자본/소득 비율은 국민소득의 8배로 상승할 것이다.
    • 성장률이 연간 1% 하락할 경우에는 국민소득의 12배로 상승해 자본집약도가 성장률이 2%일 때의 2배에 이르는 사회가 될 것이다.
  • 어떤 면에서 이것은 반가운 소식이다. 자본은 모든 사람에게 잠재적으로 유용하며, 모든 것이 적절하게 조직된다면 모두가 그 혜택을 얻을 수 있기 때문이다.
    • 그러나 다른 측면에서 보면 자본소유자가 전체 경제적 자원 가운데 더 큰 몫을 장악할 수 있다는 뜻이기도 하다. 어쨌든 그러한 변화는 경제적, 사회적, 정치적으로 상당한 반향을 일으킨다.
  • 반면 성장률이 3%로 상승하면 국민소득의 겨우 4배로 떨어질 것이다. 동시에 저축률이 9%로 약간 하락하면 장기적으로 자본/소득 비율은 3으로 떨어질 것이다.
  • \beta = s / g 법칙에서 사용하는 성장률은 전체 국민소득 증가율, 즉 1인당 국민소득 증가율과 인구증가율의 합이기 때문에 이러한 효과가 더욱더 중요하다.
    • 다시 말해 저축률이 대략 10-12%이고, 1인당 국ㅁ니소득 증가율이 연간 1.5~2%라면 유럽처럼 인구증가율이 제로에 가깝고 따라서 전체 성장률이 1.5~2% 가까운 국가는 국민소득의 6-8배에 달하는 자본총량을 축적할 것이라고 예상할 수 있다.
    • 반면 미국처럼 인구증가율이 연간 대략 1%이고 따라서 전체 성장률이 2.5~3%인 국가는 국민소득의 겨우 3-4배에 달하는 자본총량을 축적할 것이다.
    • 후자와 같은 국가의 인구가 전자만큼 빠른 속도로 노령화되고 있지 않기 때문에 후자의 저축률이 전자보다 약간 낮다면, 결과적으로 이 메커니즘은 더욱 강화될 것이다.
    • 즉 1인당 소득의 성장률이 비슷한 국가들도 인구증가율이 매우 다르다면 자본/소득 비율이 큰 차이를 보일 수 있다.
  • 이 법칙은 자본/소득 비율의 역사적 추이를 섦여하는데도 유용하다. 특히 1914-1945년의 충격과 20세기 후반의 이례적인 급성장을 겪은 뒤 현재 자본/소득 비율이 매우 높은 수준으로 되돌아가고 있는 이유를 설명할 수 있다.
    • 또한 유럽이 구조적으로 미국보다 더 많은 자본을 축적하는 경향을 보이는 원인을 이해하는데 도움이 된다.

장기적 법칙

  • 먼저 자본주의의 제2기본법칙인 \beta = s / g 는 특정한 주요 가정들이 충족되어야 적용될 수 있다는 점을 분명히 하는 것이 중요하다.
  • 첫째 \beta = s / g 는 장기적으로 유효하다는 의미에서 점근적(asymptotic) 법칙이다.
    • 한 국가가 언제까지나 계속해서 솓그의 일정 비율 s 를 저축하고 국민소득 성장률이 언제까지나 g 라면 자본/소득 비율 \beta = s / g 에 점점 더 가까워질 것이고, 그 수준에서 안정화되는 경향을 나타낼 것이다.
    • 그러나 하루 아침에 이렇게 되지는 않는다. 한 국가가 소득의 일정 비율 s 를 단 몇 년간만 저축할 경우, 자본/소득 비율 \beta = s / g 가 성립하기에 충분치 않기 때문이다.
  • 예컨대 한 국가의 자본이 제로에서 출발해 국민소득의 12%를 1년간 저축하면 소득의 6배에 해당하는 자본총량을 축적하지 못할 것이다.
    • 자본이 제로에서 출발해 연간 저축률이 12%일 경우, 소득의 6배에 상당하는 액수를 저축하려면 50년이 걸릴 것이고, 그떄가 되어도 자본/소득 비율은 6이 아닐 것이다.
    • 반세기 뒤면 국민소득 자체가 상당히 증가할 것이기 때문이다.
  • 따라서 염두에 두어야 할 첫 번쨰 원칙은 부의 축적에는 시간이 걸린다는 점이다. 따라서 \beta = s / g 의 법칙이 실현되려면 수십 년이 걸릴 것이다.
    • 이제 우리는 1914-1945년의 충격이 사라지는데 왜 그렇게 오랜 시간이 걸렸는지, 그리고 이러한 문제들을 연구할 때 아주 장기적인 역사적 관점을 취하는 것이 중요한 이유를 이해할 수 있다.
    • 개인 수준에서 보면 떄로 재산이 매우 빠르게 모이기도 하지만 국가 수준에서 보면 \beta = s / g 법칙으로 설명되는 자본/소득 비율의 변화는 장기적인 현상이다.
  • 따라서 자본주의 제1기본법칙이라고 부른 \alpha = r \times \beta 법칙과 \beta = s / g 법칙 간에는 결정적인 차이가 있다.
    • \alpha = r \times \beta 에 따르면 국민소득에서 자본소득이 차지하는 몫 \alpha 는 평균 자본수익률 r 과 자본/소득 비율 \beta 를 곱한 것과 같다.
    • 사실 \alpha = r \times \beta 법칙은 구조상 모든 장소와 모든 시기에 유효한, 순수한 회계 항등식이라는 점을 인식하는 것이 중요하다.
    • 실제로 \alpha = r \times \beta 는 법칙이라기보다 국민소득에서 자본이 차지하는 몫의 정의로 볼 수 있다.
    • 반면 \beta = s / g 법칙은 동태적인 과정의 결과다. 왜냐하면 이 법칙은 저축률이 s , 성장률이 g 라고 할 때 경제가 도달 하려는 경향이 있는 균형 상태를 나타내지만 실제로 이러한 균형 상태는 결코 완벽하게 실현되지 않기 때문이다.
  • 둘째 \beta = s / g 법칙은 인간이 축적할 수 있는 형태의 자본에 초점을 맞출 때만 유효하다.
    • 국민총자본의 상당 부분이 순수한 천연자원, 즉 그 가치가 인간이 개발하거나 과거에 투자한 것과 관련이 없는 천연자원으로 구성되어 있다면 \beta 는 저축의 기여 없이도 매우 높을 수 있다.
  • 마지막으로 \beta = s / g 법칙은 자산 가격이 평균적으로 소비자물가와 같은 수준으로 변화하는 경우에만 유효하다.
    • 부동산이나 주식의 가격이 다른 가격들보다 빨리 오르면 국민총자본의 시장가치와 연간 국민소득의 비율 \beta 는 추가적인 새로운 저축 없이도 다시 매우 높게 유지될 수 있다.
    • 단기적으로는 상대적 자산 가격의 변동이 종종 물량효과 보다 상당히 더 크다. 하지만 장기적으로 그러한 가격 변도잉 소비자 물가 상승률과 균형을 이루게 된다고 가정하면 해당 국가가 국민소득의 일정 부분 s 를 저축하기로 결정한 이유에 상관없이 \beta = s / g 법칙인 반드시 성립한다.
  • \beta = s / g 법칙은 특정 국가의 국민 또는 정부가 부를 축적하는 이유와는 전혀 관계 없다는 점이 강조되어야 한다.
    • 실제로 사람들은 갖은 이유로 자본을 축적한다. ex) 미래대비, 은퇴, 상속 등
    • 이러한 다양한 동기와 축적 메커니즘이 불평등과 자산의 분배, 불평등 구조에서 상속의 역할, 좀더 일반적으로 말하자면 부의 격차에 대한 사회적, 윤리적, 정치적 정당화에 미치는 중요한 영향에 대해서는 3부에서 논의할 것이다.
    • 내가 강조하고 싶은 요점은 \beta = s / g 법칙이 한 국가의 저축률이 정확히 왜 그 수준에 이르렀는지와 관계없이 모든 경우에 적용된다는 점이다.
  • 이렇게 주장하는 것은 \beta = s / g 가 소득의 일정 비율 s 를 저축하고 성장률이 g 인 국가에서 유일하게 안정적인 자본/소득 비율이라는 단순한 사실 때문이다.
  • 예컨대 한 국가가 매년 소득의 12%를 저축하고 초기 자본총량이 소득의 6배와 같다면 자본총량은 연간 2% 성장해 국민소득 증가율과 정확히 같아질 것이고 따라서 자본/소득 비율은 안정적으로 유지될 것이다.
    • 이와 달리 자본총량이 소득의 6배에 미치지 못할 경우, 소득의 12%에 해당하는 저축으로 인해 자본총량은 연 2% 이상 증가해 소득의 증가보다 빠를 것이고, 따라서 자본/소득 비율은 균형 수준에 도달할 때까지 상승할 것이다.
    • 반대로 자본총량이 소득의 6배보다 많은 경우 저축률이 12%라면 자본이 연간 2%보다 낮은 속도로 증가할 것이다. 따라서 자본/소득 비율은 그 수준을 유지하지 못하고 균형 상태에 이를 때까지 낮아질 것이다.
  • 각각의 경우 자산의 평균 가격이 장기적으로 소비자물가와 동일한 비율로 변하면 자본/소득 비율은 장기적으로 \beta = s / g 의 균형 수준을 향해 가는 경향을 보인다.
    • 요약하자면 \beta = s / g 법칙은 이것이 세계대전이나 1929년의 주가 대폭락과 같은 극단적인 충격의 사례로 여겨지는 사건들을 설명하지 못하는 것처럼 자본/소득 비율은 단기적인 충격은 설명하지 못하지만, 충격과 위기의 효과가 사라졌을 때 자본/소득 비율이 장기적으로 향해가는 잠재적인 균형 수준을 이해할 수 있도록 해준다.

1970년대 이후 부유한 국가들에서 나타난 자본의 귀환

  • 도표 5.3을 보면 모든 국가에서 자본/소득 비율이 아주 단기적으로는 끊임없이 변화한다는 것을 알 수 있다.
    • 이런 불규칙한 변화가 나타나는 이유는 부동산과 금융자산 가격이 악명 높을 정도로 불안정하기 때문이다.
    • 자본의 가격을 정하는 것은 항상 매우 어려운데, 이유는 부분적으로 기업이나 부동산에 의해 창출되는 상품과 서비스에 대한 미래 수요를 객관적으로 예측하기가 어렵기 때문이다.
    • 실제 미래 예상 가격은 주어진 자산 유형에 대한 전반적인 열광에 의해 좌우되는데, 이것은 이른바 자기실현적 믿음을 불러일으킬 수 있다. 누군가 어떤 자산을 자신이 지불했던 것보다 더 높은 가격으로 팔 것으로 기대할 수 있는 한, 그 자산의 근본적인 가치보다 훨씬 더 많은 금액을 지불하는 것이 개별적으로는 합리적일 수 있다. 그리하여 해당 유형의 자산에 대해 비록 과도할 수 있 있지만 전반적인 열광이 나타나게 된다.
    • 투기적 거품의 역사는 자본의 역사와 본질적으로 동일하다.

  • (이후 일본을 비롯한 여러 거품 이야기 생략)
  • 단기적인 자산 가격의 불규치적이고 예측 불가능한 변동 (최근 수십 년간 변동 폭이 더 커진 것으로 보인다. 이런 현상이 잠재적인 자본/소득 비율의 증가와 관련될 수 있다는 것은 나중에 살펴볼 것이다) 이외에 1970-2010년에 모든 부유한 국가에서 장기적인 추세가 존재한다는 점을 강조하고 싶다.
    • 1970년대초 모든 대륙의 부유한 국가에서 부채를 뺀 민간 부의 총액은 국민소득의 2-3.5배에 달했다. 2010년에는 모든 조사 대상국가에서 민간의 부가 국민소득의 4-5배에 달했다.
    • 거품은 차치하고 1970년 이후 부유한 국가들에서 민간자본이 강력하게 회복되고 있다. 바꿔 말하면 새로운 세습자본주의가 출현한 것이다.
  • 이러한 구조적 변화는 세 가지 요인으로 설명되며, 이 요인들은 상호보완적으로 이 현상을 매우 현저한 규모로 강화한다.
    • 장기적으로 가장 중요한 요인은 성장률 둔화, 특히 인구증가율의 둔화다. \beta = s / g 법칙에 따라 성장률 둔화는 높은 저축률과 결합되어 자동적으로 장기적인 자본/소득 비율을 구조적으로 상승시킨다.
    • 아주 오랜 기간을 놓고 보면 이 메커니즘이 주도적인 동력이지만 지난 수십 년간 영향력이 상당히 높아진 다른 두 요인도 가려져서는 안 된다.
    • 첫 번째는 1970년대와 1980년대 공공부문의 자산이 점차 민영화된 현상이고, 두번째는 부동산과 주식 시세의 장기적인 반등 현상이다. 이 현상은 전쟁 직후의 수십 년 동안 보다 민간 자산에 전체적으로 더 우호적이던 1980, 1990년대에 가속화 되었다.

거품을 넘어: 낮은 성장률과 높은 저축률

  • 표 5.1은 뷰유한 8개 국가의 1970-2010년 평균 성장률과 민간저축률을 보여준다.  

  • 2장에서 언급한 것처럼 1인당 국민소득 성장률은 지난 수십 년간 모든 선진국에서 아주 비슷하게 나타났다. 장기적인 평균을 보면 모든 부유한 국가가 비슷한 속도로 성장하고 있다.
    • 1970-2010년 사이 1인당 국민소득의 연평균 성장률은 8개 선진국에서 1.6-2.0%였고 보통은 1.7-1.9%였다.
    • 1970-2010년 전반적인 성장률은 미국과 다른 새로운 국가들이 유럽과 일본보다 상당히 더 높았다. 전자는 연간 약 3%였던데 반해, 후자는 2%였다.
    • 여기서 강조하고 싶은 핵심은 그러한 성장률 차이가 장기적인 자본의 축적에 엄청난 영향을 미치고, 미국보다 유럽과 일본에서 자본/소득 비율이 구조적으로 더 높은 이유를 대체로 설명해 준다는 것이다.
  • 1970-2010년 평균 저축률을 보면 국가 간에 큰 차이를 볼 수 있다.
    • 민간저축률은 미국과 영국에서는 7-8%로 낮았고 일본과 이탈리아에서는 14-15%에 이르렀다. 이러한 차이가 40년 이상 누적 되면서 상당한 격차가 생겼다.
  • 이제 성장률과 저축률의 차이를 결합시키면 국가들이 축적한 자본량이 서로 매우 다르고 1970년 이후 자본/소득 비율이 급격하게 상승한 이유를 설명하기 쉬워진다.
    • 저축률이 연간 15%에 육박하는 반면 성장률은 겨우 2%를 넘긴 일본이 장기적으로 국민소득의 6-7배에 달하는 자본총량을 축적한 것은 놀라운 일이 아니다. 이는 동태적 축적의 법칙인 \beta = s / g 의 자명한 결과다.
  • 1970-2010년 전체 기간에 걸쳐 관찰된 변화 양상을 이해하고자 한다면 물량효과가 가격효과보다 크다는 것을 분명히 알 수 있다.
    • 일본에서 민간부문의 부가 1970년에는 국민소득의 3배에서 2010년에는 6배로 증가한 사실은 저축 유량으로 거의 완벽하게 예측된다.

민간저축의 두 가지 구성 요소

  • 민간저축은 개인이 직접하는 저축과 기업들이 그 기업을 소유한 개인들을 대신하여 하는 저축으로 구분할 수 있다.
    • 후자는 개별 기업들이 직접적으로 하는 저축과 금융투자를 위한 간접저축으로 이루어진다. 이 두 번째 요소는 기업들이 재투자한 이윤으로 이루어지며 어떤 국가에서는 전체 민간저축의 절반 정도를 차지한다.
  • 저축의 이 두 번째 요소를 무시하면 모든 국가에서 저축 유량으로 민간부문의 부의 증가를 설명하기에는 매우 부족하며, 민간부문 부의 증가는 대부분 자산의 상대가격, 특히 주식 가격의 구조적 상승으로 설명될 수 있다는 결론에 이를 것이다.
    • 이러한 결론은 회계적 측면에서는 맞지만 경제적 측면에서는 자의적이다. 주가가 장기적으로 소비자 물가보다 빠른 속도로 상승하는 경향이 있는 것은 사실이지만, 그 이유는 본질적으로 유보이익이 기업들로 하여금 기업의 규모와 자본을 늘릴 수 있도록 해주기 때문이다. (이것은 가격효과가 아니라 물량효과다)
    • 그러나 민간저축에 유보이익을 포함시키면 가격효과가 대개 사라진다.
  • (이하 저축에 대한 내용 생략)

내구재 및 귀중품

  • 여기서 정의하는 민간저축과 민간자산에는 가계에서 구매하는 가구, 기기, 자동차 등의 내구재는 포함되지 않는다는 점을 분명히 해두고 싶다.
  • (이하 내구재에 대한 내용 생략)

가처분소득에 대한 민간자본

  • 민간부무의 부 전체를 지금까지처럼 국민소득이 아니라 가처분소득과 비교해 나타내면 2000년대와 2010년대 부유한 국가들의 자본/소득 비율이 더 높아질 것이라는 점에 주목해야 한다.
  • 20세기에 접어들때까지 정부는 사회경제적 삶에서 제한적인 역할만 했는데 그 결과 가처분소득이 국민소득의 약 90%를 차지했다. 20세기에 국가의 역할이 상당히 커져서 오늘날 부유한 국가들의 가처분소득은 국민소득의 70-80%를 차지한다.
    • 그 결과 민간부문의 총부를 국민소득 대신 가처분소득으로 나타내면 훨씬 더 높은 수치를 얻을 수 있다.
    • 예컨대 2000년대 부윻나 국가들의 민간자본은 국민소득의 4-5배에 해당됐는데, 이는 가처분소득의 5-9배에 달하는 수치다.
  • (이하 설명 생략)

재단 및 자본의 기타 소유자 문제

  • 민간의 부에 개인의 자산과 부채뿐만 아니라 재단과 그 외의 비영리 조직들의 자산 및 부채도 포함시켰다.
    • 분명히 하자면 여기에는 주로 개인의 기부나 조직의 재산에서 얻는 수익으로 자금을 충당하는 재단과 기타 조직들만 포함된다.
    • 주로 공적인 보조금에 의존하는 조직들은 정부 조직으로 주로 상품 판매에 의존하는 조직들은 기업으로 분류된다.
  • (이하 설명 생략)

부유한 국가들의 자산 민영화

  • 1970년과 2010년 사이에 부유한 국가들, 특히 유럽과 일본에서 나타난 민간자산의 급격한 증가는 \beta = s / g 법칙을 적용하여 성장률 둔화와 지속적으로 높은 저축률이 결합되어 나타난 현상으로 설명할 수 있다.
    • 앞서 언급했듯이 이러한 메커니즘을 강화시킨 서로 다른 두 가지 보완적 현상에 대해 논의하고자 한다. 바로 공공자산이 민간으로 서서히 이전된 민영화 현상과 장기간에 걸친 자산 가격의 ‘따라잡기’ 현상이다.
  • 먼저 민영화부터 살펴보자. 앞서 말했듯이 국민총자본에서 공공자본이 차지하는 비율은 최근 수십 년 동안 급격하게 감소했는데, 특히 프랑스와 독일에서 더욱 그랬다.
    • 이 두 나라에서 1950-1970년 기간에는 공공부문의 순자산이 국민총자본의 1/4, 심지어는 1/3까지 올라갔지만 지금은 겨우 몇 퍼센트에 불과하다.
    • 이러한 변화 양상은 주요 선진국 8개국 모두에 영향을 미친 매우 일반적인 현상을 반영하는 것이다.
    • 바로 1970-2010년에 국민소득 대비 공공자본의 비율이 서서히 감소했고 동시에 국민소득 대비 민간자본의 비율이 증가한 현상이다.
    • 민간부문 부의 부활은 어느정도 국가 자산의 민영화 현상을 반영한다. 분명 모든 국가에서 민간자본의 증가가 공공자본의 감소보다 컸고, 따라서 국민소득의 배수로 측정되는 국민총자본이 실제로 증가했다. 그러나 민영화로 인한 민간자본의 증가보다 속도가 빠르지는 않았다.

  • (이탈리아 사례 생략)
  • 모든 부유한 국가에서 공공부문의 초과지출과 그로 인한 공공부문 부의 감소가 민간부문 부 증가의 상당부분을 차지한다. 이는 민간부문 부 증가에서 주된 요인은 아니지만 무시 되어서는 안 된다.

  • 공공부문의 부가 민간부문으로 이전되는 현상이 1970년 이후 부유한 국가들에만 국한되어 나타난 것은 아니었다는 점이 중요하다. 오히려 그 반대였다.모든 대륙에서 동일한 일반적인 패턴이 나타난다.
    • 전세계적인 측면에서 보면 최근 수십 년간 그리고 자본의 전체 역사에서 가장 광범위한 민영화가 이루어진 것은 이전 소비에트연방 국가들에서였다.

자산 가격의 역사적 반등

  • 지난 수십 년간 자본/소득 비율의 증가를 설명하는 마지막 요인은 자산 가격의 역사적 반등이다. 다시 말해 1970-2010년을 1910-2010년이라는 좀 더 긴 역사적 맥락 속에 놓고 보지 않으면 정확한 분석이 불가능하다.
  • 1910-2010 혹은 1870-2010년 전체를 살펴보면 세계적인 자본/소득 비율의 변화 추이는 \beta = s / g 법칙으로 아주 잘 설명된다.
    • 특히 자본/소득 비율이 장기적으로 미국보다 유럽에서 더 높았던 사실은 지난 1세기 동안의 저축률의 차이 그리고 특히 성장률의 차이와 완벽하게 일치한다.
  • 그럼에도 불구하고 1950년대 최저 상태는 \beta = s / g 법칙으로 요약되는 간단한 축적 논리로 예측할 수 있는 수준보다 더 낮았다.
    • 20세기 중반에 자본/소득 비율이 얼마나 낮았는지 이해하려면 2차대전 여파로 나타난 꽤 많은 수의 요인으로 인해 부동산 및 주식 자산의 가격이 역사적으로 낮은 수준으로 떨어진 사실을 함께 고려해야 한다.
    • 이때의 자산 가격들은 1950년 이후 서서히 회복되었고 1980년 이후에는 회복이 가속화 되었다.
  • 나의 추정치에 따르면 이러한 역사적인 자산 가격 따라잡기 과정은 이제 완료되었다. 불규칙적이고 단기적인 가격 변동을 고려하지 않는다면, 1950년에서 2010년 사이의 자산 가격 상승은 대체로 1910년에서 1950년 사이의 하락을 상쇄하는 것처럼 보인다.
    • 그러나 자산 가격의 구조적 상승 국면은 확실히 끝났으며 앞으로 자산 가격 변동은 소비자물가와 정확히 같은 속도로 진행되리라는 결론을 내리는 것은 위험할 것이다.
  • (이하 설명 생략)
  • 마지막으로 말하자면 계속 반복되는 중, 단기적 거품과 장기적이고 구조적인 추세 이탈의 가능성을 차치하면 자보 ㄴ가격은 언제나 어느 정도는 사회정치적 결과라는 사실이다.
  • (이하 설명 생략)

부유한 국가들의 국민총자본과 순해외자산

  • 1차대전 직적에 영국과 프랑스가 보유했던 거대한 규모의 해외자산은 1914-1945년의 충격 이후 완전히 사라졌고, 순해외자산 포지션은 이전의 높은 수준을 결코 회복하지 못했다.
    • 실제로 1970년에서 2010년 사이 부유한 국가들의 국민총자본과 순해외자본의 수준을 살펴보면 해외자산의 중요성이 크지 않다는 결론을 내리고 싶어진다.
    • 그러나 이런 결론이 정확한 것은 아니다. 예컨대 일본과 독일은 지난 수십 년 동안 특히 2000년대에 순해외자산을 상당히 많이 축적했다.
    • 2010년대 초에 일본의 순해외자산은 국민소득의 약 70%였고, 독일은 50%에 육박했다.

  • 이 단계에서는 일본의 사례가 명확하게 보여주듯이 \beta = s / g 법칙의 논리가 자동적으로 매우 심각한 국제적 자본 불균형을 야기할 수 있다는 점만 간단히 언급하겠다.
    • 같은 경제발전 수준에서 성장률이나 저축률이 약간만 차이 나도 일부 국가의 자본/소득 비율이 다른 국가들보다 훨씬 더 커질 수 있다. 이 경우 자본/소득 비율이 훨씬 더 큰 국가들은 다른 국가들에 대규모 투자를 할 것이다. 이는 심각한 정치적 긴장을 야기할 수 있다.
  • (이하 설명 생략)

21세기의 자본/소득 비율은 어떻게 될 것인가?

  • 아래 도표에서 부유한 국가들이 차지하는 비중을 고려한다면 세계의 자본/소득 비율이 동일한 유형의 ‘U자 곡선’을 따른다는 사실은 놀랍지 않다.
    • 오늘날 세계의 자본/소득 비율은 500%에 가까운 것으로 보이며 이는 1차대전 직전의 수치와 비슷하다.
  • 가장 흥미로운 점은 이 곡선이 미래에 어떤 모양으로 바뀔지 추정하는 것이다.
    • 여기서는 2장에서 제시했던 인구증가율 및 경제성장률 예측을 사용했다.
    • 이 예측에 따르면 세계의 생산 증가율은 현재의 연간 3%에서 21세기 후반 1.5%로 떨어질 것이다.
    • 나는 또한 저축률이 장기적으로 약 10%로 안정화 될 것이라고 가정한다.
    • 이러한 가정들에 기초하면 동태적인 \beta = s / g 법칙은 세계의 자본/소득 비율이 계속 상승해 21세기가 끝나기 전에 700%에 도달함으로써 대략적으로 18세기부터 벨 에포크 시대까지 유럽에서 관찰되던 수준에 접근할 것이라는 대단히 논리적인 예측을 제시한다.
    • 다시 말해 2100년에 전 세계가 적어도 자본집약도 면에서는 20세기가 시작될 무렵의 유럽처럼 될 수 있다는 것이다.

토지 가치의 수수께끼

  • 정의상 \beta = s / g 법칙은 축적될 수 있는 형태의 자본에만 적용된다. ‘순수 토지’ 즉 인간이 개량하기 전의 토지를 포함한 순수 천연자원의 가치는 고려하지 않는다.
    • 2010년에 집계된 자본총랴잉 거의 전부를 \beta = s / g 법칙으로 설명할 수 있다는 사실은 순수 토지가 국민총자본의 아주 적은 부분만 차지한다는 것을 시사한다.
  • 농경지의 가치에서 인간이 개발하기 이전의 ‘순수 토지 가치’가 얼마이고 수백 년 동안 이 토지에 이루어진 많은 투자와 개량에 의한 것이 얼마인지 정확히 규정하는 것은 매우 어려운 일이다. 그래도 투자와 개량이 농경지 가치의 대부분을 차지한다는 점은 확실해 보인다.
    • 18세기 프랑스와 영국에서 농경지 가치는 적어도 75% 아마도 그 이상의 비중을 차지했을 것이다. 순수 토지의 가치는 기껏해야 1년 치 국민소득과 같은 수치를 나타냈고 어쩌면 국민소득의 절반에도 미치지 못했다.
    • 이러한 결론은 토지를 개간하고 배수하며 개량하기 위해 필요한 노동의 연간 가치가 국민소득의 3-4%에 상당했다는 사실에 기초해 내려진 것이다.
    • 성장률이 연간 1%이하로 비교적 느린 상태에서 토지 개량 투자들의 누적된 가치가 분명 토지의 총가치에 가까워졌던 것이다.
  • (이하 설명 생략)

이상엽/ 해석학/ 미분

미분계수

미분계수의 정의

Def 1. [평균변화율]

함수 f : [a, b] \to \mathbb{R} 에 대하여

{\Delta y \over \Delta x} = {f(b) - f(a) \over b - a} = {f(a + \Delta x) - f(a) \over \Delta x}

a 에서 b 로 변할 때의 함수 y = f(x) 의 평균 변화율이라 한다.

Def 2. [미분계수와 미분가능]

함수 f : (a, b) \to \mathbb{R} c \in (a, b) 에 대해

f'(c) = \lim_{\Delta x \to 0} {\Delta y \over \Delta x}

= \lim_{x \to c} {f(x) - f(c) \over x - c}

= \lim_{\Delta x \to 0} {f(c + \Delta x) - f(c) \over \Delta x}

x = c 에서의 함수 y = f(x) 의 미분계수라 하며, 미분계수가 존재하면 f x = c 에서 미분가능하다고 한다.

  • 미분계수란 순간변화율
  • 순간의 변화율을 보기 위해 극한을 이용한다.
  • 순간변화율은 접선의 기울기와 동일하다는 것은 그래프로 표현 가능할 때 가능한 표현이지만, 실제 수학에서는 그래프로 표현 불가능한 부분이 있고, 그런 부분에서도 미분이 가능한 경우가 존재하기 때문에 엄밀히 말해서 미분계수를 접선의 기울기라고 보기는 어렵다.

Def 3. [우미분계수와 좌미분계수]

  • 함수 f : [a, b) \to \mathbb{R} 에 대하여 f  x = a 에서의 우미분계수
    • f'+(a) = \lim_{\Delta x \to 0+} {f(a + \Delta x) - f(a) \over \Delta x}
    • 가 존재하면 f x = a 에서 우미분가능하다고 한다.
  • 함수 f : (a, b] \to \mathbb{R} 에 대하여 f  x = b 에서의 우미분계수
    • f'-(b) = \lim_{\Delta x \to 0-} {f(b + \Delta x) - f(b) \over \Delta x}
    • 가 존재하면 f x = b 에서 좌미분가능하다고 한다.

Def 4. [미분가능함수]

  • 함수 f : (a, b) \to \mathbb{R} (a, b) 의 모든 점에서 미분가능하면 f (a, b) 에서 미분가능 함수라고 한다.
  • 함수 f : [a, b] \to \mathbb{R} 가 다음 조건들을 만족하면 f [a, b] 에서의 미분가능 함수라고 한다.
    • f (a, b) 에서의 미분가능함수이다.
    • f x = a 에서 우미분가능하다
    • f x = b 에서 좌미분가능하다.

미분계수의 연산

f, g : D \to \mathbb{R} a \in D 에서 미분가능하면 f + g, f - g, fg, {f \over g} (g \neq 0) 도 미분가능하고 다음이 성립한다.

  1.  (f + g)'(a) = f'(a) + g'(a)
  2.  (f - g)'(a) = f'(a) - g'(a)
  3. (fg)'(a) = f'(a)g(a) + f(a)g'(a) (곱의 미분법)
  4. ({f \over g})'(a) = {f'(a)g(a) - f(a)g'(a) \over \{g(a)\}^{2}} (몫의 미분법)

주요 정리

Thm 1. [미분가능성과 연속성]

f 가  x = a 에서 미분가능하면  f 는  x = a 에서 연속이다. (불연속이면 미분 불가)

Thm 2. [극점과 미분계수]

f : D \to \mathbb{R} 일 때  f 가  D 의 내부점  x = a 에서 극값을 갖고 미분가능하면  f'(a) = 0 이다.

Thm 3. [연쇄법칙]

함수  f 가  x = a 에서 미분가능하고  g 가  f(a) 에서 미분가능하면 합성함수  g \circ f x = a 에서 미분가능하고 다음이 성립한다.

 (g \circ f)'(a) = g'(f(a))f'(a)

Lemma. 함수 f : D \to \mathbb{R} x = a(\in D) 에서 미분가능하다

\Rightarrow \exists g, g(a) = f'(a). s.t. \forall x \in D, f(x) = f(a) + g(x) (x - a)

g x = a 에서 연속

도함수

도함수의 정의

함수  f : D \to \mathbb{R} 가 임의의 점  x \in D 에서 미분 가능할 때, 함수

 f'(x) = {df \over dx} = \lim_{y \to x} {f(y) - f(x) \over y - x}

를 함수  f 의 도함수라 한다.

  • f''(x) 는 이계도함수, f'''(x) 는 삼계 도함수 f^{(4)}(x) 는 사계도함수… f^{(n)}(x) 는 n계 도함수라고 한다.

여러 함수의 도함수

  •  c' = 0 (c \in \mathbb{R})
  •  (x^{c})' = c x^{c-1} (c \in \mathbb{R})
    • 실수이므로 무리수에 대해서도 성립  (x^{\sqrt{2}})' = \sqrt{2} x^{\sqrt{2}-1}
    • 복소수에 대해서는 복소해석학에서 봐야 함
  •  (a^{x})' = a^{x} \ln a, (e^{x})' = e^{x} (\because \ln e = 1 )
  •  (\log_{a} x)' = {1 \over x \ln a}, (\ln x)' = {1 \over x} (\because \ln e = 1 )
  • (\sin x)' = \cos x, (\csc x)' = -\csc x \cot x
  • (\cos x)' = - \sin x, (\sec x)' = \sec x \tan x
  • (\tan x)' = \sec^{2} x, (\cot x)' = - \csc^{2} x
  • (x^{x})' = x^{x} (1 + \ln x)

평균값 정리

평균값 정리

  • 평균값 정리란 평균변화율과 순간변화율의 관계에 대한 것
  • 이 정리에서 파생되는 정리가 많기 때문에 대단히 중요한 정리다.

Thm 1. [롤의 정리]

 f : [a, b] \to \mathbb{R} 가  [a, b] 에서 연속이고  (a, b) 에서 미분가능하다고 할 때, 다음 명제는 참이다.

 f(a) = f(b) \Rightarrow \exists c \in (a, b), s.t. f'(c) = 0

  • 연속이고 미분 가능한 함수의 어떤 구간을 잡을 때, 그 구간의 시작점과 끝점이 동일할 경우, 순간변화율이 0이 되는 점이 1개 이상 존재한다.

Thm 2. [평균값 정리]

 f : [a, b] \to \mathbb{R} 가  [a, b] 에서 연속이고  (a, b) 에서 미분가능하면 다음이 성립하는  c 가  (a, b) 에 존재한다.

 f'(c) = {f(b) - f(a) \over b - a}

  • 평균값 정리는 롤의 정리의 일반화된 버전. 평균값 정리에서 시작점과 끝점의 값이 동일할 경우 롤의 정리가 된다.
  • 연속이고 미분 가능한 함수의 어떤 구간을 잡을 때, 구간 내에 구간의 평균변화율과 동일한 순간변화율을 갖는 점이 1개 이상 존재한다.

코시 평균값 정리

  • 코시의 평균값 정리는 평균값 정리를 확장한 버전

Thm 1. [코시 평균값 정리]

 f, g : [a, b] \to \mathbb{R} 가  [a, b] 에서 연속이고  (a, b) 에서 미분가능하면 다음이 성립하는  c 가  (a, b) 에 존재한다.

 \{ f(b) - f(a) \} g'(c) = \{ g(b) - g(a) \} f'(c)

\Rightarrow f(x)g'(c) = g(x)f'(c) (양변에 분모로 b - a 를 넣어줌)

\Rightarrow {f(x) \over g(x)} = { f'(c) \over g'(c) }

  • 두 함수의 도함수의 값을 갖게 해주는 상수가 존재한다.
  • 위의 식에서 g(x) = x 인 경우가 평균값 정리가 된다. 다시 말해 평균값 정리는 코시 평균값 정리에서 g(x) = x 인 특수한 경우가 됨

Thm 2. [로피탈의 정리]

  • 극한이 {0 \over 0}, {\infty \over \infty} 꼴을 가질 때 부정형이라고 하는데, 이러한 꼴을 쉽게 풀 수 있게 해주는 방법
  • 로피탈 정리는 요한 베르누이의 수학 업적 중 하나인데, 이를 귀족이었던 로피탈이 당시 가난에 시달리던 베르누이의 일생의 모든 연구를 모두 사서 자신의 이름으로 발표한 것. 오일러가 바로 이 요한 베르누이의 제자

 f, g : D \to \mathbb{R} 가 다음을 만족한다.

  1.  D 에서 연속함수이고  D - \{a\} 에서 미분가능함수이다.
  2. 다음 두 명제 중에 하나가 성립한다.
    1.  \lim_{x \to a} f(x) = \lim_{x \to a} g(x) = 0
    2.  \lim_{x \to a} \|f(x)\| = \lim_{x \to a} \|g(x)\| = \infty

그러면  a, L \in \mathbb{R} \cup \{ -\infty, \infty \} 에 대하여 다음이 성립한다.

 \lim_{x \to a} {f'(x) \over g'(x)} = L \Rightarrow \lim_{x \to a} { f(x) \over g(x) } = L

  • 위와 같은 꼴일 때, 도함수의 극한과 원래 함수의 극한이 같다
  • 도함수의 극한과 원래 함수의 극한이 같기 때문에, 로피탈 정리를 한 번 써서 해결이 안되면 한 번 더 써도 무방하다. 다시 말해 부정형에서 벗어날 때까지 계속 미분해서 값을 구한다. 바꿔 말하면 부정형이 아닌 상태({0 \over 0}, {\infty \over \infty} 이 아닌 형태)에서는 로피탈 정리를 써서는 안 된다. 주의!

21세기 자본/ 구유럽에서 신대륙으로

  • 우리는 영국과 프랑스의 자료로부터 일관성 있고 상호보완적인 교훈을 얻었다. 자본의 속성은 완전히 변했으나 소득과 비교한 자본의 총량은 결국 거의 변하지 않았다.

독일: 라인 자본주의와 사회적 소유

  • 2차대전 이후 중요해진 혼합경제의 문제와 관련하여 영국과 프랑스의 궤적을 독일과 비교하는 것은 흥미로운 일이다.
  • 가장 먼저 눈에 띄는 점은 전체적인 변화가 비슷하다는 것이다.
    • 먼저 농경지는 장기적으로 주거용 및 상업적 부동산과 산업 및 금융자본에 자리를 내주었고
    • 자본/ 소득 비율은 2차대전 이후 1914-1945년의 충격 이전에 달성했던 수준으로 꾸준히 회복 중인 것으로 보인다.
  • 독일에서는 19세기 후반 농경지의 중요성이 영국보다 프랑스의 경우와 더 유사했고, 산업자본의 가치는 프랑스나 영국보다도 더 높았다.
  • 독일은 지난 수십 년간 무역흑자 덕분에 상당한 해외자산을 모을 수 있었다는 것을 잊지 말아야 한다.
    • 2010년 독일의 순해외자산은 국민소득의 50%에 근접했는데 이는 1913년과 거의 같은 수준이다.
    • 이는 영국과 프랑스의 해외자산에 비하면 적은 양이지만 두 과거 식민 열강의 순해외자산이 현재 제로에 가까운 것에 비하면 상당한 것이다.

  • 독일의 공공부채 그리고 공공자본과 민간자본의 비중은 프랑스와 아주 비슷하다.
    • 1930년에서 1950년 사이 연평균 17%에 달하는 즉 이 가간 중 거의 300배에 달하는 인플레이션으로 독일은 20세기 다른 어떤 국가보다 공공부채를 더 많이 줄였다.
    • 두 차례의 전쟁 기간에서 막대한 적자를 보았음에도 인플레이션 덕분에 이 두 기간 모두 부채를 매우 낮은 수준으로 줄일 수 있었다.
    • 물론 1920년대의 초인플레이션은 독일 사회와 경제를 극심한 불안정으로 몰고 갔다.
  • 독일의 공공자산 축적 또한 프랑스와 유사하다.
    • 독일 정부는 1950-1980년 은행과 산업부문에 많은 공공자산을 보유하고 있었고, 이 자산들을 1980-2000년에 부분적으로 처분했지만, 상당 부분은 그대로 남아 있다.

  • 독일 민간자본의 가치는 프랑스와 영국과 비교할 때 상당한 차이를 보인다.
    • 독일 민간부문의 부는 2차대전 이후 놀랄만큼 증가했는데, 1950년에는 국민소득의 1.5배를 간신히 넘었으나 현재는 국민소득의 4배를 넘는다.

  • 독일이 프랑스 및 영국과 큰 차이를 보이는 것은 대부분 주택자본의 가치 때문이 아니라 오히려 기업의 자본과 같은 다른 종류의 국내자본의 가치 때문이다.
    • 다시 말해 그들의 차이는 독일 부동산의 저평가에서 비롯된 것이 아니라 오히려 독일 기업들의 저평가된 주식시장 가치에 기인한 것이다.
  • 독일 기업의 낮은 시장가치는 종종 ‘라인 자본주의(Rhenish capitalism)’나 이해관계자(stakeholder) 모델이라 불리는 경제모델의 특징을 반영한다.

20세기 자본이 받은 충격

  • 이용 가능한 모든 자료를 보면 영국, 프랑스, 독일에서 일어난 변화가 유럽 대륙 전체를 대표하는 현상임을 알 수 있다. (이 국가들의 GDP 총합은 1910-2010년에 전서유럽 GDP의 2/3, 전 유럽 GDP의 1/2 이상을 차지한다)
    • 비록 국가간에 여러 흥미로운 차이가 있긴 하지만 전반적인 패턴은 동일하다.
  • 두 차례 세계대전으로 인한 자본의 물리적 파괴는 1914-1945년 자본/ 소득 비율 하락을 오직 제한적으로만 설명한다는 사실을 짚고 넘어가야 한다.
    • 영국, 프랑스, 독일에서 국민총자본의 가치는 1913년에 국민소득의 6.5-7배였으나 1950년에 국민소득의 2.5배로 감소했는데, 그 감소 폭은 국민소득의 4년치 이상이었다.
    • 1944-1945년 프랑스와 독일에서 엄청난 폭격으로 엄청난 양의 자본이 물리적으로 파괴되었다. 프랑스은 거의 한 해 국민소득에 맞먹는 자본이 파괴되었고, 독일에서는 국민소득의 1.5배에 해당하는 자본이 파괴되었다.
    • 이런 손실은 매우 심각한 것이었지만, 이 전쟁으로 직접적인 피해를 입은 두 나라에서도 그것은 분명 자본/소득 비율 감소의 일부분만 설명할 수 있을 뿐이다.

  • 두 차례 세계대전으로 재정적, 정치적 충격이 전쟁이 가져온 파괴보다 자본에 훨씬 더 파괴적인 영향을 미쳤다.
    • 물리적 파괴와 더불어 1913-1950년 자본/소득 비율의 급격한 하락을 설명할 수 있는 주요한 요인은 두 가지다.
    • 그중 하나는 해외자산 가치의 급락과 그 당시의 특징인 매우 낮은 저축률이고
    • 다른 하나는 소유권 변화와 규제 등 전후의 새로운 정치적 상황으로 인한 낮은 자산 가격이었다.
    • 해외자본의 감소는 부분적으로 혁명과 탈식민지화 과정에서 나타난 강제수용, 그리고 더 많은 부분은 1914-1945년 유럽 여러 나라에서 나타난 매우 낮은 저축률로 설명될 수 있다.
    • 저성장과 반복되는 불황으로 1914-1945년은 모든 유럽인에게 어두운 시대였다. 특히 1930년대에는 대공황이 밀어닥쳐 기업들이 하나둘 계속 파산하자 수많은 주주와 채권자들도 함께 몰락했다.
  • 결국 1913-1950년 자본/소득 비율의 하락은 유럽의 자살과도 같은 역사였으며, 특히 유럽 자본가들에게는 안락사나 다름없었다.
  • 전후 시기 주로 1920년대 초반 그리고 특히 1940년대의 높은 인플레이션 기간에 거의 모든 곳에서 채택되었던 임대로 통제 정책 때문에 주택 가격이 역사적으로 최저치를 기록했다.
  • 영국, 프랑스, 독일의 상세한 추정치들은 2차대전 이후 하락한 부동산과 주식 가격이 1913년과 1950년 사이에 자본/소득 비율이 하락하는데 무시할 순 없지만 여전히 적은 영향만 미쳤음을 보여준다.
    • 이 가격효과는 국가에 따라 다르지만 자본/소득 비율 하락의 1/4-1/3을 설명해주고, 반면 물량효과 (낮은 국민저축률, 해외자산의 손실, 물리적 파괴 등) 는 그 비율 하락의 2/3-3/4를 설명한다.

미 대륙의 자본: 유럽보다 더 안정된 추세

  • 몇 가지 사실이 분명하게 눈에 띈다. 첫째 신대륙인 미대륙은 구세계 즉 구유럽보다는 자본의 중요성이 덜했던 곳이다.
    • 좀더 정확히 말하면 미국이 독립을 쟁취했던 1770년대부터 1810년까지 미국의 자본 총량은 국민소득의 3배를 간신히 넘는 수준이었다.
    • 자료의 불확실성을 감안하더라도 신대륙 식민지의 자본/소득 비율이 영국이나 프랑스보다 훨씬 더 낮았다는 점은 확실하다.

  • 식민지 시대와 미 공화국 초기에는 다른 형태의 자본 –주택과 기타 국내자본– 이 상대적으로 중요하지 않았다.
    • 이유는 몇가지가 있는데 인구의 커다른 부분을 차지했던 새 이주민들이 대서양을 건너올 때 주택, 도구, 기계류 등의 자본을 가져오지 않았을 뿐더러 국민소득의 몇 배에 해당하는 부동산이나 사업자본을 보유하는 것은 시간이 걸리는 일이었기 때문이다.
    • (애초에 유럽에 자산을 가지고 있던 사람이 미국으로 건너가지는 않았을 듯)
  • 미국의 낮은 자본/소득 비율은 유럽과 비교해 사회적 불평등 구조가 근본적으로 다르다는 것을 반영하고 있다.
    • 총 자본이 미국에서는 국민소드그이 겨우 3배를 웃돈데 비해 유럽에서는 7배 이상이었다는 사실은 신대륙에서 지주와 그들이 축적한 부의 영향력이 크게 중요하지 않았다는 점을 구체적으로 시사한다.
    • 새로운 이주민들이 단 몇 년만 일하면 먼저 정착해 있던 부유한 사람들과 최초의 격차를 줄일 수 있었다. 아니면 적어도 유럽에서보다 훨씬 더 빠르게 부의 격차를 줄이는 것이 가능했다.
  • 19세기를 지나며 미국에서도 유럽에서와 마찬가지로 생산에서 농업이 차지하는 부분은 꾸준히 감소했다.
    • 그러나 미국은 상당한 부동산과 산업자본을 축적한 까닭에 1810년 국민소득의 3배였던 국민총자본이 1910년에는 5배 가까이 되었다.
    • 구유럽과 여전한 차이는 있었지만 격차가 불과 한 세기만에 절반으로 줄어든 것이다.
    • 미국은 자본주의 국가가 되었지만 부의 영향력은 유럽의 벨 에포크 시대에 비하면 여전히 낮은 수준이었다.
  • 20세기 미국은 유럽보다 전쟁의 충격을 훨씬 덜 받았기 때문에 미국의 자본/소득 비율은 훨씬 더 안정된 수준을 유지했다.
    • 1910-2010년 유럽의 총자본은 국민소득의 7배 이상에서 3배 이하로 떨어졌다가 다시 5-6배로 올라간 반면, 미국은 국민소득의 4-5배 사이에서 오르내렸다.
  • 미국의 자산도 1914-1945년 위기로 타격을 받았다.
    • 특히 2차대전 중 전쟁비용 때문에 미국의 공공부채가 급격히 증가했고, 경제적으로 불잔정한 시기의 국민저축에 영향을 미쳤다. 1920년대의 호황은 1930년대의 대공황에 자리를 내주었다.
    • 미국은 1930년대와 1940년대에 특히 사회기반시설과 관련된 주요 공공투자에 착수했지만, 광범위한 국유화 정책은 시도하지 않았다.
    • 인플레이션과 성장이 공공부채를 1950년대와 1960년대 그리 높지 않은 수준으로 돌려놓았기 때문에 1970년 공공부문의 부는 확실히 플러스였다.
    • 결국 미국 민간부문의 부는 1930년 국민소득의 거의 5배에서 적지 않은 폭으로 줄어들어 1970년에는 3.5배 이하를 기록했다.

  • 그럼에도 20세기의 자본/소득 비율의 U자 곡선은 유럽에서보다 미국에서 그 폭이 작다.
    • 연간 소득 또는 생산과 비교한 미국의 자본은 20세기가 시작되는 시기부터 사실상 줄곧 안정 상태에 이른 것으로 보인다.
    • 자본/소득 비율 혹은 자본/생산 비율의 안정성이 미국 교과서, 예컨대 새뮤얼슨의 교과서에서 보편적 법칙으로 다루어질 정도였다.
  • 이에 비해 유럽의 경우 자본, 특히 민간자본의 추이가 민간자본의 추이가 막 지난 세기만 해도 확실히 눈에 띄게 혼란스러운 상태였다.
    • 벨 에포크 시대에는 자본이 왕이었으나 2차대전 이후 많은 사람이 자본주의는 거의 사라졌다고 생각했다.
    • 그러나 21세기 초 유럽은 민간의 재산이 다시 한번 미국의 수준을 능가하는 새로운 세습자본주의의 첨단에 서 있는 것으로 보인다.
    • 이러한 현실은 미국에 비해 낮은 유럽의 경제성장률, 특히 낮은 인구증가율로 잘 설명되는데, 이로 인해 과거에 축적된 부의 중요성이 더욱 커진다.
    • 여튼 중요한 사실은 20세기에 미국이 유럽보다 훨씬 더 안정적인 자본/소득 비율을 보이고 있다는 것이다. 어쩌면 이것이 미국인들이 자본주의에 대해 유럽인들보다 더 긍정적인 시각을 보이는 이유일지도 모른다.

신대륙과 해외자본

  • 미국과 유럽의 자본의 역사에서 또 한 가지 중요한 차이는, 미국에서는 해외자본이 상대적으로 중요한 적이 한 번도 없었다는 점이다.
    • 이는 식민지 중 최초로 독립을 쟁취했던 미국이 식민 열강세력이 되지 않았기 때문이다.
  • 19세기 내내 미국의 순해외자본은 약간 마이너스 상태였다. 미국 시민들이 해외에 소유하고 있던 것은 외국인 주로 영국인들이 미국 내에서 소유한 것보다 적었다.
    • 그러나 그 차이는 미미해서 기껏해야 미국 국민소득의 10-20% 정도였고, 1770년에서 1920년 사이에는 대체로 10% 이하였다.
  • 1차대전 직전 미국의 국내자본은 국민소득의 500%에 달했다.
    • 국내자본 총액 중 외국 투자자들이 소유했던 자산은 국민소득의 10%에 상당했다. 그러므로 미국의 국민총자본 혹은 순국부는 국민소득의 490%정도 였다. 다시 말해 미국은 98%가 미국인 소유이고 2%는 외국인 소유라는 뜻이다.
    • 순해외자산 포지션은 거의 균형을 유지했다.
  • 두 차례 세계대전으로 미국의 순해외자산 포지션은 반전되었다. 1913년의 마이너스 상태에서 1920년대 약간 플러스로 돌아섰고, 1970년대와 1980년대까지 유지되었다.
    • 미국은 전쟁하는 나라들에 돈을 대주었기 때문에 더는 유럽의 채무자가 아니었고 오히려 채권자가 되었다.
    • 그러나 미국의 순해외자산 총량은 국민소득의 겨우 10% 정도로 그리 크지 않았다.
    • 특히 1950년대와 1960년대 미국이 소유하던 순해외자본은 여전히 상당히 제한적이었다.
  • 미국의 순해외자본 포지션은 1980년대 약간 마이너스로 돌아섰고 1990년대에서 2000년대까지는 무역적자의 누적으로 점점 더 마이너스가 되었다.
    • 그럼에도 미국의 해외투자는 미국이 외국인 투자자들에게 진 부채에 지불하는 것보다 계속해서 더 나은 수익률을 기록했다. 이는 달러화에 대한 신뢰가 가져다준 특권이었다.
    • 이것은 1990년대 국민소득의 약 -10%에 달했고 2010년대에는 약 -20%를 상회하는 미국의 순해외자본 포지션이 더 악화되는 것을 막아주었다.
  • 따라서 모든 것을 고려할 때 현재 상황은 1차대전 직전의 상황과 상당히 비슷하다.
    • 미국의 국내자본은 국민소득의 약 450%에 이른다. 이 가운데 외국인 투자자가 보유한 자산은 국민소득의 20%에 해당된다.
    • 그러므로 미국의 순국부는 국민소득의 약 430%다. 다시 말해 미국인이 미국의 95% 이상을 소유하고 외국인은 미국의 5% 미만을 소유하고 있는 것이다.
    • 요약하면 미국의 순해외자산 포지션은 떄로 약간 마이너스였거나 약간 플러스였지만, 이 포지션은 미국 시민이 소유한 자본총량과 비교했을 때 언제나 상대적으로 그리 중요하지 않았다. (항상 5%이하였고 보통은 2%보다 적은 수준이었다)

오랫동안 왕이 소유했던 캐나다

  • 캐나다가 앞서 언급한 국가들과 매우 다른 경로를 걸어왔다는 점을 관찰하는 것은 흥미롭다.
    • 캐나다 국내자본의 많은 부분은 외국인 투자자들 특히 천연자원 부문은 영국인들이 주로 소유하고 있었다.
    • 1910년 캐나다의 국내자본은 국민소득의 530%에 이르는 것으로 평가되었다. 이 가운데 외국인 투자자들이 소유하고 있는 자산은 국민소득의 120%에 달했다. 즉 전체 국내자본의 1/5-1/4 수준이었다.
    • 두 차례의 세계대전은 이 상황을 상당히 바꿔놓았는데, 그것은 유럽인들이 많은 해외자산을 처분해야 했기 때문이다.
  • 오늘날 캐나다의 상황은 미국의 사정과 아주 흡사하다. 캐나다의 국내자본은 국민소득의 약 410%에 달한다.
    • 이 가운데 외국인 투자자들이 소유한 자산은 국민소득의 10%이하를 차지한다. 그러므로 캐나다는 98% 이상을 캐나다인들이 소유하고 2% 이하를 외국인들이 소유한다.

  • 이 같은 비교는 흥미로운데, 이 두 북미 국가의 발전과정이 왜 이렇게 근본적인 차이를 보이는가에 대해 순수하게 경제적인 이유를 찾는 것이 어렵기 때문이다.
    • 정치적 요인이 핵심적인 역할을 한 것만은 분명하다.
    • 미국은 항상 외국인 투자에 개방적이었지만 19세기 미국시민들이 국부의 1/4을 옛 식민지 지배자들이 소유하는 상황을 용인했으리라 상상하기는 어렵지만, 영국의 식민지로 남아 있던 캐나다에서는 별 문제가 되지 않았다.

구대륙과 신대륙: 노예제의 중요성

  • 유럽과 미국 자본의 변형이라는 주제는 노예제 문제와 미국 자산에서 노예가 차지한 지위를 논하지 않고는 결론 지을 수 없다.
    • 노예의 수는 1770년대 약 40만 명에서 1800년에는 100만 명으로 증가했고, 1060년에는 다시 4배로 불어나 400만 명을 넘어섰다. 즉 한 세기도 안 돼 노예 수가 10배로 증가한 것이다.
    • 노예경제는 1865년 결국 노예제의 폐지로 종지부를 찍게 되었다.
    • 1800년에 노예는 미국 인구의 거의 20%를 차지했다. 거의 모든 노예가 살았던 남부에서는 인구의 40%가 노예였다.
  • 도표를 보면 18세기 말과 19세기 초의 노예의 총시장가치는 미국 국민소득의 거의 1.5배 수준이었으며, 이는 대략 농경지의 총가치와 비슷했음을 알 수 있다.
    • 다른 구성 요소들과 더불어 부의 요소에 노예를 포함시킬 경우 미국의 총자본은 식민지 시대부터 현재까지 국민소득의 약 4.5배에 달하는 비교적 안정된 수준을 유지했다.
    • 미국 남부에서 노예의 총 가치가 국민소득의 2.5-3배로 나타났고 농경지와 노예들을 합한 가치는 국민소득의 4배를 넘었다.
    • 이 모든 것을 고려하면 미국 남부의 노예 소유주들은 구유럽의 지주들보다 더 큰 부를 장악했음을 알 수 있다.
    • 그들이 소유한 농경지는 그 자체로서는 별 가치가 없었지만, 그들은 토지뿐만 아니라 그 토지에서 일하는데 필요한 노동력까지 소유한다는 기발한 생각을 한 덕분에 그들이 가진 총자본은 훨씬 많았다.
    • 노예의 시장가치를 재산의 다른 요소들에 더할 경우 남부의 자본가치는 남부 소득의 6배를 초과하는데, 이는 영국과 프랑스의 총자본가치와 맞먹는 수준이었다.
    • 반면 노예가 거의 없던 북부에서는 총자본이 매우 적었다. 즉 국민소득의 3배에 불과했는데, 이는 미국 남부와 유럽의 절반 수준에 지나지 않았다.

노예자본과 인적자본

  • 1770년-1810년 미국의 경우 노예자본의 가치가 대략 국민소득의 1.5배 정도였는데, 그 이유는 한편으로는 총인구에서 노예가 차지하는 비율이 20%였고, 다른 한편으로는 노예의 평균 생산성이 자유민보다 낮았으며, 노예의 자본 수익율은 5%가 아니라 7-8%에 가깝거나 그보다 높아 자본화의 정도가 낮았기 때문이다.
  • 실제로 남북전쟁 직전 미국에서 노예의 시장가격이 자유민 노동자 임금의 10-12배와 같았다.
    • 노예와 자유민 노동자가 동일한 생산성과 수익률을 보인다면 20배에 달해야 하는데 그렇지 못했다.
  • (기타 노예와 인적자본에 대한 내용 생략)

21세기 자본/ 자본의 변신

부의 속성: 문학에서 현실까지

  • 오노레 드 발자크와 제인 오스틴이 소설을 쓰던 19세기 초의 부의 속성은 명백했다. 당시 재산은 지대, 즉 자산 소유주의 확실하고 정기적인 소득을 얻기 우한 것으로 여겨졌는데, 보통 토지나 국채 형태를 띠었다.
    • (문학 작품 속 주인공들의 자산에 대한 설명 생략)
  • 18세기 이후 자본의 구조에는 어떤 실제적인 변화가 일어났을까?
    • 고리오 영감의 파스타는 스티브 잡스의 태블릿으로 바뀌고, 1800년의 서인도제도 투자는 2010년 중국이나 남아프리카에 대한 투자로 바뀌었을지 모르지만, 과연 자본의 심층적인 구조가 실질적으로 변화했다고 할 수 있을까?
    • 자본은 결코 조용한 법이 없다. 자본은 적어도 형성기에는 언제나 위험추구적이고 기업가적이다. 그러나 충분히 축적되면 자본은 늘 지대로 바뀌는 경향이 있다. 이것은 자본의 사명이자 논리적 귀결이다.

영국과 프랑스에서 자본의 변신

  • 18세기 이후 영국과 프랑스의 자본 구조에 어떤 변화가 일어났는지 살펴보자.
    • 아래 도표에서 이 두 국가의 자본/소득 비율이 비슷한 궤적을 따랐다는 사실을 확인할 수 있다.
    • 18-19세기에 비교적 안정적으로 머물다가 20세기에 엄청난 충격을 경험한 후 다시 1차대전 직전과 비슷한 수준으로 되돌아갔다.
    • 18-19세기를 거쳐 1914년에 이르기까지 영국과 프랑스의 국민총자본의 가치는 한 해 국민소득의 6-7배 사이를 오르내렸다.
    • 1차대전 이후 자본/소득 비율은 갑자기 추락했고, 대공황과 2차대전 때 계속해서 떨어지다가 1950년대에는 국민총자본이 국민소득의 2-3배로까지 추락했다.
    • 이후 자본/소득 비율은 상승하기 시작해 계속해서 높아지고 있다. 2010년에는 두 국가 모두 자본의 총가치가 국민소득의 대략 5-6배이다.

  • 간단히 말해 자본/소득 비율은 우리가 막 지나온 세기에 걸쳐 인상적인 U자 곡선을 그리고 있다.
    • 자본/소득 비율은 1914-1945년 거의 2/3나 떨어졌다가 1945-2012년 다시 2배이상 상승했다.
    • 이는 20세기를 특징적는 군사적, 정치적, 경제적 갈등에 따른 엄청난 변동이다. 이런 갈등에서 핵심적인 이슈는 자본, 사유재산, 부의 세계적 분배였다. 18세기와 19세기는 이와 비교하면 상대적으로 평온해 보인다.
  • 2010년이 되자 자본/소득 비율은 1차대전 이전 수준으로 되돌아갔다. 자본총량을 국민소득이 아닌 가계가처분소득으로 나눌 경우 심지어 1차대전 이전 수준을 넘어섰다.
  • 자본/소득 비율의 전체적인 변화는 중요한 것이지만 그렇다고 전체적인 변화가 1700년 이후 자본 구성 요소들에 나타난 엄청난 변화를 가리도록 해서는 안된다.
    • 자산 구성 면에서 21세기 자본은 18세기 자본과 공통점이 거의 없다.
    • 간단히 말해 아주 오랜 기간에 걸쳐 농경지는 점차 건물, 기업과 정부 기관이 투자한 사업자본 및 금융자본으로 대체되었음을 알 수 있다. 그러나 연간 국민소득 대비 자본총량의 규모는 실질적으로 변하지 않았다.
  • 한 국가의 총 자본은 다음과 같이 분해할 수 있다.
    • 국민총자본 = 농경지 + 주택 + 기타 국내자본 + 순해외자본
  • 장기간에 걸친 구조적 변화는 다음 두 가지 사실을 반영한다.
    • 그중 하나는 경제와 산업이 발전함에 따라 주택이 갈수록 규모뿐만 아니라 질과 가치 면에서도 중요해졌다는 것이다.
    • 다른 하나는 산업혁명 이후 기업과 정부 기관이 비농업 분야의 온갖 상품과 서비스를 생산하기 위해 사용하는 기업용 건물, 설비, 기계, 창고, 사무실, 장비 그리고 물질적, 비물질적 자본이 대규모로 축적되었다는 사실이다.
    • 자본의 성격은 변했다. 과거에 주로 토지였던 자본은 이제 부동산, 산업 및 금융자산으로 바뀌었다. 그러나 그 중요성은 전혀 잃지 않았다.

해외자본의 부침

  • 해외자산은 1750-1800년에 처음으로 중요한 의미를 갖기 시작했다. 그러나 해외자산이 차지하는 비중은 크지 않았다.
    • 영국 국민이 전 세계에 상당한 자산을 축적하기 시작한 것은 19세기 동안이었는데, 그 자산 규모는 일찍이 유례가 없었으며, 오늘날까지도 기록이 깨지지 않을 정도이다.
    • 1차대전 직전까지 영국은 세계 최고의 식민제국을 건설했으며, 국민소득의 2배에 가까운 해외자산을 보유하고 있었다.
    • 세계 두 번째의 주요 식민제국이었던 프랑스도 1년 치 국민소득보다 더 많은 해외자산을 보유한 덕분에 1900-1910년의 모든 해에 국민소득이 국내생산보다 약 5-6% 높았다.
  • 여기서 알아야 할 것은 이 대규모 순해외자산 덕분에 19세기 후반과 20세기 초반에 영국과 프랑스가 구조적인 무역적자를 기록해도 괜찮았다는 사실이다.
    • 1880-1914년 이 두 나라는 해외로 수출하는 것보다 훨씬 더 많은 상품과 서비스를 다른 나라에서 수입했고, 이 기간 내내 두 나라의 무역적자는 평균적으로 국민소득의 1-2%에 이르렀다.
    • 하지만 영국과 프랑스가 해외자산으로부터 얻는 소득이 국민소득의 5%를 웃돌았기 때문에 이것은 아무런 문제가 되지 않았다.
  • 18세기와 현재의 국민총자본의 구조를 비교해보면, 두 시기 모두 순해외자산의 역할을 미미했으며, 장기간에 걸친 구조적 변화 속에서 국민소득과 비교한 자본총량은 대체로 변하지 않았지만 농지가 장기간에 걸쳐 부동산과 영업자본(working capital)으로 점차 대체되는 실질적인 구조 변화가 나타났음을 알 수 있다.

소득과 부: 대략의 규모

  • (현재와 300년전 영국, 프랑스 국민소득 비교 내용 생략)

공공부문과 민간부문의 부

  • 국민총자본을 공공부문 자산과 민간부문 자산으로 구분하는 문제를 살펴보면 유용할 것이다.
    • 국민총자본은 공공자본과 민간자본의 합이다. 공공자본은 국가의 자산에서 부채를 뺀 값이고 민간자본은 물론 개인들의 자산에서 부채를 뺀 것이다.
    • 공공이든 민간이든 자본은 언제나 순 부, 즉 누군가가 소유한 것의 시장가치(자산)에서 그가 빚진 것의 가치(부채 또는 채무)를 뺀 값으로 정의된다.
  • 추정치가 완벽한 것은 아니지만 현재 영국에서 공공부문 자산의 총가치가 한 해 국민소득과 거의 맞먹고 프랑스에서는 국민소득의 1.5배에 약간 못 미치는 것으로 추산된다.
    • 두 나라는 공공부문 순자산이 아주 적고 민간부문 총자산에 비하면 확실히 미미하다는데는 의심의 여지가 없다.

역사적 관점에서 본 공공부문의 부

  • 18세기 이후 영국과 프랑스의 공공부문 자산과 부채는 민간부문에 비해 매우 미미한 금액이었다.
    • 다시 말해 18세기 이래 국민소득 대비 국민총자본 비율의 역사는 대체로 국민소득과 민간자본 간 관계의 역사였다.
    • 이는 영국과 프랑스가 사유재산에 기반을 둔 국가로서 국가가 대부분의 자본을 통제하는 공산주의를 실험해 본 적이 없기 때문에 놀랍지 않은 일이다.

  • 이 두 나라에서 공공정책이 극단으로 치달은 적은 없지만, 정책이 민간부문 부의 축적에 무시할 수 없는 영향을 미친 적이 분명히 몇 차례 있었으며 정책 방향에도 차이가 있었다.
    • 18세기와 19세기 영국에서는 정부가 대규모 공공부채를 짐으로써 민간의 부를 증대시키는 경향이 있었다. 앙시앵레짐과 벨 에포크 시대 프랑스 정부도 똑같은 일을 했다.

영국: 공공부채와 민간자본의 강화

  • 나폴레옹 전쟁이 끝난 후와 2차대전 후 영국의 공공부채는 극히 높은 수준에 이르렀는데, GDP의 200% 혹은 그보다 약간 더 높은 수준이었다.
    • 영국은 그 어떤 국가보다 높은 수준의 공공부채를 가장 오랜기간 떠안고 있었지만 한 번도 디폴트에 빠지지 않았다.
    • 사실 영국이 디폴트 상태가 된 적이 없었다는 사실이 많은 공공부채를 오랫동안 지고 있었던 이유를 설명해준다.
  • (영국과 프랑스의 부채 이야기 생략)
  • 이런 역사적 경험에서 어떤 교훈을 얻을 수 있을까?
    • 먼저 영국의 높은 공공부채가 영국 사회에서 민간부문 부의 영향력을 확대했다는데는 의심의 여지가 없다.
    • 재산을 가진 영국인들은 민간투자를 눈에 띄게 줄이지는 않으면서 정부에 필요한 돈을 빌려주었다. 1770-1810년 크게 늘어난 공공부채는 주로 그에 상응하는 민간저축으로 충당되었다.
    • 이는 당시 영국의 유산계급이 정말로 번창하고 있었고 국채 수익률이 매력적이었음을 보여준다.
    • 이에 따라 이 기간 내내 국민총자본은 국민소득의 대략 7배 수준에서 안정된 상태로 머물러 있었고 민간의 부는 1810년대에 국민소득의 8배가 넘게 늘어났다. 이때 공공부문의 순자본은 점점 더 큰 폭으로 마이너스가 되었다.
    • 둘째, 모든 면을 고려했을 때 이토록 높은 수준의 공공부채가 채권자들과 그 자손들의 이해관계에 아주 잘 맞아떨어졌음은 분명하다. 정부에 돈을 빌려줄 여유가 있는 사람들 입장에서 봤을 때 보상도 없는 세금을 내는 것보다 정부에 돈을 빌려주고 수십 년간 그 이자를 받는 편이 훨씬 더 유리했다.
    • 더욱이 정부 적자는 민간 자본에 대한 전반적인 수요를 증대시켜 불가피하게 그 자본에 따른 수익율을 높여주었으며, 이는 국채 투자수익률에 따라 소득 수준이 달라지는 사람들의 이해에도 부합했다.
  • 여기서 가장 중요한 사실이자 20세기와 본질적으로 다른 점은 19세기에는 정부에 돈을 빌려준 사람들의 보상이 상당히 컸다는 것이다.
    • 1815-1914년 인플레이션은 사실상 제로였고 국채 이자율은 보통 4-5% 수준이었다. 이는 당시 성장률보다 훨씬 높은 수준이었기 때문에 공공부채에 투자하는 것은 부자들과 그 상속인들에게 수지맞는 장사가 될 수 있었다.
    • 1815-1914년에 걸쳐 영국의 예산은 항상 상당한 흑자를 기록하고 있었다. 다시 말해 조세 수입이 늘 지출을 초과해 흑자 폭은 GDP의 몇%에 이르렀다.
    • 결국 영국이 한 세기의 고행 끝에 국민소득 대비 공공부채 비율을 크게 줄일 수 있었던 것은 오로지 국내생산과 국민소득이 1815-1914년까지 한 해에 2.5%가까이 늘어난 덕분이었다.

공공부채는 누구에게 이득이 되는가?

  • 공공부채에 관한 기록은 몇 가지 이유에서 중요하다.
    • 첫째 마르크스를 비록한 19세기 사회주의자들에게 어떤 통찰력을 발휘해 공공부채를 민간자본의 도구로 보면서 왜 그토록 경계했는지를 이해할 수 있게 해준다.
    • 당시 영국에서 뿐만 아니라 프랑스를 비롯한 여러 나라에서도 공공부채 투자자들은 두둑한 보상을 받았기 때문에 사회주의자들의 염려는 더욱 컸다.
    • 20세기에는 공공부채에 대한 다른 견해가 부상했다. 이런 견해는 부채가 공공지출을 늘리고 가장 가난한 사회 구성원들에게 이득이 되도록 부를 재분배하는 정책 수단으로서의 역할을 할 수 있다는 확신에 바탕을 둔 것이었다.
  • 이 두가지 견해의 차이는 매우 단순하다. 19세기에는 채권자가 부채에 대한 두둑한 이자를 받아 사적인 부를 늘릴 수 있었던 반면, 20세기에는 부채는 인플레이션으로 인해 가치가 하락했고 가치가 줄어든 화폐로 지불되었다.
    • 이런 상황은 실제로 그만한 세금 인상 없이 국가에 돈을 빌려준 사람들이 재정적자를 메우도록 해주었다.
    • 공공부채에 대한 이런 ‘진보적’인 관점은 인플레이션이 오래전부터 19세기보다 그리 높지 않은 수준으로 떨어지고 재분배 효과가 비교적 불분명한데도 오늘날까지 많은 사람들에게 영향을 끼치고 있다.
  • (인플레이션 덕분에 프랑스와 영국 정부의 부채가 줄어든 내용 생략)
  • 인플레이션을 통한 재분배 메커니즘은 매우 강력했고, 20세기를 처기는 동안 영국과 프랑스 양국에서 중요한 역할을 했다.
    • 그럼에도 불구하고 이는 두 가지 중요한 문제를 야기한다. 첫째, 인플레이션 메커니즘은 목표를 선택하는데 그다지 정밀하지 않다. 어느 정도 재산을 보유한 사람들 가운데 국채를 가진 이들이 반드시 부유한 사람은 아니다. 실상은 전혀 그렇지 않다.
      • (국채는 대부분 은행이 가지고 있지 않나?)
    • 둘째, 인플레이션 메커니즘은 무기한 작동할 수 없다. 인플레이션이 지속되면 채권자들은 좀 더 높은 명목 이자율을 요구하고 따라서 물가 상승이 기대만큼 효과를 내지 못하기 때문이다.

리카도 등가의 부침

  • 길고 격동적인 공공부채의 역사는 그 시대의 집단적인 기억과 논의에 지울 수 없는 흔적을 남겼다.
    • 이같은 역사적 경험은 경제학자들에게도 마찬가지로 흔적은 남겼는데, 예컨대 1817년 리카도가 오늘늘 ‘리카도의 등가(Ricardian equivalence)’ 즉, 특정한 조건에서는 공공부채가 국민총자본 축적에 아무런 영향을 미치지 못한다는 내용의 가설을 공식화 했을 때, 이미 그는 주위에서 목격한 현실로부터 많은 영향을 받았던 것이 분명하다.
    • 그가 책을 쓸 당시에도 영국의 공공부채는 GDP의 200%에 가까웠으나 이런 공공부채가 민간투자나 자본 축적의 흐름을 고갈 시키지는 않았던 것으로 보인다.
    • 크게 염려했던 ‘구축 효과(crowding out effect)’ –정부가 지출을 늘리면 민간 투자가 위축되는 효과– 는 일어나지 않았고, 늘어난 공공부채는 민간저축 증대로 충당되었던 것으로 보인다.
  • 물론 이것이 리카도 등가가 언제 어디서나 적용될 수 있는 보편적 법칙임을 의미하지는 않는다.
    • 왜냐면 모든 것은 관련 사회집단의 번영, 제시된 이자율, 정부에 대한 신뢰에 달려 있기 때문이다.
    • 리카도는 역사적인 시계열 자료나 자본 유형의 통계도 갖고 있지 않았지만, 당시 영국 자본주의에 대한 깊은 지식을 지녔었다.
    • 리카도가 영국의 거대한 공공부채는 국부에 뚜렷한 영향을 미치지 않으며 단순히 그 나라 국민의 일부가 다른 사람들에게 갖는 청구권을 구성할 뿐이라는 것을 명백히 인식했다는 사실은 주목할 만하다.
  • 마찬가지로 케인스(John Maynard Keynes)가 ‘자본소득자의 안락사’에 대해 저술할 당시 그 역시 주위에서 관찰되는 일들로부터 깊은 영향을 받았다.
    • 그 무렵 1차대전 이전의 자본소득자들은 몰락하는 중이었고, 당시의 경제적 위기나 예산상의 어려움을 극복할 만한 어떠한 정치적 해결책도 마련되지 않았다.
    • 특히 케인스는 인플레이션이 공공부채의 짐을 덜고 축적된 부의 영향을 줄이는데 반드시 가장 공정한 방법은 아니더라도 가장 단순한 방법이라는 것을 분명히 알았다.
    • 당시 영국인들은 1914년 이전 금본위제에 대해 강력한 믿음을 갖는 보수적 태도 때문에 여전히 인플레이션을 받아들이기 꺼렸다.
  • 1970년대 이후 공공부채에 대한 분석은 이른바 대표적 경제주체 모형에 경제학자들이 아마도 지나치게 의존했었다는 사실로 인해 어려움을 겪었다.
    • 이 모형에서는 각 경제 주체가 같은 소득을 얻고 같은 금액의 재산을 물려 받는다.
    • 이처럼 현실을 단순화 시키면 좀더 복잡한 모형에서는 분석하기 어려운 논리적 관계를 끌어내는데 유용할 수 있으나, 이런 모형들은 부와 소득분배의 불평등 문제를 완전히 도외시함으로써 종종 극단적이고 비현실적인 결론에 이르며, 따라서 명확성보다는 혼란을 낳는다.
  • 공공부채 문제에 대해 대표적 경제주체 모형을 사용할 경우 정부의 빚이 국민총자본 뿐만 아니라 재정적 부담의 배분에 있어서도 완전히 중립적이라는 결론에 이를 수 있다.
    • 리카도 등가에 관한 이처럼 극단적인 재해석은 미국 경제학자 배로(Robert Barro)가 처음 제시한 것이다.
    • 이런 해석은 실제로는 전체 국민 가운데 소수가 공공부채의 대부분을 소유하며, 따라서 그 부채는 상환되지 않을 때는 물론이고 제대로 상환될 때에도 내부적으로 중요한 재분배의 수단이 된다는 점을 고려하지 못한다.
  • 항상 부의 분배의 특징이었던 부의 심각한 집중이라는 관점에서 보면 사회 집단 사이의 불평등을 살펴보지 않고 이런 문제들을 연구하는 것은 사실상 그 주제의 중요한 측면에 대해 그리고 무엇이 중요한 쟁점인지에 대해 아무것도 말하지 않는 것과 같다.

프랑스: 전후 시대의 자본가 없는 자본주의

  • 정부부채의 역사와 비교할 때 공공자산의 역사는 덜 격동적이었던 것 같다.
    • 간단히 말해 프랑스와 영국의 공공자산의 총가치는 장기간에 걸쳐 늘어나 18세기와 19세기 국민소득의 약 50%에서 20세기 말에는 대략 100%로 증가했다.
  • 대체로 이같은 공공자산의 증가는 역사적으로 정부의 경제적 역할이 꾸준히 확대되었음을 반영하는 것이다.
    • 이는 특히 갈수록 늘어나는 공공서비스의 발전에 따른 것이며 여기에는 의료와 교육 분야 서비스 및 운송과 통신 분야 사회기반시설에 대한 공공 또는 준공공투자가 포함된다.
  • 장기간에 걸친 공공자산 축적에 대한 이 단순하고 차분한 분석은 지난 세기의 역사에서 한 가지 중요한 부분을 빠뜨리고 있다.
    • 1950-1980년에 산업과 금융부문에서 상당한 규모의 공공자산 축적이 이뤄진 다음, 1980년 이후 나타난 그 자산들에 대한 대대적인 민영화 물결이 그것이다.
    • 이 두 현상 모두 여러 신흥국에서 뿐만 아니라 대부분의 선진국, 특히 유럽에서 다양하게 나타났다.
  • 프랑스에서 뿐만 아니라 전 세계 여러 나라에서 1930년대 경제위기와 그에 따른 파급효과로 민간 주도 자본주의에 대한 신념이 크게 흔들렸다.
    • 모든 나라가 19세기 그리고 대체로 1930년대 초까지 정부가 경제에 간섭하지 않는 ‘자유방임주의’를 고수했는데, 이 전통적인 교리는 영구적으로 신뢰를 잃었다. 많은 나라가 더 높은 수준의 국가 개입주의를 선택했다.
    • 게다가 소련이 2차대전 승리국이 된 사실은 볼셰비키가 확립한 국가주의 경제 시스템의 위상을 강화했다.
    • 1942년 슘폐터(Joseph Schumpeter)는 사회주의가 필연적으로 자본주의에 승리할 것이라 믿었고, 1970년 새뮤얼슨(Paul Samuelson)은 그의 유명한 경제학 교과서 8판에서 여전히 소련의 GDP가 1990-2000년 어느 시점에 미국을 능가할 것이라고 예측했다.
  • 이용 가능한 통계에 따르면, 1950년 프랑스 공공자산의 총가치는 국민 소득을 초과했다.
    • 인플레이션으로 공공부채의 가치가 급격히 감소함으로써 공공부문의 순자산은 국민소득과 비슷한 수준이 되었고, 당시에 민간의 자산 총액은 국민소득의 겨우 2배였다.
  • 국유화의 물결은 1950년에 공공자산의 가치가 국민소득을 능가한 영국을 비롯해 같은 시기에 다른 많은 나라에서도 나타났다.
  • 1980년대 전 세계 국가들에 영향을 미친 경제의 민영화는 상품과 서비스 시장의 자유화, 금융시장과 자본 흐름에 대한 규제완화를 포함하는데, 그 기원은 복잡하고 다양했다.
    • 1970년대 ‘스태그플레이션’은 전후 시대 케인스식 정책의 한계를 드러냈다. 따라서 전후의 재건과 영광의 30년 동안 높은 성장률을 구가하던 시기가 끝나면서 정부의 역할 그리고 국가 전체 생산에서 정부가 차지하는 비중이 무한정 확장되는데 의문을 품는 것은 지극히 당연한 일이었다.
    • 규제완화 움직임은 1970-1980년 미국과 영국에서 일어난 ‘보수혁명’과 함께 시작되었는데, 당시 두 나라는 다른 나라들에게 추월당할까봐 신경을 쓰고 있었다.
    • 한편 1970년대 소련과 중국의 국가주의 모델의 실패가 점점 더 분명해지자, 공산권의 두 거인은 1980년대에 기업에 대한 새로운 형태의 사유재산을 도입해 경제 시스템의 점진적인 자유화를 추구하기 시작했다.
  • (이하 프랑스 상황 설명 생략)

물리학으로 보는 사회

물리학으로 보는 사회

물리학자의 관점에서 사회가 어떻게 돌아가는지를 분석하고자 한 책. 소제목에 나오는 ‘임계 질량’ 이라는 표현만 봐도 복잡성 (복잡계)에 대한 책임을 알 수 있다.

개인적으로 복잡계를 좋아하기 때문일 수도 있지만, 책의 서술은 물론 흥미롭고 재미있다. 관심 있다면 추천할만한 책.

다만 복잡계를 다루는 책의 특성이 그러하듯, 현실에 대한 설명은 잘 되지만 적용이 이루어지기 까지는 아직 갈 길이 멀다는 생각이 든다. 경제학에서 흔히 쓰는 표현을 빌리자면 기차에서 역방향으로 가는 좌석에 앉은 것과 비슷한데, 지나간 풍경들에 대한 설명은 잘 되지만, 그 다음에 어떤 풍경이 나올지는 알 수가 없는 것.

물론 현실 세계에는 예측 근본적으로 불가능한 것들이 존재하고, 그렇지 않은 것들도 예측이라는 것은 시-공간 적인 차원에서의 제약 –미시적인 수준에서 가능한 예측의 시공간과 거시적인 수준에서 가능한 예측의 시공간은 범위가 다르다. 우주적인 관점에서는 몇 억년 뒤의 것도 예측이 되지만, 양자 수준에서는 1초 뒤의 것도 예측이 어려우니까– 이 존재하기 때문에  한계는 있지만, 그 한계가 어느 지점인지를 이해하는 것이 중요하다는 생각이 든다.

번외로 책 자체는 이 책이 아마도 훨씬 먼저 나왔겠지만, 개인적으로는 다른 책들 –아마도 이 책에서 영향 받았을– 에서 비슷한 이야기를 많이 접했기 때문에, 큰 감흥은 못 느꼈다. 비단 이 책뿐만 아니라 요즘 내가 관심을 두었던 분야들에 대해 대중 교양 수준에서는 더 새로운 내용을 접하지 못한다는 느낌이 있어서, 여기서 더 이해하려면 전공 수준의 컨텐츠를 접해야 할텐데, 내 업이 그쪽에 있지 않아서 애매한 느낌이다. 내 삶의 시간은 한정적인데 모든 것을 그렇게 할 수는 없으니까. 이제는 아예 관심을 두지 않았던 책들 –예컨대 문학– 을 읽는게 나을까?